Luo, J. (2025). Policy Gradient Methods for Multi-Agent Reinforcement Learning: A Comparative Study. Highlights in Science, Engineering and Technology, 140, 378-383. https://doi.org/10.54097/58j7ca95