Luo, J. (2025) “Policy Gradient Methods for Multi-Agent Reinforcement Learning: A Comparative Study”, Highlights in Science, Engineering and Technology, 140, pp. 378–383. doi:10.54097/58j7ca95.