Luo, Jianing. “Policy Gradient Methods for Multi-Agent Reinforcement Learning: A Comparative Study”. Highlights in Science, Engineering and Technology 140 (May 23, 2025): 378–383. Accessed June 8, 2026. https://hsetdata.com/index.php/ojs/article/view/752.