多智能体强化学习论文

返回上层目录
mean-field: Mean Field Multi-Agent Reinforcement Learning ICML2018

===

个人认为，cooperative multi-agent reinforcement learning在发现了基于策略梯度的sequential rollout机制以后就算是解决了，剩下就是对sequential rollout工程实现上的修补改进（比如引入order matters, transformer结构, distill方法等）。

多智能体Transfermor

论文地址：https://arxiv.org/pdf/2205.14953.pdf
项目主页：https://sites.google.com/view/multi-agent-transformer

多智能体在连续动作空间中使用Qmix方法（FACMAC）

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

paper.md

paper.md

多智能体强化学习论文

Files

paper.md

Latest commit

History

paper.md

File metadata and controls

多智能体强化学习论文