Skip to content

Latest commit

 

History

History
61 lines (19 loc) · 2.16 KB

File metadata and controls

61 lines (19 loc) · 2.16 KB

多智能体强化学习

===

多智能体强化学习大模型初探

多智能体强化学习大模型初探-知乎备份

国内团队「大模型异构智能体」获重大突破!无人机、机器狗、机械臂三合一自主协作

李学龙教授团队在大模型驱动多智能体协作方面取得重大进展,实现了大模型对无人机集群、机器狗、机械臂的真机协同控制。该成果展示了大模型在智能体控制方面的能力,也为智能无人系统的研究提供了无限可能。

在人工智能领域,大模型控制智能体是大势所趋。

智能体赋予大模型物理实体,使其具备与真实物理世界感知交互的能力。同时,借助于大模型,智能体能够获得更强大的感知、决策和执行能力,使其具备更高的自主性和适应性。

星际争霸II协作对抗基准超越SOTA,新型Transformer架构解决多智能体强化学习问题

多智能体强化学习(MARL)入门经验以及个人观点

【实战】重现DeepMind星际争霸强化学习算法

多智能体顶级会议AAMAS2022最佳论文,伍斯特理工《蚂蚁启发的多机器人协调》获最佳,弗吉尼亚大学《新冠疫苗接种分布》最佳学生

多智能体强化学习代码汇总(pytorch)

多智能体强化学习入门1-基本Gymnasium环境使用

NeurIPS多智能体强化学习竞赛夺冠的背后,是决策智能公司「启元世界」

北大领衔,多智能体强化学习研究登上Nature子刊