Skip to content

Latest commit

 

History

History
20 lines (8 loc) · 710 Bytes

File metadata and controls

20 lines (8 loc) · 710 Bytes

Transformer+RL

===

Transformer+强化学习,DeepMind让大模型成为机器人感知世界大脑

近日,Google DeepMind 提出了 Q-Transformer,目标是将基于多样化真实世界数据集的大规模机器人学习与基于强大 Transformer 的现代策略架构结合起来。

为什么目前的强化学习里深度网络很少用 transformer ,更多的是 lstm rnn 这类网络? by OpenDILab浦策