Skip to content

Latest commit

 

History

History
12 lines (6 loc) · 833 Bytes

File metadata and controls

12 lines (6 loc) · 833 Bytes

Visual Backtracking Teleoperation: A Data Collection Protocol for Offline Image-Based Reinforcement Learning

paper: Visual Backtracking Teleoperation: A Data Collection Protocol for Offline Image-Based Reinforcement Learning

此外,机器人团队还投入了大量的资金在更有效的数据模拟学习上,实验证明了一种简单的模仿学习方法 BC-Z 可以对训练中没有看到的新任务进行zero-shot泛化。

并且还引入了一个迭代模仿学习算法 GoalsEye,从游戏中学习和目标条件行为克隆相结合,用于高速高精度的乒乓球游戏。

Google AI年终总结第六弹:没有波士顿动力的谷歌机器人,发展得怎么样了?