Skip to content

Latest commit

 

History

History
16 lines (7 loc) · 1.15 KB

i-Sim2Real-Reinforcement-Learning-of-Robotic-Policies-in-Tight-Human-Robot-Interaction-Loops.md

File metadata and controls

16 lines (7 loc) · 1.15 KB

i-Sim2Real: Reinforcement Learning of Robotic Policies in Tight Human-Robot Interaction Loops

paper: i-Sim2Real

谷歌的研究团队还证明,数据驱动方法通常适用于不同环境中的不同机器人平台,以学习范围广泛的任务,包括移动操作、导航、运动和乒乓球等,也为学习低层次机器人技能指明了一条明确的道路:可扩展的数据收集。

与互联网上丰富的视频和文本数据不同,机器人数据极其稀缺,难以获取,收集和有效使用代表真实世界交互的丰富数据集的方法是数据驱动方法的关键。

仿真是一种快速、安全和易于并行化的选择,但是在仿真中很难复制完整的环境,特别是物理环境和人机交互环境。

在 i-Sim2Real 中,研究人员展示了一种方法,通过从简单的人类行为模型中自举,并在模拟训练和在现实世界中部署之间交替进行,来解决仿真与现实之间的不匹配问题,并学习与人类对手打乒乓球,在每次迭代中,人类行为模型和策略都会得到细化。