Skip to content

Latest commit

 

History

History
21 lines (9 loc) · 1.26 KB

Value-Function-Spaces-Skill-Centric-State-Abstractions-for-Long-Horizon-Reasoning.md

File metadata and controls

21 lines (9 loc) · 1.26 KB

Value Function Spaces: Skill-Centric State Abstractions for Long-Horizon Reasoning

paper: Value Function Spaces

当LLM遇上机器人

大型语言模型(LLM)的一个特性是能够将描述和上下文编码成「人和机器都能理解」的格式。

当把LLM应用到机器人技术中时,可以让用户仅通过自然语言指令就能给机器人分配任务;当与视觉模型和机器人学习方法相结合时,LLM 为机器人提供了一种理解用户请求的上下文的方法,并能够对完成请求所采取的行动进行规划。

研究人员选择使用 LLM 来预测完成长期任务的步骤顺序,以及一个表示机器人在给定情况下实际能够完成的技能的affordance 模型。

强化学习模型中的价值函数可以用来建立affordance 模型,即一个机器人在不同状态下可以执行的动作的抽象表示,从而将现实世界中的长期任务,如「整理卧室」与完成任务所需的短期技能,如正确挑选、放置和安排物品等联系起来。

Google AI年终总结第六弹:没有波士顿动力的谷歌机器人,发展得怎么样了?