paper: Value Function Spaces
当LLM遇上机器人
大型语言模型(LLM)的一个特性是能够将描述和上下文编码成「人和机器都能理解」的格式。
当把LLM应用到机器人技术中时,可以让用户仅通过自然语言指令就能给机器人分配任务;当与视觉模型和机器人学习方法相结合时,LLM 为机器人提供了一种理解用户请求的上下文的方法,并能够对完成请求所采取的行动进行规划。
研究人员选择使用 LLM 来预测完成长期任务的步骤顺序,以及一个表示机器人在给定情况下实际能够完成的技能的affordance 模型。
强化学习模型中的价值函数可以用来建立affordance 模型,即一个机器人在不同状态下可以执行的动作的抽象表示,从而将现实世界中的长期任务,如「整理卧室」与完成任务所需的短期技能,如正确挑选、放置和安排物品等联系起来。