本项目旨在实现一个完全本地的训练环境,避免与Hugging Face的交互,从而节省成本和时间。同时,还针对汉诺塔任务进行了专门的优化和训练。
- 完全本地训练:无需与Hugging Face交互,避免了因网络问题导致的训练中断和额外费用。具体修改细节请参阅:离线训练更改细节.md
- 数据集微操: 删除特定episode, 数据集合并,重新计算相关统计量,具体操作步骤请参阅:数据集微操.md
- docker部署:实测cpu、gpu版本环境部署,可更换项目(更改 git clone 地址用最新版本的代码)具体操作步骤请参阅:Dockerfile 安装历程
注意:官方Lerobot代码目前正在进行大规模重构,本项目仅针对汉诺塔任务进行优化,不实时跟进最新版本的代码修改。
- 分解动作训练:针对汉诺塔任务每次移动训练一个模型。
- 汉诺塔算法:递归算法,生成模型动作序列
- 接入大模型:gpt分析初始状态图片,数字化初始状态,输入汉诺塔算法进行求解
- 持续更新:更多功能和优化正在开发中,敬请期待。
初始状态:
目标状态: