"less is more"
- 🔭 正在从事多模态数据合成、reasoning model、multi agent、超长上下文、RL scaling的研究
- 🌱 是个ENTJ水瓶座的大四在读医学生
jupyter、python(flask、fastapi)、golang、react、tailwindcss、typescript、vite、uniapp、taro、git、docker、k8s......
pytorch、huggingface、multi-agent、posttraining、data generation、reasoning model、long contenxt memory、RL scaling......
SFT训练数据构建工具 |
视频问答数据集构建 |
大模型RLHF(ppo奖励模型)训练偏好数据排序助手(支持ollama本地模型) |
视频转图文并茂的pdf—loopytransform:打工人(会议记录)和学生党(网课笔记)等必备! |
多模态数据工厂 |
- 💬 微信公众号:正经人王同学
- 📱 微信:whatisallineed
- 🐦 Twitter:@zjrwtx
- 📫 邮箱:[email protected]