Skip to content

基于InterLM的《黑神话:悟空》AI小助手,了解更多背后的故事--在更新视频中

Notifications You must be signed in to change notification settings

xzyun2011/wulewule

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🐒悟了悟了🐒 — 《黑神话:悟空》AI助手


Logo

悟了悟了


查看Demo · 报告Bug & 提出新特性

📜 前言

国产3A游戏《黑神话:悟空》自发布以来,以其精美绝伦的画面、流畅自如的战斗机制、精心雕琢的设计、深厚的文化底蕴等,在全网引发热潮。开发这款“悟了悟了”AI小助手的初衷,是想帮助玩家深入探索游戏的文化内涵,丰富游戏体验。通过解析游戏中的故事情节、角色渊源、与原著的巧妙联系、游戏隐藏细节以及有趣的彩蛋等内容,让玩家更了解游戏背后的中国传统文化,为玩家在酣畅淋漓的战斗之余,带来一场精神上的盛宴。此外,小助手还提供详尽的游戏攻略,助力玩家轻松通关,尽享游戏乐趣。

悟了悟了的模型使用 xtunerInternLM2.5 微调得到, 首先在一些网络数据(如《西游记》中英文版、《悟空传》等)上进行增量预训练,再基于RAG生成的准确的问答对数据集,基于此数据集进行QLoRA指令微调。部署时集成了RAGLMDeploy 加速推理

项目亮点总结:

  1. 📊 基于RAG制作准确实时的新知识数据集
  2. 📚 RAG 检索增强生成回答
  3. 🚀 KV cache + Turbomind 推理加速
  4. 📲 基于LlamaIndex 的智能体(TTS、文生图)

🎥 微调模型效果图

wulewulev1_7b_4bit.mp4

🌐 Agent在线体验

Hugging Face的体验地址:https://huggingface.co/spaces/xzyun2011/wulewule

Agent中模型都是调用SiliconFlow的api(非微调后的模型),仅供体验整体效果。

🗂️ 目录


📊 框架图

🧩 Model Zoo

模型 基座 类型 ModelScope(HF) OpenXLab(HF)
wulewule_v1_1_8b internlm2_5_chat_1_8b 预训练+QLoRA微调 wulewule_v1_1_8b wulewule_v1_1_8b
wulewule_v1_1_8b-w4a16-4bit internlm2_5_chat_1_8b 预训练+QLoRA微调+w4a16量化 wulewule_v1_1_8b-w4a16-4bit wulewule_v1_1_8b-w4a16-4bit
wulewule_v1_7b internlm2_5_chat_7b 预训练+QLoRA微调 wulewule_v1_7b wulewule_v1_7b
wulewule_v1_7b-w4a16-4bit internlm2_5_chat_7b 预训练+QLoRA微调+w4a16量化 wulewule_v1_7b-w4a16-4bit wulewule_v1_7b-w4a16-4bit

🚀 快速使用

💻 本地部署

git clone https://github.com/xzyun2011/wulewule.git
cd wulewule
conda create -n wulewule python=3.10.0 -y
conda activate wulewule
conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.1 -c pytorch -c nvidia
pip install -r requirements.txt
apt-get install git-lfs
streamlit run app.py

📖 详细指南

🔍 数据集制作

数据制作代码讲解见数据制作流程,使用脚本直接制作数据集:

📚 增量预训练数据

将网络收集到的文本数据切分,执行脚本,得到incremental_pretraining.jsonl增量预训练数据

conda activate wulewule
cd wulewule/data
python3 generate_incremental_pretraining.py --root-path ./ --save-path ./incremental_pretraining.jsonl

🤔 自我认知数据

data_utils.py中的"api_key"换成自己的,执行脚本,将得到self_cognition.jsonl自我认知数据

python3 generate_selfcognition.py --save-path ./self_cognition.jsonl

💬 指令微调数据

开启茴香豆server服务后,执行脚本,将得到huixiangdou_conversations.jsonl准确的问答对数据

python3 huixiangdou_rag_QA.py

🔄 模型训练

训练配置代码讲解见训练配置, 🚨其中有个参数需要注意一下:accumulative_counts = 1 #单卡训练切记改成1,不然会有问题,🚨切记切记!!!

命令行直接如下操作:

QLoRA+deepspeed训练

#增量预训练
xtuner train ./xtuner_config/pretrain/internlm2_5-1_8b-chat_pretrain.py  --work-dir ./pretrain --deepspeed deepspeed_zero1

#指令微调
xtuner train ./xtuner_config/finetune/internlm2_5_chat_1_8b_qlora_wulewule_all_test.py  --work-dir ./finetune --deepspeed deepspeed_zero1

模型转换 + LoRA 合并

export MKL_SERVICE_FORCE_INTEL=1
export MKL_THREADING_LAYER=GNU
##指令微调为例子,先获取最后保存的一个pth文件
pth_file=`ls -t ./finetune/internlm2_5_chat_1_8b_qlora_wulewule_all_test.py/*.pth | head -n 1| sed 's/:$//' `
# 转换格式
xtuner convert pth_to_hf ./internlm2_5_chat_1_8b_qlora_wulewule_all_test.py ${pth_file} ./hf
# 合并参数
xtuner convert merge /root/models/internlm2_5-1_8b-chat ./hf /root/wulewule/models/wulewule_v1_1_8b --max-shard-size 2GB

🎨 模型量化

使用一下命令对模型采取w4a16量化,更多操作请参考lmdeploy官网文档

lmdeploy lite auto_awq \
   /root/wulewule/models/wulewule_v1_1_8b \
  --calib-dataset 'ptb' \
  --calib-samples 128 \
  --calib-seqlen 2048 \
  --w-bits 4 \
  --w-group-size 128 \
  --batch-size 1 \
  --search-scale False \
  --work-dir /root/wulewule/models/wulewule_v1_1_8b-w4a16-4bit

量化前后速度对比

Model Toolkit Speed (words/s)
wulewule_v1_1_8b transformer 68.0986
wulewule_v1_1_8b-w4a16-4bit LMDeploy (Turbomind) 667.8319

修改configs/model_cfg.yaml文件开启基于lmdeploy的w4a16-4bit模型(默认开启);deploy/lmdeploy_model.py里是一个简单的demo,修改配置后可以直接执行

python3 deploy/lmdeploy_model.py

🔎 RAG(检索增强生成)

默认data目录为txt数据源目录,开启RAG后,会使用bce-embedding-base_v1自动将data目录下的txt数据转为换chroma向量库数据,存放在rag/chroma 目录下(如果该目录下已有数据库文件,则跳过数据库创建),然后使用bce-reranker-base_v1对检索到的信息重排序后,将问题和上下文一起给模型得到最终输出。rag/simple_rag.py里是一个简单的demo,参数配置见configs/rag_cfg.yaml

RAG代码讲解见rag配置

📲 Agent(智能体)

修改configs/agent_cfg.yaml配置文件,默认使用SiliconFlow API的远端LLM、Embeddings模型。Agent中Rag工具是加载data目录下的txt数据构建知识库,另外还有文本转语音、文生图工具,这两者均调用SiliconFlow API实现。

📅 开发计划

🌟 初版功能

  • 游戏角色、背景故事、原著联系等知识问答助手

  • 使用RAG支持游戏攻略、菜单、网络梗等新鲜知识的更新

  • 基于OpenXLab使用LMDepoly实现初版demo部署

  • 增加history记忆,增加标准测试集,opencompass评估模型性能

🤖 多模态版本

  • 收集多模态的数据(文字、图片/视频的结构化数据)

  • 微调多模态模型,支持多模态的输入和输出,给到游戏攻略和指导

  • 优化部署效果,提升用户体验

  • 优化代码框架,尝试拓展至其他游戏

🙏 致谢

非常感谢以下这些开源项目给予我们的帮助:

最后感谢上海人工智能实验室推出的书生·浦语大模型实战营,为我们的项目提供宝贵的技术指导和强大的算力支持!

⚠️ 免责声明

本项目相关资源仅供学术研究之用,严禁用于商业用途。 使用涉及第三方代码的部分时,请严格遵循相应的开源协议。模型生成的内容受模型计算、随机性和量化精度损失等因素影响,本项目不对其准确性作出保证。对于模型输出的任何内容,本项目不承担任何法律责任,亦不对因使用相关资源和输出结果而可能产生的任何损失承担责任。本项目由个人及协作者业余时间发起并维护,因此无法保证能及时回复解决相应问题。

About

基于InterLM的《黑神话:悟空》AI小助手,了解更多背后的故事--在更新视频中

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages