Skip to content

Latest commit

 

History

History
16 lines (12 loc) · 609 Bytes

README.md

File metadata and controls

16 lines (12 loc) · 609 Bytes

Qwen

1.模型介绍

通义千问(Qwen) 是阿里云研发的通义千问大模型系列的模型, 有 70 亿和 140 亿两个规模。Qwen是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。

支持模型权重:

Model
qwen/qwen-7b
qwen/qwen-7b-chat
qwen/qwen-14b
qwen/qwen-14b-chat

2. 模型精调

请参考LLM全流程工具介绍