docs:shb update category and note

HUSTAI · Nov 1, 2023 · 103b194 · 103b194
1 parent 457714b
commit 103b194
Show file tree

Hide file tree

Showing 12 changed files with 504 additions and 504 deletions.
diff --git a/README.md b/README.md
@@ -13,7 +13,7 @@
 
 `category` 请从以下类别中选择
 
-- `RAG`
+- 检索增强生成(`RAG`)
 - 语言模型(`LLM`)
 - 提示技术(`Prompt`)
 - 微调技术(`Finetune`)

diff --git a/src/zh/README.md b/src/zh/README.md
@@ -12,7 +12,7 @@ article: false
 
 projects:
   - icon: circle-question
-    name: RAG
+    name: 检索增强生成(RAG)
     link: /zh/category/rag/
 
   - icon: circle-question
@@ -40,7 +40,7 @@ projects:
     link: /zh/category/大模型推理/
 
   - icon: puzzle-piece
-    name: Token
+    name: Token、分词
     link: /zh/category/token/
 
 footer: 分享知识-分享快乐

diff --git a/src/zh/posts/README.md b/src/zh/posts/README.md
@@ -9,11 +9,11 @@ article: false
 
 本页面包含一些论文分享的分类：
 
-- [RAG](./rag/)
+- [检索增强生成(RAG)](./rag/)
 - [语言模型](./llm/)
 - [提示技术](./prompt/)
 - [微调技术](./finetune/)
 - [评估方法](./eval/)
 - [数据集](./dataset/)
 - [大模型推理](./reasoning/)
-- [Token](./token/)
+- [Token、分词](./token/)
diff --git a/src/zh/posts/eval/M3KE.md b/src/zh/posts/eval/M3KE.md
@@ -7,11 +7,11 @@ date: 2023-07-08
 tag:
   - 语言模型
   - 评估
-shortTitle: M3KE数据集分享
+shortTitle: M3KE-大模型中文评估
 ---
 
 
-# M3KE评估数据集分享
+# M3KE-大模型中文能力综合评估
 
 M3KE数据集是一种针对大语言模型的多层次、多主题的知识评估数据集，旨在衡量中文大型语言模型在零样本和少样本设置中获取知识的能力。
 
@@ -26,12 +26,12 @@ M3KE数据集是一种针对大语言模型的多层次、多主题的知识评
 :::
 
 
-## 1 数据集数据
+## 1 评估数据
 M3KE 收集了 20,477 个真人标准化考试题目（包含 4 个候选答案），覆盖 71 个任务，包括小学、初中、高中、大学、研究生入学考试题目，涉及人文、历史、政治、法律、教育、心理学、科学、工程技术、艺术等学科。
 
 ![图1.1 M3KE数据集中任务分布](/assets/images/eval/M3KE_1.png "图1.1 M3KE数据集中任务分布" =430x400)
 
-## 2 数据集优势
+## 2 评估优势
 （1） 契合中国教育体系，覆盖多教育阶段
 研究人员模仿中国学生的教育经历，即小学、初中、高中、大学等主要教育阶段，旨在评估中文大模型在不同教育阶段下的表现。由于每个教育阶段需要掌握的知识点不同（例如，在语文学科中，小学和初中的知识或考点存在明显的差异），因此，M3KE 在不同教育阶段会包含相同的学科。为了提高数据集中学科知识点的覆盖范围，研究人员选择了中国升学考试中的统考试题，包括小升初、中考、高考，研究生入学考试和中国公务员考试等真题题目。
 （2） 覆盖多学科领域

diff --git a/src/zh/posts/rag/README.md b/src/zh/posts/rag/README.md
@@ -1,5 +1,5 @@
 ---
-title: RAG
+title: 检索增强生成(RAG)
 icon: puzzle-piece
 index: false
 article: false

diff --git a/src/zh/posts/prompt/CoT.md → src/zh/posts/reasoning/CoT.md b/src/zh/posts/prompt/CoT.md → src/zh/posts/reasoning/CoT.md
@@ -1,88 +1,88 @@
----
-author: lx
-icon: wand-magic-sparkles
-date: 2023-06-05
-shortTitle: "Chain-of-Thought: 思维链"
-category:
-  - 提示技术
-tag:
-  - 推理
-  - LLM
-  - CoT
----
-
-# Chain-of-Thought: 思维链
-
-该文介绍了 `Chain-of-Thought: 思维链` 框架，结合 `in-context`, `few-shot prompting` 以及多步中间推理，通过大模型来改善数学计算、常识推理的效果。
-
-<!-- more -->
-
-::: tip
-论文题目：Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
-作者：Jason Wei, Xuezhi Wang, Dale Schuurmans, Maarten Bosma, Brian Ichter, Fei Xia, Ed H. Chi, Quoc V. Le, Denny Zhou
-机构：Google
-:::
-
-<PDF url="https://arxiv.org/pdf/2201.11903.pdf" />
-
-<BiliBili bvid="BV1t8411e7Ug" />
-
----
-
-## 1 背景介绍
-
-> 语言模型的本质是对任意一段文本序列的概率进行建模
-
-用一个训练好的大语言模型求解推理任务的几种范式：
-
-### 1.1 Zero-Shot
-
-![图1.1 Zero-Shot](/assets/images/prompt/cot1.png "图1.1 Zero-Shot" =550x)
-
-这里语言模型的输入就是一道数学题，连接上一个字符串 `The answer is`，然后让语言模型帮助续写。续写的答案就是80。
-
-### 1.2 Zero-Shot-CoT
-
-![图1.2 Zero-Shot-CoT](/assets/images/prompt/cot2.png "图1.2 Zero-Shot-CoT" =550x)
-
-`Zero-Shot-CoT` 在 `Zero-Shot` 的基础上增加了一句 `Let's think step by step.`，大语言模型会自动续写推理过程并得出最后的答案。
-
-### 1.3 Manual-CoT
-
-![图1.3 Manual-CoT](/assets/images/prompt/cot3.png "图1.3 Manual-CoT" =400x)
-
-在输入问题之前，**手动设计**一些问题和答案的样例。`Manual-CoT` 比 `Zero-Shot-CoT` 的性能要好，因为在输入端提供了问题，推理，答案的样例供参考。然而为了提供这些样例就需要人工设计，这就增加了人工的成本。
-
-### 1.4 Auto-CoT
-
-![图1.4 Auto-CoT](/assets/images/prompt/cot4.png "图1.4 Auto-CoT" =400x)
-
-如何将人工设计样例的过程自动化？步骤如下：
-（1）通过多样性选择有代表性的问题
-（2）对于每一个采样的问题，接上 `Let's think step by step.`，直接丢给语言模型，让它帮我们生成中间推理步骤和答案。然后把所有采样的问题和模型自动生成的推理步骤和答案全部拼接在一起来构成 `Few-Shot-Learning` 所需要的样例，最后跟上下面需要求解的问题，一起丢给语言模型，让其帮我们续写。
-
-
-## 2 思路
-
-结合 `in-context`, `few-shot prompting` 以及多步中间推理，通过大模型来改善数学计算、常识推理的效果
-
-![图2.1 CoT](/assets/images/prompt/cot5.png "图2.1 CoT" =600x)
-
-`CoT` 思维链的灵感来源于人做推理的过程，作者借鉴了这个过程，通过设计类似于思维链来激发大模型，使之拥有推理能力，并且能由于这个有逻辑性的思维链的存在，多步的中间推到可以得到最终的正确答案。
-
-![图2.2 CoT Examplars](/assets/images/prompt/cot6.png "图2.2 CoT Examplars" =600x)
-
-## 3 实验结果
-
-![图3.1 不同模型实验结果](/assets/images/prompt/cot7.png "图3.1 不同模型实验结果" =480x)
-
-100B（1000亿参数）参数量以下的模型效果不好，侧面反映了他们的instruct fine-tune不够，COT很难激发他的in-context 推理能力。而在100B以上模型效果很好，甚至超过了之前基于监督训练的SOTA模型。
-
-
-## 4 参考
-
-<!--
-[1] [Chain-of-Thought Prompting Elicits Reasoning in Large Language Models](https://zhuanlan.zhihu.com/p/610241799)
-[2] [GOOGLE | COT（chain of thought）开山之作，利用思维链提升复杂问题推理能力一、概述](https://mp.weixin.qq.com/s?__biz=Mzg3Njk2NTc4Mw==&mid=2247483895&idx=1&sn=33ab2fe70af404d528f0771ae5416c87&chksm=cf2b7b0ff85cf21928bba2205f9a3b61b44486bda55947f9f6f2891a4bf6d1b3787cfbf523e5&scene=21#wechat_redirect)
-[3] [CoT开山之作：Chain-of-Thought Prompting Elicits Reasoning in Large Language Models 论文解读](https://zhuanlan.zhihu.com/p/617594574)
--->
+---
+author: lx
+icon: wand-magic-sparkles
+date: 2023-06-05
+shortTitle: "Chain-of-Thought: 思维链"
+category:
+  - 提示技术
+tag:
+  - 推理
+  - LLM
+  - CoT
+---
+
+# Chain-of-Thought: 思维链
+
+该文介绍了 `Chain-of-Thought: 思维链` 框架，结合 `in-context`, `few-shot prompting` 以及多步中间推理，通过大模型来改善数学计算、常识推理的效果。
+
+<!-- more -->
+
+::: tip
+论文题目：Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
+作者：Jason Wei, Xuezhi Wang, Dale Schuurmans, Maarten Bosma, Brian Ichter, Fei Xia, Ed H. Chi, Quoc V. Le, Denny Zhou
+机构：Google
+:::
+
+<PDF url="https://arxiv.org/pdf/2201.11903.pdf" />
+
+<BiliBili bvid="BV1t8411e7Ug" />
+
+---
+
+## 1 背景介绍
+
+> 语言模型的本质是对任意一段文本序列的概率进行建模
+
+用一个训练好的大语言模型求解推理任务的几种范式：
+
+### 1.1 Zero-Shot
+
+![图1.1 Zero-Shot](/assets/images/prompt/cot1.png "图1.1 Zero-Shot" =550x)
+
+这里语言模型的输入就是一道数学题，连接上一个字符串 `The answer is`，然后让语言模型帮助续写。续写的答案就是80。
+
+### 1.2 Zero-Shot-CoT
+
+![图1.2 Zero-Shot-CoT](/assets/images/prompt/cot2.png "图1.2 Zero-Shot-CoT" =550x)
+
+`Zero-Shot-CoT` 在 `Zero-Shot` 的基础上增加了一句 `Let's think step by step.`，大语言模型会自动续写推理过程并得出最后的答案。
+
+### 1.3 Manual-CoT
+
+![图1.3 Manual-CoT](/assets/images/prompt/cot3.png "图1.3 Manual-CoT" =400x)
+
+在输入问题之前，**手动设计**一些问题和答案的样例。`Manual-CoT` 比 `Zero-Shot-CoT` 的性能要好，因为在输入端提供了问题，推理，答案的样例供参考。然而为了提供这些样例就需要人工设计，这就增加了人工的成本。
+
+### 1.4 Auto-CoT
+
+![图1.4 Auto-CoT](/assets/images/prompt/cot4.png "图1.4 Auto-CoT" =400x)
+
+如何将人工设计样例的过程自动化？步骤如下：
+（1）通过多样性选择有代表性的问题
+（2）对于每一个采样的问题，接上 `Let's think step by step.`，直接丢给语言模型，让它帮我们生成中间推理步骤和答案。然后把所有采样的问题和模型自动生成的推理步骤和答案全部拼接在一起来构成 `Few-Shot-Learning` 所需要的样例，最后跟上下面需要求解的问题，一起丢给语言模型，让其帮我们续写。
+
+
+## 2 思路
+
+结合 `in-context`, `few-shot prompting` 以及多步中间推理，通过大模型来改善数学计算、常识推理的效果
+
+![图2.1 CoT](/assets/images/prompt/cot5.png "图2.1 CoT" =600x)
+
+`CoT` 思维链的灵感来源于人做推理的过程，作者借鉴了这个过程，通过设计类似于思维链来激发大模型，使之拥有推理能力，并且能由于这个有逻辑性的思维链的存在，多步的中间推到可以得到最终的正确答案。
+
+![图2.2 CoT Examplars](/assets/images/prompt/cot6.png "图2.2 CoT Examplars" =600x)
+
+## 3 实验结果
+
+![图3.1 不同模型实验结果](/assets/images/prompt/cot7.png "图3.1 不同模型实验结果" =480x)
+
+100B（1000亿参数）参数量以下的模型效果不好，侧面反映了他们的instruct fine-tune不够，COT很难激发他的in-context 推理能力。而在100B以上模型效果很好，甚至超过了之前基于监督训练的SOTA模型。
+
+
+## 4 参考
+
+<!--
+[1] [Chain-of-Thought Prompting Elicits Reasoning in Large Language Models](https://zhuanlan.zhihu.com/p/610241799)
+[2] [GOOGLE | COT（chain of thought）开山之作，利用思维链提升复杂问题推理能力一、概述](https://mp.weixin.qq.com/s?__biz=Mzg3Njk2NTc4Mw==&mid=2247483895&idx=1&sn=33ab2fe70af404d528f0771ae5416c87&chksm=cf2b7b0ff85cf21928bba2205f9a3b61b44486bda55947f9f6f2891a4bf6d1b3787cfbf523e5&scene=21#wechat_redirect)
+[3] [CoT开山之作：Chain-of-Thought Prompting Elicits Reasoning in Large Language Models 论文解读](https://zhuanlan.zhihu.com/p/617594574)
+-->
diff --git a/src/zh/posts/prompt/GoT.md → src/zh/posts/reasoning/GoT.md b/src/zh/posts/prompt/GoT.md → src/zh/posts/reasoning/GoT.md