diff --git a/README.md b/README.md index 30260ca..3c70573 100644 --- a/README.md +++ b/README.md @@ -126,6 +126,8 @@ pkuseg具有如下几个特点: #### 代码示例 +以下代码示例适用于python交互式环境。 + 代码示例1:使用默认模型及默认词典分词 ```python3 import pkuseg @@ -163,6 +165,7 @@ pkuseg.test('input.txt', 'output.txt', nthread=20) # 对input.txt的文件 # 使用默认模型和词典,开20个进程 ``` + 代码示例5:训练新模型 ```python3 import pkuseg @@ -172,6 +175,24 @@ import pkuseg # 模型存到'./models'目录下,开20个进程训练模型 pkuseg.train('msr_training.utf8', 'msr_test_gold.utf8', './models', nthread=20) ``` + +#### 多进程 + +当将以上代码示例置于文件中运行时,如涉及多进程功能,请务必使用`if __name__ == '__main__'`保护全局语句,如: +mp.py文件 +```python3 +import pkuseg + +if __name__ == '__main__': + pkuseg.test('input.txt', 'output.txt', nthread=20) + pkuseg.train('msr_training.utf8', 'msr_test_gold.utf8', './models', nthread=20) +``` +运行 +``` +python3 mp.py +``` +详见[无法使用多进程分词和训练功能,提示RuntimeError和BrokenPipeError](https://github.com/lancopku/pkuseg-python/wiki#3-无法使用多进程分词和训练功能提示runtimeerror和brokenpipeerror)。 + #### 参数说明 模型配置 @@ -266,11 +287,12 @@ year = {2016}} 1. [为什么要发布pkuseg?](https://github.com/lancopku/pkuseg-python/wiki#1-为什么要发布pkuseg) 2. [pkuseg使用了哪些技术?](https://github.com/lancopku/pkuseg-python/wiki#2-pkuseg使用了哪些技术) -3. [是如何跟其它工具包在细领域数据上进行比较的?](https://github.com/lancopku/pkuseg-python/wiki#3-是如何跟其它工具包在细领域数据上进行比较的) -4. [在黑盒测试集上进行比较的话,效果如何?](https://github.com/lancopku/pkuseg-python/wiki#4-在黑盒测试集上进行比较的话,效果如何) -5. [如果我不了解待分词语料的所属领域呢?](https://github.com/lancopku/pkuseg-python/wiki#5-如果我不了解待分词语料的所属领域呢) -6. [如何看待在一些特定样例上的分词结果?](https://github.com/lancopku/pkuseg-python/wiki#6-如何看待在一些特定样例上的分词结果) -7. [如何看待网络上的文稿?](https://github.com/lancopku/pkuseg-python/wiki#7-如何看待网络上的文稿) +3. [无法使用多进程分词和训练功能,提示RuntimeError和BrokenPipeError。](https://github.com/lancopku/pkuseg-python/wiki#3-无法使用多进程分词和训练功能提示runtimeerror和brokenpipeerror) +4. [是如何跟其它工具包在细领域数据上进行比较的?](https://github.com/lancopku/pkuseg-python/wiki#4-是如何跟其它工具包在细领域数据上进行比较的) +5. [在黑盒测试集上进行比较的话,效果如何?](https://github.com/lancopku/pkuseg-python/wiki#5-在黑盒测试集上进行比较的话效果如何) +6. [如果我不了解待分词语料的所属领域呢?](https://github.com/lancopku/pkuseg-python/wiki#6-如果我不了解待分词语料的所属领域呢) +7. [如何看待在一些特定样例上的分词结果?](https://github.com/lancopku/pkuseg-python/wiki#7-如何看待在一些特定样例上的分词结果) +8. [如何看待网络上的文稿?](https://github.com/lancopku/pkuseg-python/wiki#8-如何看待网络上的文稿)