Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于词库管理的小建议 (已解决) #15

Open
GoogleCodeExporter opened this issue Mar 9, 2016 · 3 comments
Open

关于词库管理的小建议 (已解决) #15

GoogleCodeExporter opened this issue Mar 9, 2016 · 3 comments

Comments

@GoogleCodeExporter
Copy link
Contributor

用了几个分词器,效果不理想,最后还是找到这个分词器,��
�果不错,感谢作者的贡献,在使用过程中,想到有一点建议�
��
配置文件中词库路径能不能支持多个路径的载入?这样可以��
�便一点点词库的规划
自动重载词库能不能支持正则表达式匹配词库文件载入?

非常感谢作者贡献这么好的分词器d=(´▽`)=b

Original issue reported on code.google.com by [email protected] on 29 Nov 2013 at 2:08

@GoogleCodeExporter
Copy link
Contributor Author

1. 
配置文件只是方便初始化,简化工作。jcseg提供了对应的API来
指定从对应的文件或者目录加载词库。 
自主开发的话可以很好的解决这个问题。。。

2. 词库的重载支持正则, 这个想法挺好的。

我会加载下期的版本中加入你说的这些功能,感谢你的反馈��
�

也感谢你的夸奖。。。。

Original comment by [email protected] on 29 Nov 2013 at 2:04

  • Changed title: 关于词库管理的小建议 (已解决)

@GoogleCodeExporter
Copy link
Contributor Author

还有一个问题,就是那个在core里面的ADictionary这个类里面的lo
adWordFromFile的方法,有几个个这样的判断if ( 
config.LOAD_CJK_PINYIN && ! "null".equals(wd[2]) ) 建议加上非空判断if ( 
config.LOAD_CJK_PINYIN && wd[2]!=null &&! "null".equals(wd[2]) ) 
不知道是不是编译的问题(建议最好在说明写上编译版本)��
�我载入词库的时候总是说有转换Int异常,应该是335行那里的�
��题,但是MyEclipse不能够追踪到代码行数(TOT),我将源��
�加上空判断之后编译就跑过了
( ゚∀゚)アハハ

Original comment by [email protected] on 2 Dec 2013 at 3:45

@GoogleCodeExporter
Copy link
Contributor Author

@thunderbird.shun

你自定义的词库吧. 自定义的词库注意词库的格式.

我起初的想法是: 如果出错了, 会影响词库的加载, 
与其屏蔽掉这种错误, 不如让其暴露出来, 
让开发者明白发生了什么事情.

感谢你的建议, 下个版本加入更友好的提示...

Original comment by [email protected] on 3 Dec 2013 at 1:46

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant