Skip to content

Releases: hankcs/HanLP

v1.2.1

08 May 03:53
Compare
Choose a tag to compare
  1. fixed issue #10
  2. data与data-for-1.2.0.zip兼容,不必升级

v1.2.0新增TnT分词器

07 May 13:42
Compare
Choose a tag to compare
  1. 分词器支持数词和数量词识别
  2. 消除CRF分词对句子开头的词语的错误合并
  3. 实现了一个基于HMM2-Trigram字符序列标注的分词器
  4. 加入了一些防止缓存不兼容的安全措施
  5. 词典减肥,新增TnT模型:data-for-1.2.0.zip
  6. 重构分词器
    image

v1.1.5内存优化

02 May 15:32
Compare
Choose a tag to compare
  1. 词典由AhoCorasickDoubleArrayTrie降级为DoubleArrayTrie,内存占用减少一半
  2. 所以词典的缓存与旧版不兼容,请删除缓存或者下载data-for-1.1.5.zip
  3. 为减小配置难度,提供内置了mini数据包的Portable版,零配置,可以通过Maven直接引入:
        <dependency>
            <groupId>com.hankcs</groupId>
            <artifactId>hanlp</artifactId>
            <version>portable-1.1.5</version>
        </dependency>

v1.1.4

28 Apr 11:20
Compare
Choose a tag to compare
  1. 优化了Viterbi分词速度
  2. 降低了人名识别误命中率
  3. 调整词性标注时的Viterbi算法
  4. 大幅改进CRF分词效果,并且提供新模型(与旧版本不兼容)

v1.1.3

15 Apr 08:49
Compare
Choose a tag to compare
  1. 新增了分词结果是否展示词性的配置项ShowTermNature=true
  2. 修复了停用词词典编码的潜在问题
  3. CRF算法微调,等待未来重新发布新模型
  4. 最大词频参数微调

v1.1.2

02 Apr 13:47
Compare
Choose a tag to compare

fixed issue #2

v1.1.1

31 Mar 11:46
Compare
Choose a tag to compare

修复两个词典路径问题

v1.1.0首发版

27 Mar 07:34
Compare
Choose a tag to compare

中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxEnt依存句法分析、CRF依存句法分析)
需要jdk1.6以上

内部版本

12 Feb 09:30
Compare
Choose a tag to compare
内部版本 Pre-release
Pre-release

定义了基本接口,完成了大部分文档。
需要jdk1.7。