hadoop小学生
精灵王
精灵王
  • 注册日期2018-09-13
  • 发帖数160
  • QQ3234520070
  • 火币360枚
  • 粉丝0
  • 关注0
阅读:21502回复:0

自然语言处理工具hanlp定制用户词条

楼主#
更多 发布于:2019-05-20 10:12
关于hanlp的文章已经分享过很多,似乎好像大部分以理论性的居多。最近有在整理一些hanlp应用项目中的文章,待整理完成后会陆续分享出来。本篇分享的依然是由baiziyu 分享的一篇文章,感兴趣的可以在知乎上关注下他的专栏,写的还是挺好的!

以下为文章的主要内容:
自定义词表的修改
自定义词表在pyhanlp\static\data\dictionary\custom”路径下的“CustomDictionary.txt”文件中,HanLP.segment支持自定义此词表。如果需要修改自定义词表,则直接编辑文件“CustomDictionary.txt”,之后删除路径下的“CustomDictionary.txt.bin”,运行分词代码后即可自动生效。
验证修改是否生效

图片:图1.jpg


图片:图2.jpg





验证代码
from pyhanlp import *
term_list = HanLP.segment(text)

喜欢0 评分0
DKHadoop用着还不错!
游客

返回顶部