本文旨在介绍如何利用HanLP训练分词模型,包括语料格式、语料预处理、训练接口、输出格式等。 目前HanLP内置的训练接口是针对一阶HMM-NGram设计的,另外附带了通用的语料加载工具,可以通过少量代码导出供其他训练工具使用的特定格式(如CRF++)。语料格式输入语料格式为人民...
全文
回复(0) 2019-02-13 15:01 来自版块 - 网络技术
表情
啊哦,还没有人评论哦,赶快抢个沙发!

返回顶部