与基于隐马尔可夫模型的最短路径分词、N-最短路径分词相比,基于条件随机场(CRF)的分词对未登录词有更好的支持。本文(HanLP)使用纯Java实现CRF模型的读取与维特比后向解码,内部特征函数采用 双数组Trie树(DoubleArrayTrie)储存,得到了一个高性能的中文分...
全文
回复(0) 2018-10-19 11:52 来自版块 - 网络技术
表情
啊哦,还没有人评论哦,赶快抢个沙发!

返回顶部