在进行文本分类(非情感分类)时,我们经常只保留实词(名、动、形)等词,为了文本分类的分词方便,HanLP专门提供了实词分词器类NotionalTokenizer,同时在分类数据集加载处理时,默认使用了NotionalTokenizer分词器。在HanLPJava版代码库中可以查看...
全文
回复(0) 2019-05-27 10:36 来自版块 - 网络技术
表情
啊哦,还没有人评论哦,赶快抢个沙发!

返回顶部