-
1. 官方文档及参考链接 l 关于词典问题Issue,首先参考:FAQ l 自定义词典其实是基于...hadoop小学生 (11-02 11:07)0/3572
-
HanLP方法封装类: 1. # -*- coding:utf-8 -*- 2. # Filen...hadoop小学生 (10-31 11:06)0/4895
-
在分布式Web程序设计中,解决高并发以及内部解耦的关键技术离不开缓存和队列,而缓存角色类似计算机硬件...hadoop小学生 (10-29 16:44)0/6481
-
在看源码之前,先看几遍论文《基于角色标注的中国人名自动识别研究》 关于命名识别的一些问题,可参考下...hadoop小学生 (10-29 11:37)0/3736
-
数据缺失是数据科学家在处理数据时经常遇到的问题,本文作者基于不同的情境提供了相应的数据插补解决办法。...hadoop小学生 (10-26 15:39)0/4391
-
众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描...hadoop小学生 (10-26 13:50)0/4744
-
从事大数据行业的朋友应该都知道大数据已经上升到了国家战略高度,2015年8月31日,国务院印发了《促...hadoop小学生 (10-23 15:48)0/5149
-
天写完了人名识别模块,与分词放到一起形成了两层隐马模型。虽然在算法或模型上没有什么新意,但是胜在训练...hadoop小学生 (10-22 15:30)0/5134
-
大数据也不是近几年才出现的新东西,只是最近几年才真正意义上变得热门、火爆!而这要得益于互联网信息技术...hadoop小学生 (10-19 15:05)0/4796
-
与基于隐马尔可夫模型的最短路径分词、N-最短路径分词相比,基于条件随机场(CRF)的分词对未登录词有...hadoop小学生 (10-19 11:52)0/3554
-
大数据的时代已经来了,信息的爆炸式增长使得越来越多的行业面临这大量数据需要存储和分析的挑战。Hado...hadoop小学生 (10-17 15:08)0/5107
-
生成式句法分析指的是,生成一系列依存句法树,从它们中用特定算法挑出概率最大那一棵。句法分析中,生成模...hadoop小学生 (10-17 13:16)0/4665
-
近年,随着互联网的发展特别是移动互联网的发展,数据的增长呈现出一种爆炸式的成长势头。单是谷歌的爬虫程...hadoop小学生 (10-15 15:56)0/5186
-
前言: 文本分类任务的第1步,就是对语料进行分词。在单机模式下,可以选择python jieba分...hadoop小学生 (10-15 13:52)0/4725
-
Hadoop集群环境搭建是很多学习hadoop学习者或者是使用者都必然要面对的一个问题,网上关于ha...hadoop小学生 (10-12 15:45)0/4348
-
中文分词是中文文本处理的基础步骤,也是中文人机自然语言交互的基础模块。由于中文句子中没有词的界限,因...hadoop小学生 (10-12 11:27)0/7974
-
每家公司在是一个数据公司,在一定范围能够使用机器学习在云中部署智能应用程序,这归功于三个机器学习的趋...hadoop小学生 (10-10 14:26)0/4453
-
之前在spark环境中一直用的是portable版本,词条数量不是很够,且有心想把jieba,swc...hadoop小学生 (10-10 10:32)0/4104
-
1、通过git下载分词器代码。 连接如下:https://gitee.com/hualongdata...hadoop小学生 (10-09 09:14)0/4000
-
最近一段时间一直在接触关于hadoop方面的内容,从刚接触时的一片空白,到现在也能够说清楚一些问...hadoop小学生 (09-20 15:56)0/3839
-
Hanlp是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。Hanlp具备...hadoop小学生 (09-19 13:11)0/4038
-
一、Hadoop是什么? 首次听到hadoop这次单词,相信很多人跟我当时是一样,不免心中画上一个...hadoop小学生 (09-18 11:49)0/4007
-
“学习hadoop需要什么基础”这已经不是一个新鲜的话题了,随便上网搜索一下就能找出成百上千篇的文...hadoop小学生 (09-13 11:46)0/6477
-
【群里独享各种免单福利,请速度加入组织,qq群:146378543 】PS:关注灯火互联网福利,每天...w1355660324 (08-04 17:24)25/19354
-
回帖可见benjaminlee (08-03 14:47)56/33314