• 帖子:91
  • 被关注:0
hadoop小学生
hadoop小学生大快搜索黑科技亮相2019(第四届)大数据产业生态大会
深耕核心技术·赋能数字化转型 图1:2019(第四届)大数据产业生态大会 8月1日,以“激活数据价值 释放数据原力”为主题的“2019(第四届)大数据产业生态大会”在北京拉开序幕。北京大学教授、工业和信息化部原副部长杨学山,工业和信息化部信息...
2019-08-07 16:53 来自版块 - 网络技术
hadoop小学生
hadoop小学生hanlp分词工具应用案例:商品图自动推荐功能的应用
本篇分享一个hanlp分词工具应用的案例,简单来说就是做一图库,让商家轻松方便的配置商品的图片,最好是可以一键完成配置的。 先看一下效果图吧: 商品单个推荐效果:匹配度高的放在最前面 这个想法很好,那怎么实现了。分析了一下解决方案步骤...
2019-08-07 11:43 来自版块 - 网络技术
hadoop小学生
hadoop小学生HanLP分词工具中的ViterbiSegment分词流程
本篇文章将重点讲解HanLP的ViterbiSegment分词器类,而不涉及感知机和条件随机场分词器,也不涉及基于字的分词器。因为这些分词器都不是我们在实践中常用的,而且ViterbiSegment也是作者直接封装到HanLP类中的分词器,作者也推荐...
2019-08-05 10:31 来自版块 - 网络技术
hadoop小学生
hadoop小学生hanlp自然语言处理包的人名识别代码解析
HanLP发射矩阵词典nr.txt中收录单字姓氏393个。袁义达在《中国的三大姓氏是如何统计出来的》文献中指出:当代中国100个常见姓氏中,集中了全国人口的87%,根据这一数据我们只保留nr.txt中的100个常见词语的姓氏角色,其他词语去掉其姓氏角...
2019-08-02 10:00 来自版块 - 网络技术
hadoop小学生
hadoop小学生HanLP-命名实体识别总结
人名识别 在HanLP中,基于角色标注识别了中国人名。首先系统利用隐马尔可夫模型标注每个词语的角色,之后利用最大模式匹配法对角色序列进行匹配,匹配上模式的即为人名。理论指导文章为:《基于角色标注的中国人名自动识别研究》,大家可以百度一下看看 地名...
2019-07-31 13:08 来自版块 - 网络技术
hadoop小学生
hadoop小学生Hanlp-地名识别调试方法详解
HanLP收词特别是实体比较多,因此特别容易造成误识别。下边举几个地名误识别的例子,需要指出的是,后边的机构名识别也以地名识别为基础,因此,如果地名识别不准确,也会导致机构名识别不准确。 类型1 数字+地名 [1] 暗访哈尔滨网约车:下10...
2019-07-29 10:54 来自版块 - 网络技术
hadoop小学生
hadoop小学生HanLP-地名识别调试方法
HanLP收词特别是实体比较多,因此特别容易造成误识别。下边举几个地名误识别的例子,需要指出的是,后边的机构名识别也以地名识别为基础,因此,如果地名识别不准确,也会导致机构名识别不准确。 类型1 数字+地名 [1] 暗访哈尔滨网约车:下10...
2019-07-19 10:42 来自版块 - 网络技术
hadoop小学生
hadoop小学生python调用hanlp进行命名实体识别
本文分享自 6丁一的猫 的博客,主要是python调用hanlp进行命名实体识别的方法介绍。以下为分享的全文。 1、python与jdk版本位数一致 2、pip install jpype1(python3.5) 3、类库hanl...
2019-07-15 09:57 来自版块 - 网络技术
hadoop小学生
hadoop小学生hanlp添加自定义字典的步骤介绍
本篇分享一个hanlp添加自定义字典的方法,供大家参考! 总共分为两步: 第一步:将自定义的字典放到custom目录下,然后删除CustomDicionary.txt.bin,因为分词的时候会读这个文件。如果没有的话它会根据配置文件中路径去加载字...
2019-07-12 10:22 来自版块 - 网络技术
hadoop小学生
hadoop小学生Spring MVCD框架中调用HanLP分词的方法
项目简要:关于java web的一个项目,用的Spring MVCd 框架。鉴于参与此次项目的人中并不是所人都做的Spring,为了能够提高效率,建议大家是先抛开SPring来写自己负责的模块,最后再把各个模块在Spring里面集成。 项目里有一个...
2019-07-10 10:29 来自版块 - 网络技术

返回顶部