机器学习

关注该话题
  • 帖子:15
  • 被关注:0
hadoop小学生
hadoop小学生hanlp自然语言处理包的人名识别代码解析
HanLP发射矩阵词典nr.txt中收录单字姓氏393个。袁义达在《中国的三大姓氏是如何统计出来的》文献中指出:当代中国100个常见姓氏中,集中了全国人口的87%,根据这一数据我们只保留nr.txt中的100个常见词语的姓氏角色,其他词语去掉其姓氏角...
2019-08-02 10:00 来自版块 - 网络技术
hadoop小学生
hadoop小学生Hanlp-地名识别调试方法详解
HanLP收词特别是实体比较多,因此特别容易造成误识别。下边举几个地名误识别的例子,需要指出的是,后边的机构名识别也以地名识别为基础,因此,如果地名识别不准确,也会导致机构名识别不准确。 类型1 数字+地名 [1] 暗访哈尔滨网约车:下10...
2019-07-29 10:54 来自版块 - 网络技术
hadoop小学生
hadoop小学生HanLP-地名识别调试方法
HanLP收词特别是实体比较多,因此特别容易造成误识别。下边举几个地名误识别的例子,需要指出的是,后边的机构名识别也以地名识别为基础,因此,如果地名识别不准确,也会导致机构名识别不准确。 类型1 数字+地名 [1] 暗访哈尔滨网约车:下10...
2019-07-19 10:42 来自版块 - 网络技术
hadoop小学生
hadoop小学生自然语言处理工具中的中文分词器介绍
中文分词是中文文本处理的一个基础步骤,也是中文人机自然语言交互的基础模块,不同于英文的是,中文句子中没有词的界限,因此在进行中文自然语言处理时,通常需要先进行分词,分词效果将直接影响词性,句法树等模块的效果,当然分词只是一个工具,场景不同,要求也不同...
2019-06-24 10:37 来自版块 - 网络技术
hadoop小学生
hadoop小学生比较好的中文分词方案汇总推荐
中文分词是中文文本处理的一个基础步骤,也是中文人机自然语言交互的基础模块。不同于英文的是,中文句子中没有词的界限,因此在进行中文自然语言处理时,通常需要先进行分词,分词效果将直接影响词性、句法树等模块的效果。当然分词只是一个工具,场景不同,要求也不同...
2019-05-13 10:17 来自版块 - 网络技术
hadoop小学生
hadoop小学生hanlp提取文本关键词的使用方法记录
本文是csu_zipple 分享的关于使用hanlp汉语言处理包提取关键词的过程一个简单的记录分享。想要使用hanlp提取文本关键词的新手朋友们可以参考学习一下! 如何在一段文本之中提取出相应的关键词呢? 之前有想过用机器学习的方法来进行词法分析,...
2019-03-01 09:26 来自版块 - 网络技术
hadoop小学生
hadoop小学生HanLP分词命名实体提取详解
HanLP分词命名实体提取详解 分享一篇大神的关于hanlp分词命名实体提取的经验文章,文章中分享的内容略有一段时间(使用的hanlp版本比较老),最新一版的hanlp已经出来了,也可以去看看新版的hanlp在这方面有何提升! 文本挖掘是抽取有效...
2019-01-11 14:14 来自版块 - 网络技术
hadoop小学生
hadoop小学生大数据hadoop入门之hadoop家族产品详解
大数据这个词也许几年前你听着还会觉得陌生,但我相信你现在听到hadoop这个词的时候你应该都会觉得“熟悉”!越来越发现身边从事hadoop开发或者是正在学习hadoop的人变多了。作为一个hadoop入门级的新手,你会觉得哪些地方很难呢?运行环境的搭...
2018-12-26 15:03 来自版块 - 网络技术
hadoop小学生
hadoop小学生hadoop和spark的区别
学习hadoop已经有很长一段时间了,好像是二三月份的时候朋友给了一个国产Hadoop发行版下载地址,因为还是在学习阶段就下载了一个三节点的学习版玩一下。在研究、学习hadoop的朋友可以去找一下看看(发行版DKhadoop,去大快的网站上应...
2018-11-30 16:15 来自版块 - 网络技术
hadoop小学生
hadoop小学生自然语言处理怎么最快入门?
本文整理自知乎上的一个问答,分享给正在学习自然然语言处理的朋友们! 一、自然语言处理是什么? 自然语言处理说白了,就是让机器去帮助我们完成一些语言层面的事情,典型的比如:情感分析、文本摘要、自动问答等等。我们日常场景中比较常见到的类似Siri...
2018-11-28 10:08 来自版块 - 网络技术

热门话题


返回顶部