• 帖子:1442
  • 被关注:14
hadoop小学生
hadoop小学生超详细Dkhadoop虚拟机图文安装步骤
前两天看到有人留言问在什么情况下需要部署hadoop,我给的回答也很简单,就是在需要处理海量数据的时候才需要考虑部署hadoop。关于这个问题在很早之前的一篇分享文档也有说到这个问题,数据量少的完全发挥不了hadoop的优势,所以也没必要部署。但对于...
2019-01-07 15:16 来自版块 - 网络技术
hadoop小学生
hadoop小学生pyhanlp 中文词性标注与分词简介
pyhanlp实现的分词器有很多,同时pyhanlp获取hanlp中分词器也有两种方式 第一种是直接从封装好的hanlp类中获取,这种获取方式一共可以获取五种分词器,而现在默认的就是第一种维特比分词器 1.维特比 (viterbi):效...
2019-01-07 13:12 来自版块 - 网络技术
hadoop小学生
hadoop小学生hadoop集群管理系统搭建规划说明
Hadoop分布式集群环境搭建是每个入门级新手都非常头疼的事情,因为你可能花费了很久的时间在搭建运行环境,最终却不知道什么原因无法创建成功。但对新手来说,运行环境搭建不成功的概率还蛮高的。 在之前的分享文章中给hadoop新手入门推荐的大快...
2019-01-04 14:31 来自版块 - 网络技术
hadoop小学生
hadoop小学生大数据hadoop入门之hadoop家族产品详解
大数据这个词也许几年前你听着还会觉得陌生,但我相信你现在听到hadoop这个词的时候你应该都会觉得“熟悉”!越来越发现身边从事hadoop开发或者是正在学习hadoop的人变多了。作为一个hadoop入门级的新手,你会觉得哪些地方很难呢?运行环境的搭...
2018-12-26 15:03 来自版块 - 网络技术
hadoop小学生
hadoop小学生自然语言处理工具HanLP被收录中国大数据产业发展的创新技术新书《数据之翼》
在12月20日由中国电子信息产业发展研究院主办的2018中国软件大会上,大快搜索获评“2018中国大数据基础软件领域领军企业”,并成功入选中国数字化转型TOP100服务商。 图:大快搜索获评“2018中国大数据基础软件领域领军企业” 在本届20...
2018-12-24 13:51 来自版块 - 网络技术
hadoop小学生
hadoop小学生DKHadoop安装的环境准备介绍
前几天去参加了一个线下的聚会,参加聚会的基本都是从事互联网工作的。会上有人提到了区块链,从而引发了一场关于大数据方面的探讨。我也是从去年才正式接触大数据,一直在学习hadoop。相信接触过hadoop的人都知道,。单独搭建hadoop里每个组...
2018-12-05 14:23 来自版块 - 网络技术
hadoop小学生
hadoop小学生hadoop和spark的区别
学习hadoop已经有很长一段时间了,好像是二三月份的时候朋友给了一个国产Hadoop发行版下载地址,因为还是在学习阶段就下载了一个三节点的学习版玩一下。在研究、学习hadoop的朋友可以去找一下看看(发行版DKhadoop,去大快的网站上应...
2018-11-30 16:15 来自版块 - 网络技术
hadoop小学生
hadoop小学生自然语言处理之:搭建基于HanLP的开发环境
环境搭建比FNLP的简单,具体参考:https://github.com/hankcs/HanLP 各个版本的下载:https://github.com/hankcs/HanLP/releases 完毕后有一个报错: 字符类型对应表加载失败: ...
2018-11-09 10:17 来自版块 - 网络技术
hadoop小学生
hadoop小学生详谈分布式系统缓存的设计细节
在分布式Web程序设计中,解决高并发以及内部解耦的关键技术离不开缓存和队列,而缓存角色类似计算机硬件中CPU的各级缓存。如今的业务规模稍大的互联网项目,即使在最初beta版的开发上,都会进行预留设计。但是在诸多应用场景里,也带来了某些高成本的技术问题...
2018-10-29 16:44 来自版块 - 网络技术
hadoop小学生
hadoop小学生自然语言处理中的分词问题总结
众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。把中文的汉字序列切分成有意义的词,就是中文分词,有些人也称为切词。本文转载自明略研究院的技术经理牟小峰老师讲授的语言处理中的分词问题。 ...
2018-10-26 13:50 来自版块 - 网络技术

返回顶部