DKHadoop大数据平台架构详解
5108 点击·0 回帖
![]() | ![]() | |
![]() | 大数据的时代已经来了,信息的爆炸式增长使得越来越多的行业面临这大量数据需要存储和分析的挑战。hadoop作为一个开源的分布式并行处理平台,以其高拓展、高效率、高可靠等优点越来越受到欢迎。这同时也带动了hadoop商业版的发行。这里就通过大快DKhadoop为自然语言处理1详细介绍一下hadoop大数据平台架构内容。 目前国内的商业发行版hadoop除了大快DKhadoop以外还有像华为云等。虽然发行方不同,但在平台架构上相似,这里就以我比较熟悉的dkhadoop来介绍。 图片:DKHadoop.jpg ![]()
4、DKhadoop一体化开发框架提供了大数据、搜索、自然语言处理和人工智能开发中常用的二十多个类,总计一百余种方法,实现了开发效率的大幅提升。DK.HADOOP整合集成了NOSQL数据库,简化了文件系统与非关系数据库之间的编程;DK.HADOOP改进了集群同步系统,使得HADOOP的大数据平台架构6更加高效。 5、DKhadoop的SQL版本,还提供了分布式MySQL的集成,传统的信息系统,可无缝的实现面向大数据和分布式的跨越。 6、ES:快递DKhadoop的搜索系统是在开源ES系统上二次开发的,支持完成的全文搜索。整合了对中文搜索的有效支持以及对大快数据同步技术的支持后的高性能版本,DK.ES是DKH的核心组件之一,仅随DKH集成整合了对中文搜索的有效支持以及对大快数据同步技术的支持后的高性能版本,DK.ES是DKhadoop的核心组件之一。 7、汉语言处理组件:大快的汉语言处理是目前国内使用率最高的开源自然语言处理开发包。 简单的就介绍这些了吧,想要进一步了解的可以搜索查询下或者下载一下dkhadoop学习版本了解。以下是关于dkhadoop版本的问题: DKH标准版 DKH-分布式SQL版 DK.HADOOP发行版 DKH标准版有三个不同的子版本:用于开发调试的单机版;支持三节点的学习版;支持5节点以上的标准服务器版 DKH-分布式SQL版有两个子版本:学习版、服务器版 | |
![]() | ![]() |