大数据-互联网大规模数据挖掘与分布式处理..PDF版
2538 点击·0 回帖
![]() | ![]() | |
![]() | 图片:qq截图20131112130448.jpg ![]() 《大数据:互联网大规模数据挖掘与分布式处理》由斯坦福大学的“web 挖掘”课程的内容总结而成,主要关注极大规模数据的挖掘。主要内容包括分布式文件系统、相似性搜索、搜索引擎技术、频繁项集挖掘、聚类算法、广告管理及推荐系统。其中相关章节有对应的习题,以巩固所讲解的内容。读者更可以从网上获取相关拓展材料。 《大数据:互联网大规模数据挖掘与分布式处理》适合本科生、研究生及对数据挖掘感兴趣的读者阅读。 目录: 第1章 数据挖掘基本概念 1 第2章 大规模文件系统及map-reduce 16 第3章 相似项发现 44 第4章 数据流挖掘 89 第5章 链接分析 115 第6章 频繁项集 146 第7章 聚类 176 第8章 web广告 207 第9章 推荐系统 227 点击下载 | |
![]() | ![]() |