博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《Hadoop海量数据处理:技术详解与项目实战》一导读
阅读量:6683 次
发布时间:2019-06-25

本文共 721 字,大约阅读时间需要 2 分钟。

q1

前 言

Hadoop海量数据处理:技术详解与项目实战

为什么要写这本书
2013年被称为“大数据元年”,标志着世界正式进入了大数据时代,而就在这一年,我加入了清华大学苏州汽车研究院大数据处理中心,从事Hadoop的开发、运维和数据挖掘等方面的工作。从出现之日起,Hadoop就深刻地改变了人们处理数据的方式。作为一款开源软件,Hadoop能让所有人享受到大数据红利,让所有人在大数据时代站在了同一起跑线上。Hadoop很好地诠释了什么是“大道至简,衍化至繁”,Hadoop来源于非常朴素的思想,但是却衍生出大量的组件,让初学者难以上手。

我在学习和工作的过程中,走过很多弯路也做过很多无用功,尽管这是学习新技术的必由之路,但却浪费了大量的时间。我将自己学习和工作的心得记录下来,为了帮助更多像我当年一样的Hadoop学习者,我决定写一本书,一本自己开始Hadoop职业生涯的时候也想读到的书。

目 录

第1章

1.1
1.2
1.3
第2章 环境准备
第3章
3.1
3.2
3.3
第4章 分而治之的智慧:MapReduce
第5章 SQL on Hadoop:Hive
第6章 SQL to Hadoop : Sqoop
第7章 Hadoop性能调优和运维
应用篇:商业智能系统项目实战
第8章 在线图书销售商业智能系统
第9章 系统结构设计
第10章 在开发之前
第11章 实现数据导入导出模块
第12章 实现数据分析工具模块
第13章 实现业务数据的数据清洗模块
第14章 实现点击流日志的数据清洗模块
第15章 实现购书转化率分析模块
第16章 实现购书用户聚类模块
第17章 实现调度模块
结束篇:总结和展望
第18章 总结和展望

转载地址:http://obsao.baihongyu.com/

你可能感兴趣的文章
nginx的location优先级
查看>>
晕,CCNP升级了
查看>>
克隆虚拟机
查看>>
开启关闭windows的匿名共享
查看>>
替代Linux下的rm命令
查看>>
goldengate 灾备端外键约束导致 ora-01403 (delete)
查看>>
redis的持久化方式RDB和AOF的区别
查看>>
Linux查看CPU和内存使用情况
查看>>
如何运行shell脚本
查看>>
实践 HTML5 的 CSS3 Media Queries
查看>>
linux内核裁剪的具体过程和方法
查看>>
Linux--IP基础知识 网关设定 dns服务
查看>>
shell练习-远程监控
查看>>
ansible 1.7.2 api 获取有某些应用的ip
查看>>
Java文件复制
查看>>
网络基础5
查看>>
dubbo monitor 简易版安装
查看>>
Linux常用命令
查看>>
linux下的时间修改
查看>>
冒泡算法
查看>>