《Hadoop海量数据处理：技术详解与项目实战》一导读-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

《Hadoop海量数据处理：技术详解与项目实战》一导读

阅读量：6683 次

发布时间：2019-06-25

本文共 721 字，大约阅读时间需要 2 分钟。

前言

Hadoop海量数据处理：技术详解与项目实战

为什么要写这本书

2013年被称为“大数据元年”，标志着世界正式进入了大数据时代，而就在这一年，我加入了清华大学苏州汽车研究院大数据处理中心，从事Hadoop的开发、运维和数据挖掘等方面的工作。从出现之日起，Hadoop就深刻地改变了人们处理数据的方式。作为一款开源软件，Hadoop能让所有人享受到大数据红利，让所有人在大数据时代站在了同一起跑线上。Hadoop很好地诠释了什么是“大道至简，衍化至繁”，Hadoop来源于非常朴素的思想，但是却衍生出大量的组件，让初学者难以上手。

我在学习和工作的过程中，走过很多弯路也做过很多无用功，尽管这是学习新技术的必由之路，但却浪费了大量的时间。我将自己学习和工作的心得记录下来，为了帮助更多像我当年一样的Hadoop学习者，我决定写一本书，一本自己开始Hadoop职业生涯的时候也想读到的书。

目录

第1章

1.1

1.2

1.3

第2章环境准备

第3章

3.1

3.2

3.3

第4章分而治之的智慧：MapReduce

第5章 SQL on Hadoop：Hive

第6章 SQL to Hadoop : Sqoop

第7章 Hadoop性能调优和运维

应用篇：商业智能系统项目实战

第8章在线图书销售商业智能系统

第9章系统结构设计

第10章在开发之前

第11章实现数据导入导出模块

第12章实现数据分析工具模块

第13章实现业务数据的数据清洗模块

第14章实现点击流日志的数据清洗模块

第15章实现购书转化率分析模块

第16章实现购书用户聚类模块

第17章实现调度模块

结束篇：总结和展望

第18章总结和展望

转载地址：http://obsao.baihongyu.com/

你可能感兴趣的文章

nginx的location优先级

晕,CCNP升级了

克隆虚拟机

开启关闭windows的匿名共享

替代Linux下的rm命令

goldengate 灾备端外键约束导致 ora-01403 (delete)

redis的持久化方式RDB和AOF的区别

Linux查看CPU和内存使用情况

如何运行shell脚本

实践 HTML5 的 CSS3 Media Queries

linux内核裁剪的具体过程和方法

Linux--IP基础知识网关设定 dns服务

shell练习-远程监控

ansible 1.7.2 api 获取有某些应用的ip

Java文件复制

dubbo monitor 简易版安装

Linux常用命令

linux下的时间修改

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-01-27 16:18:34 当前IP: 13.59.183.77 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我