题名:
Hadoop+Spark生态系统操作与实战指南   hadoop+sparksheng tai xi tong cao zuo yu shi zhan zhi nan / 余辉著 ,
ISBN:
978-7-302-47967-3 价格: CNY69.00
语种:
chi
载体形态:
12,337页 图 26cm
出版发行:
出版地: 北京 出版社: 清华大学出版社 出版日期: 2017
内容提要:
本书共12章,大致分为3个部分,第1部分(第1~7章)讲解Hadoop的原生态组件,包括Hadoop、ZooKeeper、HBase、Hive环境搭建与安装,以及介绍MapReduce、HDFS、ZooKeeper、HBase、Hive原理和Apache版本环境下实战操作。第2部分(第8~11章)讲解Spark的原生态组件,包括Spark Core、Spark SQL、Spark Streaming、DataFrame,以及介绍Scala、Spark API、Spark SQL、Spark Streaming、DataFrame原理和CDH版本环境下实战操作,其中Flume和Kafka属于Apache顶级开源项目也放在本篇讲解。第3部分(第12章)讲解两个大数据项目,包络网页日志离线项目和实时项目,在CDH版本环境下通过这两个项目将Hadoop和Spark原生态组件进行整合,一步步带领读者学习和实战操作。 
主题词:
数据处理软件  
中图分类法:
TP274 版次: 5
主要责任者:
余辉 yu hui 著
附注:
大数据技术 
索书号:
TP274/104