Hive编程指南
(副标题):无 ;
(作者): 51epub.cc ;
内容简介:
本书是一本Apache Hive的编程指南,旨在介绍如何使用Hive的SQL方法——HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。全书通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述,最终演示Hive如何在Hadoop生态系统进行工作。 本书适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。
目录预览:
Hive编程指南
版权信息
版权声明
内容提要
O'Reilly Media,Inc.介绍
作者简介
作者序
致谢
前言
第1章 基础知识
1.1 Hadoop和MapReduce综述
MapReduce
1.2 Hadoop生态系统中的Hive
1.2.1 Pig
1.2.2 HBase
1.2.3 Cascading、Crunch及其他
1.3 Java和Hive:词频统计算法
1.4 后续事情
第2章 基础操作
2.1 安装预先配置好的虚拟机
........