大数据技术体系详解:原理、架构与实践
(副标题):无 ;
(作者): 董西成 ;
内容简介:
第1章 企业级大数据技术体系概述
随着机构和企业积累的数据越来越多,大数据价值逐步体现出来。2015年国务院向社会公布了《促进大数据发展行动纲要》(以下简称《纲要》),正式将大数据提升为国家级战略。《纲要》明确提出了大数据的基本概念:大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。《纲要》提到大数据在推动经济转型发展,重塑国家竞争优势,以及提升政府治理能力等方面具有重要的意义,提出在信用、交通、医疗、卫生、金融、气象等众多领域发展大数据。
为了确保大数据思想顺利落地,在各个行业开花结果,需要掌握和利用大数据技术。本书正是从技术角度探讨了如何利用开源技术构建大数据解决方案,从而真正为政府和企业带来实用价值。
目录预览:
大数据技术体系详解:原理、架构与实践
第1章 企业级大数据技术体系概述
1.1 大数据系统产生背景及应用场景
1.2 企业级大数据技术框架
1.3 企业级大数据技术实现方案
1.4 大数据架构:Lambda Architecture
1.5 Hadoop与Spark版本选择及安装部署
1.6 小结
1.7 本章问题
第二部分 数据收集篇
第2章 关系型数据的收集
2.1 Sqoop概述
2.2 Sqoop基本架构
2.3 Sqoop使用方式
2.4 数据增量收集CDC
2.5 小结
2.6 本章问题
第3章 非关系型数据的收集
3.1 概述
3.2 Flume NG基本架构
........