ODPS权威指南-阿里大数据平台应用开发实践
(副标题):无 ;
(作者): 李妹芳 ;
内容简介:
第1章 ODPS概述
1.1 引言
这是个云计算时代,这是个大数据时代。
随着PC和移动互联网影响人们的生活方式,数据呈爆发式增长,其间错综复杂的关联交互,使得现今的传统技术,已经承载不了高效处理的重任。经过几年的探索和发展,云计算已经不再是几年前的“概念股”,它已经落地开花,大型分布式技术变得更加成熟。很多大公司(包括Amazon、阿里云等)已经在规模、可用性和安全领域实现了技术突破,实现了公有云基础设施,并探索出按需租用的商业模式,为中小企业提供灵活的云存储和云计算服务。
和云计算相比,大数据的浪潮到底有多猛?在过去三年里产生的数据量比以往四万年的数据量还要大。大数据可以来自方方面面,从日常生活购物到社交网络,从地理位置定位到在线视频都会有大量的数据。云计算的蓬勃发展,进一步提升了大数据的价值。廉价的存储和计算,高效的海量数据处理,使我们已经进入了“大数据时代”。搜索、推荐、广告、游戏和社交网络正在迅速融合,新的商业模式层出不穷。
1.2 初识ODPS
开放数据处理服务(Open Data Processing Service,ODPS)是一个海量数据处理平台,基于阿里巴巴自主研发的分布式操作系统开发,以云计算服务的形式支撑集团数据分享和海量数据处理业务的发展,其官方访问地址是http://www.aliyun.com/product/odps/。
ODPS 提供 PB 级别的数据处理能力,适用于海量数据存储、数据仓库构建、数据统计和挖掘、机器学习和商业智能等领域。
1.2.1 背景和挑战
今天,移动、交易、广告、社会化游戏、在线传感器以及工业传感器数量在迅猛增长,数据规模给传统技术带来了很大的挑战。随着规模的不断增长,传统软件无法承载大数据处理的重任。从大型互联网企业的数据仓库和BI分析、中型网站的LOG分析、电子商务网站的交易分析到手机
目录预览:
ODPS权威指南——阿里大数据平台应用开发实践
第1章 ODPS概述
第2章 ODPS入门
第3章 收集海量数据
第4章 使用SQL处理海量数据
第5章 SQL进阶
第6章 通过Tunnel迁移数据
第7章 使用MapReduce处理数据
第8章 MapReduce进阶
第9章 机器学习算法
第10章 使用SDK访问ODPS服务
第11章 ODPS权限、资源和数据管理
第12章 深入了解ODPS
第13章 探索ODPS之美
附录 ODPS消息认证机制
后记
版权