大规模分布式存储系统:原理解析与架构实战

admin 2022年08月07日 141次浏览

大规模分布式存储系统:原理解析与架构实战

(副标题):无 ;

(作者): 杨传辉 ;

内容简介:


序言

关于分布式系统的知识,可以从大学教科书上找到,许多人还知道Andrew S.Tanenbaum等人在2002年出版的“分布式系统原理与范型”(Distributed Systems:Principles and Paradigms)这本书。其实分布式系统的理论出现于上个世纪70年代,"Symposium on Principles of Distributed Computing(PODC)"和"International Symposium on Distributed Computing(DISC)"这两个分布式领域的学术会议分别创立于1982年和1985年。然而,分布式系统的广泛应用却是最近十多年的事情,其中的一个原因就是人类活动创造出的数据量远远超出了单个计算机的存储和处理能力。比如,2008年全球互联网的网页超过了1万亿,按平均单个网页10KB计算,就是10PB;又如,一个2亿用户的电信运营商,如果平均每个用户每天拨打接听总共10个电话,每个电话400字节,5年的话费记录总量即为0.2G×10×0.4K×365×5=1.46PB。除了分布式系统,人们还很难有其他高效的手段来存储和处理这些PB级甚至更多的数据。另外一个原因,其实是一个可悲的事实,那就是分布式环境下的编程十分困难。

与单机环境下的编程相比,分布式环境下的编程有两个明显的不同:首先,分布式环境下会出现一部分计算机工作正常,另一部分计算机工作不正常的情况,程序需要在这种情况下尽可能地正常工作,这个挑战非常大。其次,单机环境下的函数调用常常可以在微秒级内返回,所以除了少数访问外部设备(例如磁盘、网卡等)的函数采用异步方式调用外,大部分函数采用同步调用的方式,编译器和操作系统在调用前后自动保存与恢复程序的上下文;在分布式环境下,计算机之间的函数调用(远程调用,即RPC)的返回时间通常是

目录预览:

​ 大规模分布式存储系统:原理解析与架构实战 (大数据技术丛书)
序言
前言
第1章 概述
1.1 分布式存储概念
1.2 分布式存储分类
第一篇 基础篇
第2章 单机存储系统
2.1 硬件基础
2.1.1 CPU架构
2.1.2 IO总线
2.1.3 网络拓扑
2.1.4 性能参数
2.1.5 存储层次架构
2.2 单机存储引擎
2.2.1 哈希存储引擎
2.2.2 B树存储引擎
2.2.3 LSM树存储引擎
2.3 数据模型
2.3.1 文件模型
........


[EPUB下载]