Greenplum:从大数据战略到实现

admin 2022年11月13日 165次浏览

Greenplum:从大数据战略到实现

(副标题):无 ;

(作者): 冯雷 姚延栋 高小明 杨瑜 ;

内容简介:

​ 6.2.1 dblink简介
dblink是从PostgreSQL 8.3开始引入的扩展模块,Greenplum从5.0版本开始提供对dblink模块的支持。在PostgreSQL中,dblink允许一个PostgreSQL数据库实例通过libpq协议连接到另外一个远程PostgreSQL实例,在同一个会话里(Session)通过UDF的方式对远程数据库进行查询、更新等操作。dblink的这种操作方式被视为FDW(Foreign Data Wrapper)的雏形,即在一个数据库实例中访问和操作另一个数据库里的数据。由于dblink是通过libpq连接远程数据库的,因此任何兼容当前使用的libpq协议版本的远程数据库都可以作为dblink的目标数据库。对于PostgreSQL,高版本的客户端能够兼容低版本的服务器端,也就是说,PostgreSQL 10中的dblink可以正常访问PostgreSQL 8.3的数据库,但反之不一定成立。Greenplum 5.0中的dblink只可以连接Greenplum数据库,但无法连接PostgreSQL数据库。对于Greenplum中的dblink,所有的数据连接和请求是通过Master节点完成的,各个Segment节点不直接参与dblink的工作。由于所有的工作都由Master节点来完成,可能会导致Master节点占用资源过多,影响其他任务的运行,且单节点的实际执行效率也不高。因此,dblink适合对大量小表进行操作,例如维度表的迁移等。使用dblink迁移小表的好处是可以避免远程数据的导出操作以及采用外部表所引起的catalog膨胀。
由于Greenplum的MPP架构与PostgreSQL在工作机制上有很大的不同,因此不是所有的dblink函数都能在Greenplum上正常工作。首先,Greenplum中的dblink不支持下列

目录预览:

​ Greenplum:从大数据战略到实现
第1章 ABC:人工智能、大数据和云计算
1.1 再谈云计算
1.1.1 云计算由南向转为北向
1.1.2 P层云的精细化发展
1.1.3 大数据系统在云中部署不断朝南上移
1.2 大数据
1.2.1 从CRUD到CRAP
1.2.2 MPP(大规模并行计算)
1.2.3 大数据系统
1.2.4 当大数据遇到云计算
1.3 人工智能
1.3.1 模型化方法
1.3.2 AI的发展史
1.3.3 对AI应用的正确预期
1.4 ABC之间的关系
1.5 AI和人
1.5.1 经验与逻辑
1.5.2 公理化的逻辑系统
1.5.3 图灵机和可计算数
........


[EPUB下载]