订阅是逻辑复制的下游端。订阅被定义在其中的节点被称为订阅者。一个订阅会定义到另一个数据库的连接以及它想要订阅的发布集合(一个或者多个)。
订阅者数据库的行为与任何其他PostgreSQL实例相同,并且可以被用作其他数据库的发布者,只需要定义它自己的发布。
如果需要,一个订阅者节点可以有多个订阅。可以在一对发布者-订阅者之间定义多个订阅,在这种情况下要确保被订阅的发布对象不会重叠。
每一个订阅都将通过一个复制槽(见第 27.2.6 节)接收更改。预先存在的表数据的初始数据同步过程可能会要求额外的复制槽,并且在数据同步结束后删除。
逻辑复制订阅可以是同步复制(见第 27.2.8 节)的后备服务器。后备名称默认是该订阅的名称。可以在订阅的连接信息中用application_name
指定一个可供选择的名称。
如果当前用户是一个超级用户,则订阅会被pg_dump
转储。否则订阅会被跳过并且写出一个警告,因为非超级用户不能从pg_subscription
目录中读取所有的订阅信息。
可以使用CREATE SUBSCRIPTION
增加订阅,并且使用ALTER SUBSCRIPTION
在任何时刻停止/继续订阅,还可以使用DROP SUBSCRIPTION
删除订阅。
在一个订阅被删除并且重建时,同步信息会丢失。这意味着数据必须被重新同步。
模式定义不会被复制,并且被发布的表必须在订阅者上存在。只有常规表可以成为复制的目标。例如,不能复制视图。
表在发布者和订阅者之间使用完全限定的表名进行匹配。不支持复制到订阅者上命名不同的表。
表的列也通过名称匹配。订阅表中的列顺序不需要与发布表中的顺序一样。
列的数据类型也不需要一样,只要可以将数据的文本表示形式转换为目标类型即可。
例如,您可以从integer
类型的列复制到bigint
类型的列。
目标表还可以具有发布表中不存在的额外列。额外列都将使用目标表的定义中指定的默认值填充。
如早前所提到的,每一个(活跃的)订阅会从远(发布)端上的一个复制槽接收更改。
额外的表同步槽通常是临时的,在内部创建以执行初始表同步,并在它们不再被需要时自动删除。这些表同步槽命名为: “pg_%u_sync_%u_%llu
”
(参数是: Subscription oid
,
Table relid
, system identifier sysid
)
通常,远程复制槽是在使用CREATE SUBSCRIPTION
创建订阅是自动创建的,并且在使用DROP SUBSCRIPTION
删除订阅时,复制槽也会自动被删除。不过,在一些情况下,有必要单独操纵订阅以及其底层的复制槽。下面是一些场景:
在创建一个订阅时,复制槽已经存在。在这种情况下,可以使用create_slot = false
选项创建订阅并关联到现有的槽。
在创建一个订阅时,远程主机不可达或者处于一种不明状态。在这种情况下,可以使用connect = false
选项创建订阅。那么远程主机将根本不会被联系。这是pg_dump所使用的方式。这样,在订阅可以被激活之前,必须手工创建远程复制槽。
在删除一个订阅时,复制槽应该被保留。当订阅者数据库正在被移动到一台不同的主机并且将从那里再被激活时,这种行为很有用。在这种情况下,可以在尝试删除该订阅之前,使用ALTER SUBSCRIPTION
将复制槽解除关联。
在删除一个订阅时,远程主机不可达。在这种情况下,可以在尝试删除该订阅之前,使用ALTER SUBSCRIPTION
将复制槽解除关联。如果远程数据库实例不再存在,那么不需要进一步的行动。不过,如果远程数据库实例只是不可达,那么复制槽应该被手动删除(以及任何剩余的表同步槽)。否则它将会继续保留WAL并且最终可能会导致磁盘被填满。这种情况应该要仔细地研究。
在发布者上创建一些测试表。
test_pub=# CREATE TABLE t1(a int, b text, PRIMARY KEY(a)); CREATE TABLE test_pub=# CREATE TABLE t2(c int, d text, PRIMARY KEY(c)); CREATE TABLE test_pub=# CREATE TABLE t3(e int, f text, PRIMARY KEY(e)); CREATE TABLE
在订阅者上创建相同的表。
test_sub=# CREATE TABLE t1(a int, b text, PRIMARY KEY(a)); CREATE TABLE test_sub=# CREATE TABLE t2(c int, d text, PRIMARY KEY(c)); CREATE TABLE test_sub=# CREATE TABLE t3(e int, f text, PRIMARY KEY(e)); CREATE TABLE
在发布者端向表中插入数据。
test_pub=# INSERT INTO t1 VALUES (1, 'one'), (2, 'two'), (3, 'three'); INSERT 0 3 test_pub=# INSERT INTO t2 VALUES (1, 'A'), (2, 'B'), (3, 'C'); INSERT 0 3 test_pub=# INSERT INTO t3 VALUES (1, 'i'), (2, 'ii'), (3, 'iii'); INSERT 0 3
为这些表创建publication。publicationpub2
和pub3a
禁止一些publish
操作。
publicationpub3b
有一行过滤器(参见第 31.3 节)。
test_pub=# CREATE PUBLICATION pub1 FOR TABLE t1; CREATE PUBLICATION test_pub=# CREATE PUBLICATION pub2 FOR TABLE t2 WITH (publish = 'truncate'); CREATE PUBLICATION test_pub=# CREATE PUBLICATION pub3a FOR TABLE t3 WITH (publish = 'truncate'); CREATE PUBLICATION test_pub=# CREATE PUBLICATION pub3b FOR TABLE t3 WHERE (e > 5); CREATE PUBLICATION
为这些publication创建订阅。订阅sub3
订阅了pub3a
和pub3b
。
所有订阅将默认复制初始数据。
test_sub=# CREATE SUBSCRIPTION sub1 test_sub-# CONNECTION 'host=localhost dbname=test_pub application_name=sub1' test_sub-# PUBLICATION pub1; CREATE SUBSCRIPTION test_sub=# CREATE SUBSCRIPTION sub2 test_sub-# CONNECTION 'host=localhost dbname=test_pub application_name=sub2' test_sub-# PUBLICATION pub2; CREATE SUBSCRIPTION test_sub=# CREATE SUBSCRIPTION sub3 test_sub-# CONNECTION 'host=localhost dbname=test_pub application_name=sub3' test_sub-# PUBLICATION pub3a, pub3b; CREATE SUBSCRIPTION
注意,初始表数据会被复制,无论对发布执行publish
操作。
test_sub=# SELECT * FROM t1; a | b ---+------- 1 | one 2 | two 3 | three (3 rows) test_sub=# SELECT * FROM t2; c | d ---+--- 1 | A 2 | B 3 | C (3 rows)
此外,由于初始数据复制忽略了publish
操作,并且因为发布pub3a
没有行过滤器,
这意味着复制的表t3
包含所有行,即使它们不匹配发布pub3b
的行过滤器。
test_sub=# SELECT * FROM t3; e | f ---+----- 1 | i 2 | ii 3 | iii (3 rows)
在发布方面向表格中插入更多数据。
test_pub=# INSERT INTO t1 VALUES (4, 'four'), (5, 'five'), (6, 'six'); INSERT 0 3 test_pub=# INSERT INTO t2 VALUES (4, 'D'), (5, 'E'), (6, 'F'); INSERT 0 3 test_pub=# INSERT INTO t3 VALUES (4, 'iv'), (5, 'v'), (6, 'vi'); INSERT 0 3
现在发布者端的数据如下:
test_pub=# SELECT * FROM t1; a | b ---+------- 1 | one 2 | two 3 | three 4 | four 5 | five 6 | six (6 rows) test_pub=# SELECT * FROM t2; c | d ---+--- 1 | A 2 | B 3 | C 4 | D 5 | E 6 | F (6 rows) test_pub=# SELECT * FROM t3; e | f ---+----- 1 | i 2 | ii 3 | iii 4 | iv 5 | v 6 | vi (6 rows)
观察到在正常复制过程中,适当的publish
操作被使用。这意味着publicationpub2
和pub3a
不会复制INSERT
。
另外,publicationpub3b
只会复制与pub3b
的行过滤器匹配的数据。现在订阅方的数据如下:
test_sub=# SELECT * FROM t1; a | b ---+------- 1 | one 2 | two 3 | three 4 | four 5 | five 6 | six (6 行) test_sub=# SELECT * FROM t2; c | d ---+--- 1 | A 2 | B 3 | C (3 行) test_sub=# SELECT * FROM t3; e | f ---+----- 1 | i 2 | ii 3 | iii 6 | vi (4 行)