使用 PostgreSQL 时间点恢复(Point-In-Time Recovery)的多种数据恢复技术

2025-12-12 0 519

引言

本文面向那些已经具备一定数据库经验、但希望进一步学习 PostgreSQL 基础知识的初学者。假设已在 Ubuntu 环境中正确安装 PostgreSQL,本文的全部操作基于 PostgreSQL 16(开发版本)与 Ubuntu 22.10 系统完成。文章将介绍三种常用的数据恢复方法:

  1. 恢复至最新状态。
  2. 基于日志序列号(LSN, Log Sequence Number)的恢复。
  3. 基于时间戳的恢复。

时间点恢复(Point-In-Time Recovery,简称 PITR)是一种通过重放预写日志(Write Ahead Logging,WAL)文件,将数据库恢复至指定时间点状态的技术手段。

为说明该过程,可构建两个数据库副本,在其中一个数据库中插入数据,并将生成的 WAL 文件进行归档,随后令另一数据库重放该日志文件,以实现状态同步。

此过程类似于数据库因故障导致部分数据丢失的情形,可依靠 WAL 文件将系统恢复至故障前状态。重放 WAL 文件相当于自上一次检查点起,按顺序重新执行全部数据库操作,直至指定时间点,从而实现数据库的精确恢复。

开始使用

首先,创建一个新的数据库,并建立用于存放归档文件的文件夹。

$ initdb -D data/
$ mkdir archive/

随后,编辑该数据库的 postgresql.conf 配置文件。

port = 5432
wal_level = replica
archive_mode = on
archive_command = \'cp %p $HOME/pg/archive/%f\'
archive_timeout = 60

接着,复制整个数据库集群(由于此时尚未创建任何表或数据,实际上并无可备份的内容)。

$ cp -rp data/* data.backup/

启动主数据库。

$ pg_ctl -D data/ -l data.log start
$ createuser -s postgres

在数据库中插入测试数据。

$ psql -U postgres -c \"create database test\"
CREATE DATABASE
$ psql -U postgres -d test -c \"create table t1 (id int, val text)\"
CREATE TABLE
$ psql -U postgres -d test -c \"insert into t1 values (1, \'hello\')\"
INSERT 0 1
$ psql -U postgres -d test -c \"insert into t1 values (2, \'world\')\"
INSERT 0 1
$ psql -U postgres -d test -c \"insert into t1 values (3, \'foo\')\"
INSERT 0 1
$ psql -U postgres -d test -c \"insert into t1 values (4, \'bar\')\"
INSERT 0 1

检查归档目录,确认归档命令执行是否正常。若未生成归档文件,可手动触发数据库生成未完成的 WAL 文件。但需注意,未完成的 WAL 文件与已完成文件大小一致,频繁执行可能导致数据库体积快速膨胀。

$ psql -U postgres -c \"select pg_switch_wal()\"
 pg_switch_wal
---------------
 0/187BBC8
(1 row)

$ ls -l archive/
total 16384
-rw------- 1 tristen tristen 16777216 Apr 1 09:49 000000010000000000000001

停止主服务器。

$ pg_ctl -D data stop

编辑副本数据库的 postgresql.conf 文件,将 recovery_target_timeline 参数设置为 \”latest\”,以便让该副本重放 WAL 文件到最新的状态。

port = 5433
archive_mode = off
restore_command = \'cp $HOME/pg/archive/%f %p\'
recovery_target_timeline = \'latest\'

创建 recovery.signal 文件,用于指示数据库以恢复模式启动。

$ touch data.backup/recovery.signal

启动副本服务器,此时系统将进入恢复模式并开始重放 WAL 文件。

$ pg_ctl -D data.backup -l data.backup.log start
$ tail data.backup.log
2023-04-14 09:50:16.459 PDT [21530] LOG:  redo done at 0/2000060 system usage: CPU: user: 0.00 s, system: 0.01 s, elapsed: 0.03 s
2023-04-14 09:50:16.459 PDT [21530] LOG:  last completed transaction was at log time 2023-04-14 09:49:13.53674-07
2023-04-14 09:50:16.468 PDT [21530] LOG:  restored log file \"000000010000000000000002\" from archive
cp: cannot stat \'/home/tristen/pg/archive/00000002.history\': No such file or directory
2023-04-14 09:50:16.479 PDT [21530] LOG:  selected new timeline ID: 2
cp: cannot stat \'/home/tristen/pg/archive/00000001.history\': No such file or directory
2023-04-14 09:50:16.496 PDT [21530] LOG:  archive recovery complete
2023-04-14 09:50:16.497 PDT [21528] LOG:  checkpoint starting: end-of-recovery immediate wait
2023-04-14 09:50:16.513 PDT [21528] LOG:  checkpoint complete: wrote 905 buffers (5.5%); 0 WAL file(s) added, 0 removed, 2 recycled; write=0.006 s, sync=0.007 s, total=0.018 s; sync files=259, longest=0.001 s, average=0.001 s; distance=28136 kB, estimate=28136 kB; lsn=0/3000028, redo lsn=0/3000028
2023-04-14 09:50:16.515 PDT [21525] LOG:  database system is ready to accept connections

最后,检查副本数据库中的数据。

$ psql -U postgres -d test -c \"select * from t1\" -p 5433
 id |  val
----+-------
  1 | hello
  2 | world
  3 | foo
  4 | bar
(4 rows)

结果显示,备份已成功重放 WAL 文件,并恢复至最新的变更状态。

使用 LSN 进行时间点恢复

按照前述步骤执行操作,但在关闭主服务器之前暂停。

随后,执行命令以获取主数据库当前 WAL 文件的日志序列号(LSN, Log Sequence Number)。

$ psql -U postgres -d test -c \"select pg_current_wal_insert_lsn()\"
 pg_current_wal_insert_lsn
---------------------------
 0/2000060
(1 row)

将获取的 LSN 值配置到副本数据库的 postgresql.conf 文件中。

port = 5433
archive_mode = off
restore_command = \'cp $HOME/pg/archive/%f %p\'
recovery_target_lsn = \'0/2000060\'

完成设置后,关闭主数据库,并按照前述方式执行恢复操作。

$ pg_ctl -D data stop
$ touch data.backup/recovery.signal
$ pg_ctl -D data.backup -l data.backup.log start
$ psql -U postgres -d test -c \"select * from t1\" -p 5433
 id |  val
----+-------
  1 | hello
  2 | world
  3 | foo
  4 | bar
(4 rows)

使用时间戳进行时间点恢复

基于时间戳的恢复方式相对复杂,因为需要明确指定数据库应恢复到的具体时间点。

在操作过程中,可参照默认示例的步骤执行,直至插入数据的阶段。

$ psql -U postgres -c \"create database test\"
CREATE DATABASE
$ psql -U postgres -d test -c \"create table t1 (id int, val text)\"
CREATE TABLE
$ psql -U postgres -d test -c \"insert into t1 values (1, \'hello\')\"
INSERT 0 1
$ psql -U postgres -d test -c \"insert into t1 values (2, \'world\')\"
INSERT 0 1
$ sleep 60
$ psql -U postgres -c \"select now()\"
              now
-------------------------------
 2023-04-14 12:54:23.160389-07
(1 row)

$ psql -U postgres -d test -c \"insert into t1 values (3, \'foo\')\"
INSERT 0 1
$ psql -U postgres -d test -c \"insert into t1 values (4, \'bar\')\"
INSERT 0 1
$ sleep 60
$ psql -U postgres -c \"select now()\"
              now
-------------------------------
 2023-04-14 12:55:23.184277-07
(1 row)

在插入数据时,可通过加入 sleep 延时命令来方便管理时间戳。同时,使用 select now() 命令获取数据库当前的时间戳。与前述步骤相同,需生成剩余的 WAL 文件,并创建用于恢复的 recovery.signal 文件。

$ psql -U postgres -c \"select pg_switch_wal()\"
$ pg_ctl -D data stop
$ touch data.backup/recovery.signal

在本次操作中,应在副本数据库的 postgresql.conf 文件中添加以下配置:

port = 5433
archive_mode = off
restore_command = \'cp $HOME/pg/archive/%f %p\'
recovery_target_time = \'2023-04-14 12:54:23\'

其中,recovery_target_time 参数对应于在插入前两条数据后、插入后两条数据之前获取的时间戳。随后,启动副本服务器并查看数据内容:

$ pg_ctl -D data.backup -l data.backup.log start
$ psql -U postgres -d test -c \"select * from t1\" -p 5433
 id |  val
----+-------
  1 | hello
  2 | world
(2 rows)

此时,数据库中仅包含前两条数据,符合预期。接着,可将恢复时间设置为比前一次时间戳晚 1 秒,并按以下方式修改 recovery_target_time 参数:

recovery_target_time = \'2023-04-14 12:54:24\'

由于系统在成功完成恢复后会自动删除 recovery.signal 文件,因此需重新创建该文件:

$ touch data.backup/recovery.signal

最后,重新启动副本服务器,并按前述步骤查询表中数据:

pg_ctl -D data.backup -l data.backup.log restart
psql -U postgres -d test -c \"select * from t1\" -p 5433
 id |  val
----+-------
  1 | hello
  2 | world
  3 | foo
  4 | bar
(4 rows)

根据向服务器执行插入命令的速度不同,可能需要调整recovery_target_time 参数以获得理想的恢复结果。若恢复时间设置过晚,可能在日志文件中出现如下错误信息:

FATAL: recovery ended before configured recovery target was reached

该错误表明指定的恢复时间超出了可恢复范围,即时间点设置过于靠后。应将恢复时间适当提前数秒后,再次启动服务器进行恢复。

结论

至此,本文完整演示了多种数据库时间点恢复方法的实现过程。我们依次介绍了三种典型方式:基于最新时间线的恢复、基于特定 LSN(日志序列号)的恢复,以及基于指定时间戳的恢复。

不同方法适用于不同场景。熟练掌握这些恢复技术,不仅有助于提升数据库运维与管理的效率,也能在突发数据问题时,确保系统具备更高的可控性与数据安全性。

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

申明:本文由第三方发布,内容仅代表作者观点,与本网站无关。对本文以及其中全部或者部分内容的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本网发布或转载文章出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

左子网 编程相关 使用 PostgreSQL 时间点恢复(Point-In-Time Recovery)的多种数据恢复技术 https://www.zuozi.net/35865.html

常见问题
  • 1、自动:拍下后,点击(下载)链接即可下载;2、手动:拍下后,联系卖家发放即可或者联系官方找开发者发货。
查看详情
  • 1、源码默认交易周期:手动发货商品为1-3天,并且用户付款金额将会进入平台担保直到交易完成或者3-7天即可发放,如遇纠纷无限期延长收款金额直至纠纷解决或者退款!;
查看详情
  • 1、描述:源码描述(含标题)与实际源码不一致的(例:货不对板); 2、演示:有演示站时,与实际源码小于95%一致的(但描述中有”不保证完全一样、有变化的可能性”类似显著声明的除外); 3、发货:不发货可无理由退款; 4、安装:免费提供安装服务的源码但卖家不履行的; 5、收费:价格虚标,额外收取其他费用的(但描述中有显著声明或双方交易前有商定的除外); 6、其他:如质量方面的硬性常规问题BUG等。 注:经核实符合上述任一,均支持退款,但卖家予以积极解决问题则除外。
查看详情
  • 1、左子会对双方交易的过程及交易商品的快照进行永久存档,以确保交易的真实、有效、安全! 2、左子无法对如“永久包更新”、“永久技术支持”等类似交易之后的商家承诺做担保,请买家自行鉴别; 3、在源码同时有网站演示与图片演示,且站演与图演不一致时,默认按图演作为纠纷评判依据(特别声明或有商定除外); 4、在没有”无任何正当退款依据”的前提下,商品写有”一旦售出,概不支持退款”等类似的声明,视为无效声明; 5、在未拍下前,双方在QQ上所商定的交易内容,亦可成为纠纷评判依据(商定与描述冲突时,商定为准); 6、因聊天记录可作为纠纷评判依据,故双方联系时,只与对方在左子上所留的QQ、手机号沟通,以防对方不承认自我承诺。 7、虽然交易产生纠纷的几率很小,但一定要保留如聊天记录、手机短信等这样的重要信息,以防产生纠纷时便于左子介入快速处理。
查看详情

相关文章

猜你喜欢
发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务