使用 cron 作业使用 dd 自动备份同一驱动器

使用 cron 作业使用 dd 自动备份同一驱动器

所以我想每月使用 dd 在外部硬盘驱动器中备份我的系统驱动器(整个驱动器而不仅仅是分区)。所以我的 crontab 中有类似的东西

0 9 1 * *   dd if=/dev/sda | gzip -c > /mnt/5E13119070E2D202/Backups/system_drive.backup.img.gz

效果很好。但我试图弄清楚如何用在重新启动之间持续存在的东西替换 /dev/sda (系统驱动器)。

使用blkid(修剪):

/dev/sda5: UUID="58141b62-72af-463c-a3c3-57d0b739c632" TYPE="swap" PARTUUID="c1b89110-05"
/dev/sda1: UUID="a97d9b38-e8a6-4cc2-9684-b7e579c1a990" BLOCK_SIZE="4096" TYPE="ext4" PARTUUID="c1b89110-01"
/dev/sdg1: BLOCK_SIZE="512" UUID="5E13119070E2D202" TYPE="ntfs" PARTUUID="000b4ae7-01"

有任何想法吗?

答案1

但我试图弄清楚如何用在重新启动之间持续存在的东西替换 /dev/sda (系统驱动器)。

因此,您需要为整个磁盘指定一个“全球唯一名称”。幸运的是,Linux 可以满足您的需求。

  1. wwn-*通过在 /dev/disk/by-id 中查找正确的条目来找出驱动器的唯一名称。你可以只是ls -l /dev/disk/by-id/wwn-*寻找sda,或者做类似的事情find /dev/disk/by-id -name 'wwn-*' -lname '*/sda'。无论哪种方式,您都会得到一个像 /dev/disk/by-id/wwn-0x1234cafe 这样的符号链接。
  2. 在你的脚本中,
devlink=/dev/disk/by-id/wwn-0x1234cafe

gzip < "${devlink}" > /mnt/5E13119070E2D202/Backups/system_drive.backup.img.gz

因为在这里使用实际上没有任何优势dd。恰恰相反!dd只需让压缩器直接在输入上完成其工作,而不是使用自己的块大小和潜在的复制开销进行插入。

我建议您不要这样做gzip,原因有两个:

  1. 它的算法很旧,速度很慢并且不擅长压缩。
  2. 它是单线程的,给已经很慢的算法带来了另一个瓶颈

gzip您至少可以使用 ,而不是使用pigz,它是多线程的并且具有相同的功能。但是,虽然我非常尊重阿德勒和他的压缩器,但几十年过去了,现代压缩器的压缩速度更快,压缩效果更好;所以这在速度和压缩比方面都会表现更好

#!/bin/sh
devlink=/dev/disk/by-id/wwn-0x1234cafe
zstd -5 -T0 --force -- "${devlink}" > /mnt/5E13119070E2D202/Backups/system_drive.backup.img.gz
#    ^  ^    ^       ^  ^
#    |  |    |       |  |
#    \-------------------- -5: use a medium-low compression ratio. 
#       |    |       |  |      still better than `gzip --best`, typically, but also faster.
#       |    |       |  |      Possible values are 1 to 18, where you typically see
#       |    |       |  |      diminishing returns for values > 12.
#       |    |       |  |      
#       \----------------- -T0: use as many threads as you have CPU cores
#            |       |  |      
#            \------------ --force: because the input is not a regular file, zstd want
#                    |  |           to be explicitly told that, yes, we want this.
#                    |  |      
#                    \---- --: afterwards there's file names. Just for good measure.
#                       |      
#                       \- "${devlink}": input filename

结合其他评论:

  • 在主动的、读/写安装的根文件系统上运行备份:是的,您可以这样做,但在您尝试恢复它的那一刻就需要修复它。因此,这是一个坏主意。最好从实时图像中执行此操作,或者至少sync; mount -o remount,ro ${root partition} /在之前和之后执行此操作。mount -o remount,rw …是的,这会在备份运行时扰乱系统的运行。但是,您进行备份并不是为了“出于不确定的目的而在某处写入一些备份”,而是为了让您的计算机具有可恢复、可靠的状态。
  • 如果您需要在实时系统上执行此操作,通常会采用不同的方法。您可以使用 LVM 或快照文件系统(ZFS、btrfs)作为根卷和数据卷,创建快照并备份该快照。如果我从你的部分分区列表中猜对了,你的系统甚至没有设置为使用 LVM,这对你来说真的很烦人(没有人愿意在 2023 年处理原始分区!这不是 90 年代。)。考虑重新安装系统以使用 LVM、btrfs 或 ZFS。
  • 您正在将备份写入 NTFS 卷。 Linux NTFS 驱动程序对于备份来说可能不太可靠。另外,ntfs-3g 很慢!所以,你会提高压缩比(你的gzip 必须使用-9/ --best,你zstd会倾向于) 以牺牲压缩速度-12-14代价,因为你主要受到写入速度的限制,而不是压缩速度,无论如何,写得少会让事情变得更糟
    • 更可靠,因为写入的位数越少意味着出错的机会就越少,并且
    • 更快,因为要写入的位数更少,等待的时间更少

相关内容