Linux 文件存档

点击访问 Linux 命令大全 >>

文件存档指将一大堆零散的文件打包成一个特殊后缀的文件(如:.tar),这样我们就更容易对文件备份、传输、携带等操作。

tar 命令

文件存档的根本目的是为了让“文件”的携带和保存更为便捷。Linux 中最著名的文件打包工具是 tar,这个程序读取多个文件和目录,并将它们打包成一个文件。

语法如下:

用法: tar [选项...] [FILE]...
 GNU ‘tar’
将许多文件一起保存至一个单独的磁带或磁盘归档,并能从归档中单独还原所需文件。

示例
  tar -cf archive.tar foo bar  # 从文件 foo 和 bar 创建归档文件
archive.tar。
  tar -tvf archive.tar         # 详细列举归档文件 archive.tar
中的所有文件。
  tar -xf archive.tar          # 展开归档文件 archive.tar
中的所有文件。

 主操作模式:
  -A, --catenate, --concatenate 追加 tar 文件至归档
  -c, --create                  创建一个新归档
  -d, --diff, --compare         找出归档和文件系统的差异
      --delete                  从归档(非磁带!)中删除
  -r, --append                  追加文件至归档结尾
  -t, --list                    列出归档内容
      --test-label              测试归档卷标并退出
  -u, --update                  仅追加比归档中副本更新的文件
  -x, --extract, --get          从归档中解出文件

 操作修饰符:
      --check-device            当创建增量归档时检查设备号(默认)
  -g, --listed-incremental=FILE 处理新式的 GNU 格式的增量备份
  -G, --incremental             处理老式的 GNU 格式的增量备份
      --ignore-failed-read      当遇上不可读文件时不要以非零值退出
      --level=NUMBER            所创建的增量列表归档的输出级别
  -n, --seek                    归档可检索
      --no-check-device         当创建增量归档时不要检查设备号
      --no-seek                 归档不可检索
      --occurrence[=NUMBER]     仅处理归档中每个文件的第 NUMBER
                                个事件;仅当与以下子命令 --delete,
                                --diff, --extract 或是 --list
                                中的一个联合使用时,此选项才有效。而且不管文件列表是以命令行形式给出或是通过
                                -T 选项指定的;NUMBER 值默认为 1
      --sparse-version=MAJOR[.MINOR]
                                设置所用的离散格式版本(隐含 --sparse)
  -S, --sparse                  高效处理离散文件

 重写控制:
  -k, --keep-old-files          don't replace existing files when extracting, treat them as errors
      --keep-directory-symlink  preserve existing symlinks to directories when extracting
      --keep-newer-files        不要替换比归档中副本更新的已存在的文件
      --no-overwrite-dir        保留已存在目录的元数据
      --overwrite               解压时重写存在的文件
      --overwrite-dir           解压时重写已存在目录的元数据(默认)
      --recursive-unlink        解压目录之前先清除目录层次
      --remove-files            在添加文件至归档后删除它们
      --skip-old-files          don't replace existing files when extracting, silently skip over them
  -U, --unlink-first            在解压要重写的文件之前先删除它们
  -W, --verify                  在写入以后尝试校验归档

 选择输出流:
      --ignore-command-error    忽略子进程的退出代码
      --no-ignore-command-error 将子进程的非零退出代码认为发生错误
  -O, --to-stdout               解压文件至标准输出
      --to-command=COMMAND      将解压的文件通过管道传送至另一个程序

 操作文件属性:
      --atime-preserve[=METHOD] 在输出的文件上保留访问时间,要么通过在读取(
                                默认 METHOD=‘replace’)后还原时间,要不就不要在第一次(METHOD=‘system’)设置时间
      --delay-directory-restore 直到解压结束才设置修改时间和所解目录的权限
      --group=名称                强制将 NAME 作为所添加的文件的组所有者
      --mode=CHANGES            强制将所添加的文件(符号)更改为权限  CHANGES
      --mtime=DATE-OR-FILE      从 DATE-OR-FILE 中为添加的文件设置 mtime
  -m, --touch                   不要解压文件的修改时间
      --no-delay-directory-restore 
                                取消 --delay-directory-restore 选项的效果
      --no-same-owner           将文件解压为您所有(普通用户默认此项)
      --no-same-permissions     从归档中解压权限时使用用户的掩码位(默认为普通用户服务)
      --numeric-owner           总是以数字代表用户/组的名称
      --owner=名称                强制将 NAME 作为所添加的文件的所有者
  -p, --preserve-permissions, --same-permissions 
                                解压文件权限信息(默认只为超级用户服务)
      --preserve                与 -p 和 -s 一样
      --same-owner              尝试解压时保持所有者关系一致(超级用户默认此项)
  -s, --preserve-order, --same-order
                                member arguments are listed in the same order as the files in the archive

 Handling of extended file attributes:
      --acls                 Enable the POSIX ACLs support
      --no-acls              Disable the POSIX ACLs support
      --no-selinux           Disable the SELinux context support
      --no-xattrs            Disable extended attributes support
      --selinux              Enable the SELinux context support
      --xattrs               Enable extended attributes support
      --xattrs-exclude=MASK  specify the exclude pattern for xattr keys
      --xattrs-include=MASK  specify the include pattern for xattr keys

 设备选择和切换:

  -f, --file=ARCHIVE         使用归档文件或 ARCHIVE 设备
      --force-local          即使归档文件存在副本还是把它认为是本地归档
  -F, --info-script=名称, --new-volume-script=名称
                             在每卷磁带最后运行脚本(隐含 -M)
  -L, --tape-length=NUMBER   写入 NUMBER × 1024 字节后更换磁带
  -M, --multi-volume         创建/列出/解压多卷归档文件
      --rmt-command=COMMAND  使用指定的 rmt COMMAND 代替 rmt
      --rsh-command=COMMAND  使用远程 COMMAND 代替 rsh
      --volno-file=FILE      使用/更新 FILE 中的卷数

 设备分块:
  -b, --blocking-factor=BLOCKS   每个记录 BLOCKS x 512 字节
  -B, --read-full-records    读取时重新分块(只对 4.2BSD 管道有效)
  -i, --ignore-zeros         忽略归档中的零字节块(即文件结尾)
      --record-size=NUMBER   每个记录的字节数 NUMBER,乘以 512

 选择归档格式:
  -H, --format=FORMAT        创建指定格式的归档

 FORMAT 是以下格式中的一种:
    gnu                      GNU tar 1.13.x 格式
    oldgnu                   GNU 格式 as per tar <= 1.12
    pax                      POSIX 1003.1-2001 (pax) 格式
    posix                    等同于 pax
    ustar                    POSIX 1003.1-1988 (ustar) 格式
    v7                       old V7 tar 格式

      --old-archive, --portability 等同于 --format=v7
      --pax-option=关键字[[:]=值][,关键字[[:]=值]]... 控制 pax 关键字
      --posix                等同于 --format=posix
  -V, --label=TEXT           创建带有卷名 TEXT 的归档;在列出/解压时,使用 TEXT 作为卷名的模式串

 压缩选项:

  -a, --auto-compress        使用归档后缀名来决定压缩程序
  -I, --use-compress-program=PROG 通过 PROG 过滤(必须是能接受 -d 选项的程序)
  -j, --bzip2                通过 bzip2 过滤归档
  -J, --xz                   通过 xz 过滤归档
      --lzip                 通过 lzip 过滤归档
      --lzma                 通过 lzma 过滤归档
      --lzop
      --no-auto-compress     不使用归档后缀名来决定压缩程序
  -z, --gzip, --gunzip, --ungzip   通过 gzip 过滤归档
  -Z, --compress, --uncompress   通过 compress 过滤归档

 本地文件选择:
      --add-file=FILE        添加指定的 FILE 至归档(如果名字以 - 开始会很有用的)
      --backup[=CONTROL]     在删除前备份,选择 CONTROL 版本
  -C, --directory=DIR        改变至目录 DIR
      --exclude=PATTERN      排除以 PATTERN 指定的文件
      --exclude-backups      排除备份和锁文件
      --exclude-caches       除标识文件本身外,排除包含 CACHEDIR.TAG 的目录中的内容
      --exclude-caches-all   排除包含 CACHEDIR.TAG 的目录
      --exclude-caches-under 排除包含 CACHEDIR.TAG 的目录中所有内容

      --exclude-tag=FILE     除 FILE 自身外,排除包含 FILE 的目录中的内容
      --exclude-tag-all=FILE 排除包含 FILE 的目录
      --exclude-tag-under=FILE   排除包含 FILE 的目录中的所有内容
      --exclude-vcs          排除版本控制系统目录
  -h, --dereference          跟踪符号链接;将它们所指向的文件归档并输出
      --hard-dereference     跟踪硬链接;将它们所指向的文件归档并输出
  -K, --starting-file=MEMBER-NAME
                             begin at member MEMBER-NAME when reading the archive
      --newer-mtime=DATE     当只有数据改变时比较数据和时间
      --no-null              禁用上一次的效果 --null 选项
      --no-recursion         避免目录中的自动降级
      --no-unquote           不以 -T 读取的文件名作为引用结束
      --null                 -T 读取以空终止的名字,-C 禁用
  -N, --newer=DATE-OR-FILE, --after-date=DATE-OR-FILE
                             只保存比 DATE-OR-FILE 更新的文件
      --one-file-system      创建归档时保存在本地文件系统中
  -P, --absolute-names       不要从文件名中清除引导符‘/’
      --recursion            目录递归(默认)
      --suffix=STRING        在删除前备份,除非被环境变量 SIMPLE_BACKUP_SUFFIX
                             覆盖,否则覆盖常用后缀(‘’)
  -T, --files-from=FILE      从 FILE 中获取文件名来解压或创建文件
      --unquote              以 -T 读取的文件名作为引用结束(默认)
  -X, --exclude-from=FILE    排除 FILE 中列出的模式串

 文件名变换:
      --strip-components=NUMBER   解压时从文件名中清除 NUMBER 个引导部分
      --transform=EXPRESSION, --xform=EXPRESSION
                             使用 sed 代替 EXPRESSION 来进行文件名变换

 文件名匹配选项(同时影响排除和包括模式串):
      --anchored             模式串匹配文件名头部
      --ignore-case          忽略大小写
      --no-anchored          模式串匹配任意‘/’后字符(默认对 exclusion 有效)
      --no-ignore-case       匹配大小写(默认)
      --no-wildcards         逐字匹配字符串
      --no-wildcards-match-slash   通配符不匹配‘/’
      --wildcards            use wildcards (default)
      --wildcards-match-slash 通配符匹配‘/’(默认对排除操作有效)

 提示性输出:
      --checkpoint[=NUMBER]  每隔 NUMBER 个记录显示进度信息(默认为 10 个)
      --checkpoint-action=ACTION   在每个检查点上执行 ACTION
      --full-time            print file time to its full resolution
      --index-file=FILE      将详细输出发送至 FILE
  -l, --check-links          只要不是所有链接都被输出就打印信息
      --no-quote-chars=STRING   禁用来自 STRING 的字符引用
      --quote-chars=STRING   来自 STRING 的额外的引用字符
      --quoting-style=STYLE  设置名称引用风格;有效的 STYLE
                             值请参阅以下说明
  -R, --block-number         每个信息都显示归档内的块数
      --show-defaults        显示 tar 默认选项
      --show-omitted-dirs    列表或解压时,列出每个不匹配查找标准的目录
      --show-transformed-names, --show-stored-names
                             显示变换后的文件名或归档名
      --totals[=SIGNAL]      处理归档后打印出总字节数;当此
                             SIGNAL 被触发时带参数 - 打印总字节数;允许的信号为:
                             SIGHUP,SIGQUIT,SIGINT,SIGUSR1 和
                             SIGUSR2;同时也接受不带 SIG 前缀的信号名称
      --utc                  以 UTC 格式打印文件修改时间
  -v, --verbose              详细地列出处理的文件
      --warning=KEYWORD      警告控制:
  -w, --interactive, --confirmation
                             每次操作都要求确认

 兼容性选项:
  -o                         创建归档时,相当于
                             --old-archive;展开归档时,相当于
                             --no-same-owner

 其它选项:
  -?, --help                 显示此帮助列表
      --restrict             禁用某些潜在的有危险的选项
      --usage                显示简短的用法说明
      --version              打印程序版本

长选项和相应短选项具有相同的强制参数或可选参数。

除非以 --suffix 或 SIMPLE_BACKUP_SUFFIX
设置备份后缀,否则备份后缀就是“~”。
可以用 --backup 或 VERSION_CONTROL 设置版本控制,可能的值为:

  none, off         从不做备份
  t, numbered       进行编号备份
  nil, existing     如果编号备份存在则进行编号备份,否则进行简单备份
  never, simple     总是使用简单备份

--quoting-style 选项的有效参数为:
  literal
  shell
  shell-always
  c
  c-maybe
  escape
  locale
  clocale

此 tar 默认为:
--format=gnu -f- -b20 --quoting-style=escape --rmt-command=/etc/rmt
--rsh-command=/usr/bin/ssh

将错误报告发送到 <bug-tar@gnu.org>。

实例:将 bak 目录打包成 bak.tar 文件。如下:

## 将 bak 目录打包成 bak.tar 文件
[root@localhost ~]# tar -cvf bak.tar bak/
bak/
bak/tree-1.5.3-3.el6.x86_64.rpm
bak/tree-1.6.0-10.el7.x86_64.rpm
bak/data1/
bak/data2/
bak/data2/data.txt
bak/vim-8.2.1253-1.1.x86_64.rpm
bak/tmp/
bak/tmp/data/
bak/tmp/data/hello.txt~
bak/tmp/data/hello.txt
bak/tmp/data/hello_bak.txt
bak/tmp/data1/
bak/tmp/data1/data.txt
bak/rarlinux-x64-5.9.1.tar.gz

## 查看打包结果
[root@localhost ~]# ll bak.tar
-rw-r--r--. 1 root root 2641920 8月   8 18:45 bak.tar

上面用到了 tar 命令的 3 个选项。其中:

  • c 表示 tar 命令将创建归档文件

  • v 用于显示命令的执行过程

  • f 用于指定归档文件文件名称,上面设置为 bak.tar

注意:tar 和 gzip 不同,tar 打包完成后不会删除原来的文件。

怎样解压 tar 文件呢?只需要将 -c 选项改成 -x 选项既可以了。如下:

## 解压 tar 文件
[root@localhost tmp]# tar -xvf bak.tar
bak/
bak/tree-1.5.3-3.el6.x86_64.rpm
bak/tree-1.6.0-10.el7.x86_64.rpm
bak/data1/
bak/data2/
bak/data2/data.txt
bak/vim-8.2.1253-1.1.x86_64.rpm
bak/tmp/
bak/tmp/data/
bak/tmp/data/hello.txt~
bak/tmp/data/hello.txt
bak/tmp/data/hello_bak.txt
bak/tmp/data1/
bak/tmp/data1/data.txt
bak/rarlinux-x64-5.9.1.tar.gz

## 查看解压结果
[root@localhost tmp]# ll
总用量 2580
drwxr-xr-x. 5 root root     182 8月   6 06:36 bak
-rw-r--r--. 1 root root 2641920 8月   8 18:45 bak.tar

怎样实现每次将单个文件加入归档文件,或从归档文件提取单个文件时给出提示,要求用户输入Y或N。我们可以使用 -w 选项实现,如下:

## 打包 data 目录,只打包 data1.db 和 data2.db 文件
[root@localhost ~]# tar -cvwf data.tar data/
add “data”?Y
data/
add “data/data1.db”?Y
data/data1.db
add “data/data2.db”?Y
data/data2.db
add “data/data3.db”?N

解开 tar 文件时也可以使用 -w 选项实现提示信息。如下:

## 解压 tar 文件,我们只提取了 data1.db 文件
[root@localhost tmp]# tar -xvwf data.tar
extract “data”?Y
data/
extract “data/data1.db”?Y
data/data1.db
extract “data/data2.db”?N

## 查看解压结果
[root@localhost tmp]# ll ./data
总用量 0
-rw-r--r--. 1 root root 0 8月   8 18:58 data1.db

需要注意,上面几个实例虽然对目录/文件打包了,但是并没有压缩文件。还好,tar 提供了 -z 选项,该选项将调用 gzip 对文件进行压缩。创建归档文件时,tar 程序在最后调用 gzip 压缩归档文件。在解压归档文件时,tar 程序先调用 gzip 解压文件,然后再次解开被 gzip 处理的 tar 文件。例如:

## 创建 tar.gz 压缩文件
[root@localhost ~]# tar -czvf bak.tar.gz bak/
bak/
bak/tree-1.5.3-3.el6.x86_64.rpm
bak/tree-1.6.0-10.el7.x86_64.rpm
bak/data1/
bak/data2/
bak/data2/data.txt
bak/vim-8.2.1253-1.1.x86_64.rpm
bak/tmp/
bak/tmp/data/
bak/tmp/data/hello.txt~
bak/tmp/data/hello.txt
bak/tmp/data/hello_bak.txt
bak/tmp/data1/
bak/tmp/data1/data.txt
bak/rarlinux-x64-5.9.1.tar.gz

## 查看结果
[root@localhost ~]# ll bak.tar.gz
-rw-r--r--. 1 root root 2480036 8月   8 19:19 bak.tar.gz

上下命令相当于,先用 tar 归档,然后使用 gzip 对 tar 文件进行压缩。如下:

## 先创建 tar 归档文件
[root@localhost ~]# tar -cvf bak.tar bak/
bak/
bak/tree-1.5.3-3.el6.x86_64.rpm
bak/tree-1.6.0-10.el7.x86_64.rpm
bak/data1/
bak/data2/
bak/data2/data.txt
bak/vim-8.2.1253-1.1.x86_64.rpm
bak/tmp/
bak/tmp/data/
bak/tmp/data/hello.txt~
bak/tmp/data/hello.txt
bak/tmp/data/hello_bak.txt
bak/tmp/data1/
bak/tmp/data1/data.txt
bak/rarlinux-x64-5.9.1.tar.gz

## 再次压缩 bak.tar 文件
[root@localhost ~]# gzip bak.tar

## 查看结果
[root@localhost ~]# ll
总用量 2424
drwxr-xr-x. 5 root root     182 8月   6 06:36 bak
-rw-r--r--. 1 root root 2480044 8月   8 19:21 bak.tar.gz

解压 tar.gz 文件,如下:

[root@localhost ~]# ll
总用量 2424
-rw-r--r--. 1 root root 2480044 8月   8 19:21 bak.tar.gz

## 解压 bak.tar.gz 文件
[root@localhost ~]# tar -xvzf bak.tar.gz
bak/
bak/tree-1.5.3-3.el6.x86_64.rpm
bak/tree-1.6.0-10.el7.x86_64.rpm
bak/data1/
bak/data2/
bak/data2/data.txt
bak/vim-8.2.1253-1.1.x86_64.rpm
bak/tmp/
bak/tmp/data/
bak/tmp/data/hello.txt~
bak/tmp/data/hello.txt
bak/tmp/data/hello_bak.txt
bak/tmp/data1/
bak/tmp/data1/data.txt
bak/rarlinux-x64-5.9.1.tar.gz

## 查看结果
[root@localhost ~]# ll
总用量 2424
drwxr-xr-x. 5 root root     182 8月   6 06:36 bak
-rw-r--r--. 1 root root 2480044 8月   8 19:21 bak.tar.gz

tar 解压也是先调用 gunzip 解压,然后使用 tar 解开 tar 文件。如下:

[root@localhost ~]# ll
总用量 2424
-rw-r--r--. 1 root root 2480044 8月   8 19:21 bak.tar.gz

## 使用 gunzip 解压缩
[root@localhost ~]# gunzip bak.tar.gz

[root@localhost ~]# ll
总用量 2580
-rw-r--r--. 1 root root 2641920 8月   8 19:21 bak.tar

## 使用 tar 将 bak.tar 提取文件
[root@localhost ~]# tar -xvf bak.tar
bak/
bak/tree-1.5.3-3.el6.x86_64.rpm
bak/tree-1.6.0-10.el7.x86_64.rpm
bak/data1/
bak/data2/
bak/data2/data.txt
bak/vim-8.2.1253-1.1.x86_64.rpm
bak/tmp/
bak/tmp/data/
bak/tmp/data/hello.txt~
bak/tmp/data/hello.txt
bak/tmp/data/hello_bak.txt
bak/tmp/data1/
bak/tmp/data1/data.txt
bak/rarlinux-x64-5.9.1.tar.gz

## 查看结果
[root@localhost ~]# ll
总用量 2580
drwxr-xr-x. 5 root root     182 8月   6 06:36 bak
-rw-r--r--. 1 root root 2641920 8月   8 19:21 bak.tar

tar 命令还可以使用 -j 参数调用 bzip2 程序,对 tar 文件进行压缩。该参数的用法和 -z 参数用法完全一致。如下:

## 创建 tar.bz2 文件
[root@localhost ~]# tar -cvjf bak.tar.bz2 bak/

## 解压 tar.bz2 文件
[root@localhost tmp]# tar -xvjf bak.tar.bz2

dd 命令

dd 命令曾经广泛地用于复制文件系统,但因为有了更好的 dump 和 restore 命令,dd 现在已经很少使用了,下面还是将介绍 dd 命令的简单用法。

dd 命令使用 if 选项指定输入端的文件系统,而 of 选项指定输出端。下面命令将一张光盘内容存储为 iso 镜像文件。例如:

## 将光盘内容保存到 CD.tar 文件中
[root@localhost ~]# dd if=/dev/cdrom of=CD.iso
记录了16524+0 的读入
记录了16524+0 的写出
8460288字节(8.5 MB)已复制,0.0738448 秒,115 MB/秒

## 查看结果
[root@localhost ~]# ll
总用量 8264
drwxr-xr-x. 5 root root     182 8月   6 06:36 bak
-rw-r--r--. 1 root root 8460288 8月   8 19:47 CD.iso
drwxr-xr-x. 3 root root      36 8月   8 19:39 tmp

dd 命令也可以用在两个大小完全相同的分区或磁盘之间复制文件系统。但是如果使用不正确,dd 命令可能破坏分区信息,因此一般不推荐这样做。

说说我的看法
全部评论(
没有评论
关于
本网站专注于 Java、数据库(MySQL、Oracle)、Linux、软件架构及大数据等多领域技术知识分享。涵盖丰富的原创与精选技术文章,助力技术传播与交流。无论是技术新手渴望入门,还是资深开发者寻求进阶,这里都能为您提供深度见解与实用经验,让复杂编码变得轻松易懂,携手共赴技术提升新高度。如有侵权,请来信告知:hxstrive@outlook.com
公众号