点击访问 Linux 命令大全 >>
文件存档指将一大堆零散的文件打包成一个特殊后缀的文件(如:.tar),这样我们就更容易对文件备份、传输、携带等操作。
文件存档的根本目的是为了让“文件”的携带和保存更为便捷。Linux 中最著名的文件打包工具是 tar,这个程序读取多个文件和目录,并将它们打包成一个文件。
语法如下:
用法: tar [选项...] [FILE]... GNU ‘tar’ 将许多文件一起保存至一个单独的磁带或磁盘归档,并能从归档中单独还原所需文件。 示例 tar -cf archive.tar foo bar # 从文件 foo 和 bar 创建归档文件 archive.tar。 tar -tvf archive.tar # 详细列举归档文件 archive.tar 中的所有文件。 tar -xf archive.tar # 展开归档文件 archive.tar 中的所有文件。 主操作模式: -A, --catenate, --concatenate 追加 tar 文件至归档 -c, --create 创建一个新归档 -d, --diff, --compare 找出归档和文件系统的差异 --delete 从归档(非磁带!)中删除 -r, --append 追加文件至归档结尾 -t, --list 列出归档内容 --test-label 测试归档卷标并退出 -u, --update 仅追加比归档中副本更新的文件 -x, --extract, --get 从归档中解出文件 操作修饰符: --check-device 当创建增量归档时检查设备号(默认) -g, --listed-incremental=FILE 处理新式的 GNU 格式的增量备份 -G, --incremental 处理老式的 GNU 格式的增量备份 --ignore-failed-read 当遇上不可读文件时不要以非零值退出 --level=NUMBER 所创建的增量列表归档的输出级别 -n, --seek 归档可检索 --no-check-device 当创建增量归档时不要检查设备号 --no-seek 归档不可检索 --occurrence[=NUMBER] 仅处理归档中每个文件的第 NUMBER 个事件;仅当与以下子命令 --delete, --diff, --extract 或是 --list 中的一个联合使用时,此选项才有效。而且不管文件列表是以命令行形式给出或是通过 -T 选项指定的;NUMBER 值默认为 1 --sparse-version=MAJOR[.MINOR] 设置所用的离散格式版本(隐含 --sparse) -S, --sparse 高效处理离散文件 重写控制: -k, --keep-old-files don't replace existing files when extracting, treat them as errors --keep-directory-symlink preserve existing symlinks to directories when extracting --keep-newer-files 不要替换比归档中副本更新的已存在的文件 --no-overwrite-dir 保留已存在目录的元数据 --overwrite 解压时重写存在的文件 --overwrite-dir 解压时重写已存在目录的元数据(默认) --recursive-unlink 解压目录之前先清除目录层次 --remove-files 在添加文件至归档后删除它们 --skip-old-files don't replace existing files when extracting, silently skip over them -U, --unlink-first 在解压要重写的文件之前先删除它们 -W, --verify 在写入以后尝试校验归档 选择输出流: --ignore-command-error 忽略子进程的退出代码 --no-ignore-command-error 将子进程的非零退出代码认为发生错误 -O, --to-stdout 解压文件至标准输出 --to-command=COMMAND 将解压的文件通过管道传送至另一个程序 操作文件属性: --atime-preserve[=METHOD] 在输出的文件上保留访问时间,要么通过在读取( 默认 METHOD=‘replace’)后还原时间,要不就不要在第一次(METHOD=‘system’)设置时间 --delay-directory-restore 直到解压结束才设置修改时间和所解目录的权限 --group=名称 强制将 NAME 作为所添加的文件的组所有者 --mode=CHANGES 强制将所添加的文件(符号)更改为权限 CHANGES --mtime=DATE-OR-FILE 从 DATE-OR-FILE 中为添加的文件设置 mtime -m, --touch 不要解压文件的修改时间 --no-delay-directory-restore 取消 --delay-directory-restore 选项的效果 --no-same-owner 将文件解压为您所有(普通用户默认此项) --no-same-permissions 从归档中解压权限时使用用户的掩码位(默认为普通用户服务) --numeric-owner 总是以数字代表用户/组的名称 --owner=名称 强制将 NAME 作为所添加的文件的所有者 -p, --preserve-permissions, --same-permissions 解压文件权限信息(默认只为超级用户服务) --preserve 与 -p 和 -s 一样 --same-owner 尝试解压时保持所有者关系一致(超级用户默认此项) -s, --preserve-order, --same-order member arguments are listed in the same order as the files in the archive Handling of extended file attributes: --acls Enable the POSIX ACLs support --no-acls Disable the POSIX ACLs support --no-selinux Disable the SELinux context support --no-xattrs Disable extended attributes support --selinux Enable the SELinux context support --xattrs Enable extended attributes support --xattrs-exclude=MASK specify the exclude pattern for xattr keys --xattrs-include=MASK specify the include pattern for xattr keys 设备选择和切换: -f, --file=ARCHIVE 使用归档文件或 ARCHIVE 设备 --force-local 即使归档文件存在副本还是把它认为是本地归档 -F, --info-script=名称, --new-volume-script=名称 在每卷磁带最后运行脚本(隐含 -M) -L, --tape-length=NUMBER 写入 NUMBER × 1024 字节后更换磁带 -M, --multi-volume 创建/列出/解压多卷归档文件 --rmt-command=COMMAND 使用指定的 rmt COMMAND 代替 rmt --rsh-command=COMMAND 使用远程 COMMAND 代替 rsh --volno-file=FILE 使用/更新 FILE 中的卷数 设备分块: -b, --blocking-factor=BLOCKS 每个记录 BLOCKS x 512 字节 -B, --read-full-records 读取时重新分块(只对 4.2BSD 管道有效) -i, --ignore-zeros 忽略归档中的零字节块(即文件结尾) --record-size=NUMBER 每个记录的字节数 NUMBER,乘以 512 选择归档格式: -H, --format=FORMAT 创建指定格式的归档 FORMAT 是以下格式中的一种: gnu GNU tar 1.13.x 格式 oldgnu GNU 格式 as per tar <= 1.12 pax POSIX 1003.1-2001 (pax) 格式 posix 等同于 pax ustar POSIX 1003.1-1988 (ustar) 格式 v7 old V7 tar 格式 --old-archive, --portability 等同于 --format=v7 --pax-option=关键字[[:]=值][,关键字[[:]=值]]... 控制 pax 关键字 --posix 等同于 --format=posix -V, --label=TEXT 创建带有卷名 TEXT 的归档;在列出/解压时,使用 TEXT 作为卷名的模式串 压缩选项: -a, --auto-compress 使用归档后缀名来决定压缩程序 -I, --use-compress-program=PROG 通过 PROG 过滤(必须是能接受 -d 选项的程序) -j, --bzip2 通过 bzip2 过滤归档 -J, --xz 通过 xz 过滤归档 --lzip 通过 lzip 过滤归档 --lzma 通过 lzma 过滤归档 --lzop --no-auto-compress 不使用归档后缀名来决定压缩程序 -z, --gzip, --gunzip, --ungzip 通过 gzip 过滤归档 -Z, --compress, --uncompress 通过 compress 过滤归档 本地文件选择: --add-file=FILE 添加指定的 FILE 至归档(如果名字以 - 开始会很有用的) --backup[=CONTROL] 在删除前备份,选择 CONTROL 版本 -C, --directory=DIR 改变至目录 DIR --exclude=PATTERN 排除以 PATTERN 指定的文件 --exclude-backups 排除备份和锁文件 --exclude-caches 除标识文件本身外,排除包含 CACHEDIR.TAG 的目录中的内容 --exclude-caches-all 排除包含 CACHEDIR.TAG 的目录 --exclude-caches-under 排除包含 CACHEDIR.TAG 的目录中所有内容 --exclude-tag=FILE 除 FILE 自身外,排除包含 FILE 的目录中的内容 --exclude-tag-all=FILE 排除包含 FILE 的目录 --exclude-tag-under=FILE 排除包含 FILE 的目录中的所有内容 --exclude-vcs 排除版本控制系统目录 -h, --dereference 跟踪符号链接;将它们所指向的文件归档并输出 --hard-dereference 跟踪硬链接;将它们所指向的文件归档并输出 -K, --starting-file=MEMBER-NAME begin at member MEMBER-NAME when reading the archive --newer-mtime=DATE 当只有数据改变时比较数据和时间 --no-null 禁用上一次的效果 --null 选项 --no-recursion 避免目录中的自动降级 --no-unquote 不以 -T 读取的文件名作为引用结束 --null -T 读取以空终止的名字,-C 禁用 -N, --newer=DATE-OR-FILE, --after-date=DATE-OR-FILE 只保存比 DATE-OR-FILE 更新的文件 --one-file-system 创建归档时保存在本地文件系统中 -P, --absolute-names 不要从文件名中清除引导符‘/’ --recursion 目录递归(默认) --suffix=STRING 在删除前备份,除非被环境变量 SIMPLE_BACKUP_SUFFIX 覆盖,否则覆盖常用后缀(‘’) -T, --files-from=FILE 从 FILE 中获取文件名来解压或创建文件 --unquote 以 -T 读取的文件名作为引用结束(默认) -X, --exclude-from=FILE 排除 FILE 中列出的模式串 文件名变换: --strip-components=NUMBER 解压时从文件名中清除 NUMBER 个引导部分 --transform=EXPRESSION, --xform=EXPRESSION 使用 sed 代替 EXPRESSION 来进行文件名变换 文件名匹配选项(同时影响排除和包括模式串): --anchored 模式串匹配文件名头部 --ignore-case 忽略大小写 --no-anchored 模式串匹配任意‘/’后字符(默认对 exclusion 有效) --no-ignore-case 匹配大小写(默认) --no-wildcards 逐字匹配字符串 --no-wildcards-match-slash 通配符不匹配‘/’ --wildcards use wildcards (default) --wildcards-match-slash 通配符匹配‘/’(默认对排除操作有效) 提示性输出: --checkpoint[=NUMBER] 每隔 NUMBER 个记录显示进度信息(默认为 10 个) --checkpoint-action=ACTION 在每个检查点上执行 ACTION --full-time print file time to its full resolution --index-file=FILE 将详细输出发送至 FILE -l, --check-links 只要不是所有链接都被输出就打印信息 --no-quote-chars=STRING 禁用来自 STRING 的字符引用 --quote-chars=STRING 来自 STRING 的额外的引用字符 --quoting-style=STYLE 设置名称引用风格;有效的 STYLE 值请参阅以下说明 -R, --block-number 每个信息都显示归档内的块数 --show-defaults 显示 tar 默认选项 --show-omitted-dirs 列表或解压时,列出每个不匹配查找标准的目录 --show-transformed-names, --show-stored-names 显示变换后的文件名或归档名 --totals[=SIGNAL] 处理归档后打印出总字节数;当此 SIGNAL 被触发时带参数 - 打印总字节数;允许的信号为: SIGHUP,SIGQUIT,SIGINT,SIGUSR1 和 SIGUSR2;同时也接受不带 SIG 前缀的信号名称 --utc 以 UTC 格式打印文件修改时间 -v, --verbose 详细地列出处理的文件 --warning=KEYWORD 警告控制: -w, --interactive, --confirmation 每次操作都要求确认 兼容性选项: -o 创建归档时,相当于 --old-archive;展开归档时,相当于 --no-same-owner 其它选项: -?, --help 显示此帮助列表 --restrict 禁用某些潜在的有危险的选项 --usage 显示简短的用法说明 --version 打印程序版本 长选项和相应短选项具有相同的强制参数或可选参数。 除非以 --suffix 或 SIMPLE_BACKUP_SUFFIX 设置备份后缀,否则备份后缀就是“~”。 可以用 --backup 或 VERSION_CONTROL 设置版本控制,可能的值为: none, off 从不做备份 t, numbered 进行编号备份 nil, existing 如果编号备份存在则进行编号备份,否则进行简单备份 never, simple 总是使用简单备份 --quoting-style 选项的有效参数为: literal shell shell-always c c-maybe escape locale clocale 此 tar 默认为: --format=gnu -f- -b20 --quoting-style=escape --rmt-command=/etc/rmt --rsh-command=/usr/bin/ssh 将错误报告发送到 <bug-tar@gnu.org>。
实例:将 bak 目录打包成 bak.tar 文件。如下:
## 将 bak 目录打包成 bak.tar 文件 [root@localhost ~]# tar -cvf bak.tar bak/ bak/ bak/tree-1.5.3-3.el6.x86_64.rpm bak/tree-1.6.0-10.el7.x86_64.rpm bak/data1/ bak/data2/ bak/data2/data.txt bak/vim-8.2.1253-1.1.x86_64.rpm bak/tmp/ bak/tmp/data/ bak/tmp/data/hello.txt~ bak/tmp/data/hello.txt bak/tmp/data/hello_bak.txt bak/tmp/data1/ bak/tmp/data1/data.txt bak/rarlinux-x64-5.9.1.tar.gz ## 查看打包结果 [root@localhost ~]# ll bak.tar -rw-r--r--. 1 root root 2641920 8月 8 18:45 bak.tar
上面用到了 tar 命令的 3 个选项。其中:
c 表示 tar 命令将创建归档文件
v 用于显示命令的执行过程
f 用于指定归档文件文件名称,上面设置为 bak.tar
注意:tar 和 gzip 不同,tar 打包完成后不会删除原来的文件。
怎样解压 tar 文件呢?只需要将 -c 选项改成 -x 选项既可以了。如下:
## 解压 tar 文件 [root@localhost tmp]# tar -xvf bak.tar bak/ bak/tree-1.5.3-3.el6.x86_64.rpm bak/tree-1.6.0-10.el7.x86_64.rpm bak/data1/ bak/data2/ bak/data2/data.txt bak/vim-8.2.1253-1.1.x86_64.rpm bak/tmp/ bak/tmp/data/ bak/tmp/data/hello.txt~ bak/tmp/data/hello.txt bak/tmp/data/hello_bak.txt bak/tmp/data1/ bak/tmp/data1/data.txt bak/rarlinux-x64-5.9.1.tar.gz ## 查看解压结果 [root@localhost tmp]# ll 总用量 2580 drwxr-xr-x. 5 root root 182 8月 6 06:36 bak -rw-r--r--. 1 root root 2641920 8月 8 18:45 bak.tar
怎样实现每次将单个文件加入归档文件,或从归档文件提取单个文件时给出提示,要求用户输入Y或N。我们可以使用 -w 选项实现,如下:
## 打包 data 目录,只打包 data1.db 和 data2.db 文件 [root@localhost ~]# tar -cvwf data.tar data/ add “data”?Y data/ add “data/data1.db”?Y data/data1.db add “data/data2.db”?Y data/data2.db add “data/data3.db”?N
解开 tar 文件时也可以使用 -w 选项实现提示信息。如下:
## 解压 tar 文件,我们只提取了 data1.db 文件 [root@localhost tmp]# tar -xvwf data.tar extract “data”?Y data/ extract “data/data1.db”?Y data/data1.db extract “data/data2.db”?N ## 查看解压结果 [root@localhost tmp]# ll ./data 总用量 0 -rw-r--r--. 1 root root 0 8月 8 18:58 data1.db
需要注意,上面几个实例虽然对目录/文件打包了,但是并没有压缩文件。还好,tar 提供了 -z 选项,该选项将调用 gzip 对文件进行压缩。创建归档文件时,tar 程序在最后调用 gzip 压缩归档文件。在解压归档文件时,tar 程序先调用 gzip 解压文件,然后再次解开被 gzip 处理的 tar 文件。例如:
## 创建 tar.gz 压缩文件 [root@localhost ~]# tar -czvf bak.tar.gz bak/ bak/ bak/tree-1.5.3-3.el6.x86_64.rpm bak/tree-1.6.0-10.el7.x86_64.rpm bak/data1/ bak/data2/ bak/data2/data.txt bak/vim-8.2.1253-1.1.x86_64.rpm bak/tmp/ bak/tmp/data/ bak/tmp/data/hello.txt~ bak/tmp/data/hello.txt bak/tmp/data/hello_bak.txt bak/tmp/data1/ bak/tmp/data1/data.txt bak/rarlinux-x64-5.9.1.tar.gz ## 查看结果 [root@localhost ~]# ll bak.tar.gz -rw-r--r--. 1 root root 2480036 8月 8 19:19 bak.tar.gz
上下命令相当于,先用 tar 归档,然后使用 gzip 对 tar 文件进行压缩。如下:
## 先创建 tar 归档文件 [root@localhost ~]# tar -cvf bak.tar bak/ bak/ bak/tree-1.5.3-3.el6.x86_64.rpm bak/tree-1.6.0-10.el7.x86_64.rpm bak/data1/ bak/data2/ bak/data2/data.txt bak/vim-8.2.1253-1.1.x86_64.rpm bak/tmp/ bak/tmp/data/ bak/tmp/data/hello.txt~ bak/tmp/data/hello.txt bak/tmp/data/hello_bak.txt bak/tmp/data1/ bak/tmp/data1/data.txt bak/rarlinux-x64-5.9.1.tar.gz ## 再次压缩 bak.tar 文件 [root@localhost ~]# gzip bak.tar ## 查看结果 [root@localhost ~]# ll 总用量 2424 drwxr-xr-x. 5 root root 182 8月 6 06:36 bak -rw-r--r--. 1 root root 2480044 8月 8 19:21 bak.tar.gz
解压 tar.gz 文件,如下:
[root@localhost ~]# ll 总用量 2424 -rw-r--r--. 1 root root 2480044 8月 8 19:21 bak.tar.gz ## 解压 bak.tar.gz 文件 [root@localhost ~]# tar -xvzf bak.tar.gz bak/ bak/tree-1.5.3-3.el6.x86_64.rpm bak/tree-1.6.0-10.el7.x86_64.rpm bak/data1/ bak/data2/ bak/data2/data.txt bak/vim-8.2.1253-1.1.x86_64.rpm bak/tmp/ bak/tmp/data/ bak/tmp/data/hello.txt~ bak/tmp/data/hello.txt bak/tmp/data/hello_bak.txt bak/tmp/data1/ bak/tmp/data1/data.txt bak/rarlinux-x64-5.9.1.tar.gz ## 查看结果 [root@localhost ~]# ll 总用量 2424 drwxr-xr-x. 5 root root 182 8月 6 06:36 bak -rw-r--r--. 1 root root 2480044 8月 8 19:21 bak.tar.gz
tar 解压也是先调用 gunzip 解压,然后使用 tar 解开 tar 文件。如下:
[root@localhost ~]# ll 总用量 2424 -rw-r--r--. 1 root root 2480044 8月 8 19:21 bak.tar.gz ## 使用 gunzip 解压缩 [root@localhost ~]# gunzip bak.tar.gz [root@localhost ~]# ll 总用量 2580 -rw-r--r--. 1 root root 2641920 8月 8 19:21 bak.tar ## 使用 tar 将 bak.tar 提取文件 [root@localhost ~]# tar -xvf bak.tar bak/ bak/tree-1.5.3-3.el6.x86_64.rpm bak/tree-1.6.0-10.el7.x86_64.rpm bak/data1/ bak/data2/ bak/data2/data.txt bak/vim-8.2.1253-1.1.x86_64.rpm bak/tmp/ bak/tmp/data/ bak/tmp/data/hello.txt~ bak/tmp/data/hello.txt bak/tmp/data/hello_bak.txt bak/tmp/data1/ bak/tmp/data1/data.txt bak/rarlinux-x64-5.9.1.tar.gz ## 查看结果 [root@localhost ~]# ll 总用量 2580 drwxr-xr-x. 5 root root 182 8月 6 06:36 bak -rw-r--r--. 1 root root 2641920 8月 8 19:21 bak.tar
tar 命令还可以使用 -j 参数调用 bzip2 程序,对 tar 文件进行压缩。该参数的用法和 -z 参数用法完全一致。如下:
## 创建 tar.bz2 文件 [root@localhost ~]# tar -cvjf bak.tar.bz2 bak/ ## 解压 tar.bz2 文件 [root@localhost tmp]# tar -xvjf bak.tar.bz2
dd 命令曾经广泛地用于复制文件系统,但因为有了更好的 dump 和 restore 命令,dd 现在已经很少使用了,下面还是将介绍 dd 命令的简单用法。
dd 命令使用 if 选项指定输入端的文件系统,而 of 选项指定输出端。下面命令将一张光盘内容存储为 iso 镜像文件。例如:
## 将光盘内容保存到 CD.tar 文件中 [root@localhost ~]# dd if=/dev/cdrom of=CD.iso 记录了16524+0 的读入 记录了16524+0 的写出 8460288字节(8.5 MB)已复制,0.0738448 秒,115 MB/秒 ## 查看结果 [root@localhost ~]# ll 总用量 8264 drwxr-xr-x. 5 root root 182 8月 6 06:36 bak -rw-r--r--. 1 root root 8460288 8月 8 19:47 CD.iso drwxr-xr-x. 3 root root 36 8月 8 19:39 tmp
dd 命令也可以用在两个大小完全相同的分区或磁盘之间复制文件系统。但是如果使用不正确,dd 命令可能破坏分区信息,因此一般不推荐这样做。