Dlaczego gzipowanie pliku na standardowym wyjściu daje mniejszy wynik niż ten sam plik podany jako argument?

13

Kiedy robię:

# gzip -c foo > foo1.gz 
# gzip < foo > foo2.gz

Dlaczego foo2.gzostatecznie jest mniejszy niż foo1.gz?

MichalH
źródło

Odpowiedzi:

19

Ponieważ zapisuje nazwę pliku i znacznik czasu, dzięki czemu może spróbować przywrócić oba pliki po późniejszej dekompresji. Ponieważ w drugim przykładzie foopodano parametr gzipvia <stdin>, nie może przechowywać informacji o nazwie pliku i znaczniku czasu.

Z strony podręcznika:

   -n --no-name
          When compressing, do not save the original file name and time stamp by default. (The original name is always saved if the name had
          to  be truncated.) When decompressing, do not restore the original file name if present (remove only the gzip suffix from the com-
          pressed file name) and do not restore the original time stamp if present (copy it from the compressed file). This  option  is  the
          default when decompressing.

   -N --name
          When compressing, always save the original file name and time stamp; this is the default. When decompressing, restore the original
          file name and time stamp if present. This option is useful on systems which have a limit on file name  length  or  when  the  time
          stamp has been lost after a file transfer.

Problem odtworzyłem tutaj:

[root@xxx601 ~]# cat /etc/fstab > file.txt
[root@xxx601 ~]# gzip < file.txt > file.txt.gz
[root@xxx601 ~]# gzip -c file.txt > file2.txt.gz
[root@xxx601 ~]# ll -h file*
-rw-r--r--. 1 root root  465 May 17 19:35 file2.txt.gz
-rw-r--r--. 1 root root 1.2K May 17 19:34 file.txt
-rw-r--r--. 1 root root  456 May 17 19:34 file.txt.gz

W moim przykładzie file.txt.gzjest to odpowiednik twojego foo2.gz. Użycie -nopcji wyłącza to zachowanie, gdy w przeciwnym razie miałby dostęp do informacji:

[root@xxx601 ~]# gzip -nc file.txt > file3.txt.gz
[root@xxx601 ~]# ll -h file*
-rw-r--r--. 1 root root  465 May 17 19:35 file2.txt.gz
-rw-r--r--. 1 root root  456 May 17 19:43 file3.txt.gz
-rw-r--r--. 1 root root 1.2K May 17 19:34 file.txt
-rw-r--r--. 1 root root  456 May 17 19:34 file.txt.gz

Jak widać powyżej, rozmiary plików file.txti są file3.txtzgodne, ponieważ teraz zarówno pomijają nazwę, jak i datę.

Bratchley
źródło