Jaka jest praktyczna wartość nadmiarowości w plikach zip?

9

W jaki sposób nadmiarowość jest wdrażana podczas kompresowania i jak z niej skorzystać?

Zakładam, że składa się z czegoś takiego jak przechowywanie tablic wyszukiwania dwa razy, więc pojedyncza wada nie unieważnia całej reszty pliku. Jeśli chodzi o przypadek użycia, być może podczas przechowywania pliku na dysku CD, który ma niewielkie rysy?

Jednak osobiście nigdy nie zyskałem na dodawaniu nadmiarowości do plików zip i zwykle je pomijam, więc zastanawiałem się, czy faktycznie są one przydatne w praktyce.

mafu
źródło
Płyty CD używają własnego rodzaju redundancji w celu kompensacji zarysowań itp. Nazywa się to modulacją od ośmiu do czternastu. Myślę, że lepszym przykładem użycia byłyby pliki do pobrania, które ulegają uszkodzeniu z jakichkolwiek powodów.
slhck

Odpowiedzi:

1

Myślę, że mówisz o algorytmie adaptacyjnym LZ. Nie jest to określane jako redundancja z powodu wszystkiego, co jest duplikowane podczas budowania pliku zip. Termin pochodzi od tego, jak działa ta metoda kompresji.

Aby to zilustrować, oto przykład. Powiedzmy, że miałem dokument zawierający frazę:

It is what it is because that's what it is

Gdybym chciał skrócić tę frazę poprzez redundancję, najpierw stworzyłbym słownik zawierający wszystkie powtórzone słowa, tak

1it
2is
3what

A potem przepisałbym zdanie jako

12312becausethats312 

Jeśli chcę go później skompresować, mogę dodać do mojego słownika:

312x
12y

Tak się staje

yxbecausethatsx

Jak widać, im więcej kontroli nadmiarowości, tym większa kompresja. Ale zwiększasz również prawdopodobieństwo korupcji. Wynika to z faktu, że wraz ze wzrostem słownika staje się on bardziej podatny na uszkodzenia, a jeśli jakakolwiek część słownika ulegnie uszkodzeniu, reszty nie można odczytać.

Blomkvist
źródło
2
Myślę, że nie o to mi chodziło. Mówiłem o opcji dodania informacji odzyskiwania. Ta funkcja może jednak nie istnieć w klasycznym formacie zip.
mafu
2
Dobra odpowiedź na inne pytanie: /
endolith