W jaki sposób nadmiarowość jest wdrażana podczas kompresowania i jak z niej skorzystać?
Zakładam, że składa się z czegoś takiego jak przechowywanie tablic wyszukiwania dwa razy, więc pojedyncza wada nie unieważnia całej reszty pliku. Jeśli chodzi o przypadek użycia, być może podczas przechowywania pliku na dysku CD, który ma niewielkie rysy?
Jednak osobiście nigdy nie zyskałem na dodawaniu nadmiarowości do plików zip i zwykle je pomijam, więc zastanawiałem się, czy faktycznie są one przydatne w praktyce.
Odpowiedzi:
Myślę, że mówisz o algorytmie adaptacyjnym LZ. Nie jest to określane jako redundancja z powodu wszystkiego, co jest duplikowane podczas budowania pliku zip. Termin pochodzi od tego, jak działa ta metoda kompresji.
Aby to zilustrować, oto przykład. Powiedzmy, że miałem dokument zawierający frazę:
Gdybym chciał skrócić tę frazę poprzez redundancję, najpierw stworzyłbym słownik zawierający wszystkie powtórzone słowa, tak
A potem przepisałbym zdanie jako
Jeśli chcę go później skompresować, mogę dodać do mojego słownika:
Tak się staje
Jak widać, im więcej kontroli nadmiarowości, tym większa kompresja. Ale zwiększasz również prawdopodobieństwo korupcji. Wynika to z faktu, że wraz ze wzrostem słownika staje się on bardziej podatny na uszkodzenia, a jeśli jakakolwiek część słownika ulegnie uszkodzeniu, reszty nie można odczytać.
źródło