Jak „Rozmiar słowa” wpływa na kompresję?

24

W 7 Zip podczas dodawania folderu do archiwum istnieje możliwość zmiany rozmiaru słowa.

Jak ten rozmiar słowa wpływa na kompresję, w szczególności końcowy rozmiar zamka?

Zauważyłem, że zmiana poziomu kompresji zwiększa rozmiar słowa, jednak nawet w ultra wybiera on tylko rozmiar słowa 128, nawet jeśli największa opcja jest ponad dwukrotnie większa. Czy istnieje powód, dla którego ultra nie wybiera największego? Czy optymalny rozmiar kompresji jest gdzieś pomiędzy największym a najmniejszym rozmiarem słowa?

Aequitas
źródło
Sprawdź, co Shell mówi w tym poście o części twoich pytań tutaj -> Post .
Pimp Juice IT
@LMFAO_A_JOKE, który mówi tylko, że dla niektórych plików lepiej jest czasem lepiej nie
Aequitas
1
To NIE ODPOWIADA na wszystkie twoje pytania bardzo szczegółowo, ale w JEDNYM pytaniu -> How does this word size affect compression, in particular the final size of the zip?myślę, że w części wpisu WordSize: usually the bigger, the better (and slower) for well-compressible data (such as documents). Archive size depends quite non-monotonically of it.wyjaśniono CZĘŚĆ zestawu pytań. Dlatego umieściłem to tutaj tylko w komentarzu i NIE odpowiadałem - próbuję wam coś dać !!!
Pimp Juice IT
Co oznacza ostatnie zdanie, Rozmiar archiwum ... nie monotonicznie
Aequitas
1
Myślę, że oznacza to, że rozmiar archiwum będzie mniejszy (bardziej zmniejszy się od rozmiaru oryginalnego) „zwykle” przy większej wartości WordSize, ale „zależy” od ściśliwości kompresowanych typów danych, takich jak tekst w przeciwieństwie do plików graficznych, być może jako jeden z przykładów. Sugerowano, aby przetestować różne wartości, aby uzyskać najbardziej optymalną wartość dla danych, aby wiedzieć, że wybierasz najlepsze opcje w zależności od potrzeb.
Pimp Juice IT

Odpowiedzi:

8

To zależy od kompresowanych danych i zastosowanego algorytmu.

Rozmiar słowa

Wprowadź długość słów, które zostaną użyte do znalezienia identycznych sekwencji bajtów do kompresji. W przypadku LZMA duży rozmiar słowa zwykle zapewnia nieco lepszy współczynnik kompresji i wolniejszy proces kompresji. Parametr dużego słowa może znacznie zwiększyć współczynnik kompresji w przypadku, gdy pliki zawierają długie identyczne sekwencje bajtów. Dla PPMd rozmiar słowa ma duże znaczenie. Silnie wpływa zarówno na współczynnik kompresji, jak i szybkość kompresji / dekompresji.

Istnieje kilka porównań tutaj

Hefewe1zen
źródło