Dzisiaj przypadkowo dowiedziałem się, że .docx jest tym samym .zip (lub nie ma między nimi dużej różnicy). Kiedy zmienisz .docx na .zip i otworzysz za pomocą WinRAR, zobaczysz kilka plików XML w folderach. W tym pliku XML jest zapisany tekst, czcionki, właściciel, ostatnia modyfikacja i tak dalej. Jednym słowem wszystkie informacje są przechowywane jako dane XML.
Ale to samo nie jest odpowiednie dla plików z rozszerzeniem .doc. Nie można otworzyć ich jako .zip op jako .rar.
Pytanie: jaka jest korzyść z przechowywania danych .docx w XML, ponieważ Microsoft zmienił sposób przechowywania danych? Rzeczywiście nie chcę znać zalet formatu XML, ale dlaczego Microsoft używa wielu plików XML do przechowywania danych .docx. Okazuje się, że .docx nie jest nowym formatem w katalogu głównym.
źródło
Odpowiedzi:
.docx
Plik można zapisać osadzonych zasobów, takich jak pliki obrazu, a nie tylko pliki XML. Zamiast kodować rzeczy w base64 lub coś i przechowywać je w pliku XML lub wynaleźć inny binarny format serializacji, zdecydowali się na standardowy format ZIP.Poza tym XML jest bardzo pełnym formatem plików, zawierającym wiele zbędnych wzorców. Możesz uzyskać wysoki współczynnik kompresji dla plików XML.
Nawiasem mówiąc, tak naprawdę nie rozumiem części oszukiwania nas. Czy lepiej jest wymyślić od nowa nowy, tajemniczy format pliku, czy użyć standardowego znanego formatu?
źródło
Artykuł w Wikipedii całkiem ładnie podsumowuje:
„Microsoft znalazł się pod rosnącą presją, aby przyjąć otwarty format pliku, w szczególności kilka narodów przyjęło zasady, że oficjalne dokumenty powinny być w otwartym formacie”.
Edycja: spakowanie go ma sens, ponieważ XML jest bardzo szczegółowy i naturalnie bardzo dobrze się kompresuje.
źródło
Używanie pliku .zip o zmienionej nazwie jest dość powszechną praktyką - na przykład pliki .pak programu Quake III są tak naprawdę plikami .zip. Nie ma sensu wymyślać własnego skompresowanego formatu pliku, jeśli istnieją już doskonale dobre.
źródło
.jar
, Winamp.wsz
/.wal
(skórki), Firefox.xpi
(XPInstaller - motywy, dodatki). (tar
archiwa są również popularne.)Nie tylko Office Open XML wykorzystuje spakowany XML. OpenDocument Open Office robi to samo za kulisami.
Istnieje kilka zalet wymienionych na stronie Wikipedii w konwencji Open Packaging :
źródło
Największą zaletą jest to, że możesz dostać się do swoich danych poprzez rozpakowanie pliku i skopiowanie tekstu z plików XML. Można to zrobić za pomocą narzędzia zip i edytora tekstu, nawet jeśli nie masz kopii programu Word 2007.
To sprawia, że format jest bardziej otwarty niż starsze formaty binarne.
źródło