Dlaczego Word 2010 tworzy tak duże pliki PDF?

11

Dopiero teraz zauważyłem, że moje dokumenty Word 2010 (docx), które mają tylko jedną stronę, zawierają prostą grafikę wektorową WMF i trochę tekstu mają prawie 1 MB. Dokument programu Word ma tylko 50 kB, a plik PDF utworzony za pomocą drukarki Bullzip PDF ma mniej więcej ten sam rozmiar. Więc co Microsoft pisze do pozostałych 950 kB?

Aktualizacja: ponieważ ostatnio otrzymuję odpowiedzi, które nie dotyczą wszystkich, chciałbym oszczędzić Ci pracy. Problem zniknął po użyciu systemu Windows 7 zamiast XP (co zrobiłem ponad rok temu). Coś wydaje się nie być obsługiwane w starym systemie, podejrzewam, że to jakieś podzestawy czcionek. Nie mogę też wypróbować twoich sugestii, ponieważ problem już nie istnieje. Więc nie jestem w stanie zaakceptować odpowiedzi na to.

ygoe
źródło
Czy wyjście się zgadza? Domyślam się, że Word będzie pasował do formatu PDF bliżej niż Bullzip (osobiście nigdy o nim nie słyszałem).
Ramhound,
1
Zaczęło się to dopiero po najnowszych aktualizacjach WORD2010. Mam WORD2010 i Acro Reader 9.5, ale jeden komputer nie otrzymał najnowszych aktualizacji WORD. Ten pobiera mocno załadowany plik DOCX ze zdjęciami i konwertuje go W DÓŁ z 4 MB do 3 MB, drugi komputer z ostatnimi aktualizacjami WORD konwertuje DOCX z 4 MB do 18 MB. Nie mogę użyć tak dużego pliku. NIE AKTUALIZUJ SWOICH SŁÓW programów.
1
Wygląda na to, że Word eksportuje obrazy w formacie bitmapy o bardzo wysokiej rozdzielczości. Powiększ i porównaj pliki PDF wygenerowane przez Worda i Bullzipa i porównaj jakość
tumchaaditya
1
Och, kochanie, to jest stare. Program Word 2010 zaczął tworzyć pliki PDF o rozsądnych rozmiarach po przejściu z systemu Windows XP na Windows 7. Zakładam, że system Windows 7 ma interfejs API z podziałem czcionek, z którego korzysta program Word, którego nie ma w systemie Windows XP, więc zawsze zawierał całą czcionkę lub coś w tym rodzaju .
ygoe
1
Właśnie miałem ten sam problem podczas używania programu Word 2013 na Windows 7 Pro 64 bity: Mam plik Word 2013 (docx) o pojemności 14 kB TYLKO tekst lorem ipsum z domyślnym formatowaniem, program Word tworzy plik PDF 90 kB, gdy PDFcreator generuje plik PDF 22 kB. I rośnie szybko, ten sam plik z pewnym formatowaniem (tytuł, nagłówki 1 i 2), plik Word 15kB (bez zdjęć) staje się plikiem 230kB z zapisanym plikiem PDF Worda jako (przy maksymalnej kompresji), ale tylko 30kB z PDFcreatorem. Mój problem polega na tym, że PDFcreator nie przetwarza linków.
Thomas

Odpowiedzi:

3

Wciąż jest to problem z programem Word 2016. Być może nie taki sam jak PO, ale nadal tam jest: zacznij od dokumentu o wielkości 1 strony i rozmiarze 20 KB, zapisz jako PDF, a otrzymasz 300 KB PDF.

Nie mogę powiedzieć, dlaczego Word to robi, ale istnieje prosty sposób na zminimalizowanie tych plików PDF: zainstaluj GhostScript , a następnie uruchom następujące polecenie:

gswin64c.exe -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dQUIET -dBATCH "-sOutputFile=%2" "%1"

gdzie% 1 to wejściowy plik PDF, a% 2 to wyjściowy plik PDF. Zamienia ten 300 KB PDF na 40 KB PDF. Nadal nie tak mały jak CutePDF (ten zarządzał około 30 KB dla tego samego dokumentu), ale ogromna poprawa.

Lub po prostu pomiń ten krok i wydrukuj bezpośrednio w CutePDF.

RomanSt
źródło
1
Zobacz komentarz Arjana do odpowiedzi Jakke.
fixer1234
Tworzenie kopii zapasowej odpowiedzi. Zamiast 670k, cutePDF utworzył plik 170k.
szako
Tak, wywołanie GhostScript daje ogromne oszczędności - zwłaszcza w połączeniu z „Microsoft print to PDF” zamiast „Save as PDF”. Jednak GhostScript obniża również jakość osadzonej grafiki. Czy można zachować jakość osadzonej grafiki i zoptymalizować resztę?
Pygmalion
@Pygmalion zobacz to - jeszcze nie próbowałem, ale jest kilka opcji.
RomanSt
1
Dzięki. Jeśli ktoś przychodzi z tym samym pytaniem, w moim przypadku pomogło to: -dDownsampleColorImages=false (Wypróbowałem je wszystkie i ten przyniósł pożądany efekt).
Pygmalion
1

Wiele powodów.

  1. Stylizacja XML
  2. Obrazy przekonwertowane na base64, który jest 33%większy niż oryginał
  3. Inne rzeczy, takie jak czcionki itp ...
  4. Wiele rzeczy, które pozornie nic nie robią!
Nikt
źródło
1

Sprawdź ustawienia opcji w programie Word 2010. Być może instruujesz program Word, aby osadził jedną lub kilka całych czcionek w dokumencie. Powoduje to straszne wzdęcie dokumentu, szczególnie jeśli używasz czcionek Unicode. Odznacz tę opcję, jeśli jest zaznaczona, a Word osadzi tylko znaki, które są faktycznie używane w twoim dokumencie.

Należy również pamiętać, że * .docx to skompresowany format pliku, który należy zdekompresować, aby można go było przekonwertować na plik PDF, który zwiększa jego rozmiar.

Jeśli to nie zadziała, istnieje kilka narzędzi do optymalizacji plików PDF, które są dostępne za pośrednictwem Adobe i Nuance.

Mam nadzieję że to pomoże.

Flfstangard
źródło
0

Myśl: Program Word konwertuje grafikę wektorową na mapę bitową lub PNG i osadza ją w dokumencie z ograniczoną kompresją lub bez niej. Sprawdź ustawienia PDF i sprawdź, czy możesz to zmienić.

Analiza: Jednym ze sposobów sprawdzenia tego jest zmiana rozszerzenia pliku Word na .ZIP i przekonanie się, co robi Word!

Jozuego
źródło
2
W ogóle nie można modyfikować generowania plików PDF programu Word. Możesz wybierać tylko spośród jakości „normalnej” i „internetowej”, ale to tylko kilka kB różnicy. Będę musiał sprawdzić konwersję wektora na piksele, która powinna być widoczna przy bardzo dużych współczynnikach powiększenia.
ygoe
3
Dziwne, gdy powiększam dokument PDF, bardzo szybko widzę tekst i grafikę w formacie rastrowym. Wygląda jak zrzut ekranu okna programu Word, w tym tekst wygładzony ClearType w niskiej rozdzielczości. Po tym momencie treść zostaje zastąpiona rysunkami wektorowymi o wysokiej rozdzielczości dla grafiki i tekstu. Jak mogę zajrzeć do dokumentu PDF, aby dowiedzieć się, czy w środku jest ukryty obraz pikselowy, który można usunąć?
ygoe
Nie sądzę też, żeby to był powód. Zauważyłem ten sam wzdęcie z dokumentami nie zawierającymi obrazów.
HappyNomad
@LonelyPixel: Prawdopodobnie zajmuje więcej czasu, aby twój czytnik PDF ponownie renderował zawartość przy powiększaniu ..
tumchaaditya
0

Wynika to z faktu, że formatowanie dokumentu PDF będzie zawierało style (prawdopodobnie) dla każdego znaku. Zrobiłem coś takiego, ale w HTML i wygenerowałem plik HTML 20KB jako plik 600KB.

Damodar Dahal
źródło
0

Używaj oprogramowania zaprojektowanego do określonego celu. Program Word jest dobry w tworzeniu dokumentów tekstowych, a ponieważ wiele innych programów dodaje tę funkcję, MS nie może jej pominąć. Naprawdę nie rozumiem, dlaczego zdecydowali się poświęcić dużo czasu i wysiłku na optymalizację czegoś, z czego większość ludzi nawet nie korzysta ani nie dba o to. Ludzie, którym zależy, nie używają słowa do drukowania plików PDF.

Powinieneś rozważyć zainstalowanie dedykowanej drukarki PDF na komputerze i użyć funkcji DRUKUJ, aby utworzyć plik PDF. Dostępnych jest wiele bezpłatnych i komercyjnych pakietów, które wykonują perfekcyjną robotę i ograniczają kompresję pliku PDF do minimum.

Pytanie, DLACZEGO dokładnie Word tworzy tak ogromne pliki PDF, jest czymś, o co lepiej zapytać inżynierów MS na ich forach ... tylko oni mogą to powiedzieć. Tutaj dostaniesz wiele domysłów, dlaczego stwardnienie rozsiane robi rzeczy tak, jak oni.

Jakke
źródło
1
Bardzo wolę wbudowaną funkcję eksportu PDF, ponieważ pozwala ona zachować klikalne tabele treści lub osadzone adresy URL i tym podobne. (Jako taki eksport w OpenOffice jest świetny.) Niektóre programy mogą działać dobrze z opcjami drukowania PDF, jeśli są dostarczane przez system operacyjny . Podobnie jak niektóre przeglądarki w OS X działają bezbłędnie dzięki wbudowanemu drukowaniu PDF .
Arjan