Jak zapisać dokument Word jako plik PDF * bez * osadzonych czcionek?

9

Mam program Microsoft Word 2010 i próbuję go użyć do utworzenia dokumentu PDF z haczykiem. Ja nie chcę żadnej z czcionek używanych osadzone. Jednak wszystkie opcje zapisywania, które próbowałem, skutkują czcionkami „Embedded Subset”. Czy jest jakiś sposób, aby zapisać jako PDF bez osadzania ŻADNYCH czcionek?

slipsec
źródło
1
Czego obecnie używasz do tworzenia tych plików PDF? Pliki PDF są zasadniczo przeznaczone do drukowania dokumentów elektronicznych i są mniej lub bardziej niezmienne. Ponadto, z czym je czytasz, że nie chcesz, aby czcionki faktycznie były drukowane na dokumencie? Do czego ich używasz?
Austin T French
Testuję konwersję do innych formatów graficznych (np. Tiff) i muszę przetestować scenariusze, w których czcionki NIE zostały osadzone, aby upewnić się, że są odwzorowane na coś, co nie zmienia wyrównania i odstępów. Łatwo jest wygenerować dokument Word zawierający wszystkie zainstalowane czcionki systemowe, ale chcę zapisać / wyeksportować jako plik pdf bez osadzania czcionek.
slipsec

Odpowiedzi:

3

Możliwe jest usunięcie wszystkich czcionek tworzących typ dokumentu XML typu WordML.

<?xml version="1.0" encoding="UTF-8"?>
<?mso-application progid="Word.Document"?>
    <w:wordDocument xml:space="preserve" xmlns:w="http://schemas.microsoft.com/office/word/2003/wordml">
     <w:body>

      <w:tbl>
       <w:tblPr>
        <w:tblW w:w="9570" w:type="dxa"></w:tblW>
         <w:tblBorders> <w:top w:val="nil" /><w:left w:val="nil" /><w:bottom w:val="nil" /><w:right w:val="nil" />
         </w:tblBorders>
       </w:tblPr>

    <w:tr>
     <w:tc>
    <w:tcPr><w:tcW w:w="4785" w:type="dxa" /></w:tcPr>  <w:p></w:p>  </w:tc>
     <w:tc>  
    <w:tcPr><w:tcW w:w="4785" w:type="dxa" /></w:tcPr>  <w:p></w:p>  </w:tc>
    </w:tr>   

     <w:tr>    
         <w:tc>
          <w:tcPr><w:tcW w:w="0" w:type="auto" /></w:tcPr>  <w:p><w:pPr><w:jc w:val="right" /></w:pPr>
       <w:r><w:t>Company: </w:t></w:r> 
      </w:p>
     </w:tc>   

        <w:tc>
          <w:tcPr><w:tcW w:w="0" w:type="auto" />
           <w:tcBorders>      <w:top w:val="single" w:sz="2" w:color="0070C0" />    <w:left w:val="single" w:sz="2" w:color="0070C0" /> <w:bottom w:val="single" w:sz="2" w:color="0070C0" /> <w:right w:val="single" w:sz="2" w:color="0070C0" />
           </w:tcBorders>
          </w:tcPr>
         <w:p><w:pPr><w:jc w:val="left" /></w:pPr><w:r><w:t></w:t></w:r></w:p>
        </w:tc>      
       </w:tr>       
      </w:tbl>
     </w:body>
    </w:wordDocument>

Ale nawet jeśli usuniesz wszystkie style i czcionki z oryginalnego dokumentu, program Word przypisze domyślnie podczas otwierania stylu dokumentu. Ponadto co najmniej jedna czcionka będzie znajdować się w dokumencie Acrobat, gdy go otworzysz, jakbyś nie działał.

Plik Office WordML XML, Word ładuje domyślny styl:

Plik Office WordML XML

Po zapisaniu jako plik PDF w programie Acrobat wyświetl jedną czcionkę

Prop. Czcionka dokumentu Acrobat

Dobrym rozwiązaniem jest wybranie co najmniej jednej czcionki, która będzie nadal w pliku pdf i użycie jej.

Sposób 2: Usuwanie nieużywanych stylów z programu Word

wprowadź opis zdjęcia tutaj

Sub DeleteUnusedStyles()
    Dim oStyle As Style
    For Each oStyle In ActiveDocument.Styles
        ‘Only check out non-built-in styles
        If oStyle.BuiltIn = False Then
            With ActiveDocument.Content.Find
                .ClearFormatting
                .Style = oStyle.NameLocal
                .Execute FindText:=””, Format:=True
                If .Found = False Then oStyle.Delete
            End With
        End If
    Next oStyle
End Sub 

Zobacz Formatowanie czcionek dla wartości domyślnych pola tekstowego

Styl prawie zawsze obejmuje czcionkę i rozmiar czcionki używane do określania innych rozmiarów. Akapit, odstępy między wierszami itp. Jeśli potrzebujesz innego stylu, wygeneruj sam dokument. W tym czcionki zastępcze. Jeśli końcowy dokument PDF, użyj wbudowanego Adobe JavaScript. Lub Adobe LiveCycle Designer ES i XDP XML.

Czcionka w Adobe LiveCycle Designer XDP XML

Korzystanie z Acrobat JavaScript w formularzach: importowanie i eksportowanie danych formularza

Architektura formularzy XML PDF!

STTR
źródło
Czy to nie usunie samych ustawień stylu, a nie osadzonych czcionek? Chcę zachować styl, ale usuń osadzone czcionki, aby wymusić „odgadnięcie” mapowania przez oprogramowanie do konwersji, które próbuję przetestować.
slipsec
@slipsec Może być konieczne ręczne utworzenie pliku PDF?
STTR
@slipsec, W tym celu może być konieczne użycie płatnego komponentu innej firmy.
Adam
używane iText, opublikuje, gdy skończę.
slipsec
0
[System.Reflection.Assembly]::LoadFrom("C:\path\to\itextsharp.dll")
#by default fonts are NOT embedded
#[iTextSharp.text.FontFactory]::DefaultEmbedding -eq false

$doc = New-Object iTextSharp.text.Document
$fileStream = New-Object IO.FileStream("C:\foo\test\allFonts2.pdf", [System.IO.FileMode]::Create)
[iTextSharp.text.pdf.PdfWriter]::GetInstance($doc, $filestream)

#iTextSharp provides a class to work with fonts, but first we have to register them:
[iTextSharp.text.FontFactory]::RegisterDirectories()

#Phrase is the smallest bit of text that will understand a newline if needed.  it is a chunk[] and paragraph is a phrase[]
$phrase = new-object iTextSharp.text.Phrase 
$paragraph = New-Object iTextSharp.text.Paragraph

#Different fonts for mapping tests
$fN = [iTextSharp.text.Font]::NORMAL
$fB = [iTextSharp.text.Font]::BOLD
$fI = [iTextSharp.text.Font]::ITALIC
$fBI = [iTextSharp.text.Font]::BOLDITALIC

#Sample string
$string = "The quick brown fox jumps over the lazy dog 1234567890 ?.,:;!@#$%^&*()`"'`n"
#something I know maps nicely (I love fixed width fonts!)
$consolas = [iTextSharp.text.FontFactory]::GetFont("consolas", 9)

#create all the nesting needed.
[iTextSharp.text.FontFactory]::RegisteredFamilies | %{

    $chunk = new-object iTextSharp.text.Chunk("`n$_`n", $consolas)
    $phrase.Add($chunk) | out-null

    $a = [iTextSharp.text.FontFactory]::GetFont($_, 9, $fN)
    "adding font: $_"
    $chunk = new-object iTextSharp.text.Chunk($string, $a)
    $phrase.Add($chunk) | out-null

    $b = [iTextSharp.text.FontFactory]::GetFont($_, 9, $fB)
    $chunk = new-object iTextSharp.text.Chunk($string, $b) 
    $phrase.Add($chunk) | out-null

    $c = [iTextSharp.text.FontFactory]::GetFont($_, 9, $fI)
    $chunk = new-object iTextSharp.text.Chunk($string, $c) 
    $phrase.Add($chunk) | out-null

    $d = [iTextSharp.text.FontFactory]::GetFont($_, 9, $fBI)
    $chunk = new-object iTextSharp.text.Chunk($string, $d) 
    $phrase.Add($chunk) | out-null
}

$paragraph.add($phrase) | out-null
$doc.Open()
$doc.add($paragraph) | out-null
$doc.close()
slipsec
źródło
Czy możesz wyjaśnić, co to jest?
turbanoff
@turbanoff Wygląda jak Powershell z biblioteką PDF itextsharp (dla .NET).
Bob