Donnerstag, 5. Januar 2012

PDFLaTeX, Ligaturen und Copy'n'paste

Heute hatte ich wieder mal meine Not mit dem schönen Text den PDFLATEX produziert. Bestimmte Buchstabenkombinationen (wie zum Beispiel f+i und f+l) verschmelzen zu einem Letter, einer Ligatur.
  

  

Das sieht schöner aus und liest sich besser. In den letzten Jahren hat sich dank Unicode viel getan und die Suche nach Wörtern in PDF Dokumenten findet auch Ligaturen. Sucht man nach "film" (f+i+l+m), so wird auch fi+l+m gefunden. Wenn man jedoch Text aus einem PDF kopiert, so ist es Unicode Text mit Ligaturen drin. Erwischt man dann eine Software, oder füllt Online-Formulare via Copy'n'paste, so kann es passieren, das die Ligaturen nicht mehr ordentlich verarbeitet werden und man deren Stelle dann Kästchen oder anderen Sonderzeichenmüll sieht.
Nun habe ich leider erfolglos nach einer Möglichkeit gesucht Ligaturen zwar anzeigen zu lassen, aber im Copy'n'paste-Text nur einzelne Zeichen zu haben. Mann kann einzelne Ligaturen mit der italic-Korrektur
\/
aufbrechen oder wenn man das Paket babel vewendet besser mit
"|
das Gleiche erreichen. Durch ein
\usepackage{microtype}
\DisableLigatures{encoding = *, family = * }
in der Präambel kann man Ligaturen im ganzen Dokument unterbinden. Doch wie kann man PDFLATEX dazu bringen im angezeigten PDF schöne Ligaturen zu zeigen, aber bei Copy-Text nur einzelne Buchstaben zu kopieren? Ich habe nirgends eine gute Beschreibung gefunden, nur einige Beispiele, und es scheint zu funktionieren. Man fügt noch vor der Definition der Dokumentenklasse (/documentclass{...}) die Befehle
\input glyphtounicode.tex
\pdfgentounicode=1
ein. Bei MikTEX war es mit dabei, ansonsten gibt es glyphtounicode.tex im Netz.

1 Kommentar:

  1. Siehe auch: http://tex.stackexchange.com/questions/4397/make-ligatures-in-linux-libertine-copyable-and-searchable

    AntwortenLöschen