Tipps und Tricks zur Konvertierung

Inhaltsverzeichnis


Einleitung

Im Folgenden sind eine Reihe von Lösungen zu Problemen angegeben, die im Rahmen der Konvertierung auftreten können.

Wenn Sie ein bisher noch nicht beschriebenes Problem selbst gelöst haben, teilen Sie uns bitte Problem und Lösung mit. Sie helfen damit anderen. Wenn Sie das Problem nicht selber lösen können, wenden Sie sich per E-Mail an uns: dissonline@ub.fu-berlin.de.

Verwenden Sie bei der Erstellung ihres Textes unbedingt die vorgesehenen Gliederungselemente Ihres Textverarbeitungsprogrammes, z.B. automatische Erzeugung der Inhaltsverzeichnisse, Erzeugung von Listen und Tabellen, automatischer Seitenumbruch ... . NICHT!! mit Tabulatoren, Leerzeichen und Zeilenumbrüchen eine Tabelle erstellen, Inhaltsverzeichnisse mit Leerzeichen formatieren, durch Einfügen von Leerzeilen einen Seitenumbruch erzeugen ... .


Erstellen von HTML-Dateien, z.B. für "Zusammenfassung"

Speichern Sie die Zusammenfassungen als ASCII ab. Am einfachsten geht dies, wenn Sie mit Copy&Paste den Text direkt in die Eingabemaske überführen. Wenn Sie besondere Auszeichnungen in Ihrem Text wünschen (fett, kursiv, Indices), so verwenden Sie bitte HTML-Tags im Text.

Oft treten Probleme bei chemischen Formeln und mathematischen Gleichungen auf. Automatische Konverter (z.B. LaTeX2HTML) erzeugen gif-Bilder für Formeln und Gleichungen. Dies führt aber meist zu einem schlechten Layout. Vermeiden Sie daher solche gif-Bilder in Ihren HTML-Dateien. Vermeiden Sie Formeln in den Zusammenfassungen, soweit es irgend geht.

Wenn Sie wenig Erfahrung mit der Sprache HTML haben, empfehlen wir Ihnen das Selfhtml aus dem Netz.


Erzeugen von PDF-Dateien

Das PDF-Format, in dem Sie Ihre Dissertation abgeben, können Sie auf verschiedene Weise erzeugen.

  • Bei Installation der entsprechenden Software direkt durch Druck in eine Datei (PDF-Writer). Fragen Sie Ihren lokalen Systemadministrator. Denken Sie bitte an geeignete Dateibenennungen.
  • In den Rechnerpools der Zedat und einiger Fachbereiche ist die Software installiert
  • Mit dem kostenlosen Adobe-Postscripttreiber über einen Postscriptfile und dem kostenlosen Ghostscriptpaket, das das Konvertierungstool ps2pdf enthält.

Sind Ihre Probleme hier noch nicht beschrieben, können Sie Lösungen unter den folgenden zwei Adressen finden: Die Datenbank von Adobe unter http://www.adobe.com/cfusion/search/index.cfm und die Tipps und Tricks der PDFzone.com unter http://www.pdfzone.com/c/s/Tips/


Erstellen von internen Verweisen in PDF

Ihre in PDF konvertierte Datei können Sie mit Verweisen (Links) auf die einzelnen Bestandteile versehen.

Sie können innerhalb der PDF-Datei die Möglichkeit verwenden, Links innerhalb des Textes zu legen.

Interne Verweise (Verweise heißen bei Acrobat "Bookmark") erstellt man wie folgt:

  1. Bookmark-Liste im Fenster links vom entsprechenden Dokument öffnen durch View -> Bookmarks & Page
  2. An das Ziel des Verweises im Dokument gehen, den Text des Verweises mit der Maus markieren (ggf. vorher Tools -> Select Text), und kopieren (Edit -> Copy oder Ctrl-c)
  3. Neue Bookmarks erzeugen durch Document -> New Bookmarks oder Ctrl-b
  4. Verweistext einfügen durch Edit -> Paste oder Ctrl-v
  5. Ggf. die Bookmarks mit der Maus in der Liste verschieben. Durch Verschieben nach rechts wird das aktuelle Bookmark dem darüberliegenden hierarchisch untergeordnet, was bei Kapiteln mit Unterkapiteln zu empfehlen ist.

Metadaten in PDF

PDF besitzt in den neueren Versionen einen internen Metadatensatz. Dieser ist zugänglich über Datei-> Preferenzen.

Bei der Erzeugung der PDF-Datei werden in diesen Metadaten der Name des Autoren (abgeleitet aus dem Loginnamen) und der Dateiname eingetragen. Darüber hinaus erlaubt das Adobe-Programm,Subjecte und Keywords einzutragen.

Interessant ist diese Option, da die üblichen Suchmaschinen diese Daten indizieren und im Ranking verwenden.


Word-Dokumente

Am einfachsten geht die Erzeugung eines PDF-Dokuments mit dem Adobe Acrobat Paket, aktuelle Version 8.0. Durch die Installation des Programms wird in Word ein Button erzeugt, mit dem direkt aus der Anwendung heraus ein PDF-Dokument erstellt wird. Beachten Sie die Hinweise unter Allgemeines , wenn Ihre PDF-Datei 'falsch' formatiert wird. Andere Fehler erfordern allerdings umfangreichere Lösungen.

Eine Alternative ist die Erzeugung einer PostScript-Datei. Dies erfolgt durch Drucken der Arbeit in eine Datei unter Verwendung eines PostScript-Druckertreibers. Am besten geeignet ist dabei der Adobe-Treiber. Sie sollten diesen installieren und verwenden. Dies ist insbesondere notwendig, wenn Sie mit anderen als den Standardfonts von PDF arbeiten. Die Postscriptfiles anderer Druckertreiber binden fremde Fonts meist nicht ein, weil diese auf ihrem Rechner vorhanden (und damit druckbar) sind. Auf einem anderen Recher fehlen diese Fonts meist und werden dann falsch dargestellt. Dies betrifft vor allem fremde Schriftzeichen (koreanisch, hebräisch) oder Symbole.

Erzeugen Sie die PostScript-Dateien vorzugsweise auf dem gleichen Rechner, auf dem Sie die Arbeit erstellt haben. Anderenfalls können Probleme mit den Schriften auftreten, aber auch das Layout wird durch unterschiedliche Druckertreiber verändert.

Die Formeleditoren in Word 6.0 und Word 7.0 sind nicht identisch. Also Vorsicht beim Wechsel zwischen beiden Versionen.

Der HTML-Konverter von Word (Version 2.04) übersetzt die deutschen Umlaute falsch. Verwenden Sie einen anderen Konverter.

Im Originaltext sollten keine Trennstriche benutzt werden, um Wörter, die normalerweise zusammen geschrieben werden, am Zeilenende zu trennen. Bedingte Trennstriche können benutzt werden.

Eine kostenlose, wenn auch nicht ganz so leistungsfähige Variante zum Erstellen der PDF-Files ist unter der URL http://freepdfxp.de/fpxp.htm zu finden. Die Werkzeuge sind auf die Microsoft-Oberflächen ausgelegt und arbeiten zeilenorientiert im MS-DOS Fenster. Sie müssen einzeln geladen und ausgepackt werden.

Gelegentlich tauchen Probleme mit speziellen Fonts auf, die in Word verwendet werden. Diese lassen sich nicht mit dem Distiller einbinden, und daher kann kein valider PDF-File erzeugt werden (Umgangssprachlich: anstelle der Sonderzeichen erscheinen irgendwelche merkwürdigen Zeichen). Hintergrund ist, daß einige Fonts aus lizenzrechtlichen Gründen nicht eingebunden werden. Details dazu finden sich bei Adobe.

Für dieses Problem gibt es zwei Lösungen: Zum einen kann der Font im Ursprungstext auf einen anderen Font geändert werden, wobei dieser Font natürlich einbindbar sein muss. Die andere Möglichkeit ist, die betreffenden Seiten auszudrucken, einzuscannen und die eingescannte Seite in ein PDF-Dokument umzuwandeln und im Abgabedokument auszutauschen.


TeX und LaTeX

Bei der Konvertierung von TeX/LaTeX-Dateien in PDF empfiehlt es sich grundsätzlich, zuerst PostScript-Dateien zu erstellen und diese dann mit dem Acrobat-Distiller in PDF zu übersetzen. Alternativ kann auch Aladdin Ghostscript ab Version 4 verwendet werden. Dieses unterstützt allerdings weniger Schriften.

Grundsätzlich sollten PostScript-Schriften vom Type 1 verwendet werden. Andere Fonts führen zu unzureichender Bildschirmdarstellung, aber auch zu Fehlern mit Sonderzeichen. Bei der Standard-Konvertierung von DVI-Dateien in PostScript-Dateien ("dvips") werden Schriften vom Type 3 verwendet. Daher muss die Verwendung von Type 1 fonts aktiv angegeben werden.

Nach der bisherigen Erfahrung reicht es aus, nur die cmz-Fonts (computer modern) von Type 1 zu verwenden. Die Konvertierung von DVI nach PS wird dann mit folgendem Befehl vorgenommen:

dvips -P cmz -o dateiname.ps dateiname.dvi

Im ChemNet wird diese Option auf die folgende Weise aufgerufen:

dvips -P pdf dateiname.dvi

Schrifttypen, die nicht standardmässig installiert sind, müssen in den Postscriptfile eingebunden werden. Dazu dient ein Befehl des Adobe Acrobat Distillers, der dann allerdings auf dem Heimatrechner installiert sein muss.

distill -embedallfonts on file.ps file.pdf

Die Programme pdftex oder pdfLaTeX sind zur direkten Konvertierung von TeX bzw. LaTeX in PDF geeignet. Sie können nur verwendet werden, wenn die Arbeit keine Abbildungen (Ausnahmen: PNG- und PDF-Bilder) enthält.

Wenn das (Window-)Programm Miktex verwendet wird, müssen in der Datei config.ps (bei Standardinstallation: c:\texmf\dvips\config\config.ps) die folgenden zwei Zeilen aktiviert werden: p +bsr.map und p +bsr-interpolated.map.

Abbildungen im EPS-Format können in LaTeX-Dateien eingebunden werden. Der Acrobat Reader 3.01, Window 95 ist nicht immer in der Lage, solche Bilder auszudrucken. In diesem Fall kann ein anderes Programm (z.B. GSview) weiterhelfen. EPS-Dateien, die mit CorelDraw erzeugt werden, sind manchmal fehlerhaft und werden nicht in PDF konvertiert. In diesem Fall kann es helfen, die Textbestandteile in Kurven umzuwandeln. Der Fehler tritt typischerweise auf, wenn Textfonts eingebunden werden sollen.

Eine Reihe zusätzlicher Informationen erhält man vom Rechenzentrum Hannover: http://www.rrzn.uni-hannover.de/pdfform.html

Wer plant, den PDF-Text mit Links anzureichern, ist mit dem Paket hyperref gut bedient.

Wenn sie mit TeX/LaTeX arbeiten: Um eine gute Qualität der PDF-Ausdrucke zu erhalten, sollte man bei der Umwandlung von DVI-Dateien in PS-Dateien Fonts vom Type 1 verwenden.


Macintosh

Wenn Sie die PDF-Dateien auf einem Macintosh-Computer erzeugt haben, überzeugen Sie sich bitte, das Sie nicht BinHex 4.0-Dateien übertragen. Diese können auf den Dosen nicht gelesen werden. Vergewissern Sie sich, das Ihre PDF-Dateien auf dem Macintosh Ascii-Formate haben und übertragen Sie dann auch per FTP und Einstellung der Ascii-Übertragung.

Korrekte Dateien sehen in einem normalen Editor etwa wie folgt aus:

%PDF-1.3

%âãÏÓ

93 0 obj

<

/Linearized 1

/O 96

/H [ 1051 481 ]

/L 95373

/E 25146


Abbildungen

Graustufenbilder stellen in PDF kein Problem dar. Verwenden Sie aber farbige Abbildungen, so sollten Sie beim Einscannen von Abbildungen (etwa Fotos) eine ausreichende Auflösung wählen (in der Regel 300 dpi) und den CMYK-Modus (Cyan-Magenta-Yello-Kontrast) einstellen. Achten Sie aber darauf, keine zu hohe Auflösung zu wählen und möglichst hohe Kompression, um die Grösse der Dateien so klein wie möglich zu halten. Abhängig von den Einstellungen des Bildschirmes erhalten Sie jedoch fast immer Farbunterschiede im Vergleich mit den Ausdrucken.

Wenn Ihre Abbildungen nicht direkt in die PDF-Datei eingebunden sind, erzeugen Sie die Abbildungen für die Web-Präsentation am besten im Format png, auch gif und jpg sind geeignet. Legen Sie die Abbildungen in einem eigenen Verzeichnis ab. In die PDF-Dateien können Sie relative Links auf die Abbildungen einfügen.

EPS-Dateien, die mit CorelDraw erzeugt werden, sind manchmal fehlerhaft und werden nicht in PDF konvertiert. In diesem Fall kann es helfen, die Textbestandteile in Kurven umzuwandeln. Der Fehler tritt typischerweise auf, wenn Textfonts eingebunden werden sollen.

Gelegentlich sind Seiten, insbesondere Bilder, im eps-Format in einer falschen Orientierung. Im EPS oder PS-File steht folgende Sequenz:

%%BeginDefaults

%%ViewingOrientation: 0 1 -1 0

%%EndDefaults

Werden die "View-Parameter" auf 1 0 0 1 gesetzt, tritt das Problem nicht mehr auf. Dieser Parameter kann problemlos im gesamten ps-File durch Suchen und Ersetzen umgewandelt werden. Es sollte jedoch kontrolliert werden, ob er nicht an irgendeiner Stelle bewusst so gesetzt wurde.


Konvertierung von Capella-Dokumenten

Erarbeitet von Bernward Halbscheffel

Capella ist ein Programm zum Setzen von Partituren. Es verwendet eigene Fonts und ist nur mit Mühe in ein PDF-Dokument zu konvertieren. Der hier beschriebene Weg ist auch grundsätzlich bei anderen Programmen geeignet, die eigene Formate verwenden.

Kurzfassung der Konvertierung von Capella-Dokumenten

  1. Neuesten Adobe Postcript-Druckertreiber installieren
  2. Capella starten, das jeweilige Beispiel laden.
  3. Druckdialog aufrufen, den Adobe Postscsript-Druckertreiber wählen und die Checkbox "Ausdruck in eine Datei" ankreuzen.
  4. Corel Draw 8 oder 9 (10 wird wohl auch funktionieren) starten und die jeweilige PRN-Datei importieren. Dabei auf jeden Fall die Checkbox "Text als Kurven importieren" ankreuzen.
  5. Nach dem Import "Gruppierung aufheben", dann in das Bild klicken, damit die Vektor-Punkte verschwinden. Dann kann man das Notenbild bearbeiten. Da etwa jedes zweite Element invertiert dargestellt wird, muß man diese markieren und über den entsprechenden Corel-Draw-Menüpunkt invertieren.Auch kleinere Veränderungen können in Corel Draw vorgenommen werden. Dann alles wieder gruppieren.
  6. Datei als EPS-Datei exportieren.
  7. Diese Datei kann in Indesign 1.5 positioniert werden. Höchstwahrscheinlich ist dies auch in Pagemaker, Quark Express usw. möglich, wurde aber nicht getestet.

Wenn man in Capella eine mehrseitige Partitur geschrieben hat, muß man jede Seite einzeln mit dem Adobe Postscript-Druckertreiber in eine Datei drucken. Es wird immer nur die erste Seite in ein prn-file gedruckt. Die jeweils überflüssigen Seiten muß man in Capella löschen. Auch auf das Seitenformat der Partitur muß man achten, ggf. im Drucker-Dialog ändern, eventuell auch die Ränder so knapp wie möglich einstellen. Der Querausdruck wird in Corel Draw um 90 Grad gedreht und spiegelverkehrt angezeigt. Auch in Corel Draw ist es ratsam, jede Seite einzeln zu bearbeiten, weniger aus technischen als aus praktischen Gründen - man behält besser die Übersicht.

Die Noten selbst sind komplett Vektorobjekte. Für Beschriftungen und bestimmte musikalische Zeichen wird aber immer ein True-Type-Font mitgeschleppt, und diese Doppelbelastung der Capella-Dateien verursacht wohl auch den Ärger. So muß man beim Import der PRN-Dateien auf jeden Fall den Button "Text als Kurven importieren" einschalten. Ist man mit dem Notenbild zufrieden, exportiert man es als EPS. Das geht schnell und problemlos.


Einbinden von Klangdateien

Man kann in Acrobat ab Version 4 im Prinzip jede Art von Datei einbinden. Wenn man aber z. B. eine MIDI-Datei einbindet, wird zunächst ein MIDI-Abspielprogramm gestartet, nämlich das, das auf dem jeweiligen Computer mit MID-Files verbunden ist (meistens der Windows Media-Player). Der Nachteil liegt auf der Hand: Ein solches Programm muß auf dem jeweiligen Rechner installiert sein. Zudem werden hier die Noten abgespielt, eine 'Live'-Interpretation ist also nicht mehr möglich. AIFF, WAV und AU sind ebenfalls gut geeignete Formate für Musikaufnahmen. Die Formate weisen nur kleine Verluste durch Kompression auf. Mit den von Acrobat 4 vorgesehenen WAV-Files ist man auf der sicheren Seite. MP3, OV und RAM sind komprimierte Verfahren, die nur verlustbehaftet dekomprimiert werden können. Im Projekt werden diese Formate nicht akzeptiert.


Einbinden von Filmen

MPEG ist ein Standardformat und kann verwendet werden. In Spezialfällen kann auch Motion-JPEG verwendet werden. QT und AVI sind sogenannte Überformate. Diese können nur akzeptiert werden, wenn die verwendeten CODECs bekannt und öffentlich beschrieben sind. Durch die hohe Kompression bei allen Videoformaten ist immer mit erheblichen Datenverlusten bei der Dekompremierung oder dem Umformatieren zu rechnen.


Probleme mit Zip-Files

Vereinzelt läßt sich die in gezipptem Format geholte Arbeit nicht öffnen. Grund ist, dass die Arbeit 'on the fly' mit einem Unix-Werkzeug erzeugt wird. Dies ist aktuell pkzip 2.0.4, das den Zip-Modus 2.2 verwendet. Ältere Programme, z.B. WinZip bis Version 6.2, können dieses Format nicht richtig erkennen. Hier hilft leider nur, eine neuere Softwareversion einzusetzen.