Mein Buch zu „Indexing mit Word“ ist erschienen:
Indexing mit Word. tredition, Hamburg 2020.
344 Seiten. ISBN-13: 978-3-7439-8319-9.
Darin geht es in mehreren, zum Teil längeren Abschnitten
Mein Buch zu „Indexing mit Word“ ist erschienen:
Indexing mit Word. tredition, Hamburg 2020.
344 Seiten. ISBN-13: 978-3-7439-8319-9.
Darin geht es in mehreren, zum Teil längeren Abschnitten
Schauen wir uns zunächst die wichtigsten E-Book-Formate an.
Der E-Book-Markt wird von drei Formaten beherrscht:
PDF ist genau genommen kein E-Book-Format, sondern lediglich ein digitales Format, das auch auf E-Book-Readern dargestellt und gelesen werden kann. In ihm ist die Anordnung von Text und Bildern fixiert, PDFs sind standardmäßig nicht reflowable, sie passen sich nicht automatisch an die Bildschirmgröße an. (Auf die spezielle Variante von Reflowable-PDFs möchte ich hier nicht eingehen, weil sie in der Praxis keine große Rolle spielt.)
Die Reflowable-Formate sind EPUB und MOBI.
EPUB bedeutet „electronic publication“ und ist das Standardformat für E-Books. Es wird seit 2007 vom International Digital Publishing Forum (IDPF) entwickelt und angeboten (als offenes Format). Die aktuelle Version ist EPUB 3, wobei EPUB 2 noch eine weitaus größere Verbreitung hat (die meisten E-Books werden im EPUB-2-Format angeboten). Wer sicher gehen möchte, dass die erzeugten Daten auf allen EPUB-fähigen Readern korrekt dargestellt werden, sollte im Format EPUB 2 publizieren. Bis auf die E-Book-Reader von Amazon, kommt auf allen anderen Readern (z. B. Apple-, Kobo- und Tolino-Geräten) EPUB zum Einsatz.
MOBI ist ein Format, das ursprünglich von der Firma Mobipocket entwickelt wurde und das seit 2007 Amazon gehört; hier wurde es eine Zeit lang auch als AZW-Format vermarktet. Die Weiterentwicklung von MOBI nennt sich KF8 („Kindle Format 8“), sie ist von ihren Fähigkeiten her mit EPUB 3 vergleichbar. MOBI ist das Standardformat der Kindle-E-Book-Reader.
MOBI lässt sich ohne allzu große Probleme in EPUB konvertieren und umgekehrt.
Kurz gesagt: XML ist eine neutrale Auszeichnungssprache (synonym: Markierungssprache). Die Abkürzung bedeutet Extensible Markup Language.
Vor allem zum automatischen Verarbeiten von Inhalten!
Weil Computer – die führen die automatische Verarbeitung aus – den Sinn von Inhalten, insbesondere den Sinn von Inhalten mit Mustern nicht verstehen.
Angepasst an die Struktur entwickeln die Programmierer dann eine sog. Dokumenttypdefinition (DTD) oder ein Schema. Dabei handelt es sich um ein XML-Programm. Liegt ein solches Schema vor, können die Erzeuger (Autoren) und Bearbeiter (Lektoren) des Inhalts die Struktur der zu dem Projekt gehörenden Dokumente an dieses Schema anpassen. Das heißt, in der Regel sind wir Lektoren nicht für die Entwicklung eines Schemas zuständig, sondern wir wenden es an. Zum Glück müssen wir, um das zu können, nicht unbedingt XML-Experten werden. Die Anpassung eines Dokuments an ein vorgegebenes Schema (oder eine DTD) kann für uns einfach bedeuten, das Dokument in Word konsistent und konsequent auf Basis einer Dokumentvorlage auszuzeichnen, also Formatvorlagen anstelle von manueller („harter“) Formatierung anzuwenden. Eine auf diese Weise vorbereitete Word-Datei kann relativ problemlos in eine XML-Datei überführt werden. Dafür sind üblicherweise wiederum nicht wir, sondern Techniker zuständig. Ein Workflow, bei dem wir die Überführung der Word-Daten in XML schaffen können, selbst ohne tiefgehende XML-Kenntnisse, ist der E-Book-Workflow, auf den unten näher eingegangen wird.
Grundsätzlich muss nicht erst in Word hineingearbeitet werden, damit anschließend XML entstehen kann. Es ist auch möglich, sich als Autor oder Lektor sofort in XML-Daten zu bewegen. Auch dazu wird unten mehr gesagt.