Jede EPUB-Datei ist eigentlich ein Container für viele andere Dateien. Die Container-Eigenschaft kann offengelegt werden, wenn man .zip an die Dateinamen-Erweiterung hängt. Damit wird z. B. aus xyz.epub
EPUB
Rückkonvertierung von E-Book-Formaten wie EPUB
Im Beitrag XML-Workflow wurde geschrieben, dass die Rückkonvertierung nur etwas für technische Betriebe
Buch zu „Indexing mit Word“
Mein Buch zu „Indexing mit Word“ ist erschienen:
Indexing mit Word. tredition, Hamburg 2020.
344 Seiten. ISBN-13: 978-3-7439-8319-9.
Darin geht es in mehreren, zum Teil längeren Abschnitten
Von Word zum E-Book: eine Übersicht
Schauen wir uns zunächst die wichtigsten E-Book-Formate an.
E-Book-Formate
Der E-Book-Markt wird von drei Formaten beherrscht:
- EPUB und
- MOBI
PDF ist genau genommen kein E-Book-Format, sondern lediglich ein digitales Format, das auch auf E-Book-Readern dargestellt und gelesen werden kann. In ihm ist die Anordnung von Text und Bildern fixiert, PDFs sind standardmäßig nicht reflowable, sie passen sich nicht automatisch an die Bildschirmgröße an. (Auf die spezielle Variante von Reflowable-PDFs möchte ich hier nicht eingehen, weil sie in der Praxis keine große Rolle spielt.)
Die Reflowable-Formate sind EPUB und MOBI.
EPUB bedeutet „electronic publication“ und ist das Standardformat für E-Books. Es wird seit 2007 vom International Digital Publishing Forum (IDPF) entwickelt und angeboten (als offenes Format). Die aktuelle Version ist EPUB 3, wobei EPUB 2 noch eine weitaus größere Verbreitung hat (die meisten E-Books werden im EPUB-2-Format angeboten). Wer sicher gehen möchte, dass die erzeugten Daten auf allen EPUB-fähigen Readern korrekt dargestellt werden, sollte im Format EPUB 2 publizieren. Bis auf die E-Book-Reader von Amazon, kommt auf allen anderen Readern (z. B. Apple-, Kobo- und Tolino-Geräten) EPUB zum Einsatz.
MOBI ist ein Format, das ursprünglich von der Firma Mobipocket entwickelt wurde und das seit 2007 Amazon gehört; hier wurde es eine Zeit lang auch als AZW-Format vermarktet. Die Weiterentwicklung von MOBI nennt sich KF8 („Kindle Format 8“), sie ist von ihren Fähigkeiten her mit EPUB 3 vergleichbar. MOBI ist das Standardformat der Kindle-E-Book-Reader.
MOBI lässt sich ohne allzu große Probleme in EPUB konvertieren und umgekehrt.
Der weiche, moderierte
XML: Merkmale
Was ist XML?
Kurz gesagt: XML ist eine neutrale Auszeichnungssprache (synonym: Markierungssprache). Die Abkürzung bedeutet Extensible Markup Language.
Wozu braucht man so etwas?
Vor allem zum automatischen Verarbeiten von Inhalten!
Weshalb geht das automatische Verarbeiten nur mit neutralen Auszeichnungssprachen?
Weil Computer – die führen die automatische Verarbeitung aus – den Sinn von Inhalten, insbesondere den Sinn von Inhalten mit Mustern nicht verstehen.
Und was ist mit dem manuellen
XML-Workflow
Grundlagen