XML: Merkmale

Was ist XML?

Kurz gesagt: XML ist eine neutrale Auszeichnungssprache (synonym: Markierungssprache). Die Abkürzung bedeutet Extensible Markup Language.

Wozu braucht man so etwas?

Vor allem zum automatischen Verarbeiten von Inhalten!

Weshalb geht das automatische Verarbeiten nur mit neutralen Auszeichnungssprachen?

Weil Computer – die führen die automatische Verarbeitung aus – den Sinn von Inhalten, insbesondere den Sinn von Inhalten mit Mustern nicht verstehen.

Und was ist mit dem manuellen (also nichtautomatischen) Verarbeiten von Inhalten – kann da auch XML zum Einsatz kommen?

Prinzipiell ja. In der Verlags- und Lektoratspraxis spielt XML z. B. eine Rolle, wenn in Content-Management-Systemen gearbeitet wird oder wenn kleine E-Books individuell erstellt werden.

Was ist eine neutrale Auszeichnungssprache?

Eine Möglichkeit, mit Codierungen anzugeben,
– wie ein Text aufgebaut und
– wie er formatiert ist.
Man spricht manchmal auch von generischer Markierung.

Weshalb kann man das nicht mit „normalen Auszeichnungen“ erreichen, wie wir sie von Word oder Layoutprogrammen kennen?

– Weil solche auf dem WYSIWYG-Prinzip beruhenden Auszeichnungen in jedem Programm anders vorgenommen werden müssen und
– weil die Programme so abgekapselt sind, dass man die Inhalte von außen nur schwierig beeinflussen kann, was aber einer automatischen Verarbeitung zuwiderläuft.

Um welche Muster geht es?

Im Prinzip um ganz einfache Dinge: z. B. um die Hervorhebung von Textstellen mit dem Ziel, dem Leser mitzuteilen, dass solche Textstellen besonders wichtig sind. So wie oben die Wörter „neutrale Auszeichnungssprache“ und „automatisches Verarbeiten“. Der Leser kann außerdem an der unterschiedlichen Art der Hervorhebung (fett bzw. kursiv) erkennen, dass es sich anscheinend um verschiedene Typen von Mitteilungen handelt: fett bedeutet, hier wird auf einen wichtigen Fachbegriff hingewiesen, bei Kursivauszeichnung könnte es sich einfach um eine rhetorische Betonung handeln.

Kann man nur mit XML generisch markieren?

Nein, neben XML (oder auch SGML, Standard Generalized Markup Language) sind vor allem

  • TEX bzw. LaTEX und
  • RTF (Rich Text Format)

zu nennen.

Beide sind aber
– weder so streng wie es für eine wirklich neutrale Auszeichnungs­sprache nötig ist
– noch lassen sie sich so einfach den jeweiligen Gegebenheiten eines Publikationsprojekts anpassen wie XML.

Was zeichnet XML noch aus?

– XML eignet sich nicht nur zum Strukturieren von Publikationsprojekten, sondern auch zum Strukturieren von Computerprogrammen, m.a.W.: mit XML kann man programmieren! Das Office-Paket von Microsoft ist im Wesentlichen in XML programmiert.

– XML passt ideal zum modularen Konzept moderner Programmier­sprachen: XML-Dokumente können selbst aus mehreren klar definierten Teilen („Objekten“) aufgebaut sein. Man spricht dann von OpenXML. Offen bedeutet in diesem Zusammenhang, dass jedes Einzelteil separat erzeugt und/oder verändert werden kann und erst die Summe aller Teile die eigentliche Dokumentdatei ergibt. Word und OpenOffice arbeiten nach diesem Offenheitsprinzip.

– Durch die Strenge – Auszeichnungen können nur in einer bestimmten Reihenfolge vorgenommen werden ­– ist der Aufbau von XML-Dokumenten ideal zum Austausch mit Datenbanken geeignet, weil die ebenfalls nach strengen formalen Kriterien aufgebaut sind.

xml_merkmale

Bild 1: Drei wesentliche Merkmale von XML: Neutralität, Strenge, Offenheit

Weiter zum Beitrag über XML-Workflows.

Schreibe einen Kommentar


*