XML ist ein textbasiertes Datenformat, das häufig von Herstellern, dem Großhandel, Marktplätzen und Datenempfängern angefordert wird. Wir erklären euch die wesentlichen Grundlagen zu diesem Austauschformat ganz einfach und verständlich.

XML steht für „eXtensible Markup Language“ und ist ein seit 1998 international etabliertes, textbasiertes Format zum Beschreiben und Austauschen von Daten. Die XML-Struktur basiert auf hierarchischen Elementen mit öffnenden und schließenden Tags. Dadurch ist sie sowohl für Menschen als auch für Maschinen gut lesbar. Ihr könnt es im Produktdatenmanagement vor allem nutzen, um Produktdaten plattformunabhängig zwischen Systemen wie PIM oder ERP und verschiedenen Empfängern auszutauschen. Unter anderem basiert der weit verbreitete Datenstandard BMEcat auf dem XML-Datenformat. Auch GS1 XML wird im Produktdatenmanagement verwendet. Ihr seht: Strukturierte Austauschformate wie XML oder auch JSON sind für einen reibungslosen elektronischen Datenaustausch im Handel unerlässlich.
XML ist eine Abkürzung für „eXtensible Markup Language”, was auf Deutsch “erweiterbare Auszeichnungssprache” bedeutet. Das Datenformat wurde erstmals 1998 vom W3C (World Wide Web Consortium) eingeführt und wird seitdem regelmäßig international verwendet. Es handelt sich dabei um ein textbasiertes Datenformat, welches in einem einfachen Texteditor bearbeitet werden kann. Ihr könnt das XML-Format zum Beschreiben, Speichern und Austauschen von Daten (wie etwa Produktdaten) verwenden.
XML bietet euch als Datenaustauschformat vielfältige Nutzungsmöglichkeiten. Das liegt auch an seiner technischen Verbreitung: Viele Softwarelösungen und Apps nutzen die klar definierte, hierarchische Struktur des Formats zur Planung und Darstellung von Layouts oder auch zur Speicherung von Konfigurationsinformationen. Aufgrund seiner Flexibilität wird es zudem standardmäßig in der Webentwicklung eingesetzt, um Daten zwischen Server und Client zu übertragen.
Da das Datenformat sowohl für Menschen als auch für Maschinen gut lesbar ist, wird es häufig für den standardisierten Austausch von Produktdaten verwendet. XML dient dabei als technisches Fundament für zahlreiche Branchenstandards. Zu den bekanntesten Anwendungen gehören:
XML ermöglicht euch einen klar strukturierten, plattformunabhängigen Austausch von Daten und Informationen zwischen mehreren Systemen und Datenempfängern. Die Strukturierung des Datenformats erfolgt durch folgende Komponenten:
XML-Elemente bestehen aus sogenannten „Tags“. Diese Tags sind dabei durch spitze Klammern (< >) charakterisiert. Es wird dabei zwischen öffnenden Tags bzw. Start-Tags (<Artikel>) und schließenden Tags bzw. End-Tags (</Artikel>) unterschieden. Der End-Tag ist gut durch einen vorangestellten Schrägstrich (/) zu erkennen.
Alles zwischen dem Start-Tag und dem End-Tag wird dann als Inhalt des jeweiligen Elements betrachtet.
Ein XML-Element könnte zum Beispiel so aussehen: <Produktbezeichnung>Laptop XYZ-123</Produktbezeichnung>. „Laptop XYZ-123“ ist dabei der Inhalt eines Elements „Produktbezeichnung“.
Eine XML-Datei beginnt normalerweise mit einer kurzen Deklaration, welche die Version der XML-Spezifikation oder auch die verwendete Zeichencodierung angibt. Hier eine Beispieldeklaration: <?xml version=“1.0″ encoding=“UTF-8″?>
XML-Dateien enthalten außerdem Angaben zum sogenannten „Wurzelelement“. Warum der Name? Weil es das oberste Element in der XML-Hierarchie ist.
Im Falle unseres Beispielskatalogs könnte das Wurzelelement „Produktdatenkatalog“ sein:
<?xml version=“1.0″ encoding=“UTF-8″?>
<Produktdatenkatalog></Produktdatenkatalog>
Übrigens: Falls ihr mit XML-Dateine im Kontext des Datenstandards BMEcat zu tun habt, heißt das Wurzelelement dort dann „BMEcat“.
Wie ihr vielleicht schon vermutet, kann so eine Hierarchie innerhalb einer XML-Datei durchaus vielschichtig sein: Je nach Use-Case gibt es viele Elemente mit jeweils unterschiedlichem Inhalt. Nicht selten sind XML-Elemente auch in anderen Elementen verschachtelt.
Nicht nur, aber gerade deshalb ist es auch so wichtig, eine Übersichtlichkeit zu bewahren und sicherzustellen, dass alle geöffneten Elemente auch wieder geschlossen werden. Andernfalls ist die XML-Datei fehlerhaft und ihr könnt die Daten nicht richtig verarbeiten.
Die dem XML-Wurzelelement untergeordneten Elemente werden auch „Kinderelemente“ genannt.
In Beispiel unten wäre das der „Artikel“. Unter dem „Artikel“ befinden sich dann noch weitere Unterelemente, wie Name, Beschreibung, Preis, Hersteller etc..
In der Praxis könnte das so aussehen:
<?xml version=“1.0″ encoding=“UTF-8″?>
<Produktdatenkatalog>
<Artikel>
<Name>Laptop XYZ-123</Name>
<Beschreibung> Ein leistungsstarker Laptop mit schnellem Prozessor und hochauflösendem Display. </Beschreibung>
<Preis>999.99</Preis>
<Hersteller>ABC Electronics</Hersteller>
</Artikel>
</Produktdatenkatalog>
Hier seht ihr das Wurzelelement <Produktdatenkatalog>, innerhalb dessen verschiedene Kinderelemente angeordnet sind. Innerhalb des Kinderelementes <Artikel> sind auch weitere Elemente wie <Name> oder <Preis> verschachtelt.
Wichtig bezüglich des Schließens dieser Elemente ist auch die Einhaltung der Element-Hierarchie bzw. -Reihenfolge: Beispielsweise müsst ihr hier das XML-Element <Preis> vor dem nachfolgenden Element <Hersteller> schließen.
Schon gewusst? In der BMEcat-XML-Struktur haben solche Kinderlemente Namen wie z. B. „Header“ oder „T_NEW_CATALOG“.
Außerdem könnt ihr XML-Elemente auch mit zusätzlichen Attributen versehen, um zusätzliche Informationen darzustellen. Ein Attribut besteht dabei aus einem Attributnamen und einem Wert. XML-Attribute erhalten immer einen Namen und bekommen dann mit Gleichheitszeichen einen Wert zugewiesen. Dieser Wert wird in hochgestellte Kommata gesetzt.
Im folgenden Beispiel bekommt das XML-Element „Artikel“ eine entsprechende Kategorie zugeordnet, und auch ein Bild-URL-Attribut wurde ergänzt:
<?xml version=“1.0″ encoding=“UTF-8″?>
<Produktdatenkatalog>
<Artikel Kategorie=“Laptops“>
<Name>Laptop XYZ-123</Name>
<Beschreibung> Ein leistungsstarker Laptop mit schnellem Prozessor und hochauflösendem Display. </Beschreibung>
<Preis>999.99</Preis>
<Hersteller>ABC Electronics</Hersteller>
image url=“ https://example.com/smartphone_xyz.jpg “ />
</Artikel>
</Produktdatenkatalog>
Darüber hinaus könnt ihr auch Kommentare in einer XML hinterlegen. Sie dienen der Dokumentation oder Anmerkungen zur Erklärung. Das sieht dann so aus:
<!– Erster Kommentarzeile
Zweite Kommentarzeile –>
<Artikel>ABC</Artikel>
Das sind im Wesentlichen die Grundbestandteile einer XML-Datei im Kontext eines elektronischen Produktdatenkatalogs. Dabei könnt ihr beliebig viele Artikel hinzufügen, indem ihr das „Artikel“-Element wiederholt.
XML-Dateien basieren auf festgelegten Strukturgrundlagen. Dazu gehören:
<Artikel>
<Name>Laptop XYZ-123</Name>
<Beschreibung> Ein leistungsstarker Laptop mit schnellem Prozessor und hochauflösendem Display. </Beschreibung>
<Preis>999.99</Preis>
<Hersteller>ABC Electronics</Hersteller>
</Artikel>
Hier könnt ihr z. B. <Artikel> erst schließen, wenn alle darin geschachtelten Elemente ebenfalls wieder chronologisch geschlossen sind. Das Kinderelement <Name> dürfte zum Beispiel auch nicht erst nach dem Element <Preis> geschlossen werden.
Wir wir schon gelernt haben, wird das XML-Datenformat aufgrund seiner Vorteile vielfach im Bereich des Produktdatenmanagements genutzt. Hier findet ihr einen kleinen Einblick in Datenstandards, die XML nutzen:
Gut zu wissen: Es gibt auch spezifische XML-Formate wie etwa „cXML“. Es wurde speziell für den Austausch geschäftlicher Informationen (Bestellungen, Auftragsbestätigungen, eKataloge) entwickelt.
Das XML-Format eignet sich für das Produktdatenmanagement gleich aus mehreren Gründen:
Neben den vielfältigen Vorteilen solltet ihr natürlich auch potenzielle Herausforderungen und Nachteile von XML im Blick behalten.
Denn: Obwohl ihr Produktdaten in XML-Strukturen klar und eindeutig darstellen könnt, kann die hierarchische XML-Struktur gerade bei vielen und komplex verschachtelten Elementen spürbare Auswirkungen auf Aspekte wie
Um die gerade genannten XML-Herausforderungen zu minimieren und eine schlankerer Datenstruktur zu ermöglichen, wurden im Laufe der Zeit weitere Dateiformate wie JSON entwickelt.
Beide Austauschformate werden heute regelmäßig in der digitalen Datenverarbeitung genutzt. Es gibt viele Ähnlichkeiten zwischen XML und JSON, aber auch ein paar Unterschiede in wichtigen Punkten. Zu den größten Gemeinsamkeiten und Unterschiede zwischen XML und JSON gehören:
Das erklärt auch, warum der JSON-basierte Datenstandard ETIM xChange bewusst als Nachfolger für den XML-basierten, älteren BMEcat konzipiert wurde.
Egal ob XML, JSON oder andere Austauschformate – eines haben alle gemeinsam: Die manuelle Aufbereitung und Verarbeitung von Produktdaten mithilfe von Texteditoren ist oft zeitaufwändig, mühselig und ziemlich fehleranfällig.
Hier helfen euch unsere SaaS-Lösungen Supplier-Portal und CatalogExpress: Verarbeitet diverse Datenformate aus diversen Quellen (PIM, ERP, Dateien…), reichert sie mit weiteren Daten an, konvertiert sie in andere Formate, generiert Datenstandards und leitet alles automatisiert aus.
Klingt spannend? Hier erfahrt ihr mehr:
Wie ein fleißiges Eichhörnchen sammelt, prüft und sortiert das Supplier-Portal eure Lieferantendaten – strukturiert, automatisiert und nachvollziehbar.
Fehlerhafte Angaben werden früh erkannt, fehlende Informationen nachgefordert und alles sauber vereinheitlicht. So landen geprüfte, vollständige Daten direkt in euren Systemen – etwa PIM oder ERP. Für weniger manuelle Nacharbeiten, klar definierte Prozesse und Lieferanten, die wissen, was gefordert wird.
Wie ein wandelbares Chamäleon passt sich CatalogExpress jeder Datenanforderung an – egal ob von Kunden, Marktplätzen oder Datenpools.
Ihr kombiniert damit Produktdaten aus verschiedenen Quellen, prüft die Inhalte, bringt alles in die passende Struktur und verteilt die aufbereiteten Daten automatisiert. Ob individuelle Kundenanforderungen oder Standards wie BMEcat, ETIM & Co. – CatalogExpress generiert euch passende Produktdaten-Feeds schnell, fehlerfrei und jederzeit wiederverwendbar.
Jan ist seit 2024 bei nexoma. Dem gelernten E-Commerce-Kaufmann sind Produktdaten alles andere als fremd. Als sprachlich versierter Marketing Manager ist Jan außerdem unser Mann für viele Texte (Deutsch und Englisch) und versorgt euch unter anderem mit wissenswerten NEXIpedia- und Newsletter-Beiträgen.
