Wenn du Datensätze, Datenfeeds oder strukturierte Datenkataloge auf deiner Website veröffentlichst, kann DataFeed und DataCatalog Schema Markup dafür sorgen, dass Google diese Inhalte vollständig versteht und in spezialisierten Suchergebnissen wie der Google Dataset Search anzeigt. Diese Schema.org-Typen sind weniger bekannt als Article oder LocalBusiness — bieten aber enormes Potenzial für Websites, die Daten bereitstellen.
In diesem Artikel lernst du, was DataFeed und DataCatalog genau sind, wie du sie mit JSON-LD implementierst und welche Vorteile sie für die Sichtbarkeit deiner Website bringen.
Was sind DataFeed und DataCatalog?
Beide Typen gehören zur Dataset-Familie im Schema.org-Vokabular und beschreiben verschiedene Abstraktionsstufen von Datensätzen:
DataFeed — Ein strukturierter Datenstrom
DataFeed (schema.org/DataFeed) ist eine Unterklasse von Dataset und beschreibt einen konkreten Datenstrom in einem strukturierten Format — also eine abrufbare Datei oder einen Endpunkt, der Daten in maschinenlesbarer Form liefert. Typische Beispiele:
- Eine CSV-Datei mit Produktpreisen
- Ein JSON-Endpunkt mit tagesaktuellen Börsenkursen
- Ein XML-Feed mit Immobilienangeboten
- Eine GeoJSON-Datei mit Standortdaten
- Ein RSS-Feed (technisch gesehen auch ein DataFeed)
DataFeed hat eine eigene Property dataFeedElement, mit der du einzelne Einträge (vom Typ DataFeedItem) innerhalb des Feeds beschreiben kannst. Das ist besonders nützlich, wenn du Google mitteilen möchtest, was jeder einzelne Datenpunkt im Feed repräsentiert.
DataCatalog — Eine Sammlung von Datensätzen
DataCatalog (schema.org/DataCatalog) ist eine Sammlung oder ein Verzeichnis mehrerer Datasets. Wenn du eine Website betreibst, die viele verschiedene Datensätze bereitstellt — etwa ein Open-Data-Portal, ein Forschungsinstitut oder ein Behördenportal — dann beschreibst du die übergeordnete Sammlung mit DataCatalog und verlinkst die einzelnen Datasets darüber.
Die Beziehung zwischen den Typen sieht so aus:
DataCatalog → enthält → Dataset → hat als Datenstrom → DataFeed → enthält → DataFeedItem
Warum DataFeed und DataCatalog für SEO relevant sind
Google betreibt seit 2018 die Google Dataset Search (datasetsearch.research.google.com) — eine dedizierte Suchmaschine für Datensätze. Websites, die korrekt ausgezeichnete Datasets veröffentlichen, können dort gefunden werden — zusätzlich zur normalen Google-Suche.
Das ist besonders wertvoll für:
- Forschungseinrichtungen und Universitäten, die Studiendaten veröffentlichen
- Behörden und öffentliche Institutionen mit Open-Data-Portalen
- Unternehmen, die Marktdaten, Preislisten oder API-Endpunkte anbieten
- Non-Profit-Organisationen, die gesellschaftlich relevante Daten teilen
- Medienhäuser, die Datenjournalismus betreiben
Auch wenn du kein Datensatz-Portal betreibst: Jede Website, die strukturierte Daten veröffentlicht — sei es eine Preisliste, eine Fahrplantabelle oder eine Statistik — kann von DataFeed-Markup profitieren, da Google den Inhalt besser versteht und in Knowledge Panels einbinden kann.
Mehr zur Grundlage aller Structured-Data-Formate findest du in unserem Artikel Strukturierte Daten für SEO: Schema Markup einfach erklärt.
DataCatalog JSON-LD Implementierung
Ein DataCatalog beschreibt die übergeordnete Sammlung. Hier ein vollständiges JSON-LD-Beispiel für ein Open-Data-Portal:
{
"@context": "https://schema.org",
"@type": "DataCatalog",
"name": "Offene Daten der Stadt Musterstadt",
"description": "Das offizielle Open-Data-Portal der Stadt Musterstadt mit Datensätzen zu Bevölkerung, Verkehr, Umwelt und Wirtschaft.",
"url": "https://opendata.musterstadt.de",
"publisher": {
"@type": "Organization",
"name": "Stadt Musterstadt",
"url": "https://www.musterstadt.de",
"contactPoint": {
"@type": "ContactPoint",
"contactType": "customer service",
"email": "opendata@musterstadt.de"
}
},
"license": "https://creativecommons.org/licenses/by/4.0/",
"dataset": [
{
"@type": "Dataset",
"name": "Bevölkerungsdaten Musterstadt 2020–2025",
"url": "https://opendata.musterstadt.de/bevoelkerung"
},
{
"@type": "Dataset",
"name": "Verkehrszählungen Musterstadt 2024",
"url": "https://opendata.musterstadt.de/verkehr"
}
]
}
Die wichtigsten DataCatalog-Properties
- name (Pflicht): Name des Datenkatalogs
- description (empfohlen): Beschreibung, was der Katalog enthält
- url (empfohlen): URL des Katalogs
- publisher (empfohlen): Organisation, die den Katalog veröffentlicht
- license (empfohlen): Lizenz der Daten (idealerweise als URL, z.B. Creative Commons)
- dataset: Array der enthaltenen Datasets (mit @type: Dataset)
- keywords: Schlüsselwörter zur thematischen Einordnung
- spatialCoverage: Geografischer Geltungsbereich (z.B. "Deutschland")
- temporalCoverage: Zeitlicher Geltungsbereich (ISO 8601)
Dataset JSON-LD — Die mittlere Ebene
Ein einzelner Datensatz wird mit dem Typ Dataset beschrieben. Dataset ist der zentrale Typ, den Google für die Dataset Search auswertet:
{
"@context": "https://schema.org",
"@type": "Dataset",
"name": "Verkehrszählungen Musterstadt 2024",
"description": "Stündliche Fahrzeugzählungen an 48 Messstellen im Stadtgebiet Musterstadt, Zeitraum Januar bis Dezember 2024.",
"url": "https://opendata.musterstadt.de/verkehr",
"identifier": "https://opendata.musterstadt.de/verkehr/2024",
"keywords": ["Verkehr", "Fahrzeugzählung", "Musterstadt", "Mobilität", "2024"],
"creator": {
"@type": "Organization",
"name": "Stadtplanungsamt Musterstadt"
},
"publisher": {
"@type": "Organization",
"name": "Stadt Musterstadt",
"url": "https://www.musterstadt.de"
},
"datePublished": "2025-01-15",
"dateModified": "2025-03-01",
"license": "https://creativecommons.org/licenses/by/4.0/",
"isAccessibleForFree": true,
"spatialCoverage": {
"@type": "Place",
"name": "Musterstadt",
"geo": {
"@type": "GeoCoordinates",
"latitude": 52.5200,
"longitude": 13.4050
}
},
"temporalCoverage": "2024-01-01/2024-12-31",
"variableMeasured": "Fahrzeuganzahl pro Stunde",
"measurementTechnique": "Induktionsschleife",
"includedInDataCatalog": {
"@type": "DataCatalog",
"name": "Offene Daten der Stadt Musterstadt",
"url": "https://opendata.musterstadt.de"
},
"distribution": [
{
"@type": "DataDownload",
"encodingFormat": "text/csv",
"contentUrl": "https://opendata.musterstadt.de/verkehr/2024/daten.csv"
},
{
"@type": "DataDownload",
"encodingFormat": "application/json",
"contentUrl": "https://opendata.musterstadt.de/verkehr/2024/daten.json"
}
]
}
Die Property distribution mit dem Typ DataDownload ist besonders wichtig: Sie teilt Google mit, in welchen Formaten die Daten heruntergeladen werden können. Google zeigt diese Downloadformate in der Dataset Search direkt an.
DataFeed JSON-LD — Strukturierte Datenströme
DataFeed erweitert Dataset um die Möglichkeit, einzelne Einträge (DataFeedItem) zu beschreiben. Das ist besonders nützlich für regelmäßig aktualisierte Daten:
{
"@context": "https://schema.org",
"@type": "DataFeed",
"name": "Tagesaktuelle Luftqualitätsdaten Musterstadt",
"description": "Stündlich aktualisierter Feed mit Luftqualitätsmesswerten (PM2.5, PM10, NO2, O3) für alle Messstationen in Musterstadt.",
"url": "https://opendata.musterstadt.de/luftqualitaet/feed",
"dateModified": "2026-04-23T08:00:00+02:00",
"publisher": {
"@type": "Organization",
"name": "Umweltamt Musterstadt"
},
"encodingFormat": "application/json",
"dataFeedElement": [
{
"@type": "DataFeedItem",
"dateCreated": "2026-04-23T08:00:00+02:00",
"item": {
"@type": "Observation",
"name": "PM2.5 Messung Innenstadt",
"measuredProperty": "PM2.5",
"measuredValue": 12.4,
"unitCode": "GRM",
"observedNode": {
"@type": "Place",
"name": "Messstation Innenstadt"
}
}
}
],
"includedInDataCatalog": {
"@type": "DataCatalog",
"name": "Offene Daten der Stadt Musterstadt"
}
}
DataFeedItem — Einzelne Feed-Einträge
Ein DataFeedItem hat drei Properties:
- dateCreated: Zeitstempel, wann der Eintrag erstellt wurde
- dateDeleted: Für gelöschte Einträge (nützlich bei inkrementellen Feeds)
- item: Das eigentliche Datenobjekt — kann jeder Schema.org-Typ sein (Product, Event, Offer, Place etc.)
Die Stärke von DataFeedItem liegt darin, dass du beliebige Schema.org-Typen als item einbetten kannst. Ein Produktfeed würde also DataFeedItem-Objekte enthalten, die jeweils ein Product als item haben.
Praxisbeispiel: Produktdatenfeed
Ein klassischer Anwendungsfall für DataFeed ist ein strukturierter Produktfeed. So könnte ein vereinfachter Produktdatenfeed aussehen:
{
"@context": "https://schema.org",
"@type": "DataFeed",
"name": "Produktkatalog Muster GmbH",
"description": "Vollständiger Produktkatalog mit Preisen und Verfügbarkeit, täglich aktualisiert.",
"url": "https://www.mustershop.de/feeds/produkte.json",
"dateModified": "2026-04-23T00:00:00+02:00",
"encodingFormat": "application/json",
"publisher": {
"@type": "Organization",
"name": "Muster GmbH",
"url": "https://www.mustershop.de"
},
"dataFeedElement": [
{
"@type": "DataFeedItem",
"dateCreated": "2026-04-23T00:00:00+02:00",
"item": {
"@type": "Product",
"name": "Ergonomischer Bürostuhl ErgoPro 3000",
"sku": "BST-3000",
"description": "Höhenverstellbarer Bürostuhl mit Lendenwirbelstütze und atmungsaktivem Netzbezug.",
"brand": {
"@type": "Brand",
"name": "ErgoMax"
},
"offers": {
"@type": "Offer",
"price": "349.99",
"priceCurrency": "EUR",
"availability": "https://schema.org/InStock"
}
}
}
]
}
Dieser Ansatz unterscheidet sich von normalem Product Schema Markup dadurch, dass er explizit einen Feed-Container beschreibt — was für Systeme nützlich ist, die den Feed automatisch verarbeiten oder indizieren.
Wichtige Properties für Dataset (Google Dataset Search)
Google hat für die Dataset Search spezifische Empfehlungen, welche Properties besonders wichtig sind. Diese Pflicht-Properties für die Dataset Search solltest du immer einbinden:
- name: Aussagekräftiger Name des Datensatzes
- description: Mindestens 50 Zeichen, idealerweise mehrere Sätze
Empfohlene Properties für bessere Sichtbarkeit:
- url: Kanonische URL der Dataset-Seite
- sameAs: URL in anderen Datenkatalogen (z.B. data.gov, Wikidata)
- version: Versionsnummer des Datensatzes
- license: Lizenz-URL (Creative Commons bevorzugt)
- isAccessibleForFree: true/false — wichtig für die Filterung in Dataset Search
- creator: Person oder Organisation, die den Datensatz erstellt hat
- distribution: Download-Möglichkeiten mit Format und URL
- temporalCoverage: Zeitraum der Daten im ISO-8601-Format
- spatialCoverage: Geografischer Geltungsbereich
- variableMeasured: Was gemessen wird (als Text oder PropertyValue)
DataDownload: Download-Optionen beschreiben
Die distribution-Property mit dem Typ DataDownload ist entscheidend für die Google Dataset Search. Sie zeigt Nutzern, in welchen Formaten die Daten verfügbar sind:
"distribution": [
{
"@type": "DataDownload",
"encodingFormat": "text/csv",
"contentUrl": "https://example.de/daten/export.csv",
"contentSize": "2.5 MB"
},
{
"@type": "DataDownload",
"encodingFormat": "application/json",
"contentUrl": "https://example.de/api/daten.json",
"contentSize": "4.1 MB"
},
{
"@type": "DataDownload",
"encodingFormat": "application/vnd.ms-excel",
"contentUrl": "https://example.de/daten/export.xlsx",
"contentSize": "1.8 MB"
}
]
Für encodingFormat verwendest du MIME-Types. Häufige Werte: text/csv, application/json, application/xml, application/zip, application/geo+json.
Validierung und Fehlerdiagnose
Nach der Implementierung kannst du dein Markup auf zwei Wegen prüfen:
- Google Rich Results Test: Testet grundsätzlich ob das JSON-LD valide ist
- Schema.org Validator: Prüft das Markup gegen das Schema.org-Vokabular
- Unser JSON-LD Structured Data Validator: Überprüfe dein Markup direkt im Browser
Häufige Fehler bei DataFeed/DataCatalog:
- Fehlende description: Google ignoriert Datasets ohne Beschreibung oft in der Dataset Search
- Keine distribution-Property: Ohne Download-Links zeigt die Dataset Search keine Downloadmöglichkeiten an
- Falsche encodingFormat-Werte: Nutze MIME-Types statt Freitext wie "CSV" oder "Excel"
- Fehlender license-Link: Ohne Lizenzangabe können Nutzer die Daten nicht rechtssicher verwenden
- Zu allgemeine keywords: Spezifische, fachliche Keywords verbessern die Auffindbarkeit in Dataset Search
Checkliste: DataFeed und DataCatalog korrekt implementieren
- ☑ DataCatalog für die Gesamtsammlung anlegen (falls mehrere Datasets)
- ☑ Jedes Dataset einzeln mit vollständigem JSON-LD beschreiben
- ☑ name und description für jedes Dataset (Mindestanforderung für Dataset Search)
- ☑ distribution mit mindestens einem DataDownload-Eintrag
- ☑ encodingFormat als MIME-Type angeben
- ☑ license als URL einbinden (Creative Commons empfohlen)
- ☑ isAccessibleForFree: true setzen wenn kostenlos zugänglich
- ☑ temporalCoverage für zeitbezogene Datensätze angeben
- ☑ spatialCoverage für geografische Datensätze einbinden
- ☑ includedInDataCatalog bei Datasets, die Teil eines Katalogs sind
- ☑ DataFeed statt Dataset verwenden, wenn regelmäßig aktualisierte Streams vorliegen
- ☑ Markup mit JSON-LD Validator prüfen
- ☑ Dataset in Google Search Console überwachen
Zusammenfassung
DataFeed und DataCatalog Schema Markup sind spezialisierte Werkzeuge für Websites, die strukturierte Datensätze veröffentlichen. Während die meisten SEO-Guides sich auf Article, Product oder LocalBusiness konzentrieren, bieten diese weniger bekannten Typen erhebliches Potenzial in einem weniger kompetitiven Umfeld.
Für die Implementierung gilt: Beginne immer mit einem vollständigen Dataset-Objekt mit name, description und distribution. Erweitere zu DataCatalog, wenn du mehrere Datasets verwaltest. Wechsle zu DataFeed, wenn regelmäßig aktualisierte Datenströme vorliegen.
Weitere Schema-Typen für spezialisierte Inhalte findest du in unserem Artikel über CreativeWork Schema Markup — der Basis-Typ, von dem DataFeed und Dataset abstammen. Die technische Grundlage für alle Structured-Data-Implementierungen beschreibt unser Vergleich von JSON-LD, Microdata und RDFa.