DataFeed und DataCatalog Schema Markup: Datensätze für Google strukturieren

Wenn du Datensätze, Datenfeeds oder strukturierte Datenkataloge auf deiner Website veröffentlichst, kann DataFeed und DataCatalog Schema Markup dafür sorgen, dass Google diese Inhalte vollständig versteht und in spezialisierten Suchergebnissen wie der Google Dataset Search anzeigt. Diese Schema.org-Typen sind weniger bekannt als Article oder LocalBusiness — bieten aber enormes Potenzial für Websites, die Daten bereitstellen.

In diesem Artikel lernst du, was DataFeed und DataCatalog genau sind, wie du sie mit JSON-LD implementierst und welche Vorteile sie für die Sichtbarkeit deiner Website bringen.

Was sind DataFeed und DataCatalog?

Beide Typen gehören zur Dataset-Familie im Schema.org-Vokabular und beschreiben verschiedene Abstraktionsstufen von Datensätzen:

DataFeed — Ein strukturierter Datenstrom

DataFeed (schema.org/DataFeed) ist eine Unterklasse von Dataset und beschreibt einen konkreten Datenstrom in einem strukturierten Format — also eine abrufbare Datei oder einen Endpunkt, der Daten in maschinenlesbarer Form liefert. Typische Beispiele:

Eine CSV-Datei mit Produktpreisen
Ein JSON-Endpunkt mit tagesaktuellen Börsenkursen
Ein XML-Feed mit Immobilienangeboten
Eine GeoJSON-Datei mit Standortdaten
Ein RSS-Feed (technisch gesehen auch ein DataFeed)

DataFeed hat eine eigene Property dataFeedElement, mit der du einzelne Einträge (vom Typ DataFeedItem) innerhalb des Feeds beschreiben kannst. Das ist besonders nützlich, wenn du Google mitteilen möchtest, was jeder einzelne Datenpunkt im Feed repräsentiert.

DataCatalog — Eine Sammlung von Datensätzen

DataCatalog (schema.org/DataCatalog) ist eine Sammlung oder ein Verzeichnis mehrerer Datasets. Wenn du eine Website betreibst, die viele verschiedene Datensätze bereitstellt — etwa ein Open-Data-Portal, ein Forschungsinstitut oder ein Behördenportal — dann beschreibst du die übergeordnete Sammlung mit DataCatalog und verlinkst die einzelnen Datasets darüber.

Die Beziehung zwischen den Typen sieht so aus:

DataCatalog → enthält → Dataset → hat als Datenstrom → DataFeed → enthält → DataFeedItem

Warum DataFeed und DataCatalog für SEO relevant sind

Google betreibt seit 2018 die Google Dataset Search (datasetsearch.research.google.com) — eine dedizierte Suchmaschine für Datensätze. Websites, die korrekt ausgezeichnete Datasets veröffentlichen, können dort gefunden werden — zusätzlich zur normalen Google-Suche.

Das ist besonders wertvoll für:

Forschungseinrichtungen und Universitäten, die Studiendaten veröffentlichen
Behörden und öffentliche Institutionen mit Open-Data-Portalen
Unternehmen, die Marktdaten, Preislisten oder API-Endpunkte anbieten
Non-Profit-Organisationen, die gesellschaftlich relevante Daten teilen
Medienhäuser, die Datenjournalismus betreiben

Auch wenn du kein Datensatz-Portal betreibst: Jede Website, die strukturierte Daten veröffentlicht — sei es eine Preisliste, eine Fahrplantabelle oder eine Statistik — kann von DataFeed-Markup profitieren, da Google den Inhalt besser versteht und in Knowledge Panels einbinden kann.

Mehr zur Grundlage aller Structured-Data-Formate findest du in unserem Artikel Strukturierte Daten für SEO: Schema Markup einfach erklärt.

DataCatalog JSON-LD Implementierung

Ein DataCatalog beschreibt die übergeordnete Sammlung. Hier ein vollständiges JSON-LD-Beispiel für ein Open-Data-Portal:

{
  "@context": "https://schema.org",
  "@type": "DataCatalog",
  "name": "Offene Daten der Stadt Musterstadt",
  "description": "Das offizielle Open-Data-Portal der Stadt Musterstadt mit Datensätzen zu Bevölkerung, Verkehr, Umwelt und Wirtschaft.",
  "url": "https://opendata.musterstadt.de",
  "publisher": {
    "@type": "Organization",
    "name": "Stadt Musterstadt",
    "url": "https://www.musterstadt.de",
    "contactPoint": {
      "@type": "ContactPoint",
      "contactType": "customer service",
      "email": "opendata@musterstadt.de"
    }
  },
  "license": "https://creativecommons.org/licenses/by/4.0/",
  "dataset": [
    {
      "@type": "Dataset",
      "name": "Bevölkerungsdaten Musterstadt 2020–2025",
      "url": "https://opendata.musterstadt.de/bevoelkerung"
    },
    {
      "@type": "Dataset",
      "name": "Verkehrszählungen Musterstadt 2024",
      "url": "https://opendata.musterstadt.de/verkehr"
    }
  ]
}

Die wichtigsten DataCatalog-Properties

name (Pflicht): Name des Datenkatalogs
description (empfohlen): Beschreibung, was der Katalog enthält
url (empfohlen): URL des Katalogs
publisher (empfohlen): Organisation, die den Katalog veröffentlicht
license (empfohlen): Lizenz der Daten (idealerweise als URL, z.B. Creative Commons)
dataset: Array der enthaltenen Datasets (mit @type: Dataset)
keywords: Schlüsselwörter zur thematischen Einordnung
spatialCoverage: Geografischer Geltungsbereich (z.B. "Deutschland")
temporalCoverage: Zeitlicher Geltungsbereich (ISO 8601)

Dataset JSON-LD — Die mittlere Ebene

Ein einzelner Datensatz wird mit dem Typ Dataset beschrieben. Dataset ist der zentrale Typ, den Google für die Dataset Search auswertet:

{
  "@context": "https://schema.org",
  "@type": "Dataset",
  "name": "Verkehrszählungen Musterstadt 2024",
  "description": "Stündliche Fahrzeugzählungen an 48 Messstellen im Stadtgebiet Musterstadt, Zeitraum Januar bis Dezember 2024.",
  "url": "https://opendata.musterstadt.de/verkehr",
  "identifier": "https://opendata.musterstadt.de/verkehr/2024",
  "keywords": ["Verkehr", "Fahrzeugzählung", "Musterstadt", "Mobilität", "2024"],
  "creator": {
    "@type": "Organization",
    "name": "Stadtplanungsamt Musterstadt"
  },
  "publisher": {
    "@type": "Organization",
    "name": "Stadt Musterstadt",
    "url": "https://www.musterstadt.de"
  },
  "datePublished": "2025-01-15",
  "dateModified": "2025-03-01",
  "license": "https://creativecommons.org/licenses/by/4.0/",
  "isAccessibleForFree": true,
  "spatialCoverage": {
    "@type": "Place",
    "name": "Musterstadt",
    "geo": {
      "@type": "GeoCoordinates",
      "latitude": 52.5200,
      "longitude": 13.4050
    }
  },
  "temporalCoverage": "2024-01-01/2024-12-31",
  "variableMeasured": "Fahrzeuganzahl pro Stunde",
  "measurementTechnique": "Induktionsschleife",
  "includedInDataCatalog": {
    "@type": "DataCatalog",
    "name": "Offene Daten der Stadt Musterstadt",
    "url": "https://opendata.musterstadt.de"
  },
  "distribution": [
    {
      "@type": "DataDownload",
      "encodingFormat": "text/csv",
      "contentUrl": "https://opendata.musterstadt.de/verkehr/2024/daten.csv"
    },
    {
      "@type": "DataDownload",
      "encodingFormat": "application/json",
      "contentUrl": "https://opendata.musterstadt.de/verkehr/2024/daten.json"
    }
  ]
}

Die Property distribution mit dem Typ DataDownload ist besonders wichtig: Sie teilt Google mit, in welchen Formaten die Daten heruntergeladen werden können. Google zeigt diese Downloadformate in der Dataset Search direkt an.

DataFeed JSON-LD — Strukturierte Datenströme

DataFeed erweitert Dataset um die Möglichkeit, einzelne Einträge (DataFeedItem) zu beschreiben. Das ist besonders nützlich für regelmäßig aktualisierte Daten:

{
  "@context": "https://schema.org",
  "@type": "DataFeed",
  "name": "Tagesaktuelle Luftqualitätsdaten Musterstadt",
  "description": "Stündlich aktualisierter Feed mit Luftqualitätsmesswerten (PM2.5, PM10, NO2, O3) für alle Messstationen in Musterstadt.",
  "url": "https://opendata.musterstadt.de/luftqualitaet/feed",
  "dateModified": "2026-04-23T08:00:00+02:00",
  "publisher": {
    "@type": "Organization",
    "name": "Umweltamt Musterstadt"
  },
  "encodingFormat": "application/json",
  "dataFeedElement": [
    {
      "@type": "DataFeedItem",
      "dateCreated": "2026-04-23T08:00:00+02:00",
      "item": {
        "@type": "Observation",
        "name": "PM2.5 Messung Innenstadt",
        "measuredProperty": "PM2.5",
        "measuredValue": 12.4,
        "unitCode": "GRM",
        "observedNode": {
          "@type": "Place",
          "name": "Messstation Innenstadt"
        }
      }
    }
  ],
  "includedInDataCatalog": {
    "@type": "DataCatalog",
    "name": "Offene Daten der Stadt Musterstadt"
  }
}

DataFeedItem — Einzelne Feed-Einträge

Ein DataFeedItem hat drei Properties:

dateCreated: Zeitstempel, wann der Eintrag erstellt wurde
dateDeleted: Für gelöschte Einträge (nützlich bei inkrementellen Feeds)
item: Das eigentliche Datenobjekt — kann jeder Schema.org-Typ sein (Product, Event, Offer, Place etc.)

Die Stärke von DataFeedItem liegt darin, dass du beliebige Schema.org-Typen als item einbetten kannst. Ein Produktfeed würde also DataFeedItem-Objekte enthalten, die jeweils ein Product als item haben.

Praxisbeispiel: Produktdatenfeed

Ein klassischer Anwendungsfall für DataFeed ist ein strukturierter Produktfeed. So könnte ein vereinfachter Produktdatenfeed aussehen:

{
  "@context": "https://schema.org",
  "@type": "DataFeed",
  "name": "Produktkatalog Muster GmbH",
  "description": "Vollständiger Produktkatalog mit Preisen und Verfügbarkeit, täglich aktualisiert.",
  "url": "https://www.mustershop.de/feeds/produkte.json",
  "dateModified": "2026-04-23T00:00:00+02:00",
  "encodingFormat": "application/json",
  "publisher": {
    "@type": "Organization",
    "name": "Muster GmbH",
    "url": "https://www.mustershop.de"
  },
  "dataFeedElement": [
    {
      "@type": "DataFeedItem",
      "dateCreated": "2026-04-23T00:00:00+02:00",
      "item": {
        "@type": "Product",
        "name": "Ergonomischer Bürostuhl ErgoPro 3000",
        "sku": "BST-3000",
        "description": "Höhenverstellbarer Bürostuhl mit Lendenwirbelstütze und atmungsaktivem Netzbezug.",
        "brand": {
          "@type": "Brand",
          "name": "ErgoMax"
        },
        "offers": {
          "@type": "Offer",
          "price": "349.99",
          "priceCurrency": "EUR",
          "availability": "https://schema.org/InStock"
        }
      }
    }
  ]
}

Dieser Ansatz unterscheidet sich von normalem Product Schema Markup dadurch, dass er explizit einen Feed-Container beschreibt — was für Systeme nützlich ist, die den Feed automatisch verarbeiten oder indizieren.

Wichtige Properties für Dataset (Google Dataset Search)

Google hat für die Dataset Search spezifische Empfehlungen, welche Properties besonders wichtig sind. Diese Pflicht-Properties für die Dataset Search solltest du immer einbinden:

name: Aussagekräftiger Name des Datensatzes
description: Mindestens 50 Zeichen, idealerweise mehrere Sätze

Empfohlene Properties für bessere Sichtbarkeit:

url: Kanonische URL der Dataset-Seite
sameAs: URL in anderen Datenkatalogen (z.B. data.gov, Wikidata)
version: Versionsnummer des Datensatzes
license: Lizenz-URL (Creative Commons bevorzugt)
isAccessibleForFree: true/false — wichtig für die Filterung in Dataset Search
creator: Person oder Organisation, die den Datensatz erstellt hat
distribution: Download-Möglichkeiten mit Format und URL
temporalCoverage: Zeitraum der Daten im ISO-8601-Format
spatialCoverage: Geografischer Geltungsbereich
variableMeasured: Was gemessen wird (als Text oder PropertyValue)

DataDownload: Download-Optionen beschreiben

Die distribution-Property mit dem Typ DataDownload ist entscheidend für die Google Dataset Search. Sie zeigt Nutzern, in welchen Formaten die Daten verfügbar sind:

"distribution": [
  {
    "@type": "DataDownload",
    "encodingFormat": "text/csv",
    "contentUrl": "https://example.de/daten/export.csv",
    "contentSize": "2.5 MB"
  },
  {
    "@type": "DataDownload",
    "encodingFormat": "application/json",
    "contentUrl": "https://example.de/api/daten.json",
    "contentSize": "4.1 MB"
  },
  {
    "@type": "DataDownload",
    "encodingFormat": "application/vnd.ms-excel",
    "contentUrl": "https://example.de/daten/export.xlsx",
    "contentSize": "1.8 MB"
  }
]

Für encodingFormat verwendest du MIME-Types. Häufige Werte: text/csv, application/json, application/xml, application/zip, application/geo+json.

Validierung und Fehlerdiagnose

Nach der Implementierung kannst du dein Markup auf zwei Wegen prüfen:

Google Rich Results Test: Testet grundsätzlich ob das JSON-LD valide ist
Schema.org Validator: Prüft das Markup gegen das Schema.org-Vokabular
Unser JSON-LD Structured Data Validator: Überprüfe dein Markup direkt im Browser

Häufige Fehler bei DataFeed/DataCatalog:

Fehlende description: Google ignoriert Datasets ohne Beschreibung oft in der Dataset Search
Keine distribution-Property: Ohne Download-Links zeigt die Dataset Search keine Downloadmöglichkeiten an
Falsche encodingFormat-Werte: Nutze MIME-Types statt Freitext wie "CSV" oder "Excel"
Fehlender license-Link: Ohne Lizenzangabe können Nutzer die Daten nicht rechtssicher verwenden
Zu allgemeine keywords: Spezifische, fachliche Keywords verbessern die Auffindbarkeit in Dataset Search

Checkliste: DataFeed und DataCatalog korrekt implementieren

☑ DataCatalog für die Gesamtsammlung anlegen (falls mehrere Datasets)
☑ Jedes Dataset einzeln mit vollständigem JSON-LD beschreiben
☑ name und description für jedes Dataset (Mindestanforderung für Dataset Search)
☑ distribution mit mindestens einem DataDownload-Eintrag
☑ encodingFormat als MIME-Type angeben
☑ license als URL einbinden (Creative Commons empfohlen)
☑ isAccessibleForFree: true setzen wenn kostenlos zugänglich
☑ temporalCoverage für zeitbezogene Datensätze angeben
☑ spatialCoverage für geografische Datensätze einbinden
☑ includedInDataCatalog bei Datasets, die Teil eines Katalogs sind
☑ DataFeed statt Dataset verwenden, wenn regelmäßig aktualisierte Streams vorliegen
☑ Markup mit JSON-LD Validator prüfen
☑ Dataset in Google Search Console überwachen

Zusammenfassung

DataFeed und DataCatalog Schema Markup sind spezialisierte Werkzeuge für Websites, die strukturierte Datensätze veröffentlichen. Während die meisten SEO-Guides sich auf Article, Product oder LocalBusiness konzentrieren, bieten diese weniger bekannten Typen erhebliches Potenzial in einem weniger kompetitiven Umfeld.

Für die Implementierung gilt: Beginne immer mit einem vollständigen Dataset-Objekt mit name, description und distribution. Erweitere zu DataCatalog, wenn du mehrere Datasets verwaltest. Wechsle zu DataFeed, wenn regelmäßig aktualisierte Datenströme vorliegen.

Weitere Schema-Typen für spezialisierte Inhalte findest du in unserem Artikel über CreativeWork Schema Markup — der Basis-Typ, von dem DataFeed und Dataset abstammen. Die technische Grundlage für alle Structured-Data-Implementierungen beschreibt unser Vergleich von JSON-LD, Microdata und RDFa.