Google hat sich in den letzten Jahren von einfacher Keyword-Zählung weit entfernt. Heute bewertet Google die thematische Relevanz einer Seite — nicht mehr die rohe Häufigkeit eines einzelnen Begriffs. Das Konzept dahinter nennt sich Semantic SEO, und TF-IDF ist eine der mathematischen Grundlagen, auf denen es aufbaut.
Wer weiterhin nur auf eine Keyword-Dichte von exakt 2 % optimiert und dabei verwandte Begriffe ignoriert, verschenkt erhebliches Ranking-Potenzial. In diesem Artikel erkläre ich, wie TF-IDF funktioniert, was Semantic SEO bedeutet und wie du thematische Relevanz systematisch aufbaust.
TF-IDF steht für Term Frequency – Inverse Document Frequency. Es ist ein statistisches Maß, das bewertet, wie wichtig ein Begriff für ein spezifisches Dokument innerhalb einer Sammlung von Dokumenten ist.
Die Grundidee: Ein Wort ist für eine Seite dann relevant, wenn es dort häufig vorkommt, gleichzeitig aber nicht in jedem anderen Dokument vorkommt. Wörter wie "die", "und", "ist" kommen überall vor — ihr TF-IDF-Wert ist niedrig. Spezifische Fachbegriffe wie "Canonical-Tag" oder "Core Web Vitals" kommen seltener vor — ihr TF-IDF-Wert ist höher.
In der Praxis bedeutet das: Google berechnet für jede Seite einen TF-IDF-Score für alle wichtigen Begriffe und vergleicht ihn mit dem Wettbewerb. Seiten, die thematisch relevante Begriffe in der erwarteten Dichte enthalten, gelten als qualitativ hochwertig.
Die simple Keyword-Dichte sagt: "Wie oft kommt Keyword X im Text vor?" TF-IDF fragt dagegen: "Wie relevant ist dieses Wort im Vergleich zu allen anderen Seiten zu diesem Thema?"
| Merkmal | Keyword-Dichte | TF-IDF |
|---|---|---|
| Bezugspunkt | Nur dieser Text | Alle Texte zum Thema (Wettbewerb) |
| Optimierungsziel | 1–2 % Häufigkeit | Thematische Vollständigkeit |
| Stopwörter | Werden ignoriert | Werden natürlich herausgefiltert |
| Kontextverständnis | Keines | Teilweise (Termhäufigkeit) |
| Relevanz für Google heute | Gering (Abstrafung bei Stuffing) | Hoch (als Teil von BERT/MUM) |
Semantic SEO geht über TF-IDF hinaus. Es beschreibt die Optimierung auf semantische Relevanz — also die inhaltliche Bedeutung und thematische Tiefe einer Seite, nicht nur die oberflächliche Keyword-Verteilung.
Googles Algorithmus-Entwicklung der letzten Jahre zeigt klar wohin die Reise geht:
Was bedeutet das für SEO? Google rankt heute Seiten, die ein Thema vollständig und in Tiefe behandeln — nicht Seiten, die ein einzelnes Keyword möglichst oft wiederholen.
Der Begriff "LSI-Keywords" (Latent Semantic Indexing) kursiert in der SEO-Welt seit Jahren. Die Realität: Google verwendet LSI nicht mehr als aktiven Ranking-Algorithmus — das Konzept stammt aus den 1990er Jahren. Was Google verwendet, ist viel ausgefeilter: neuronale Sprachmodelle und entity-basiertes Ranking.
Dennoch hat das dahinterliegende Prinzip weiterhin Gültigkeit: Verwandte Begriffe, die natürlich in einem guten Artikel vorkommen, signalisieren Expertise. Der Unterschied ist: Nicht weil sie einem LSI-Algorithmus entsprechen, sondern weil sie zeigen, dass du das Thema wirklich verstehst.
Nehmen wir das Beispiel eines Artikels über "Keyword-Recherche". Welche verwandten Begriffe würde ein Experte natürlich verwenden?
Diese Begriffe würden in einem echten Expertenartikel über Keyword-Recherche organisch vorkommen. Wenn sie in deinem Artikel fehlen, ist das ein Zeichen mangelnder Themenabdeckung — und Google wertet das entsprechend.
Beachte dabei: Du sollst diese Begriffe nicht erzwungen einbauen, sondern das Thema tief genug behandeln, dass sie von selbst erscheinen. Die verwandten Begriffe sind ein Symptom eines guten Artikels, nicht seine Ursache.
TF-IDF und Semantic SEO gelten für einzelne Seiten. Topical Authority geht eine Ebene höher und beschreibt die Wahrnehmung einer gesamten Domain als Experten in einem Themengebiet.
Ein klassisches Beispiel: Eine Domain, die 50 detaillierte Artikel zum Thema SEO veröffentlicht hat, wird von Google als Autorität in diesem Bereich eingestuft — und bekommt einen "Vertrauensbonus" für neue Artikel zu diesem Thema. Eine Domain, die 50 Artikel zu völlig verschiedenen Themen veröffentlicht hat, hat keine Topical Authority für irgendeines dieser Themen.
Topical Authority entsteht durch vollständige Themenabdeckung in Clustern. Das bedeutet: Nicht nur einen Überblicksartikel zum Thema schreiben, sondern auch alle wichtigen Unterthemen detailliert behandeln.
Dieses Cluster-Modell — ein zentraler Pillar-Artikel verlinkt auf viele Unterthemen, die wiederum zurück auf den Pillar verlinken — ist die praktische Umsetzung von Topical Authority. Mehr dazu in unserem Artikel zu Pillar Pages und Content-Silos.
Backlinks galten lange als der wichtigste Ranking-Faktor. Heute zeigt die Praxis: Eine Domain mit starker Topical Authority rankt oft besser als eine Domain mit mehr Backlinks, aber weniger thematischer Tiefe — zumindest in ihrem Kernthema.
Das macht Topical Authority besonders attraktiv für neue oder kleinere Websites: Sie können in einem eng definierten Themenbereich durch konsequente Content-Strategie größere Websites überholen.
Entitäten sind benannte Konzepte — Personen, Orte, Organisationen, Produkte — die Google im Knowledge Graph repräsentiert. Wenn du Entitäten korrekt nennst (vollständige Produktnamen, offizielle Begriffe), signalisiert das Expertise.
Statt "die Google Tools" schreibe "Google Search Console" und "Google PageSpeed Insights". Statt "ein bekanntes SEO-Tool" schreibe "Ahrefs" oder "Semrush".
Analysiere die Top-10-Ergebnisse für dein Keyword: Welche Unterthemen behandeln sie alle? Das sind die Subtopics, die Google als essenziell für dieses Thema erwartet. Fehlende Subtopics = unvollständige Themenabdeckung = geringere Relevanz.
People-Also-Ask (PAA) Fragen zeigen, welche Aspekte Nutzer zum Hauptthema noch interessieren. Wenn du diese Fragen als H3-Überschriften im Artikel einbaust und direkt beantwortest, erhöhst du sowohl die semantische Relevanz als auch die Chance auf Featured Snippets.
Plane Content als Cluster, nicht als isolierte Artikel. Jedes Unterthema bekommt seinen eigenen Artikel, der mit dem Pillar-Artikel bidirektional verlinkt ist. Verfolge dabei welche Themen zu einem Cluster gehören und bearbeite den Cluster vollständig, bevor du zum nächsten wechselst.
Schema-Markup hilft Google, die Entitäten auf deiner Seite eindeutig zu identifizieren. Ein LocalBusiness-Schema für ein Unternehmen, ein Article-Schema für Blog-Artikel, ein FAQPage-Schema für Frage-Antwort-Abschnitte — all das stärkt die semantische Struktur deiner Seite. Mehr dazu in unserem Artikel zu Structured Data und Schema Markup.
Interne Links zwischen thematisch verwandten Artikeln signalisieren Google die semantische Nähe dieser Inhalte. Verwende dabei keyword-reiche Ankertexte, die das Thema des verlinkten Artikels präzise beschreiben. Eine systematische interne Verlinkungsstrategie ist deshalb auch aus semantischer Perspektive unverzichtbar.
Auch ohne kostenpflichtige SEO-Tools kannst du eine grundlegende TF-IDF-Analyse durchführen:
Viele Texter fügen bewusst Synonyme ein ("SEO-Optimierung", "Suchmaschinenoptimierung", "Google-Optimierung"), weil sie denken, das erhöhe die semantische Relevanz. Das stimmt nur bedingt: Natürliche Synonymverwendung ist gut, erzwungenes Synonym-Stuffing klingt künstlich und schadet der Lesbarkeit.
Ein Artikel, der 20 Unterthemen oberflächlich streift, ist semantisch schwächer als ein Artikel, der 5 Unterthemen wirklich in die Tiefe behandelt. Google bewertet Tiefe höher als Breite — konzentriere dich auf vollständige Behandlung der wichtigsten Aspekte.
Ein SEO-Blog, der plötzlich Artikel über Kochen oder Reisen veröffentlicht, verwässert die Topical Authority im SEO-Bereich. Jeder Off-Topic-Artikel schwächt das Gesamtbild der Domain als thematischen Experten. Bleibe konsequent im Themenfeld — oder erstelle eine separate Domain für andere Themen.
Viele investieren alles in einen langen "ultimativen Guide", vernachlässigen aber die Unterthemen-Artikel, die das Cluster komplett machen. Topical Authority entsteht aus der Vollständigkeit des Clusters — nicht aus der Länge eines einzelnen Artikels.
Googles E-E-A-T-Qualitätsrahmen (Experience, Expertise, Authoritativeness, Trustworthiness) ist eng mit Semantic SEO verbunden. Seiten, die ein Thema semantisch vollständig behandeln, signalisieren Expertise und Autorität — zwei der vier E-E-A-T-Dimensionen.
Das bedeutet: Semantic SEO ist nicht nur ein technischer Optimierungsansatz, sondern eine inhaltliche Qualitätsstrategie. Wer wirklich tief in Themen eindringt, erfüllt automatisch einen Großteil der E-E-A-T-Anforderungen — ohne explizit daran zu "optimieren".
Unser kostenloser SEO-Analyse-Tool prüft, ob deine Seiten thematisch vollständig optimiert sind — von Meta-Tags bis zur Heading-Struktur.
Kostenlose SEO-Analyse starten →TF-IDF war der erste Schritt weg von roher Keyword-Häufigkeit hin zu kontextueller Relevanz. Semantic SEO ist der nächste Schritt: Themen vollständig und in Tiefe behandeln, verwandte Entitäten und Konzepte natürlich verwenden und Topical Authority durch konsequente Cluster-Strategie aufbauen.
Die praktische Konsequenz ist einfach: Bevor du anfängst, einen Artikel zu schreiben, analysiere die Wettbewerber. Welche Konzepte, Fachbegriffe und Subtopics decken die Top-Seiten ab? Stelle sicher, dass dein Artikel diese enthält — und idealerweise noch darüber hinausgeht.
Beginne außerdem, Content als Cluster zu denken. Jeder neue Artikel ist ein Baustein in einem größeren semantischen Netz — nicht ein isoliertes Dokument. Wenn du dieses Netz systematisch aufbaust, entsteht die Topical Authority, die Google heute belohnt.
Weitere Artikel zum Thema OnPage-SEO: Keyword-Recherche Einsteiger-Guide · Suchintention verstehen · Content-Briefing erstellen · Pillar Pages und Content-Silos · Keyword-Kannibalisierung