Besser WDF*P*IDF als Keyworddichte

Content zählt zu den Top-3 Rankingsignalen der Google Suche. Deshalb ist die Erstellung hochwertiger Inhalte wichtig, um gute Rankings aufzubauen. Um sie optimal für die Suchintention der Besucher auszurichten, gibt es verschiedene Methoden der Keyword-Optimierung. In diesem Blog-Beitrag zeige ich eine Methode auf, die sich besser eignet, als die Keyword-Dichte.

Die Keyworddichte (Suchwortdichte/Keyword Density) war früher für Suchmaschinenoptimierer eine wichtige Kennzahl, um zu bewerten, wie hoch das Rankingpotenzial einer Webseite ist. Doch heute ist sie nicht mehr zeitgemäß, denn Suchmaschinen-Anbieter, wie Google, haben ihre Algorithmen in den letzten Jahren immer stärker für eine bessere Qualität (Panda Algorithmus) und zu Webspam-Bekämpfung (Penguin Algorithmus) ausgerichtet. Wer den Content nach der Keyword Dichte optimiert, handelt fahrlässig und nicht mehr zeitgemäß.

Was ist die Keyworddichte?

Die Keyworddichte gibt an, wie oft ein Begriff oder ein Begriffspaar auf einer Webseite vorkommt.

Wie berechnet man die Keyworddichte?

Die Dichte eines Keywords auf einer Webseite zu bestimmen, ist einfach. Die Formel lautet:

Formel zur Berechnung der Keyworddichte (KD)

KD = Keyworddichte (Suchwortdichte)
tf = Termfrequenz (Wie oft kommt der Term „u“ in einem Artikel „v“ vor?)
l = Termzahl (Wie viele Terme kommen in einem Artikel „u“ vor?)

Beispiel

Der Content einer Webseite zum Thema „Spielzeug“ umfasst 1.000 Wörter (Terme). Auf dieser kommt das Keyword „Lego“ 20-Mal vor. Die Keyworddichte des Wortes „Lego“ beträgt 2 Prozent.

KD = ((20 / 1.000) * 100)
KD = 2 Prozent

Wie hoch sollte die Keyword Dichte sein?

Diese Frage sollte sich niemand im Rahmen einer seriösen Suchmaschinenoptimierung stellen. Man sollte sich besser auf die Content-Optimierung für Besucher konzentrieren, statt die Keyword Dichte zu berechnen. Deshalb ist die Keyword Dichte keine seriöse Bewertungsgrundlage.

Die Grenzen der Keyword Dichte

Die Keyword Dichte ist nach meiner Bewertung kein geeignetes Signal, um die Relevanz eines Keywords auf einer Webseite umfassend zu bewerten. Denn sie bewertet nur, wie oft ein Begriff vorkommt. Ist es also nicht besser bei der Content-Produktion eben nicht auf Keyword-Rankings zu achten, sondern einfach zu schreiben?

Das empfiehlt Google in den Richtlinien für Webmaster (Quelle)

  • Erstellen Sie eine hilfreiche, informative Website und verfassen Sie Seiten, die den Inhalt klar und eindeutig beschreiben.
  • Überlegen Sie sich, welche Suchbegriffe Nutzer eingeben könnten, um nach Ihren Seiten zu suchen, und verwenden Sie diese Begriffe auf Ihrer Website.
  • Stellen Sie sicher, dass die wichtigsten Inhalte Ihrer Website standardmäßig sichtbar sind. Google ist in der Lage, HTML-Inhalte zu crawlen, die sich hinter Navigationselementen wie Tabs oder maximierbaren Bereichen verbergen. Wir stufen diese Inhalte jedoch als weniger zugänglich für Nutzer ein und sind der Ansicht, dass die wichtigsten Informationen in der Standard-Seitenansicht sichtbar sein sollten.

Man ist also gut beraten, Content zu erstellten, ohne dabei eine Keyword Dichte zu beachten. Doch wie kann man bewerten, dass der Content den gewünschten Themenfokus besitzt und Suchmaschinen diesen auch entsprechend bewerten können? Um den Keyword-Fokus einer Webseite zu messen, eignet sich eine WDF*P*IDF-Analyse besser.

WDF*P*IDF-Analyse

WDF*P*IDF ermöglicht eine deutlich komplexere Betrachtung. Denn die WDF umfasst die Berechnung aller Terme auf einer Webseite und die IDF die Betrachtung aller Artikel (Webseiten) mit diesem Term innerhalb eines Systems, z. B. einer Datenbank wie die Google Suchergebnisse. Zudem fließt der Korrekturfaktor P ein.

WDF – Within-document Frequency

Die Within-document Frequency, kurz WDF, bedeutet die Dokument-spezifische Gewichtung eines Begriffs. Damit berechnet man die Häufigkeit eines Terms bezogen auf alle Terme einer Webseite.

Je häufiger ein Term vorkommt, desto größer ist seine Within-document Frequency.

Die Formel zur Berechnung der WDF ist deutlich umfangreicher, als die Berechnung der Keyworddichte:

Formel zur Berechnung der Within-document Frequency (WDF)

i = Begriff (Term)
j = Dokument
L = Gesamtzahl der Wörter im Dokument „j“
Freq(i,j) = Häufigkeit des Wortes „i“ im Dokument „j“

Beispiel

In einem Artikel mit einem Umfang von 1.000 Wörtern kommt der Begriff „Lego“ 20-Mal vor. Die WDF des Begriffs innerhalb des Artikels beträgt WDF (i) = 0,4.

i = 20
L = 1.000
Freq (i,j) = 20

WDF (i) = (log2 20 + 1) / (log2 1.000)
WDF (i) = 0,4

IDF – Inverse-document Frequency

Die Inverse-document Frequency, kurz IDF, bewertet das Verhältnis eines Begriffs in einem Artikel zu allen gefundenen Artikeln mit diesem Begriff innerhalb eines Systems.

Optimiert man den Inhalt eines Artikels für ein spezifisches Keyword, kann man mit der WDF messen, wie populär der Term, bezogen auf alle Terme, in diesem Artikel ist. Die IDF berechnet, wie relevant der betrachtete Artikel im Verhältnis zu allen Artikeln in einem System ist, wie in einer Suchmaschinen-Datenbank. Ausschlaggebend sind dabei nur Artikel, die den betrachteten Term besitzen.

Die Berechnung der Inverse-document Frequency erfolgt mit folgender Formel:

Formel zur Berechnung der Inverse-Document-Frequence (IDF)

ND = Anzahl der Dokumente
ft = Anzahl der Dokumente die den Term „t“ enthalten

Zur Berechnung der IDF muss also bekannt sein, wie viele Artikel in einem System vorhanden sind und wie viele davon den Term beinhalten.

Beispiel

Ein Artikel umfasst 1.000 Wörter, darin kommt das Keyword „Lego“ 20-Mal vor. Dieser Artikel befindet sich in einer Datenbank, welche insgesamt 50.000 Artikel beinhaltet. In 12.000 Artikeln kommt das Keyword „Lego“ vor. Die IDF für „Lego“ beträgt IDFt = 0,7.

ND = 50.000
ft = 12.000

IDFt = log (1+ (50.000 / 12.000))
IDFt = 0,7

Grenzen der IDF

Für Optimierer ist die Berechnung der Inverse-document Frequency oft schwierig, weil nicht bekannt ist, wie viele Artikel sich in der Datenbank der Suchmaschine befinden. Außer man beschränkt sich auf ein Set, z. B. die Top-10 Treffer in den SERP’s für eine Suchanfrage. Für ND kann man nur mit Näherungswerten rechnen oder mit den Artikeln eines sinnvoll gewählten Sets. Betrachtet man nur den Bruch der Formel zur Berechnung der IDF, so lässt sich festhalten: Je mehr Artikel mit einem Keyword in einem System vorhanden sind, desto geringer ist die IDF.

Fazit

Eine Bewertung der WDF*P*IDF ist aussagekräftiger als die Keyword Dichte. Für optimierte Artikel, die bei Google organisch gut ranken sollen, ist die Keyworddichte keine seriöse Kennzahl. Die WDF ist eine Unterstützung, wenn man Inhalte erstellen oder optimieren möchte, die in Suchmaschinen gut gefunden werden sollen. Bei der IDF empfehle ich den Fokus nach meiner Bewertung auf die Top-10 organischen Suchergebnisse legen. Das sind die besten indexierten Artikel für eine Suchanfrage und sie ranken dort nicht grundlos. Also kann es hilfreich sein zu bewerten, welche Begriffe in den zehn besten Artikel besonders häufig vorkommen. Allerdings sollte man die Termgewichtung nicht zu wichtig nehmen, schließlich ist sie nur eines von über 200 Google Rankingfaktoren.

In der Praxis sieht eine WDF*IDF-Analyse beispielsweise für das Keyword „Wärmebildkamera“ so aus:

WDF*IDF-Analyse für "Wärmebildkamera" // OnPage.org
WDF*IDF-Analyse für „Wärmebildkamera“ // OnPage.org

Weiterführende Literatur

Kommentare(7)

  • 12. November 2012, 17:20  Antworten

    Hi Jens,
    du wie viele andere schreiben ja „Je häufiger ein Begriff (Term) in einem Dokument vorkommt und je seltener dieser in allen Dokumenten des Systems verwendet wird, desto mehr Relevanz baut das Dokument für den Begriff innerhalb des Systems auf“ das ist richtig, aber das galt für Uni Daten bzw für das Militär, etc.

    Warum gilt das aber auch für Google?

    gehen wir davon aus, dass das auch für Google gilt. Da der IDF für ein Keyword eine Konstante ist (für die verschiedenen zu untersuchenden URLs), dann ist doch der WDF nicht anderes als die Keyworddichte (in gestauchter Form), wie kann da ein Blogger oder Seitenbetreiber feststellen welcher WDF nun gut und welcher schlecht ist?

    Lg Armin

  • Jens
    12. November 2012, 22:33  Antworten

    Hallo Armin,

    du hast vollkommen Recht, die IDF findet ursprünglich im Information Retrieval ihre Anwendung.

    Deine berechtigte Frage beantworte ich gern mit meiner Herangehensweise: Für mich ist die WDF relevant, die Keyword-Dichte ist für mich keine Kennzahl mehr, an der ich mich orientiere. Denn bei der Berechnung fehlt der Logarithmus welche die von dir genannte Stauchung erzeugt.

    Was ein guter oder schlechter WDF eines Artikels ist kann ich dir leider nicht konkret beantworten. Ich finde, sie hängt auch vom internen und externen Wettbewerb ab, also den Authorities in den SERP’s. Will ich mit einem Text gut ranken, dann mache ich mir vorher konkrete Gedanken zu den Keywords, zur Bildsprache, der thematischen Abhandlung und zur internen Verlinkung. Ich skizziere den semantischen Aufbau des Contents. So schreibe ich viel spezifischer und sparsamer, was sich wiederum positiv für eine hohe WDF des Hauptkeywords auswirkt. Anders ausgedrückt: Ich benötige weniger Terme innerhalb meines Dokuments, um mit dem gewünschten Term eine maximale WDF zu erzeugen.

    Mit dieser Methode erziele ich gute Ergebnisse. Natürlich wäre es besser, die WDF der Top Wettbewerber Seiten auszuwerten, aber hier kommen auch weitere Kriterien, wie z. B. die Schlüsselwortabstand der Terme ins Spiel. Du weißt was ich meine.

    VG

  • Armin Sanjari
    13. November 2012, 10:16  Antworten

    Das ist schon richtig und deine Art und Weise den WDF zu benutzen ist ja auch nicht verkehrt, jedoch (und das ist ganz wichtig) ist der WDF ohne dem IDF und vorallem ohne dem P genuase relevant wie die Keyworddichte.

    Es ist richtig das die Steigung des WDF durch den Log (binären Log) stetig, jedoch nicht so steil ist, jedoch zeigt er bei einer Wettbewerbsanalyse doch nur an wie relevant das Keyword bei anderen URLs ist. Die gleiche Analyse könnte man mit der Keyworddichte durchführen.

    Versteh mich nicht falsch, ich halte die Keyworddichte alleine betrachtet für keine Aussagekräftige Kennzahl. Nur ist der WDF auch keine geeignete Kennzahl (alleine betrachtet).

    Ich kann dir sagen was der optimale Wert der WDF ist. Theorie 1: Es gibt keinen, weil das Clustermodel eine höhere Gewichtung besitzt.
    Theorie 2: Der WDF hat natürlich ein Intervall pro Keyword. In diesem Intervall existiert für jedes Keyword genau ein Optimum.

    Lg Armin

    • Jens
      15. November 2012, 17:26

      Mhh klingt logisch und wahnsinnig mathematisch. Aber ich glaube dir folgen zu können.

      Aus deiner Argumentation entnehme ich, dass der WDF eine verlässliche Kennzahl in Kombination mit dem IDF und P ist. Klingt auch logisch. Vielleicht hast du einen Ansatz: Wie willst du die IDF aussagekräftig bewerten, wenn ND = Anzahl der Dokumente (also in diesem Fall Googles Datenbank) nicht definierbar ist?

      VG Jens

  • 17. November 2012, 15:39  Antworten

    Sorry das ich erst jetzt schreibe. Das ist ja auch ein sehr mathematisches Thema (darüber wurden ja auch schon Diplom-, Masterarbeiten sowie Phd geschrieben. Deshlab kann man das natürlich nicht in einem Tag alles verstehen).

    Diese Gewichtung ist eine gute Kennzahl.

    Zum IDF, da habe ich zwar schon ein Tool. Aber ich möchte noch ein paar Tests machen (möchte keine falschen Tipps geben).
    Aber für N(D) brauchst du ja nicht alle TxT-Dokus. Ab Platz x sind die Ergebnisse nicht relevant. Du musst bei N(D) mit Mengenoperatoren arbeiten und pro Keyword noch ein wenig ausfiltern.

    Lg und schönes WE 🙂

    • Jens
      17. November 2012, 20:07

      Hey Armin,

      wusste gar nicht das du an einem Tool bastelst. 🙂
      Halte mich doch mal auf dem Laufenden. Daran bin ich durchaus interessiert.

      VG Jens

  • Armin
    19. November 2012, 17:12  Antworten

    Hi Jens,
    das wird mein zweites Tool. Ich meld mich wenn das Ding on geht. 🙂

Komentar verfassen