PageRank Algorithmus

  4. September 2018

Der PageRank Algorithmus ist ein durch Google patentiertes Verfahren, um die Rankingkraft einer Seite auf Grundlage ihrer eingehenden Links zu bewerten. Er wird auf einer Skala von 0 bis 10 berechnet – 10 entspricht dem Höchstwert. Der Domain-PageRank wurde beim Linkbuilding als Kennzahl verwendet, um effektive Backlink-Quellen zu finden.

Ursprünglich von den Google Gründern Larry Page und Sergei Brin an der Standford University entwickelt und 1997 patentiert, diente der PageRank anfangs dafür, Webseiten zu bewerten. Je mehr Links eine Seite besitzt, desto relevanter scheint diese zu sein und kann besser ranken. In den frühen Stunden der OffPage Optimierung besaß der PageRank eine starke Gewichtung im Google Suchalgorithmus. Heute ist der Suchalgorithmus viel komplexer und weniger abhängig von einzelnen Algorithmen.

Berechnung des PageRank

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

  • PR(A) ist der PageRank von Seite A
  • PR(Ti) ist der PageRank der Seiten Ti die auf Seite A verlinken
  • C(Ti) ist die Anzahl abgehender Links auf Seite Ti
  • d ist ein Dämpfungsfaktor, der zwischen 0 und 1 eingestellt werden kann

Der PageRank wird für jede Seite einzeln berechnet. Zudem wird der PageRank von Seite A rekursiv durch die PageRanks der Seiten definiert, die auf Seite A verlinken. Der PageRank der Seiten Ti, die auf Seite A verlinken, beeinflusst den PageRank von Seite A nicht einheitlich.

Innerhalb des PageRank-Algorithmus wird der PageRank einer Seite T immer mit der Anzahl der abgehenden Links C (T) auf Seite T gewichtet. Je mehr abgehende Links eine Seite T besitzt, desto weniger wird Seite A von einem Link profitieren. Der gewichtete PageRank der Seiten Ti wird dann addiert. Das Ergebnis davon ist, dass ein zusätzlich eingehender Link für Seite A immer den PageRank von Seite A erhöht. Schließlich wird die Summe der gewichteten PageRanks aller Seiten Ti mit einem Dämpfungsfaktor d multipliziert, der zwischen 0 und 1 gesetzt werden kann. So wird der Umfang des PageRank-Nutzens für eine Seite durch eine andere Seite verringert, die mit ihr verknüpft ist.

Random Server Modell

Lawrence Page und Sergey Brin betrachteten den PageRank Algorithmus als Modell willkürlichen Nutzerverhaltens, bei dem ein zufälliger Nutzer (Surfer) beliebig auf Links klickt, ohne den Inhalt einer Seite zu beachten. Der Nutzer besucht eine Seite mit einer bestimmten Wahrscheinlichkeit, die sich aus dem PageRank der Seite ergibt. Die Wahrscheinlichkeit, dass er auf einen Link klickt, ergibt sich ausschließlich aus der Anzahl der Links der Seite. Deshalb wird der Seiten-PageRank nicht vollständig an die verlinkten Seiten weitergeleitet, sondern wird durch die Anzahl der Links auf der Seite geteilt.

Die Wahrscheinlichkeit, dass ein zufällige Nutzer eine Seite besucht, entspricht der Summe der Wahrscheinlichkeiten auf Basis der Linksumme zu dieser Seite. Diese Wahrscheinlichkeit wird um den Dämpfungsfaktor d reduziert. Die Rechtfertigung innerhalb des Random Surfer Modells ist daher, dass der Nutzer nicht auf eine unendliche Anzahl von Links klickt, sondern manchmal gelangweilt und zufällig eine andere Seite aufruft.

Die Wahrscheinlichkeit, dass der zufällige Nutzer nicht aufhört auf Links zu klicken, ist durch den Dämpfungsfaktor d gegeben, der abhängig vom Grad der Wahrscheinlichkeit zwischen 0 und 1 liegt. Je höher d ist, desto wahrscheinlicher wird ein zufälliger Nutzer auf einen Link klicken. Da der Nutzer eine Seite zufällig aufruft, wenn er einen Link anklickt, wird die Wahrscheinlichkeit als Konstante (1-d) in den PR-Algorithmus implementiert. Unabhängig der eingehenden Links ist die Wahrscheinlichkeit, dass der zufällige Nutzer zu einer Seite springt, immer (1-d), so dass eine Seite immer einen minimalen PageRank besitzt.

Kritik

Der PageRank Algorithmus vernachlässigt den Inhalt einer Seite, seine Berechnungsgrundlagen sind Links. Moderne Suchalgorithmen, wie die Google Suche, bewerten hingegen die Content-Qualität von Seiten, siehe Google Quality Rater Guidelines. Außerdem konnte der Algorithmus durch Linkbuilding-Methoden (Linkkauf, Linkmiete, rekursive Verlinkungen, etc.) manipuliert werden. Das Interesse zur Generierung von PR-starken Links war somit lange Zeit eine beliebte Optimierungsmethode bei der Suchmaschinenoptimierung. Da der Linkaufbau vorwiegend Content-unabhängig erfolgte, war häufig kein Mehrwert für Suchmaschinen-Nutzer gegeben – vor allem nicht bei informationellen Suchanfragen. Diese Gründe führten offenbar dazu, dass Google den PageRank einer Seite nicht mehr öffentlich in der Google Toolbar zur Verfügung stellt – doch wahrscheinlich intern weiterhin nutzt.

Themenrelevante Algorithmen

SEO Glossar