Canonical Tags für PDF Dateien

Canonical Tags werden verwendet, um Suchmaschinen auf inhaltlich identische Versionen einer Ressource hinzuweisen. Technische Fehlkonfigurationen oder die Bereitstellung einer HTML Seite in einem weiteren Dateiformat sind typische Anwendungsfälle. Wie Canonical Tags für PDF Dateien richtig erstellt werden, das erkläre ich in diesem Blog-Beitrag.

Um Ranking-Probleme durch PDF Dateien (oder andere Dateitypen) zu vermeiden, nutzt man in der Suchmaschinenoptimierung gern Canonical Tags. Diese werden einfach in der .htaccess Datei eines Apache Webserver konfiguriert. Dafür ist kein Programmierwissen erforderlich.

Warum sind PDF Dateien problematisch?

Häufig kollidieren PDF Dateien mit identischen HTML Seiten einer Website oder eines Online Shops. Wenn Suchmaschinen auf beide Dateien zugreifen dürfen und ihnen nicht mitgeteilt wird, welche Datei die Standardversion ist, führt das häufig zur Keyword-Kannibalisierung. Als Folge brechen Rankings ein oder besitzen starke Schwankungen, sogenannte Auf- und Abwärtsgaps.

Das Showcase verdeutlicht sehr anschaulich, dass eine Keyword-Kannibalisierung zwischen einer HTML Seite (rot) und der identischen PDF Datei (blau) besteht. Das führt zu Rankingproblemen in den Suchmaschinen Ergebnissen, die vermieden werden sollten. Rankingpotenziale können so leider nicht ausgeschöpft werden:

Keyword-Kannibalisierung durch PDF-Datei // SISTRIX Toolbox
Keyword-Kannibalisierung durch PDF-Datei // SISTRIX Toolbox

PDF Datei kanonisieren

Im Rahmen einer technischen Suchmaschinenoptimierung sollte also konfiguriert werden, welche Datei die bevorzugte Version ist, die Google indexieren soll. Ich empfehle immer die HTML Seite zu bevorzugen. Die PDF Datei verweist via Canonical Tag auf die HTML Seite und gibt an, dass die HTML Seite die Standardversion ist – vorausgesetzt die Indexierbarkeit der HTML Seite wird durch robots.txt und Robots Meta Tag gewährleistet. Zur Konfiguration wird das Apache Modul „mod_headers “ verwendet und eine Anweisung in die .htaccess Datei geschrieben:

  • test.pdf “ muss durch den Dateinamen der PDF Datei ersetzt werden.
  • https://www.indexlift.com/de/ “ wird durch die absolute URL der HTML Seite ersetzt, die Google bevorzugen soll.
  • Für jede PDF Datei muss eine eigenständige Anweisung innerhalb des „mod_headers “ erstellt werden.

Canonical Tags prüfen

Wenn die Anweisungen vorgenommen sind und die .htaccess Datei auf dem Webserver aktualisiert ist, empfehle ich alle Canonical Tags zu prüfen. Das ist mit der Rendern-Funktion der Google Search Console möglich:

Canonical Tag überprüfen // Google Search Console
Canonical Tag überprüfen // Google Search Console

Oder man verwendet ein externes Tool, wie den Canonical Tag URL Location Checker von seoreviewtools.com:

Canonical Tag URL Location Checker // seoreviewtools.com
Canonical Tag URL Location Checker // seoreviewtools.com

Kommentare(2)

  • Chris
    29. Juli 2016, 14:18  Antworten

    Danke für den Tipp!
    Wird denn kein Pfad mitgegeben, also wo das test.pdf liegt?

    • Jens Fröhlich
      29. Juli 2016, 14:32

      Hallo Chris, das ist nicht erforderlich, probiere es aus.

      Beste Grüße
      Jens

Komentar verfassen