Canonical Tag

  17. Oktober 2018

Das Canonical Tag wird verwendet, um Duplicate Content zu vermeiden, wenn identische Inhalte auf verschiedenen URLs verfügbar sind. Durch das Tag wird PageRank auf die kanonische URL übertragen, wodurch das Rankingpotenzial der bevorzugten URL verbessert wird.

Wenn der Googlebot eine Website besucht und verarbeitet, kann es passieren, dass mehrere Seiten das selbe Thema behandeln. Der Bot bevorzugt die Seite, die am umfangreichsten und nützlichsten zu sein scheint und kennzeichnet sie als kanonisch. Um das Crawlbudget von der Website bestmöglich auszuschöpfen, werden kanonische URLs häufiger gecrawlt, als Duplikate. Neben dem Canonical Tag nutzt Google weitere Faktoren, um die kanonische Version zu ermitteln:

  • Wird die Seite über http oder https bereitgestellt?
  • Wie lautet die bevorzugte Domain des Nutzers?
  • Welche Qualität besitzt die Seite?
  • Ist die URL in einer Sitemap aufgeführt?

Anwendungsfälle

Für folgende Anwendungsfälle eignet sich die Verwendung von Canonical Tags (wenn technisch nicht anders lösbar):

  • Zur Unterstützung mehrerer Gerätetypen. (https://meine-website.de vs. https://mobil.meine-website.de vs. https://wwww.meine-website.de)
  • Wenn das Blogsystem automatisch mehrere URLs speichert, sobald der Beitrag mehreren Bereichen zugeordnet wird.
  • Bei URLs mit Suchparameter oder Sitzungs-IDs.
  • Bei Bereitstellung einer HTML-Druckversion.
  • Bei Duplicate Content zwischen HTML Seite und PDF Datei.

Canonical Tags sind keine zwingenden Anweisungen

Wird dem Googlebot eine kanonische URL mitgeteilt, entspricht das einem Hinweis jedoch nicht einer zwingenden Anweisung. Somit ist es möglich, dass Google die kanonische URL missachtet, z. B. wenn das Duplikat deutlich besser zu einer Suchanfrage passt.

Google weist darauf hin: „Sie können die Auswahl der kanonischen Seite durch Google nicht erzwingen, es ist aber möglich, die Auswahl zu beeinflussen, indem Sie eine oder mehrere der hier gezeigten Techniken nutzen.“ (Quelle)

Informationen zur Interpretation von Canonical Tags // Google Search Console Hilfe
Informationen zur Interpretation von Canonical Tags // Google Search Console Hilfe

Google behandelt Canonical Tags nicht als verbindliche Anweisung, sondern als Hinweis. Sie sind somit keine Ideallösung zur Vermeidung von Duplicate Content.

Canonical Tags sind oft vermeidbar

Content-basierte Canonical Tags sind oftmals die beste Lösung zur Vermeidung von Duplicate Content – etwa wenn mehrere Blog-Artikel mit identischen Inhalten bestehen und ein Artikel bevorzugt werden soll. Doch viele CMS- und Shop-Systeme machen es sich zu leicht und nutzen Canonical Tags als Standard-Lösung zur Vermeidung doppelter Inhalte, zum Beispiel bei Get-Parameter-URLs. Häufig reichen jedoch wenige individuelle technische Maßnahmen aus, um auf diese Canonical Tags zu verzichten. Deshalb sollte man diesen Lösungen nicht blind vertrauen, die CMS- und Shop-Systeme von Haus aus mitbringen und stattdessen bewerten, ob individuelle technische Anpassungen erfolgsversprechender sind – dazu zwei Beispiele:

Umgang mit doppelten Seiten

Wenn technisch möglich, sollten doppelte Seiten, also mehrere URLs mit exakten Inhalten, durch 301 Redirects weitergeleitet werden. Kanonische URLs bieten sich hierfür nicht an, siehe Google Hilfe für Search Console – Eine kanonische Seite angeben.

301 Weiterleitung bei exakten Inhalten (Tabelle gekürzt) // Google Search Console Hilfe
301 Weiterleitung bei exakten Inhalten (Tabelle gekürzt) // Google Search Console Hilfe

HTTP und HTTPS

Sind die Seiten einer Website durch HTTP und durch HTTPS erreichbar, wäre eine globale 301 Redirect-Regel in der .htaccess-Datei die technisch bessere Lösung, als mit kanonischen URLs zu arbeiten.

Kanonische URL im HTML Quellcode übermitteln

Die einfachste Methode, eine kanonische URL anzugeben, ist im Quellcode einer HTML Seite. Pro Seite darf nur ein Canonical Tag im HTML HEAD angegeben werden. „href=“ teilt die kanonische URL mit:

Kanonische URL im HTTP Header übermitteln

Google unterstützt diese Methode derzeit nur für Websuchergebnisse.
Ist der Server konfigurierbar, kann mithilfe des HTTP-Headers rel=“canonical“ die kanonische URL für Nicht-HTML-Dokumente angegeben werden, wie PDF-Dateien. Diese Methode eignet sich vor allem dann, wenn eine PDF-Datei über mehrere URLs zugänglich ist und diese URLs eine kanonische URL ausgeben sollen.

Kanonische URL als .htaccess-Eintrag übermitteln

Alternativ zu den ersten beiden Methoden kann eine kanonische URL auch mittels .htaccess-Eintrag erfolgen. Das bietet sich besonders für PDF-Dateien an.

Zur Konfiguration einer kanonischen URL in der .htaccess-Datei wird das Apache Modul mod_headers verwendet. Dabei wird eine Anweisung nach folgendem Schema notiert:

Diese Beispiel informiert Suchmaschinen-Bots, dass die HTML Seite („https://www.indexlift.com/de/test-zielseite“) gegenüber der PDF-Datei („test.pdf“) bevorzugt (kanonisiert) werden soll.

Nachteil dieser Methode ist das Aufblähen der .htaccess-Datei. Je größer diese Datei wird, desto schlechter können die Ladezeiten ausfallen.

Warum erzeugen PDF-Dateien Duplicate Content?

Duplicate Content liegt auch vor, wenn eine HTML Seite und eine maschinenlesbare PDF Datei exakte/identische Inhalte besitzen. Häufig brechen Keyword-Rankings in den organischen Suchergebnissen ein oder weisen starke Schwankungen auf. Das folgende Beispiel zeigt eine Keyword-Kannibalisierung von einer HTML Seite (rot) und einer PDF Datei (blau) für das selbe Keyword einer Website:

Keyword-Kannibalisierung durch PDF-Datei // SISTRIX Toolbox
Keyword-Kannibalisierung durch fehlendes Canonical Tag // SISTRIX Toolbox

Kanonische URLs in XML Sitemap übermitteln

Alle kanonischen Seiten sollten in einer XML Sitemap aufgeführt und die Sitemap in der Search Console angegeben werden. Google werden diese Seiten als kanonisch vorgeschlagen. Jedoch garantiert Google nicht, dass diese Sitemap-URLs als kanonisch eingestuft werden – doch sie erleichtern die Festlegung kanonischer Seiten bei großen Websites. Eine Sitemap ist ein weniger starkes Signal für den Googlebot, als die „rel=canonical“-Zuordnungstechnik.

Kanonische URL prüfen

Mit dem Bericht URL-Prüfung (Indexabdeckung) der Google Search Console kann für eine URL ermittelt werden, ob Google eine kanonische URL erkannt hat und welche URL schließlich als kanonisch ausgewählt wird.

URL-Prüfung - Indexabdeckung // Google Search Console
URL-Prüfung – Indexabdeckung // Google Search Console

Alternativ bietet sich das kostenfreie Online-Tool Canonical Tag URL Location Checker von seoreviewtools.com zur schnellen Validierung an.

HTML Canonical Tag URL Location Checker // seoreviewtools.com
Canonical Tag URL Location Checker // seoreviewtools.com
SEO Glossar