Canonical Tag

  30. August 2018

Das Canonical Tag wird verwendet, um Duplicate Content zu vermeiden, wenn exakte oder identische Inhalte auf verschiedenen URLs verfügbar sind. Durch das Tag wird PageRank auf die kanonische URL (bevorzugte URL) übertragen, wodurch das Rankingpotenzial verbessert wird.

Wenn der Googlebot eine Webseite besucht und verarbeitet, kann es passieren, dass mehrere Seiten das selbe Thema behandeln. Der Bot bevorzugt die Seite, die am umfangreichsten und nützlichsten zu sein scheint und kennzeichnet sie als kanonisch. Um das Crawlbudget von der Website bestmöglich auszuschöpfen, werden kanonische URLs häufiger gecrawlt, als Duplikate. Neben dem Canonical Tag nutzt Google auch weitere Faktoren, um die kanonische Version zu ermitteln:

  • Wird die Seite über http oder https bereitgestellt?
  • Wie lautet die bevorzugte Domain des Nutzers?
  • Welche Qualität besitzt die Seite?
  • Ist die URL in einer Sitemap aufgeführt?
  • Gibt es eine rel=canonical-Kennzeichnung?

Wird dem Googlebot eine kanonische (bevorzugte) URL via Canonical Tag mitgeteilt, dient das als Hinweis doch nicht als zwingende Anweisung. Es kann also vorkommen, dass Google die kanonische URL missachtet, z. B. wenn das Duplikat deutlich besser zu einer Suchanfrage passt.

Anwendungsfälle

Doch nicht immer ist die Verwendung eines Canonical Tags die beste Lösung zur Vermeidung von (Near) Duplicate Content. Vor allem, wenn dem Suchmaschinen-Bot nicht die Entscheidung überlassen werden soll. Ist eine Webseite beispielsweise mit HTTP und HTTPS erreichbar, eignet sich ein 301 Redirect besser. Oder wenn eine Webseite mit und ohne Get-Parameter erreichbar ist, wären Anweisungen in der robots.txt-Datei die bessere Lösung. Folgende Beispiele sprechen für eine Verwendung von Canonical Tags:

  • Zur Unterstützung mehrerer Gerätetypen. (https://meine-website.de vs. https://mobil.meine-website.de vs. https://wwww.meine-website.de)
  • Wenn das Blogsystem automatisch mehrere URLs speichert, sobald der Beitrag mehreren Bereichen zugeordnet wird.
  • Bei URLs mit Suchparameter oder Sitzungs-IDs.
  • Bei Bereitstellung einer HTML-Druckversion.

HTML Markup für Webseiten

Das Canonical Tag muss für jede Webseite einzeln bereitgestellt werden. Es wird im HEAD-Bereich vom HTML Quellcode definiert. Für jede Seite wird nur ein Canonical Tag angegeben, wodurch „href=“ die kanonische (bevorzugte) URL mitteilt:

Kanonisierung von PDF-Dateien

Bei PDF-Dateien, die von Google unterstützt werden, kann das Canonical Tag im Header der PDF-Datei notiert werden. Die Einbindung ist etwas schwieriger, als bei der HTML Markup für Webseiten:

Zur Konfiguration eines Canonical Tags für eine PDF-Datei kann alternativ das Apache Modul „mod_headers“ verwendet werden. Dabei wird eine Anweisung in die .htaccess-Datei auf dem Webserver geschrieben:

Kanonische URL prüfen

Die Prüfung, ob Google ein Canonical Tag richtig erkannt hat und um zu erfahren, welche URL Google kanonisiert, empfiehlt sich der Bericht URL-Prüfung (Indexabdeckung) der Google Search Console.

URL-Prüfung - Indexabdeckung // Google Search Console
URL-Prüfung – Indexabdeckung // Google Search Console
SEO Glossar