Das Canonical Tag wird verwendet, um Duplicate Content zu vermeiden, wenn identische oder exakte Inhalte auf verschiedenen URLs verfügbar sind. Das Tag überträgt PageRank auf die kanonische URL.
Inhaltsverzeichnis
- Welche Seite bevorzugt Google?
- Anwendungsfälle
- Canonical Tags sind keine zwingenden Anweisungen
- Canonical Tags sind oft vermeidbar
- Kanonische URL im HTML Quellcode übermitteln
- Kanonische URL im HTTP Header übermitteln
- Kanonische URL als .htaccess-Eintrag übermitteln
- Kanonische URLs in XML Sitemap übermitteln
- Kanonische URL prüfen
Welche Seite bevorzugt Google?
Wenn der Googlebot eine Website besucht und verarbeitet, kann es passieren, dass mehrere Seiten das selbe Thema behandeln. Der Bot bevorzugt die Seite, die am umfangreichsten und nützlichsten zu sein scheint und kennzeichnet sie als kanonisch. Um das Crawlbudget von der Website bestmöglich auszuschöpfen, werden kanonische URLs häufiger gecrawlt, als Duplikate. Neben dem Canonical Tag nutzt Google weitere Faktoren, um die kanonische Version zu ermitteln:
- Wird die Seite über http oder https bereitgestellt?
- Wie lautet die bevorzugte Domain des Nutzers?
- Welche Qualität besitzt die Seite?
- Ist die URL in einer Sitemap aufgeführt?
- …
Anwendungsfälle
Für folgende Anwendungsfälle eignet sich die Verwendung von Canonical Tags (wenn technisch nicht anders lösbar):
- Zur Unterstützung mehrerer Gerätetypen. (https://meine-website.de vs. https://mobil.meine-website.de vs. https://wwww.meine-website.de)
- Wenn das Blogsystem automatisch mehrere URLs speichert, sobald der Beitrag mehreren Bereichen zugeordnet wird.
- Bei URLs mit Suchparameter oder Sitzungs-IDs.
- Bei Bereitstellung einer HTML-Druckversion.
- Bei Duplicate Content zwischen HTML Seite und PDF Datei.
Canonical Tags sind keine zwingenden Anweisungen
Wird dem Googlebot eine kanonische URL mitgeteilt, entspricht das einem Hinweis jedoch nicht einer zwingenden Anweisung. Somit ist es möglich, dass Google die kanonische URL missachtet, z. B. wenn das Duplikat deutlich besser zu einer Suchanfrage passt.
Google weist darauf hin: „Sie können die Auswahl der kanonischen Seite durch Google nicht erzwingen, es ist aber möglich, die Auswahl zu beeinflussen, indem Sie eine oder mehrere der hier gezeigten Techniken nutzen.“ (Quelle)
Google behandelt Canonical Tags nicht als verbindliche Anweisung, sondern als Hinweis. Sie sind somit keine Garantie zur Vermeidung von Duplicate Content.
Canonical Tags sind oft vermeidbar
Content-basierte Canonical Tags sind oftmals die beste Lösung zur Vermeidung von Duplicate Content – etwa wenn mehrere Blog-Artikel mit identischen Inhalten bestehen und ein Artikel bevorzugt werden soll. Doch viele CMS- und Shopsysteme machen es sich zu leicht und nutzen Canonical Tags als Standard-Lösung zur Vermeidung doppelter Inhalte, zum Beispiel bei Get-Parameter-URLs. Häufig reichen jedoch wenige individuelle technische Maßnahmen aus, um auf diese Canonical Tags zu verzichten. Deshalb sollte man diesen Lösungen nicht blind vertrauen, die CMS- und Shopsysteme von Haus aus mitbringen und stattdessen bewerten, ob individuelle technische Anpassungen erfolgsversprechender sind – dazu zwei Beispiele:
Umgang mit doppelten Seiten
Wenn technisch möglich, sollten doppelte Seiten, also mehrere URLs mit exakten Inhalten, durch 301 Redirects weitergeleitet werden. Kanonische URLs bieten sich hierfür nicht an, siehe Google Hilfe für Search Console – Eine kanonische Seite angeben.
HTTP und HTTPS
Sind die Seiten einer Website durch HTTP und durch HTTPS erreichbar, wäre eine globale 301 Redirect-Regel in der .htaccess-Datei die technisch bessere Lösung, als mit kanonischen URLs zu arbeiten.
Kanonische URL im HTML Quellcode übermitteln
Die einfachste Methode, eine kanonische URL anzugeben, ist im Quellcode einer HTML Seite. Pro Seite darf nur ein Canonical Tag im HTML HEAD angegeben werden. „href=“ teilt die kanonische URL mit:
1 2 3 4 5 6 7 |
<html> <head> <link rel="canonical" href="https://www.indexlift.com/de/glossar/canonical-tag" /> (…) </head> <body>Sichtbarer Bereich einer Webseite</body> </html> |
Kanonische URL im HTTP Header übermitteln
Google unterstützt diese Methode derzeit nur für Websuchergebnisse.
Ist der Server konfigurierbar, kann mithilfe des HTTP-Headers rel=“canonical“ die kanonische URL für Nicht-HTML-Dokumente angegeben werden, wie PDF-Dateien. Diese Methode eignet sich vor allem dann, wenn eine PDF-Datei über mehrere URLs zugänglich ist und diese URLs eine kanonische URL ausgeben sollen.
1 |
Link: <https://www.indexlift.com/de/glossar/canonical-tag>; rel="canonical" |
Kanonische URL als .htaccess-Eintrag übermitteln
Alternativ zu den ersten beiden Methoden kann eine kanonische URL auch mittels .htaccess-Eintrag erfolgen. Das bietet sich besonders für PDF-Dateien an.
Zur Konfiguration einer kanonischen URL in der .htaccess-Datei wird das Apache Modul mod_headers verwendet. Dabei wird eine Anweisung nach folgendem Schema notiert:
1 2 3 4 5 |
<IfModule mod_expires.c> <Files canonical-tag.pdf> Header append Link "<https://www.indexlift.com/de/glossar/canonical-tag>; rel=\"canonical\"" </Files> </IfModule> |
Diese Beispiel informiert Suchmaschinen-Bots, dass die HTML Seite („https://www.indexlift.com/de/test-zielseite“) gegenüber der PDF-Datei („test.pdf“) bevorzugt (kanonisiert) werden soll.
Nachteil dieser Methode ist das Aufblähen der .htaccess-Datei. Je größer diese Datei wird, desto schlechter können die Ladezeiten ausfallen.
Warum erzeugen PDF-Dateien Duplicate Content?
Duplicate Content liegt auch vor, wenn eine HTML Seite und eine maschinenlesbare PDF Datei exakte/identische Inhalte besitzen. Häufig brechen Keyword-Rankings in den organischen Suchergebnissen ein oder weisen starke Schwankungen auf. Das folgende Beispiel zeigt eine Keyword-Kannibalisierung von einer HTML Seite (rot) und einer PDF Datei (blau) für das selbe Keyword einer Website:
Kanonische URLs in XML Sitemap übermitteln
Alle kanonischen Seiten sollten in einer XML Sitemap aufgeführt und die Sitemap in der Search Console angegeben werden. Google werden diese Seiten als kanonisch vorgeschlagen. Jedoch garantiert Google nicht, dass diese Sitemap-URLs als kanonisch eingestuft werden – doch sie erleichtern die Festlegung kanonischer Seiten bei großen Websites. Eine Sitemap ist ein weniger starkes Signal für den Googlebot, als die „rel=canonical“-Zuordnungstechnik.
Kanonische URL prüfen
Mit dem Bericht URL-Prüfung (Indexabdeckung) der Google Search Console kann für eine URL ermittelt werden, ob Google eine kanonische URL erkannt hat und welche URL schließlich als kanonisch ausgewählt wird.
Alternativ bietet sich das kostenfreie Online-Tool Canonical Tag URL Location Checker von seoreviewtools.com zur schnellen Validierung an.