Aktuelle Übersicht: das Canonical Tag von Google

Bookmark and Share

Das in die Meta-Angaben einer Webseite eingebaute “Canonical Tag” ist für Webmaster ein Segen. Allerdings birgt es auch Gefahren. Die kanonische URL zeigt dem Google-Robot zuverlässig den eigentlichen Ursprung eines Seiteninhalts. Und zwar so zuverlässig, dass schon kleine Fehler zur Katastrophe werden können. Hier eine Einführung in das Canonical Tag.

Doppelte Inhalte, auch “Duplicate Content” genannt, entstehen oft unabsichtlich manchmal auch absichtlich. Doch schädlich für Google ist ein solcher DC immer. Im Gegensatz zu einer 301-Umleitung einer Seite bietet das Canonical Tag die Möglichkeit, zwei Instanzen eines Inhalts für die User zu behalten – der Suchmaschine aber nur eine als “wichtig” zu präsentieren.

Hier eine kleine Zusammenfassung, wie man damit umgeht und welche Gefahren damit einher gehen.

1. Interne Verwendung des Canonical Tag

Sei es, das man den gleichen Inhalt einer Unterseite mehrfach anzeigen möchte, oder sei es, dass das Content Management System zu blöd ist, einzigartige Seiten zu bauen (und zum Beispiel unnötige Parameter an die URL hängt). In beiden Fällen sollte es eine einzige “richtige” und eine oder mehrere “falsche” Seiten geben. Für den korrekten Einsatz des canonical-Tags in diesen Fällen sollte man dann auf den “falschen” Seiten in den Header folgende Zeile (angepasst) schreiben:

<link rel=”canonical” href=”http://www.domain.de/richtige-URL” />

Es ist übrigens kein Problem, wenn diese Zeile auch in der “richtigen” Seite steht, diese also auf sich selber referenziert. Das macht es vor allem bei Content Management Systemen einfacher – denn da wird die gewünschte URL einfach in jede Seite eingetragen und die “blöden” Fehler-URLs enthalten in jedem Fall den richtigen Canonical Tag.

Vorsicht: Wir haben auch schon gesehen, dass ein Techniker einfach immer die angezeigte URL in das Canonical schreibt. Das macht natürlich keinen Sinn – es muss immer die URL sein, die man CMS-seitig möchte.

Ach ja, das wirklich Gute an diesem Canonical Tag ist, dass die Links, die etwa auf eine “falsche” Seite zeigen, durch dieses Tag auf die “richtige” umgelenkt werden. Das macht die Sache schon fast so gut, wie es wäre, wenn es die doppelten Seiten gar nicht gäbe. Und SEOs, die möglicherweise Links verstecken möchten, können damit sogar noch viel mehr anfangen… ;-)

Wichtig ist übrigens, dass es die Seite, auf die das Canonical Tag zeigt, auch wirklich gibt und dass sie auch z.B. über die Navigation verlinkt wird. Ist das nicht der Fall, rammt man damit jegliche Sichtbarkeit ins Nirvana.

Externe Verwendung des canonical-Tag

Jünger als die interne Verwendung ist die domainübergreifende Verwendung des Canonical Tag. Also von Webseite 1 zu Webseite 2. Dieses Canonical Tag ist der feuchte Traum eines jeden Content-Syndizierers: Denn wenn die Kunden, die etwa die Inhalte von Magazin xy übernehmen, auf dessen Seite ein Canonical Tag setzen, gewinnt beim Wettrennen um die ersten Plätze immer der Urheber. Das Problem: Die Kunden werden genau DAS nicht wollen….

Doch zur Verwendung des Tags: Diese ist genauso wie intern. Auf die “kopierten” Seiten geht im Header ein Link zum Ursprungscontent (und zwar auf die Unterseite und NICHT auf die Homepage):

<link rel=”canonical” href=”http://www.domain.de/richtige-URL” />

Da dies durchaus auch über Urheberrechte informiert und bei einem flächendeckenden Einsatz des domainübergreifenden Canonical Tag zu einer sehr interessanten Möglichkeit für Google führen würde, Scraper (also Contentklauer) zu identifizieren, könnte es ein, dass der Einsatz dieses Tags bei Duplicate Content irgendwann günstig für beide Seiten wird. Allerdings ist davon noch nichts zu erkennen.

In jedem Fall ist der Einsatz des Tags schon jetzt sehr günstig für die inhaltsgebende Seite. Denn ist auf der inhaltnehmenden Seite der Tag eingebaut, wird Google sofort erkennen, woher der Inhalt stammt und diese Seite besser stellen. Ob die Links, die auf die inhaltsnehmende Seite zeigen, auch umgebogen werden oder doch für diese rechnen, ist noch nicht erkennbar. Beides ist denkbar. Unwahrscheinlich (und bisher auch nicht zu beobachten) ist, dass die inhaltnehmende Seite aus dem Index komplett verschwindet – das wäre eine Bestrafung für den fairen Einsatz des Tags. Und so handelt Google eigentlich nicht.

Interessant und durchaus diskussionswürdig ist, dass das Canonical Tag – wenn es domainübergreifend eingesetzt wird – auch ein klares Signal setzt, dass auch die Bewertung dritter Seiten beeinflusst. Denn wenn die Seiten B, C und D Inhalte von der Seite A haben und mit dem Canonical Tag auf A zeigen, wird sich die Seite E sehr schwer tun, mit dem möglicherweise gescrapten Content vernünftig zu ranken und auch ohne ihr Zutun wird A als Urheber der Seite “erkannt”. So weit die “weiße” Seite der Medaille. Auf der schwarzen Seite könnten natürlich die Seiten A, B, C und D die “bösen” sein und der Inhalt von E stammen. Was meint ihr, wer würde dann damit ranken? Die Antwort auf diese Frage ist nicht sehr erfreulich…

Tricks mit dem Canonical Tag

…werden wir natürlich nicht ausführlich beschreiben. Denn diese sollte man nur einsetzen, wenn man seine Technik wirklich sehr gut im Griff hat. Sollte irgendwann Google das Canonical Tag korrekter einsetzen als bisher, könnte man mit solchen Tricks auf die SEO-Nase fallen.

Aber für kreative Geister hier der Hintergrund: Das Canonical Tag lässt eine Seite für den User zwar existieren, überträgt aber deren “Linkjuice” auf eine andere. Man könnte also auf die Idee kommen, eine stark verlinkte Seiten (die einem aus SEO-Sicht nicht wichtig ist) mit einem Canonical Tag auf eine schwächer verlinkte Seite (die einem aus SEO-Sicht sehr wichtig ist) zu verlinken. Egal, ob darauf nun der gleiche Inhalt ist oder nicht.

Zugegeben: Das funktioniert derzeit wirklich gut. Aber, wie gesagt, man optimiert damit auf einen Bug bei Google und wenn der gefixt ist…

Was man nicht machen sollte

Folgende Canonical Tag Fehler sind passiert, man sollte sie unbedingt vermeiden:

  • Bei der Erstellung eines neuen Bereichs wurde das Canonical Tag auf die URL jeweils ohne “www” gestellt. Diese gab es aber nicht, sie wurde sauber per 301 Redirect auf die Seite mit “www” umgeleitet. Diese aber canonicalte ja auf die ohne “www”. Ergebnis: Nach wenigen Stunden war die Sichtbarkeit des gesamten Bereiches futsch. Es hat Monate gebraucht, um sie wieder her zu stellen.
  • Ein kleiner Programmierfehler hat das neue Canonical Tag auf den Beiträgen einer großen Seite auf die Homepage zeigen lassen. Nach nur einem Tag gab es nur noch die Homepage im Index. Auch diese Wiederherstellung hat mehrere Wochen gedauert.
  • Der Entwickler hat die Anweisung “die Seiten sollen mit dem Canonical Tag immer auf sich selbst zeigen” übererfüllt und hat auch Variationen der Seite (z.B. mit ID) auf sich selber zeigen lassen. Das hat eigentlich gar nichts geändert, schon gar nichts zum Guten.
  • Die Idee war, die Folgeseiten einer Channelliste (also paginierte Seite) auf die erste Seite “umzuleiten”. Deshalb wurden Seite 2 bis unendlich auf die erste Seite “canonicalt.” Ergebnis: Die von Seite 2 bis unendlich verlinkten Artikel wurden nicht mehr sauber mit Linkjuice versorgt und verkümmerten langsam. Auch diese Reparatur dauerte sehr lange.

Fazit: man sollte wissen, was man tut

Also: Bei jedem absichtlichen und unabsichtlichen Auftreten von Duplicate Content ist das das Canonical Tag ist logisch, hilfreich und sinnvoll. Allerdings wirkt es sehr kompromisslos. Deshalb sollte man wirklich genau wissen, was man da tut und das Ergebnis auf der Webseite im Livebetrieb unbedingt ausführlich testen.

GD Star Rating
loading...
Aktuelle Übersicht: das Canonical Tag von Google, 3.7 out of 5 based on 7 ratings

Eric Kubitz

Eric Kubitz ist einer der Chefs der CONTENTmanufaktur GmbH . Außerdem ist er Redner auf Konferenzen, Dozent bei Hochschulen, schreibt über SEO (und über andere Dinge) und ist der Chefredakteur des SEO-Book.

More Posts - Website - Twitter - Facebook - LinkedIn - Google Plus

Bookmark and Share
8 comments
stefan k
stefan k

Hallo Herr Kubiz,

das ist ein seh rgelungener Artikel, der viele Fragen klärt.

Dennoch bleibt bei mir ein Punkt offen. Sie schreiben das immer mit www. das Canonical-Tag gesetzt werden soll. Momentan ist das auf unserer Webseite leider nicht der Fall. Gibt es Möglichkeit, (ein Tool) womit die techn Tauglichkeit überprüft wird? Momentan bin ich mir ein wenig unsicher, und hätte gerne ein kurzes Feedback, bevor ich an die Agentur trete und denen sage, dass die das ändern sollen

eric108
eric108

Hallo Frau Dark! Da steckt der Teufel im Detail: Die Links werden ordentlich "umgebogen". Aber das führt auch dazu, dass die von der Seite mit dem Canonical-Tag nichts mehr weiter zu geben hat. Deshalb verkümmert nicht diese Seite, sondern die Beitrags- bzw. Produkt-Seiten, die "dran hängen". Wenn du also auf der ersten Seite 20 Produkte zeigst und auf der zweiten noch mal 20, werden die zweiten zwanzig "verkümmern, weil sie über die paginierte Seite keinen Linkjuice mehr bekommen. Deshalb würde ich das auf keinen Fall machen sondern auf die Seiten 2 bis unendlich (auch in einem Shop) immer "noindex,follow" schreiben. Ein Zusatztipp (für die Hilfe vorhin): Du kannst auch die erste Seite auf, sagen wir mal "Handys" optimieren (index,follow) und die zweite Seite (wenn du dort etwas Text unterbringen kannst) auf "Handy" (index,follow und kein Canonical). Dann ab Seite 3 halt "noindex,follow". Damit erhöhst du die Zahl der optimierbaren Seiten ;-) Ist aber technisch nicht ganz trivial. fröhliche grüße eric

Dina Lewicki
Dina Lewicki

Hi, wirklich super Artikel. Ich habe nur ein Verständnisproblem (wahrscheinlich). Du schreibst oben, dass Linkjuice und power von canonicalten URLs/Seiten auf die Zielseiten weitergegeben wird. Im letzten Punkt unter "Was man nicht machen sollte" sagst Du, dass alle Seiten ab Seite 2 nicht mehr sauber mit Linkjuice versorgt wurden und diese 'verkümmerten'. Das ist mir nicht ganz schlüssig. Wie würdest Du es denn bei Paginierungen empfehlen, z.B. in einem Shop (1-n Produktseiten zu einer Kategorie)? Danke und viele Grüße Frau Dark :)

claude
claude

Schon klar, aber eigentlich möchte ich das gar nicht 'zeigen'. A, B und C sollen nur den Content liefern, deren Ranking ist sekundär. Wichtig ist mir nur, dass ich mir das 'hohe' Ranking von Z nicht versehentlich zerschiesse... ;-)

Eric Kubitz
Eric Kubitz

Doch, canonical braucht keinen Link. Wenn du mit Seite Z zeigen möchtest, das Blog A der Publisher ist - dann ist das Tag dafür perfekt.

claude
claude

Interessant, aber.. Was im folgenden Fall: Wir scrapen unseren eigenen Content von 3 Wordpress-Blogs (A,B,C) in eine Seite Z hinein, und zwar OHNE Backlink zur Quelle. Copyrights sind also irrelevant. Diese Artikel erscheinen also 2x im Suchindex, einmal auf der Quelle, einmal im Ziel. Da es [derzeit] keinen Link-Verweis zurück gibt, macht das canonical auch keinen Sinn... oder? :-)

shan_dark
shan_dark

Danke für den Artikel - ist gut praktisch und verständlich.

eric108
eric108 moderator

@stefan k   Verstehe ich Sie richtig, dass Ihre Seite ohne www publiziert wird? Na dann sollte das www natürlich nicht mit drin sein. Es geht ja um die URL, wie sie der User sieht. Da kann ich Ihnen kein Tool empfehlen...

Trackbacks

  1. […] möglichst einheitlich zu gestalten.Mehr zum Thema Canonical-Tag direkt bei Google und von uns.VN:F [1.9.20_1166]please wait…Rating: 0.0/5 (0 votes cast)Christoph BaurIch bin SEO Consultant […]

  2. […] übersichtliche Darstellung der möglichen Verwendungsformen gibt Eric Kubitz auf SEO Book. Zur Einführung des Canonical-Tag erklärte auch Matt Cuts, Kopf des […]