Feb
15
Übersicht: das Canonical-Tag von Google
Filed Under HTML
Es gibt eine Reihe von Gründen, warum ein Inhalt mehrfach auf der eigenen Seite oder auch auf anderen Domains zu finden ist. Das führt zu Duplicate Content – und damit zu einem Problem mit Google. Abhilfe schafft hierbei das relativ neue “canonical-Tag” mit dem intern und extern auf den eigentlichen Urheber eines Inhalts hingewiesen werden kann. Hier eine kleine Zusammenfassung, wie man damit umgeht:
Interne Verwendung des canonical-Tag
Sei es, das man den gleichen Inhalt einer Unterseite mehrfach anzeigen möchte, oder sei es, dass das Content Management System zu blöd ist, einzigartige Seiten zu bauen (und zum Beispiel unnötige Parameter an die URL hängt). In beiden Fällen sollte es eine einzige “richtige” und eine oder mehrere “falsche” Seiten geben. Für den korrekten Einsatz des canonical-Tags in diesen Fällen sollte man dann auf den “falschen” Seiten in den Header folgende Zeile (angepasst) schreiben:
<link rel=”canonical” href=”http://www.domain.de/richtige-URL” />
Es ist übrigens kein Problem, wenn diese Zeile auch in der “richtigen” Seite steht, diese also auf sich selber referenziert. Das macht es vor allem bei Content Management Systemen einfacher – denn da wird die gewünschte URL einfach in jede Seite eingetragen und die “blöden” Fehler-URLs enthalten in jedem Fall den richtigen canonical-Tag.
Ach ja, das wirklich Gute an diesem canonical-Tag ist, dass die Links, die etwa auf eine “falsche” Seite zeigen, durch dieses Tag auf die “richtige” umgelenkt werden. Das macht die Sache schon fast so gut, wie es wäre, wenn es die doppelten Seiten gar nicht gäbe. Und SEOs, die möglicherweise Links verstecken möchten, können damit sogar noch viel mehr anfangen…
Noch ganz kurz: Was wird passieren, wenn wir alle falschen Unterseiten per “canonical” auf die richtigen Seiten referenziert haben? Wenn alles gut geht, verschwinden die Falschen aus dem Index und die Richtigen steigen auf.
Externe Verwendung des canonical-Tag
Noch deutlich jünger als die interne Verwendung ist die domainübergreifende Verwendung des canonical-Tag. Deshalb kann man hier auch (noch) nicht genau sagen, wie Google tatsächlich mit ihm umgeht. Da er zwischen zwei unterschiedlichen Domains funktioniert, sind einige der oben genannten Punkte eigentlich nicht im Sinne von Google. Aber dazu gleich…
Zunächst zur Verwendung des Tags: Diese ist genauso wie intern. Auf die “kopierten” Seiten geht im Header ein Link zum Ursprungscontent (und zwar auf die Unterseite und NICHT auf die Homepage):
<link rel=”canonical” href=”http://www.domain.de/richtige-URL” />
Da dies durchaus auch über Urheberrechte informiert und bei einem flächendeckenden Einsatz des domainübergreifenden canonical-Tag zu einer sehr interessanten Möglichkeit für Google führen würde, Scraper (also Contentklauer) zu identifizieren, könnte es ein, dass der Einsatz dieses Tags bei Duplicate Content sogar günstig für beide Seiten wird.
In jedem Fall ist der Einsatz des Tags schon jetzt sehr günstig für die inhaltsgebende Seite. Denn ist auf der inhaltnehmenden Seite der Tag eingebaut, wird Google sofort erkennen, woher der Inhalt stammt und diese Seite vermutlich besser stellen. Ob die Links, die auf die inhaltsnehmende Seite zeigen, auch umgebogen werden oder doch für diese rechnen, ist noch nicht erkennbar. Beides ist denkbar. Unwahrscheinlich (und bisher auch nicht zu beobachten) ist, dass die inhaltnehmende Seite aus dem Index komplett verschwindet – das wäre eine Bestrafung für den fairen Einsatz des Tags. Und so handelt Google eigentlich nicht.
Interessant und durchaus schwierig ist aber, dass der canonical-Tag, wenn er domainübergreifend eingesetzt wird, auch ein klares Signal setzt, dass auch die Bewertung dritter Seiten beeinflusst. Denn wenn die Seiten B, C und D Inhalte von der Seite A haben und mit dem canonical-Tag auf A zeigen, wird sich die Seite E sehr schwer tun, mit dem möglicherweise gescrapten Content vernünftig zu ranken und auch ohne ihr Zutun wird A als Urheber der Seite “erkannt”. So weit die “weiße” Seite der Medaille. Auf der schwarzen Seite könnten natürlich die Seiten A, B, C und D die “bösen” sein und der Inhalt von E stammen. Was meint ihr, wer würde dann damit ranken? Die Antwort auf diese Frage ist nicht sehr erfreulich…
Wie gesagt: Der domainübergreifende canonical-Tag ist noch ziemlich jung und wir müssen noch lernen, wie er wirklich funktioniert und woran Google erkennt, ob er korrekt eingesetzt wurde. Und bis es so weit ist, empfehlen wir unbedingt (!) etwa bei der Syndication von Inhalten immer auch einen normalen Backlink auf den ursprünglichen Beitrag einzufordern!
Ähnliche Beiträge:
- YEPP! Google führt canonical-Tag “cross-domain” ein
- Gefahrlos Inhalte syndizieren: Test zu “canonical”-Tag extern
- SEO am Morgen: “Canonical-Tag domainübergreifend” oder “Die Rettung der Syndication?”
Comments
4 Responses to “Übersicht: das Canonical-Tag von Google”
Leave a Reply

Danke für den Artikel – ist gut praktisch und verständlich.
Interessant, aber..
Was im folgenden Fall:
Wir scrapen unseren eigenen Content von 3 WordPress-Blogs (A,B,C) in eine Seite Z hinein, und zwar OHNE Backlink zur Quelle.
Copyrights sind also irrelevant.
Diese Artikel erscheinen also 2x im Suchindex, einmal auf der Quelle, einmal im Ziel. Da es [derzeit] keinen Link-Verweis zurück gibt, macht das canonical auch keinen Sinn… oder?
Doch, canonical braucht keinen Link. Wenn du mit Seite Z zeigen möchtest, das Blog A der Publisher ist – dann ist das Tag dafür perfekt.
Schon klar, aber eigentlich möchte ich das gar nicht ‘zeigen’.
A, B und C sollen nur den Content liefern, deren Ranking ist sekundär.
Wichtig ist mir nur, dass ich mir das ‘hohe’ Ranking von Z nicht versehentlich zerschiesse…