PDF-Dokumente, Word-Vorlage oder PPT-Präsentationen sind eine gute Möglichkeit, gute Inhalte zu verbreiten – und damit Links einzusammeln. Das funktioniert auch prima – denn viele Webmaster verlinken solche Dokumente sehr gerne. Das Problem dabei ist, dass man damit Links auf diese Dokumte sammelt – und nicht auf die Webseiten, mit denen man eigentlich bei Google eine gute Position haben möchte.
Jetzt hat uns Google mit der Unterstützung des Canonical-Tags per HTTP-Header eine gute Lösung dieses Problems geschenkt:

Die Idee dahinter: Da ein PDF keine “Meta-Tags” hat, in die man einen Canonical-Link einbauen kann, lässt sich Google diesen Verweis auch im HTTP-Header zeigen – also sozusagen im Verbindungsaufbau.
Wie’s funktioniert, schreibt Google im eigenen Blog:
Angenommen, man hat ein white-paper.pdf als alternative Version einer white-paper.html-Seite, auf der dieses angekündigt oder – besser – zusammen gefasst wird:
- http://www.example.com/white-paper.html
- http://www.example.com/white-paper.pdf
Dann hört Google auf den rel=”canonical” – wenn er im HTTP Header angefodert wird:
Host: www.example.com
Content-Type: application/pdf
Content-Length: 785710 (... rest of HTTP response headers...)
Was beim Einsatz des HTTP-Canonicals wichtig ist
Voraussetzung für den Einsatz eines Canonical-Tags ist ja immer, dass die beiden Dokumente (also die HTML-Seite und die PDF-Seite z.B.) die gleichen Informationen enthalten.Theoretisch jedenfalls: Denn derzeit prüft Google die Ähnlichkeit von “kanonisierten” Dokumenten nur recht schlampig. Das würde bedeuten, dass man z.B. auch die Langversion eines Artikels, ein per HTML-Seite angekündigtes Whitepaper oder sogar die Großversion eines echt großen Bildes zum Linkaufbau besser nutzen kann. Das gibt viele spannende Möglichkeiten.
Allerdings ist der Eingriff in den HTTP-Header nicht so einfach, wie mal eben eine neue Zeile in das HTML-Dokument zu schreiben. Ich betone das, weil sich das Canonical-Tag als sehr mächtig heraus gestellt hat. Seiten mit Canonical-Tag-Fehlern sind schon ganz aus dem Google-Index verschwunden. Deshalb sollten eben solche technischen Einsätze, bei denen viele Änderungen z.B. in die .htaccess eingetragen werden, sehr sorgfältig geplant und gebaut werden.
Wie man das am besten macht, schreibt Internet-Kapitän Markus auf
Canonical-Tags für PDF- und andere Nicht-HTML-Dateien. (Ach, wäre es nur immer so, dass man am Ende eines solchen Artikels gleich einen Link zu einer so kompetenten Praxis-Hilfe hätte….)
loading...
Ähnliche Beiträge:


