Links auf PDF-, PPT-, Word- und andere Dokumente per Canonical "verwalten"

PDF-Dokumente, Word-Vorlage oder PPT-Präsentationen sind eine gute Möglichkeit, gute Inhalte zu verbreiten – und damit Links einzusammeln. Das funktioniert auch prima – denn viele Webmaster verlinken solche Dokumente sehr gerne. Das Problem dabei ist, dass man damit Links auf diese Dokumte sammelt – und nicht auf die Webseiten, mit denen man eigentlich bei Google eine gute Position haben möchte.

Jetzt hat uns Google mit der Unterstützung des Canonical-Tags per HTTP-Header eine gute Lösung dieses Problems geschenkt:

Die Idee dahinter: Da ein PDF keine „Meta-Tags“ hat, in die man einen Canonical-Link einbauen kann, lässt sich Google diesen Verweis auch im HTTP-Header zeigen – also sozusagen im Verbindungsaufbau.

Wie’s funktioniert, schreibt Google im eigenen Blog:

Angenommen, man hat ein white-paper.pdf als alternative Version einer white-paper.html-Seite, auf der dieses angekündigt oder – besser – zusammen gefasst wird:

  • http://www.example.com/white-paper.html
  • http://www.example.com/white-paper.pdf

Dann  hört Google auf den rel=“canonical“ – wenn er im HTTP Header angefodert wird:

GET /white-paper.pdf HTTP/1.1
Host: www.example.com
(…rest of HTTP request headers…)
HTTP/1.1 200 OK
Content-Type: application/pdf
Link: <http://www.example.com/white-paper.html>; rel=“canonical“
Content-Length: 785710
(... rest of HTTP response headers...)

Was beim Einsatz des HTTP-Canonicals wichtig ist

Voraussetzung für den Einsatz eines Canonical-Tags ist ja immer, dass die beiden Dokumente (also die HTML-Seite und die PDF-Seite z.B.) die gleichen Informationen enthalten.Theoretisch jedenfalls: Denn derzeit prüft Google die Ähnlichkeit von „kanonisierten“ Dokumenten nur recht schlampig. Das würde bedeuten, dass man z.B. auch die Langversion eines Artikels, ein per HTML-Seite angekündigtes Whitepaper oder sogar die Großversion eines echt großen Bildes zum Linkaufbau besser nutzen kann. Das gibt viele spannende Möglichkeiten.

Allerdings ist der Eingriff in den HTTP-Header nicht so einfach, wie mal eben eine neue Zeile in das HTML-Dokument zu schreiben. Ich betone das, weil sich das Canonical-Tag als sehr mächtig heraus gestellt hat. Seiten mit Canonical-Tag-Fehlern sind schon ganz aus dem Google-Index verschwunden. Deshalb sollten eben solche technischen Einsätze, bei denen viele Änderungen z.B. in die .htaccess eingetragen werden, sehr sorgfältig geplant und gebaut werden.

Wie man das am besten macht, schreibt Internet-Kapitän Markus auf
Canonical-Tags für PDF- und andere Nicht-HTML-Dateien. (Ach, wäre es nur immer so, dass man am Ende eines solchen Artikels gleich einen Link zu einer so kompetenten Praxis-Hilfe hätte….)

GD Star Rating
a WordPress rating system
Links auf PDF-, PPT-, Word- und andere Dokumente per Canonical "verwalten", 3.0 out of 5 based on 2 ratings

Eric Kubitz

Eric Kubitz ist einer der Chefs der CONTENTmanufaktur GmbH . Außerdem ist er Redner auf Konferenzen, Dozent bei Hochschulen, schreibt über SEO (und über andere Dinge) und ist der Chefredakteur des SEO-Book.

More Posts - Website - Twitter - Facebook - LinkedIn - Google Plus

Kommentare (2)

  1. Markus

    …und wie man den Canonical beim Apache einbaut, habe ich hier beschrieben: http://www.internetkapitaene.de/2011/06/27/canonical-tags-fur-pdf-und-andere-nicht-html-dateien/

    … und natürlich Deinen Beitrag verlinkt.

    Grüße,

    Markus

  2. Eric Kubitz (Beitrag Autor)

    So, hab den Link auch gleich oben reingebaut. Super, vielen Dank!

Schreiben Sie einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *