Panda 4.1: Sind Backlinks und andere Unterseiten Teil des Contents?

Panda 4.1Immer wenn ein Panda-Update kommt oder kam, steht der Content von Webseiten im Fokus. Und es gibt Vermutungen, welche Faktoren zu Berechnung des Rankings hinzu gekommen sind. Diesmal geht es vielleicht um Backlinks und andere Unterseiten. Und das klingt logisch.

Zugegeben, ich vereinfache hier wieder ein wenig. Aber das ist manchmal notwendig. Wer sich detailliert mit den Vermutungen auseinander setzen möchte, dem sei SEO by the SEO und SEO-United empfohlen. Interessant hier ist die vermutete Verbindung zwischen einem recht aktuellen Patent von Google und dem Panda 4.1. Hierbei werden nicht nur die Texte auf einer Seite in die Berechnung einbezogen – sondern auch die Backlinks, die auf diese URL zeigen und sogar alle anderen Unterseiten der Domain.

N-Grams und ihre Häufungen

Basis solcher Algorithmen sind so genannte N-Grams. Das sind Wortgruppen wie z.B. 5-Grams (jeweils 5 Wörter) oder 2-Grams (jeweils 2 Wörter) im die der Text aufgschlüsselt wird. Dieser Text einer URL wird also danach untersucht, ob in solchen Wortgruppen bestimmte Wortkombinationen häufiger auftreten. Google schraubt an diesem Konzept schon eine Weile herum, das zeigt auch der Ngram-Viewer. Mit diesem kann anaylsiert werden, wie häufig Wortkombinationen in N-Grams von Print-Titeln auftauchen.

n-gram viewer Google

Häufigkeit von Städtenamen in Google Books. Mmmmmh, wann war noch mal der Umzug der Bundesregierung von Bonn nach Berliin?

Diese Analyse macht Sinn, denn dann kann die Suchmaschine gleich mehrere Erkenntnisse daraus ziehen:

  1. Häufigeres Auftreten von Longtail-Suchtermen.
  2. Auftreten dieser N-Grams auf anderen Seiten, was ein Hinweis auf Duplicate Content sein könnte.
  3. Unnatürliches Auftreten dieser N-Grams, was ein Hinweis auf Spam sein könnte.

Wie auch immer: Dieses Patent legt nun nahe, dass diese N-Grams nicht nur im Text der jeweils zu analysierenden Seite gesucht werden, sondern auch in den Backlinks und auf anderen Unterseiten der betreffenden Domain. Warum macht das Sinn? Weil erstens, im Fall der Backlinks, schnell eine Unnatürlichkeit erkannt werden kann: Gibt es eine Häufung von Wortkombinationen im Text und in den Backlinks, dann könnte da Meister Spammer am Werke sein. Und zweitens, im Fall der anderen Unterseiten, kann einerseits erkannt werden, ob diese eine URL die stärkste URL auf der Domain zu dieser Wortkombination ist. Und andererseits, ob die Domain insgesamt eine Themenverwandtschaft belegen kann.

Ein Beispiel: Auf einer Segelseite werden ganz selbstverständlich auf relativ vielen Unterseiten häufiger Wortkombinationen mit „segeln“ oder „Yacht“ auftauchen. Auf einem üblichen Nachrichtenmagazin gibt es vielleicht sogar MEHR Seiten zu dem Thema – aber PROZENTUAL (also relativ) WENIGER. Do erkennt Google, ob es sich um eine Nischenseite zum Thema oder um ein allgemeines Portal handelt, das auch mal zum Thema Segeln schreibt. Und nun: Welchem Portal wird Google dann wohl mehr Kompetenz zum Thema zutrauen? Genau: dem Fachmagazin. Das könnte auch der Grund sein, warum Google angekündigt hat, dass mit diesem Algorithmus gerade kleinere Seiten ein bisschen Aufwind bekommen gegenüber den Generalisten.

Aber: Was ist daran neu?

Mir leuchtet das ein. Was mich allerdings verblüfft: Ich bin davon ausgegangen, dass genau diese beiden Bewertungen von Google schon seit längerem durchgeführt werden.

Backlinks: Der Penguin ist doch ganz offensichtlich ein Algorithmus, der nach unnatürlichen Keyword-Links sucht. Und das soll bisher ohne das bei Suchmaschinen übliche Konstukt der N-Grams erfolgt sein? Ich kann mir das fast nicht vorstellen.

Andere Unterseiten: Wer sich schon einmal mit Google News beschäftig hat, wird gemerkt haben, dass man mit einem Fachmagazin in seinem eigenen Thema viel besser ranken kann also die Generalisten von SZ und Focus.

Ich gehe sogar davon aus, dass die Bewertung des Contents noch weitergehender erfolgt:

  • Was steht in den den semantischen Text-Strukturierungen (H1, H2 u.s.w.)? Tauchen hier die Wortkombinationen in N-Grams auf? Wenn „ja“, dann wird das hier vermutlich höher bewertet als im normalen Text. Ist es zu häufig – ein Signal für Spam.
  • An anderen Text-Plätzen wie im ALT-Tag des Bildes, der Bild-Unterschrift, in Listen u.s.w.. Auch diese Orte könnten hinsichtlich der Bewertung fein justiert werden.
  • Außerdem macht es sicherlich einen Unterschied, ob die auf eine URL zeigenden Links mit den N-Grams intern oder extern sind.

Was wirklich im Algorithmus los ist, wissen wir nicht. Wenn Google diese beiden Bewertungen nun mit aufgenommen ist, habe ich Google bisher einfach zu viel zugetraut. Aber ich würde sagen, aus Sicht einer Suchmaschine macht das alles eine Menge Sinn. Und ich freue micht, dass die Kollegen bei Tante G jetzt vermutlich spätestens jetzt so weit sind. 😉

Foto: Fotolia © Brooklin

GD Star Rating
loading...
Panda 4.1: Sind Backlinks und andere Unterseiten Teil des Contents?, 2.4 out of 5 based on 11 ratings

Eric Kubitz

Eric Kubitz ist einer der Chefs der CONTENTmanufaktur GmbH . Außerdem ist er Redner auf Konferenzen, Dozent bei Hochschulen, schreibt über SEO (und über andere Dinge) und ist der Chefredakteur des SEO-Book.

More Posts - Website - Twitter - Facebook - LinkedIn - Google Plus

Kommentar (1)

  1. Pingback: likri.com

Kommentare sind geschlossen.