10. Mai 2011

OnPage Duplicate Content wirksam bekämpfen

Filed under: Suchmaschinenoptimierung — ariovist @ 14:13

Einer der wichtigsten Faktoren in der Suchmaschinenoptimierung ist guter, relevanter und vorallem einzigartiger Content. D.h. zum einen sollte es euren Text nicht noch einmal auf einer anderen Website geben und zum anderen sollte er auch auf eurer Website nicht mehrmals vorkommen. Jetzt werden sicher viele denken, das sie da kein Problem haben, denn eure Texte findet man nicht auf mehreren Seite eurer Website, aber seid ihr euch da ganz sicher?

Folgendes Beispiel:

Ihr habt eine Seite themax.htm auf die Ihr an verschieden Stellen auf eurer und durchaus auch auf anderen Webseiten mit bestimmten Parameter verlinkt (z.B externe Affiliate-Links). Dies führt dazu, das diese Seite z.B. unter themax.htm?campaign=blub1 oder auch themax.htm?campaign=blob3 aufgerufen werden kann. In euren Augen ist das sicherlich in allen Varianten die gleiche Seite, aber nicht für die Suchmaschine! Für die Suchmaschine sind das 3 verschiedene Seiten die alle HTTP-Status-Code 200 zurückgeben und den gleichen Inhalt besitzen. Dies ist auch der Fall, wenn auf diese Seite statt mit der klein geschriebenen Variante themax.htm, mit Großschreibung verlinkt wird, also auf Themax.htm. Auch in diesem Fall, sind dies in den Augen der Suchmaschine 2 verschiedene Seite mit jeweils dem gleichen Inhalt.

Ob Ihr von diesem Problem betroffen seid könnt Ihr feststellen indem ihr einen Blick in die Google Webmaster-Tools werft. Unter “Diagnose” findet man dort den Punkt “HTML-Vorschläge”, hier findet Ihre alle Seiten bei denen die Meta-Beschreibung und der Title-Tag fehlt, nicht optimal ist oder auch mehrfach vorkommt. Sollte es hier Seiten geben mit mehrfach vergebenem Titel bzw. vergebener Meta-Beschreibung, so wird das entweder daran liegen das Ihr einfach nicht jeder Seite diese Informationen individuell vergeben habt oder eben es wurde eine Seite in mehreren Versionen eingelesen.

Um solche Fälle zu vermeiden bzw. zu beheben gibt es folgende Möglichkeiten.
Eine Möglichkeit ist es mit dem HTTP-Status-Code 301 immer auf die richtige Variante weiterzuleiten, also in diesem Fall immer auf themax.htm. Der Nachteil bei dieser Variante ist das die Parameter über Analyse-Werkzeuge wie Google-Analytics nicht mehr ausgewertet werden können, daher empfehle ich mit dem 301er nur von der großgeschrieben Variante auf die klein geschriebene, mit samt den Parametern weiterzuleiten, um zumindest das Problem der verschiedenen Schreibweisen so zu erschlagen.
Eine andere Möglichkeit ist es immer, wenn der Seite Parameter über die URL mit übergeben werden, über den <link>-Tag mit dem Attribut rel=”canonical” im Kopf der Seite auf die ursprüngliche Seite zu verweisen. Also für unsere Seite /themax.htm?campaign=blub würde dieser Tag folgendermaßen aussehen: <link rel=”cononical” href=”themax.htm” />
Dabei kann man sowohl auf den relativen als auch auf den absoluten Pfad verwiesen werden. Solltet Ihr einen <base>-Link eurer Seite hinzugefügt haben, werden die relativen Pfad-Angaben anhand dieser Information aufgelöst.

Solltet Ihr also Probleme mit Duplicate Content auf eurer Website haben sind das effektive Maßnahmen um die Einzigartigkeit eures Inhalts OnPage zu gewährleisten und wesentlich einfacher zu lösen als wenn eine andere Website Inhlat von eurer Seite gestohlen hat. Hierfür lohnt sich ein Blick auf folgende Webseite um festzustellen ob Ihr geguttenbergt wurdet ;-)
http://www.copyscape.com/

1 Kommentar »

  1. Das sind wertvolle Tipps für Maßnahmen, die man selber beeinflussen kann, denn gerade nach dem neuesten Panda Update sollte Ducplicate Content vermieden werden, da es sich erheblich auf die Suchmaschinenoptimierung auswirkt. Dabei spielt es keine Rolle, ob es sich um Artikelinformationen, Blogbeiträge, SEO-Texte, oder Pressemitteilungen handelt. Webmaster sind gut beraten, duplicate content zu vermeiden und die Einzigartigkeit ihrer Webseite durch unique content zu betonen. Einerseits um sich abzugrenzen (http://de.wikipedia.org/wiki/Unique_Content) und andererseits gleichzeitig bei den Suchergebnissen ganz vorne zu stehen.

    Die Kontrolle mit http://www.copyscape.com macht Sinn, allerdings sollte regelmäßig unique content ergänzt werden (http://www.content.de/lexicon/Unique-Content-19.html), zumal damit gleichzeitig die Kontrolle auf duplicate content erfolgt und somit urheberrechtliche Konsequenzen ausgeschlossen werden.

    Kommentar by priocont — 26. August 2011 @ 15:05

RSS Feed für Kommentare zu diesem Artikel. TrackBack URI

Hinterlasse einen Kommentar