skip to content

Archiv

WB & Duplicate Content

Websitebaker und das Schreckgespenst der SEOs

"Doppelter Inhalt" ist das Schreckgespenst in den Suchmaschinen-Optimierer Foren und sowieso die erste Namensnennung, wenn "irgendwas" mit Google nicht gut läuft.
Was dran ist – und wie weit WebsiteBaker betroffen ist.

Mit Duplicate Content (DC) ist gemeint, dass (nahezu) gleicher Inhalt auf verschiedenen Seiten vorkommt. Genauer: Unter verschiedenen URLs erreichbar ist. Natürlich kann "böser Seitenklau" eine Ursache sein, oft ist es aber nur Nachlässigkeit des Webmasters, und noch häufiger: ein kleines technisch-logisches Problem des verwendeten CMS.
Davon können einzelne Seiten oder auch gleich ganze Websites (Domains) betroffen sein.

Ein einfaches – und häufiges Beispiel: Jemand baut seine Website bei einem FreeHoster wie bPlaced auf, und wenn sie fertig ist, nimmt er sich eine eigene Domain, kopiert die Site von da nach dort – und vergisst die "alte" Version, lässt die ganzen Seiten einfach als Quasi-Backup oder Spielwiese liegen.
Google findet aber beide: die bei bPlaced UND die neue, die praktisch identisch sind.

Google bläht seinen Index nicht unnötig mit so was auf: Er listet nur EINE. Nur: Welche? Normalerweise die Ältere, also die, die der Spider als erste gefunden hat. Das wäre auch richtig so, wenn Google böse Absicht vermuten würde: Wo ein Text das erste mal auftaucht, wird auch der Urheber nicht weit sein, alles spätere KANN nur geklaut sein.

Etwas anders verhält sich die Sache, wenn die Seiten innerhalb der selben Domain sind: Google kann annehmen, dass nicht geklaut wurde, sondern dass ein "Fehler" vorliegt, deshalb wird diejenige Seite gelistet, die innerhalb der Struktur  "wichtiger" erscheint. Dafür ist der gute alte PageRank immer noch sehr dienlich.

Was ist gleich, was verschieden?

Keine falsche Hoffnung: Mit einer Änderung des Templates ist es nicht getan: Google weiß sehr wohl, was der eigentliche Inhalt und was nur "Rundherum" (Menü, Header usw) ist. Mit einem anderen Template ändert sich der Inhalt nicht. Der ändert sich nicht einmal dann, wenn man gerade mal ein paar Sätze umstellt.

Ich gehe davon aus, dass Google einen groben "Vor-Check" macht, und sich bei Gelegenheit genauer anschaut, wie ähnlich sich zwei Seiten sind. Einfachste Variante: Google nimmt einige  Sätze und nutzt sich selbst, um danach zu suchen. Ist eine andere Seite -  immer wieder -  in den Ergebnissen? Schnapp!

WebsiteBaker und Duplicate Content

Aufgrund seiner Struktur ist WebsiteBaker recht unverdächtig, DC zu erzeugen, weit besser als viele andere CMS. Es gibt gerade mal eine Stelle, an der DC auftreten kann:

Die erste Seite in der Seitenliste ist auch die Startseite – aber natürlich ist die auch eine "normale" Seite: zb domain.tld/ == domain..tld/pages/aktuell.php Normalereise ist das nicht schlimm, weil /pages/ aktuell.php zwar existiert, aber nirgends verlinkt ist.
Außer: Sie wird (un)absichtlich verlinkt. Das kann etwa über einen Menu-Link passieren, oder über einen WB-Link, der aus dem Inhalt heraus gesetzt wurde. Besonders dann, wenn aktuell.php erst nachträglich zur Startseite geworden ist. Und noch mehr, da ja die ursprüngliche Seite aktuell.php - auch ohne manuelle Verlinkung – als solche einmal im Menü stand und immer noch vorhanden ist.
Ähnliches gilt für einige Module, die einen Link aus sich selbst erzeugen; zb News, Topics (ältere Versionen), Bakery und andere. Sind solche Module auf der Startseite, kann es dazu kommen, dass auf der Startseite ein Link zu ihrem DC-Ebenbild steht.

Dennoch: Halb so schlimm. Wie schon oben gesagt: Domain-intern wird die als wichtiger angesehene Seite gerankt, die DC-Version davon wird schlichtweg ignoriert. Für ganz Vorsichtige empfiehlt sich eine Weiterleitung:

redirect 301 /pages/aktuell.php http://www.domain.tld/


DC über verschiedene Domains:

Das ist ein ganz anderes Kaliber: Auf Domain A sind größere Bereiche (nahezu) identisch mit Seiten auf Domain B. Je näher sich die 2 Domains stehen, umso schneller entdeckt Google das auch. "Näher" heißt: Es gibt Links zwischen beiden Domains, sie sind auf dem selben Server, haben den gleichen Inhaber. (Google findet Adressen im Impressum!)
Die Domain, auf der der Inhalt länger bekannt ist, ist unbetroffen, die zweite Domain wird insgesamt im Ranking gedämpft. Das sollte man nicht als "Strafe" bezeichnen – eine Strafe ist etwas, was zeitlich über die Tat hinausgeht. Google ist nicht sonderlich nachtragend. Sobald sich zb der Inhalt auf Domain A so stark ändert, dass keine Konflikte zwischen Domain A und Domain B auftreten, kann Domain B sehr schnell erstarken.

Ein Sonderfall - und gar nicht mal so selten – ist es, wenn jemand mehrere Domains anmeldet, und alle zeigen ohne korrekte Weiterleitung auf den gleichen Webspace. Das ist in etwa so sinnvoll, wie sich ins Knie UND in den Kopf zu schießen und sei deswegen hier nicht weiter betrachtet.

Domain-übergreifender DC  hat natürlich nicht direkt mit dem verwendeten CMS zu tun, hier steckt immer mehr oder weniger Absicht dahinter. Nicht einmal böse.
Ein Beispiel:

Der Kunde hat bereits eine ältere Domain und will für eine bestimmte Produktgruppe – zusätzlich - eine eigene Site aufbauen. Weil natürlich der Chef gerade keine Zeit hat, die ganzen Texte neu zu schreiben, soll ich einfach mal die Inhalte von der alten Domain und ein paar anderen Quellen kopieren und irgendwie in Form bringen.
Die Folge: der Anteil der Besucher, die über Google kommen liegt auf der neuen Site stabil unter 5%.
Bis zu einem bestimmten Tag:

Am Tag X gab es einen Relaunch der alten Site, wobei alle Inhalte überarbeitet und neu strukturiert wurden. Die Inhalte auf dem "Ableger" blieben hingegen unverändert.
Unmittelbar danach beginnen die Besucherzahlen auf dem Ableger zu steigen, der Anteil der Besucher, die über Google kommen, steigt innerhalb eines Monats auf 40%..

Back

Kommentare:

11.08.2014

Michi

Hi Chio,

schöner Artikel,
aber was ist mit den ganzen urls aus dem News Modul?
Bspl: Post1 hat
a: pages/posts/post1-22.php
und b: pages/post1-22.php?g=1
Laut Google-Abfrage sind diese "g=1"-Urls ebenso gelistet... mit gleichen Title ..

wer so ein Paar Kategorien anlegt kommt hier auf etliche unnötigen URLs.
Gibts hier einen Ansatz das zu lösen ?
Bspl. eine "Kategorienseite" zu erstellen..

vg aus regensburg
Michael

Kommentar

Name:

E-Mail (required, not public):

Webseite:

Kommentar :

Up
K