Viele Blogger und manche Webmaster, die mit WordPress arbeiten, machen sich Sorgen, dass sie wegen „duplicate content“ (kopierter also verdoppelter Inhalt) durch Suchmaschinen wie Google durch Entfernen aus dem Index oder durch ein schlechtes Ranking abgestraft werden.
Die Sorge kommt wohl daher, dass WordPress die Artikel oder Post (also den content) in sehr vielfältiger Weise abrufbar macht: als Blog, als Feed, über die Kategorien, über die Monate, über die Tags, über die Autoren: der gleiche Artikel erscheint also in immer wider anderer Zusammenstellung, das muss dann wohl „duplicate content“ sein.
Doch was definiert Google genau als „duplicate content“?
Hierzu kann man im offiziellen Google Blog Webmaster-Zentrale (Eigenbeschreibung: Offizielle Informationen zum Crawling und zur Indexierung von Webseiten in den Google-Index) einen interessanten Beitrag von Adam Lasnik vom 14. März 2007 nachlesen. (Adam ist Search Evangelist, also Prediger des Suchens.)
Kürzungen wie üblich mit[…] Hervorhebungen von mir – Zitatanfang
Was ist Duplicate Content?
Als Duplicate Content werden üblicherweise Contentbereiche bezeichnet, die anderem Content – domainintern oder domainübergreifend – entweder genau gleichen oder diesem deutlich ähnlich sind. […]
(z. B.) Foren, die sowohl reguläre als auch für Handys optimierte Seiten generieren, Artikel in Onlineshops, die unter mehreren URLs gelistet (und – schlimmer noch – verlinkt) werden, usw. […]
Während des Crawlens und bei der Ausgabe von Suchergebnissen achten wir sehr darauf, Seiten mit verschiedener Information zu indexieren und anzuzeigen. Wenn es z. B. auf eurer Website sowohl eine reguläre Version als auch eine Druckansicht für Artikel gibt, von denen keine durch robots.txt oder mittels eines noindex-Metatags blockiert wird, dann suchen wir uns aus, welche Version wir listen. […]
Zitatende
Aus diesen Zitaten wird deutlich, dass für Google Duplicate Content nur für Webseiten (also Content der unter einer URL liegt) genau dann vorliegen kann, wenn dieser identisch oder sehr ähnlich ist. Was dabei identisch ist, ist klar: der Quelltext, also der HTML-Code der bei WordPress von PHP-Skripten erzeugt wird, muss identisch sein. Identische Webseiten entstehen aber bei WordPress nicht. Ähnlich müsste wohl heißen, dass der erzeugte Quelltext sehr ähnlich ist, also eine hohe Übereinstimmung hat. Auch solche Seiten werden in WordPress nicht erzeugt, wenn man normal schreibt und bloggt.
Sollte man allerdings einen ähnlichen Beitrag mehrfach schreiben und diesen auch noch mit Tags taggen, die sonst nicht verwandt werden, dann würde möglicherweise Duplicate Content entstehen.
Wer aber immer wieder neue Beiträge oder Post individuell erstellt sollte kein Problem mit Duplicate Content haben.
WordPress hat also keine Probleme mit Duplicate Content. Statt sich mit Duplicate Content Vermeidungsstrategien zu beschäftigen sollte der Webmaster sich bemühen immer wieder neue und interessante Beiträge zu schreiben. Dann freuen sich nicht nur Google sondern auch die User.
Verwandte Artikel:
- Google Suche mit 100 Ergebnissen
- Warum werden Webseiten nicht bei Suchmaschinen sichtbar?
- Long Tail in der Suchmaschinenoptimierung
- Suchmaschinenoptimierung: Fünf Irrtümer
- Eigenen Blog erstellen in wenigen Schritten
- Big Data und Gedöns
- Suchmaschinenmarketing als Ergänzung zur Suchmaschinen-Optimierung