SEO: Produziert eure Website unbemerkt Duplicate Content?

Erscheint derselbe Inhalt unter verschiedenen URLs (Uniform Resource Locators = Web-Adressen), entsteht Duplicate Content (DC, doppelte Inhalte). Das kann Google irritieren und eure Rankings beeinträchtigen. Vor allem interner DC entsteht häufig unbemerkt.


Interner Duplicate Content entsteht oft unbemerkt.
(Web Page unter CC0 1.0)

Wie riskant ist Duplicate Content?

Google möchte einzigartige Inhalte in seinem Index, weshalb Duplicate Content den Suchmaschinenriesen vor einen Konflikt stellt: Welche Version soll er in sein Verzeichnis aufnehmen?

Google selbst sagt, Duplicate Content sei unproblematisch, solange kein Manipulationsversuch vorliege. Die Suchmaschine versuche eigenständig, das Original zu identifizieren und ausschließlich dieses zu indexieren (= bei Google auffindbar zu machen).

Jedoch solltet ihr als Website-Betreiber aktiv darum bemüht sein, Duplicate Content zu vermeiden: Auch wenn Google sich entspannt gibt, kann DC zu Ranking- und Indexierungsirritationen führen.

Wie kann interner Duplicate Content unbemerkt entstehen?

Folgende URL-Bestandteile können für internen DC verantwortlich sein:
  • Slashes (Schrägstriche)
  • Protokolle (http & https)
  • Hostnames (alles nach http(s):// bis einschließlich der Top-Level-Domain, z. B. .de oder .com)

> Unkritisch: Hostnames mit und ohne Slash (Schrägstrich)
Betrachten wir folgende URL-Varianten:
  • https://www.beispiel.de
  • https://www.beispiel.de/
Ist derselbe Inhalt unter diesen beiden URL-Varianten (mit und ohne Slash am Ende des Hostnames) aufrufbar, sieht Google darin keinen Duplicate Content.

> Kritisch: Dateinamen mit und ohne Slash (Schrägstrich)
Was bei Hostnames noch unkritisch ist (siehe oben), wird auf Pfadebene zum Duplicate-Content-Problem:
  • https://www.beispiel.de/haus
  • https://www.beispiel.de/haus/
Erscheint derselbe Inhalt unter diesen beiden URLs, wertet dies Google als Duplicate Content.

> Kritisch: Derselbe Content unter verschiedenen Protokollen und Hostnames
http (Hypertext Transfer Protocol) und https (Hypertext Transfer Protocol Secure) sind Netzwerkprotokolle. Ist derselbe Inhalt unter verschiedenen Protokollen bei identischen Hostnames aufrufbar, wertet Google dies als Duplicate Content:
  • http://www.beispiel.de
  • https://www.beispiel.de
Doppelte Inhalte entstehen ebenfalls, wenn derselbe Inhalt unter verschiedenen Hostnames aufrufbar ist (mit und ohne www):
  • https://www.beispiel.de
  • https://beispiel.de

Duplicate Content kann Google irritieren.
(Duplicate unter CC0 1.0)

So vermeidet ihr internen Duplicate Content

Euer Web-Auftritt produziert doppelte Inhalte wie oben beschrieben? Dann solltet ihr eine permanente Weiterleitung einrichten, die alle Versionen stets auf eine einzige (gewünschte) weiterleitet. Machbar ist das mit einem sogenannten 301-Redirect.

Lasst es mich wissen: Wie geht ihr mit Duplicate Content um?

Kommentare

Hier bloggt Mathias Sauermann:

NEWSLETTER:

Erhalte die besten Beiträge meines Blogs >gratis und freibleibend!

Vernetze dich mit mir auf LinkedIn Xing FacebookInstagram.

Weitere spannende Beiträge dieses Blogs findest du in den Rubriken:
Online-Marketing-Tipps
Digitalisierung

Meinung!
Onliner-Allerlei


Titelbild: Digital Art unter CC0 1.0