Duplicate Content
Duplicate Content: Definition, Auswirkungen & Vermeidung
Was ist Duplicate Content?
Duplicate Content bezeichnet identische oder sehr ähnliche Inhalte, die unter mehreren URLs entweder innerhalb derselben oder auf unterschiedlichen Websites existieren.
Suchmaschinen wie Google bevorzugen eindeutige, originelle Inhalte. Duplicate Content kann zu Problemen in der Suchmaschinenoptimierung (SEO) führen, da Google möglicherweise Schwierigkeiten hat, die relevantere Seite auszuwählen. Dies kann zu schlechteren Rankings oder zur vollständigen Deindexierung der doppelten Seiten führen.
Unterschied zwischen internem und externem Duplicate Content
Duplicate Content-Typ |
Beschreibung |
Beispiel |
Interner Duplicate Content |
Identische Inhalte innerhalb einer Website |
abcdefg.de/kategorie/produkt und abcdefg.de/produkt |
Externer Duplicate Content |
Doppelte Inhalte auf verschiedenen Websites |
Ein Herstellertext, der auf mehreren Shops verwendet wird |
SEO-Probleme durch Duplicate Content:
- Google kann falsch priorisieren, welche Seite indexiert werden soll.
- Die Ranking-Signale (z. B. Backlinks, Autorität) verteilen sich auf mehrere Seiten anstatt auf eine zentrale Seite.
- Crawl Budget wird verschwendet, weil Google mehrere Seiten mit gleichem Inhalt crawlt.
Warum ist Duplicate Content schädlich für SEO?
Rankingverluste: Google bevorzugt eindeutige Inhalte. Duplicate Content kann dazu fĂĽhren, dass die falsche Seite priorisiert wird.
Schlechte User Experience: Nutzer gelangen möglicherweise auf mehrere ähnliche Seiten und sind verwirrt.
Crawl-Budget-Verschwendung: Google crawlt doppelte Seiten unnötigerweise und verschwendet wertvolle Ressourcen.
Ist Duplicate Content immer problematisch?
Nicht jede Form von Duplicate Content ist schädlich.
Unproblematisch: Seiten mit rechtlichen Informationen oder automatisch generierte Produktbeschreibungen in Online-Shops.
Problematisch: Wenn mehrere URLs mit denselben Inhalten um dasselbe Keyword konkurrieren (Stichwort Keyword-Kannibalismus).
Mehr zu Keyword-Kannibalismus: Keyword-Kannibalismus beheben
Wie entsteht Duplicate Content?
Technische Ursachen fĂĽr internen Duplicate Content
Viele doppelte Inhalte entstehen ungewollt durch technische Fehler:
Ursache |
Beispiel |
Lösung |
URLs mit und ohne Trailing Slash |
domain.de/seite vs. domain.de/seite/ |
Konsistente URL-Struktur verwenden, .htaccess-Weiterleitung einrichten |
URLs mit und ohne www |
www.domain.de vs. domain.de |
301-Weiterleitung auf eine Variante setzen |
HTTP- vs. HTTPS-Version |
http://domain.de vs. https://domain.de |
HTTPS als Standard definieren, HTTP umleiten |
Dynamische URL-Parameter |
domain.de/produkt?farbe=blau vs. domain.de/produkt?farbe=rot |
Canonical-Tags setzen oder Parameter in der Google Search Console verwalten |
Externer Duplicate Content (z. B. durch Content-Scraping)
Viele Unternehmen kopieren Inhalte von anderen Websites oder verwenden standardisierte Herstellerbeschreibungen. Dies fĂĽhrt dazu, dass Google nicht weiĂź, welche Seite die Originalquelle ist.
Lösung:
Einzigartige Inhalte schreiben
rel=“canonical“ setzen, falls Inhalte von anderen Quellen ĂĽbernommen werden
Duplicate Content finden und analysieren
Duplicate Content kann mit verschiedenen SEO-Tools aufgedeckt werden:
Tool |
Funktion |
Interne Duplicate Content-Analyse |
|
PrĂĽft externe Duplikate |
|
Screaming Frog |
Crawlt die Website und zeigt doppelte Inhalte an |
Google Search Console |
Meldet doppelte Meta-Beschreibungen & Title-Tags |
Duplicate Content vermeiden & beheben
Es gibt mehrere Strategien, um Duplicate Content zu vermeiden:
Canonical Tags setzen
Mit dem rel=“canonical“-Tag wird Google mitgeteilt, welche Version einer Seite als Hauptseite gewertet werden soll.
Beispiel fĂĽr einen Canonical-Tag:
<link rel=“canonical“ href=“https://www.websitexyz.de/meine-unterseite/“>
Vorteil: Google ignoriert alle Duplikate und wertet nur die Hauptseite.
301-Weiterleitungen verwenden
Wenn doppelte Inhalte existieren, können per .htaccess-Datei 301-Redirects eingerichtet werden:
Redirect 301 /alte-seite https://www.websitexyz.de/neue-seite/
Vorteil: Linkjuice bleibt erhalten, Nutzer gelangen automatisch zur richtigen Seite.
Noindex, Nofollow fĂĽr doppelte Seiten setzen
Falls sich eine Seite nicht vermeiden lässt, kann sie über Meta-Tags von der Indexierung ausgeschlossen werden:
<meta name=“robots“ content=“noindex, nofollow“>
Vorteil: Google crawlt die Seite nicht und zeigt sie nicht in den SERPs an.
URL-Parameter in der Google Search Console verwalten
Wenn Filter- und Sortieroptionen in Online-Shops doppelte URLs erzeugen, sollten diese in der Google Search Console korrekt verwaltet werden:
Indexierung → URL-Parameter → „Google ignorieren“ aktivieren
Fazit: Duplicate Content aktiv vermeiden
- Interner & externer Duplicate Content kann die SEO-Performance verschlechtern.
- Canonical-Tags, 301-Weiterleitungen und noindex helfen, doppelte Inhalte zu kontrollieren.
- SEO-Tools wie Siteliner oder Copyscape helfen, Duplicate Content zu erkennen.
WeiterfĂĽhrende Links