Duplicate Content: So vermeidest Du doppelten Inhalt

Doppelte Inhalte bzw. Duplicate Content sind ein SEO-Problem, das viele SEOs oder Content-Vermarkter immer wieder betrifft. Doppelte Inhalte werden von Suchmaschinen nicht gerne gesehen. Sie führen oft zu einem schlechteren Ranking der betroffenen Webseite. In diesem Artikel erfährst Du, wie Duplicate Content entstehen kann, wie Du in findest und mit welchen Tricks Du doppelte Inhalte vermeiden kannst. 

Was ist Duplicate Content?

Googles Duplicate Content Definition lautet: Duplicate Content bezieht sich im Allgemeinen auf Inhaltsblöcke innerhalb von Domains oder bei verschiedenen Domains, die entweder

Duplicate Content,content bedeutung,google duplicate content,double content,duplicate content vermeiden,doppelter content

  • vollständig mit anderen Inhalten übereinstimmen oder
  • weitestgehend übereinstimmen.

Das Google die Content Bedeutung sehr hoch ansetzt, hat einen ganz bestimmten Grund. Googles Ziel ist es, den Nutzern seiner Suchmaschine die bestmöglichen Antworten auf Ihre Suchanfragen zu liefern.

Google legt daher großen Wert auf

  • einzigartige,
  • informative und
  • hilfreiche Inhalte.

Eine Liste mit 10 inhaltsgleichen Webseiten auf der ersten Seite der Suchergebnisse ist für Google nicht akzeptable.

Gratis Ratgeber klärt endlich auf!

Die 7 Gründe warum 98,7 % aller Webseiten kein Geld (im Internet) verdienen, warum Deine Webseite zu wenig Besucher hat und Du nicht unter den Top 3 bei Google rankst... 

Wie entsteht Duplicate Content?

Es gibt eine ganze Reihe von Gründen für doppelte Inhalte. Viele von ihnen sind technischer Natur. Sie werden durch die Plattform verursacht, die Du für Deine Webseite benutzt.

Ebenso häufig ist die bewusste oder unbewusste Nutzung gleicher Inhalt auf verschiedenen Webseiten. Die häufigsten technischen Ursachen sind:

Unterschiedliche URLs für Seiten mit gleichen Inhalten

Google betrachtet URLs mit und ohne www, mit http, https, .de und .de/index.html als unterschiedliche URLs, auch wenn sie auf identische Seiten verweisen. Für Besucher ist dies kein Problem. Google wertet die Inhalte jedoch als double Content.

Session-IDs

Oft ist es sinnvoll, die Besucher einer Webseite im Auge zu behalten. Damit dies möglich ist, erhalten sie beim Aufruf der Website eine Session-ID.

Ein Problem für Suchmaschinen ist das Anhängen der ID an die URL. Jedem internen Link, auf den der Besucher klickt, wird die Session-ID hinzugefügt.

Da diese ID für diese Sitzung eindeutig ist, erstellt sie eine neue URL und dupliziert daher den Inhalt.

URL-Parameter, die zum Verfolgen und Sortieren verwendet werden

Eine weitere Ursache für doppelte Inhalte ist die Verwendung von URL-Parametern, die den Inhalt einer Seite nicht ändern. Die ist beim Verfolgen von Links der Fall.

Für eine Suchmaschine sind

  • http://www.meine-webseite.de/keyword-x/ 
  • http://www.meine-webseite.de/keyword-x/?source=rss

nicht die gleiche URL ist. Dies gilt nicht nur für Tracking-Parameter.

Es gilt für jeden Parameter, der zu einer URL hinzugefügt werden kann, aber wesentliche Inhaltselemente nicht ändert.

Paginierung von Kommentaren

WordPress, Joomla und andere Systeme bieten die Möglichkeit, Seiten mit Kommentaren zu paginieren. Dies führt dazu, dass der Inhalt über die Artikel-URL und die Artikel-URL + / comment-page-1 /, / comment-page-2 / oder ähnliche URLs dupliziert wird.

Doppelte Inhalte durch Druckversionen von Webseiten

Die Möglichkeit, eine Druckversion des Seiteninhalts beispielsweise als PDF zu erstellen oder bereitzustellen ist nutzerfreundlich. Dies führt aber in der Regel zu inhaltsgleichen Seiten mit zwei für Suchmaschinen unterschiedlichen URLs.

Duplicate Content durch gleiche Inhalte auf verschiedenen Webseiten

Oft entsteht Duplicate Content einfach durch die Verwendung gleicher Inhalte auf verschiedenen Webseiten. Die geschieht manchmal unbewusst und manchmal bewusst.

Ursache kann die Übernahme von Inhalten wie Nachrichten oder Interviews über Content-Syndication Plattformen sein. Das Kopieren von Produktbeschreibungen von den Herstellerseiten erzeugt ebenfalls doppelte Inhalte.

Oft ist ganz einfach Datenklau die Ursache. Viele Webseitenbetreiber kopieren ohne Zustimmung die Inhalte anderer Webseiten und nutzen sie für die eigene.

Wie kannst Du Duplicate Content erkennen?

Doppelte Inhalte können wie beschrieben ein Problem auf Deiner eigenen Website oder ein Problem auf anderen Webseiten sein, die Deine Inhalte verwenden. Die folgenden Abschnitte zeigen Dir, wie Du alle doppelten Inhalte finden kannst.

Duplicate Content auf der eigenen Website erkennen

Interner Duplicate Content betrifft identische oder sehr ähnliche Inhalte auf verschiedenen Seiten innerhalb Deiner eigenen Domain. Interner Duplicate Content ist häufig ein Problem bei CMS (Content-Management-Systemen) wie WordPress, Joomla oder Typo3.

Duplicate Content,content bedeutung,google duplicate content,double content,duplicate content vermeiden,doppelter content

Dieses Problem tritt beispielsweise auf, wenn Du Blogbeiträge oder Seiten mehreren verschiedenen Kategorien zuordnest.

Im Internet findest Du einer Reihe nützlicher und kostenloser Tools, mit den Du internen Duplicate Content auf Deiner aufspüren kannst. Eines dieser Tools ist Siteliner.

Auf der Website von Siteliner gibst Du die URL Deiner Website ein. Das Tool analysiert den gesamten Inhalt und erstellt eine übersichtliche Auflistung der Seiten, auf denen doppelte Inhalte gefunden wurden.

Die Analyse liefert Dir unter anderem Informationen über die Anzahl der Seite mit gleichem Inhalt und den prozentualen Anteil der Übereinstimmung.

Duplicate Content auf anderen Webseiten finden

Wenn verschiedene Domains die gleichen oder sehr ähnliche Inhalte verwenden, entsteht sogenannter externer Duplicate Content. Dieses Problem betrifft oft Nachrichtendienste und Foren.

Externe doppelte Inhalte entstehen darüber hinaus bei der Veröffentlichung Deiner eigenen Inhalt auf Newsportalen oder bei Webshops, die Produktbeschreibungen von Herstellerseiten kopieren. Und natürlich, wenn andere Webseiten einfach Deine Inhalte kopieren.

Mit dem teilweise kostenlosen Tool Copyscape kannst Du inhaltliche Kopien im Web suchen. Wie bei Siteliner gibst Du auf der Copyscape Website Deine URL ein.

Das Tool sucht und findet Kopien im ganzen Netz und nennt Dir die gefundenen Quellen. In der kostenpflichtigen Version kannst Du Copyscape nutzen, um noch nicht veröffentlichte Inhalte zu überprüfen. Ebenso kannst Du mit Copyscape das Web überwachen und siehst sehr schnell, wenn jemand Deine Inhalte kopiert hat.

Etwas aufwendiger ist die Suche nach doppelten Inhalten mit der Google Suche. Die Google Suche findet internen und externen Duplicate Content.

Mit der Google Suche kannst Du mit Textausschnitten Deiner eigenen Inhalte nach Duplicate Content suchen. Die Inhaltsausschnitte für die Suche können bis zu 32 Worte lang sein.

Mit diesen Tricks kannst Du Duplicate Content verhindern

Umleitung einer Domain mit ModRewrite in der .htaccess Datei

Die .htaccess Datei findest Du im Root Verzeichnis Deines Webservers. Diese Datei kannst Du nutzen, um Deine Domain ohne “www” auf Deine Domain mit “www” umzuleiten.

Duplicate Content,content bedeutung,google duplicate content,double content,duplicate content vermeiden,doppelter content

Der Eintrag in die .htaccess Datei sieht wie folgt aus:

RewriteEngine on
RewriteCond %{HTTP_HOST} ^meine-webseite.de
RewriteRule ^(.*)$ http://www.meine-webseite$1 [R=301,L]

Eine Umleitung in die andere Richtung geht natürlich auch.

301 Redirect Weiterleitung mit .htaccess

Mit dem 301 Redirect kannst Du eine dauerhafte Umleitung einrichten. Beispielsweise von einer Seite die nicht mehr existiert auf eine neue Seite.

Die Umleitung einer Domain auf eine andere Domain geht ebenfalls. Der PageRank wird durch den 301 Redirect ganz auf die neue Seite oder Domain übertragen.

Wenn Du nur eine einzelne Datei umleiten möchtest, lautet der Eintag in die .htaccess Datei beispielsweise:

RedirectPermanent /meine-alte-seite.html https://meine-domain.de/neue-seite.html

Eine ganze Domain kannst Die wie folgt umleiten:

RedirectPermanent / https://meine-neu-domain.de

Gratis Ratgeber klärt endlich auf!

Die 7 Gründe warum 98,7 % aller Webseiten kein Geld (im Internet) verdienen, warum Deine Webseite zu wenig Besucher hat und Du nicht unter den Top 3 bei Google rankst... 

Die Verwendung des Attributs rel=canonical

Eine weitere Möglichkeit, Duplicate Content zu vermeiden, ist die Verwendung des Attributs rel = “canonical”. Das Canonical Tag wird in den Quellcode Deiner Website eingefügt.

Das Tag verweist Suchmaschinen auf die sogenannte kanonische URL. Die kanonische URL ist die ursprüngliche Ressource des Inhaltes von Seiten mit gleichen oder annähernd gleichen Inhalten.

Mithilfe des Canonical Tag kannst Du Suchmaschinen mitteilen, welche Seite in den Index aufgenommen werden soll. Das Attribut rel = “canonical” wird in den HTML-Header Deiner Webseite eingefügt.

Die allgemeine Syntax des Canonical Tag sieht folgendermaßen aus:

< head>
… anderer Code im HTML-Kopf Deiner Website …
< link href = “URL zur Originalseite” rel = “canonical” />
… anderer Code im HTML-Kopf Deiner Website …
< / head>

Das Attribut rel = “canonical” solltest Du dem HTML-Header jeder duplizierten Version einer Seite hinzufügen. Ersetze den Ausdruck “URL zur Originalseite” im Beispiel durch den jeweiligen Link zur ursprünglichen, der kanonischen Seite.

Durch das canonical-Attribut wird an die Zielseite ungefähr die gleiche Menge an Link-Equity wie bei einem 301-Redirect übergeben. Da das Attribut direkt auf der Webseite statt auf der Serverebene implementiert wird, ist es jedoch einfacher anzuwenden.

Seiten mit dem Meta-Robots-Tag von der Indexierung ausschließen

Das Robots-Meta-Tag mit den Werten “noindex, follow” oder nur “noindex” wird in den Head-Bereich jeder einzelnen Seite hinzugefügt, die aus dem Index einer Suchmaschine ausgeschlossen werden soll. Die allgemeine Syntax lautet:

< head>
< meta name = “robots” content = “noindex, follow”>
… anderer Code im HTML-Kopf Deiner Website …
< / head>

Das Robots-Meta-Tag ermöglicht Suchmaschinen das Crawlen der Links auf einer Seite, verhindert jedoch, dass diese Links in ihre Indizes aufgenommen werden. Wenn Du nur den Googlebot an der Indexierung einer Seite hindern möchtest, kannst Du dies mit folgendem Eintrag in den Head-Bereich einer Seite erreichen:

< meta name=”googlebot” content=”noindex” />

Es ist wichtig, dass die duplizierte Seite weiterhin gecrawlt werden kann. Google warnt ausdrücklich davor, den Crawl-Zugriff auf doppelte Inhalte auf Deiner Website zu beschränken.

Die Verwendung des Robots-Meta-Tag ist eine gute Lösung für Duplicate Content Probleme im Zusammenhang mit einer Paginierung.

Die Google Search Console hilft, Duplicate Content zu vermeiden

Mit der Google Search Console kannst Du die bevorzugte Domain Deiner Website festlegen. Zum Beispiel https://meine-webseite.de anstelle von https://www.meine-webseite.de.

Zudem kannst Du in der Parameterbehandlung angeben, ob der Googlebot verschiedene URL-Parameter unterschiedlich crawlen soll. Die vorgenommenen Änderungen gelten nur für Google.

Die Vorgaben in der Google Search wirken sich nicht darauf aus, wie andere Suchmaschinen Deine Website interpretieren. Gegenbefalls musst Du zusätzlich die Webmaster-Tools anderer Suchmaschinen zur Anpassung verwenden.

Doppelte Inhalte, die von Google akzeptiert werden

Akzeptiert werden Inhalte in verschiedenen Formaten zum Beispiel für Desktops, Tablets und Nutzer von Mobiltelefonen. Die Veröffentlichung des Inhalts für jedes der Formate wird nicht zu einer Abstrafung durch Google führen.

Ebenso ist es akzeptabel, wenn ein einzelner Teil des Inhalts veröffentlicht wird und dann an mehreren Orten darauf verwiesen und verlinkt wird. Der Zweck besteht darin, dem Inhalt einen Mehrwert zu verleihen.

Es ist es aus Googles Sicht eine legitime Art der Inhaltsvervielfältigung.

An den Beispielen kannst Du erkennen, dass Google nicht bei allen internen doppelten Inhalten sehr kritisch ist. Dennoch ist es empfehlenswert, regelmäßig Deine eigene Website auf Duplicate Content zu untersuchen.

Wenn Dir dieser Beitrag gefallen hat, teile ihn gerne mit deinen Kollegen und Freunden. 🙂