Duplicate Content ist das Schreckgespenst unter den Website-Betreiber:innen. Google mag doppelte Inhalte nicht, heißt es, und manch einer fürchtet sogar eine Abstrafung. Tatsächlich ist Duplicate Content im Bereich Onpage-SEO – also doppelte Inhalte – ein häufiges Problem. Besonders knifflig: Nutzer:innen bemerken Duplicate Content oft gar nicht, für Google und andere Suchmaschinen ist er jedoch ein Quell der Verwirrung, der sich für Dich in schlechteren Rankings niederschlagen kann.
Das ist jedoch kein Grund zur Panik. Wir verraten Dir, wo die Ursachen für Duplicate Content liegen, wie Du Deine Website auf Duplicate Content prüfst und ihn in Zukunft vermeidest.
Was ist Duplicate Content?
Bei Duplicate Content handelt es sich, wie der Name schon sagt, um doppelte Inhalte. Zum Beispiel, wenn ein Text auf zwei oder mehr URLs verwendet wird. Diese doppelten Inhalte können sich auf Deiner eigenen Website (auch genannt interner Duplicate Content), aber auch auf anderen Websites befinden (dies bezeichnen wir als externen Duplicate Content).
Dabei muss die Dopplung nicht einmal mit Absicht passieren. Häufig führen fehlendes Wissen über die Gefahren von Duplicate Content oder auch technische Ursachen zu Duplikaten.
Gefahren von Duplicate Content
Entgegen der weitverbreiteten Befürchtung führt Duplicate Content nicht zu Abstrafungen durch Google. Das macht ihn jedoch nicht weniger problematisch. Denn ob interner oder externer Duplicate Content: Bei identischen Inhalten weiß Google nicht, welche Seite nun die bessere Antwort liefert. Entsprechend rankt die Suchmaschine mal diese, mal jene URL – mit dem Ergebnis, dass keine der Seiten dauerhaft gute Rankings erzielen kann. Du siehst: Durch Duplicate Content musst Du zwar keine Abstrafung von Google befürchten, aber Deinen Rankings kann er langfristig schaden.
Ursachen von internem Duplicate Content
Die Ursachen für Duplicate Content sind meist entweder technischer Natur oder liegen im schlichten Kopieren von Inhalten. Letzteres muss nicht einmal in böswilliger Absicht geschehen. Oft ist der Grund schlicht und ergreifend fehlendes Wissen oder knappe Ressourcen.
Duplicate Content durch Kopieren
Kopierte Texte sind nicht nur ein Problem im externen Duplicate Content, sondern können auch auf einer Website entstehen, wenn derselbe Text auf mehreren URLs verwendet wird. Ein Beispiel hierfür wären Online Shops, die zwei Farbvarianten desselben Produkts auf unterschiedlichen URLs führen, aber für beide URLs identische Produktbeschreibungen verwenden. Hier liegt der Grund nicht selten in fehlenden Ressourcen. Denn wenn Zeit und Budget fehlen, um viele einzigartige Texte zu produzieren, ist das Kopieren oft die naheliegendste Alternative.
Aber auch schlichtes Unwissen kann dazu führen, dass Texte auf einer Seite mehrfach benutzt werden. Wer nicht um die Gefahren von Duplicate Content weiß, denkt sich schließlich nichts Böses, wenn er einen schon vorhandenen Text noch einmal einsetzt.
Die Faustregel ist natürlich, dass jeder Text im Idealfall nur auf einer URL Deiner Website zu finden sein sollte.
Technische Ursachen für Duplicate Content
Eine häufige und tückische Ursache für Duplicate Content liegt in der Technik Deiner Website. Hier gibt es mehrere Szenarien, die versehentlich zu doppelten Inhalten führen können:
- Die URL ist sowohl mit als auch ohne Trailing-Slash (/) erreichbar
- Bei internationalen Sprachversionen fehlt der Hreflang-Tag oder ist fehlerhaft
- Es wurde keine Standard-URL festgelegt, sodass die Seite mit und ohne www oder sowohl auf http:// als auch auf https:// erreichbar ist
- Doppelte Inhalte, die Dir bekannt sind, wurden nicht mit Maßnahmen wie Redirects oder Canonical-Tags ausgestattet
Solche technisch entstandenen Duplikate sind tückisch, denn den Nutzer:innen fallen sie in der Regel gar nicht auf – und Du findest sie eigentlich nur, wenn Du gezielt danach suchst. Das ist jedoch Grund genug, um Deine Website regelmäßig auf Duplicate Content zu überprüfen.
Wie kannst Du eine Seite auf Duplicate Content prüfen?
Du weißt nicht genau, ob Deine Website ein Duplicate Content-Problem hat? Mithilfe einiger Tools kannst Du das zum Glück das ganz leicht herausfinden.
Duplicate Content-Check mit dem Screaming Frog
Eine Möglichkeit ist z.B. des SEOs liebstes Werkzeug: Der Screaming Frog. Wenn Du Deine Website mit dem Frosch crawlst, kannst Du ihn explizit nach Duplicate Content suchen lassen. Dazu stellst Du unter Configuration > Content die gewünschte Prozentangabe ein und kannst auch angeben, ob Du nur indexierbare Seiten prüfen lassen möchtest.
Eine weitere Möglichkeit, wie Du mit dem Screaming Frog Duplicate Content identifizieren kannst, ist der sogenannte Hash-Wert. Diesen gibt der Screaming Frog im Internal-Bericht aus. Wenn Du diesen Bericht in eine Excel-Datei exportierst und in der Bedingten Formatierung die “doppelten Werte” für die Hash-Spalte markieren lässt, werden Dir alle URLs aufgezeigt, die identisch sind.
Aber Achtung: Der Hash-Hack spielt Dir wirklich nur Seiten aus, die 100% identisch sind. Duplicate Content kann jedoch auch auf Seiten auftreten, die stellenweise abweichen. Hier eignet sich also eher Variation 1, um Duplikate aufzuspüren.
Weitere Tools für den Duplicate Content-Check
Weitere Tools, mit denen Du Deine Website auf Duplicate Content überprüfen kannst, sind Siteliner und Copyscape.
Siteliner crawlt Deine Seite hinsichtlich des möglichen internen Duplicate Contents und markiert Dir explizit die Stellen, auf denen bestimmte Abschnitte identisch mit Texten anderer URLs sind.
Copyscape dagegen sucht gezielt nach externem Content und gibt Dir so Hinweise, ob Deine Texte einzigartig auf Deiner Website sind oder ob Duplikate im Netz herumwabern.
Beide Tools sind in limitierten Umfang kostenlos nutzbar.
Duplicate Content vermeiden – so geht’s!
Die wirksamste Möglichkeit internen Duplicate Content zu vermeiden besteht natürlich darin, ihn gar nicht erst zu produzieren.
Hast Du jedoch internen Duplicate Content auf Deiner Seite entdeckt, gibt es höchstwahrscheinlich Handlungsbedarf. Nun heißt es: Duplikate bereinigen und dafür sorgen, dass sie nicht zurückkehren.
Es gibt mehrere Möglichkeiten, Duplicate Content aus der Welt zu schaffen. Welche davon sich am besten eignet, hängt davon ab, welche Ursache vorliegt.
Du willst mehr zum Thema SEO erfahren? Dann findest du hier unsere SEO-Tipps!
Inhalte individualisieren
Doppelt verwendete Texte lassen sich vermeiden, indem Du dafür sorgst, dass jede einzelne URL mit einzigartigem Content ausgestattet wird. Dies erfordert natürlich deutlich mehr Aufwand, insbesondere im Falle von Online-Shops, wo potenziell mehrere tausend Produktseiten mit individuellen Texten bestückt werden müssten, um für Einzigartigkeit zu sorgen.
Allerdings lohnt es sich, denn gerade in Shops stichst Du heraus, wenn Du nicht einfach den Herstellertext übernimmst oder für nur marginal variierende Produkte identische Texte verwendest.
Weiterleitungen richtig setzen
Die zuverlässigste Methode, technisch verursachten internen Duplicate Content dauerhaft zu entfernen, ist eine saubere 301-Weiterleitung. Diese eignet sich vor allem bei den eingangs erwähnten technischen Ursachen der Erreichbarkeit der Seiten mit oder ohne Trailing-Slash oder www.
Durch die 301-Weiterleitung reduzierst Du die unnötigen Duplikate auf Deiner Website.
Canonical-Tag
Ein sauberer Cut mit einer 301-Weiterleitung ist jedoch nicht immer möglich. Manchmal müssen die Seiten mit den doppelten Inhalten bestehen bleiben (etwa in unserem Online-Shop-Beispiel mit den Produktvarianten). Wenn die Kapazitäten oder Ressourcen fehlen, um für sämtliche sich zu stark ähnelnde Seiten frische Texte zu erstellen, ist das Canonical-Tag eine mögliche Methode, um Duplicate Content zu vermeiden.
Der Clou liegt hier an der Signalwirkung an Google. Denn mit dem Canonical-Tag zeichnest Du eine URL als Standard aus und signalisierst Google so, welche URL Du im Index sehen möchtest. Die Duplikate, die auf diese kanonische URL verweisen, werden dagegen nicht indexiert.
Hier ist allerdings Vorsicht und saubere Arbeit erforderlich, denn das Canonical-Tag ist nur eine Empfehlung, die Google nicht immer berücksichtigt – vor allem, wenn der Crawler seitenweit widersprüchliche oder verwirrende Signale empfängt.
Wie genau Du ein Canonical-Tag setzt und worauf Du dabei achten musst, erfährst Du in unserem Canonical-Guide.
Länderseiten & hreflang-Tag
Ein spezieller Fall ist der Duplicate Content im Kontext der Internationalisierung. Hast Du beispielsweise dieselben Inhalte auf Deiner Länderseite für Deutschland und für Österreich, so ist die Wahrscheinlichkeit groß, dass Du hier dieselben Texte verwendest – insbesondere, wenn keine lokalen sprachlichen Unterschiede vorliegen, die eine entsprechende Anpassung verlangen würden.
Du hast hier also absichtlich doppelte Inhalte erstellt und für die entsprechenden Länderseiten angelegt. Das ist auch in Ordnung. Der Kniff besteht nun darin, Google zu signalisieren, dass es sich hierbei nicht um Duplicate Content handelt, sondern um die jeweiligen Ländervarianten für beispielsweise Deutschland und Österreich.
Dies bewerkstelligst Du mithilfe der sogenannten Hreflang-Tags. Mit diesen zeichnest Du Deine Inhalte aus und verknüpfst sie auch untereinander. Damit signalisierst Du Google, in welchem Verhältnis die Seiten zueinander stehen und dass es sich hierbei nicht um Duplicate Content handelt.
Wie genau Du Hreflang-Tags setzt, überprüfst und worauf Du bei der Internationalisierung Deiner Seite achten musst, erfährst Du in unserem Blogartikel über den Hreflang-Tag.
Umgang mit externem Duplicate Content
Du hast nicht nur internen, sondern auch externen Duplicate Content gefunden? Bestenfalls besteht eine Kooperation zwischen Deinem Unternehmen und den Seiten, die Deine Texte verwenden. In diesem Fall musst Du entscheiden, wie schlimm die Duplikate für Dich sind.
Schlimmstenfalls wurden Deine Texte schlichtweg geklaut.
In beiden Fällen bleibt in der Regel nur die Kontaktaufnahme mit dem jeweiligen Seitenbetreiber, wobei es bei Kooperationspartner:innen freilich leichter ist eine Abänderung der plagiierten Texte in die Wege zu leiten.
Ebenfalls eine weniger schöne Möglichkeit: Vielleicht hat auch ein Vorgänger von Dir sich zu sehr von anderen Seiten inspirieren lassen und die Texte auf Deiner Seite sind nicht die Originale. Dies lässt sich insbesondere bei älteren Seiten jedoch nur sehr schwer feststellen.
Fazit
In der Regel profitiert niemand von Duplicate Content – auch nicht, wenn es sich um interne Duplikate handelt, die vielleicht nur durch Copy & Paste entstanden sind. Durch unkontrollierten Duplicate Content vermindern sich die Chancen einer Seite konstante gute Rankings zu erzielen, da die Konkurrenz in den doppelten Inhalten lauert.
Glücklicherweise ist es nicht allzu schwierig, Duplicate Content zu identifizieren und zu beseitigen.
Duplicate Content-Checks sollten regelmäßig durchgeführt werden, um zu verhindern, dass Duplikate Dir unbemerkt in Deine Online Marketing-Bestrebungen grätschen. Solche Überprüfungen lassen sich gut in die reguläre Website-Hygiene oder einen Frühjahrsputz einbetten.