Skip and go to main content

Von unseren Depsters November 05, 2014

Duplicate Content und Web-Shop-Optimierung

Image

Suchmaschinen richtig füttern: Duplicate Content im Webshop – Gefahren, Quellen und Gegenstrategien.

Dieser Blog-Beitrag ist der erste zur Reihe «Optimierung von Web-Shops».

Duplicate Content ist ein grundlegendes Problem der Website-Optimierung: Sind Inhalte mehrfach vorhanden, wirkt sich dies negativ auf die Erreichung gut platzierter Suchergebnisse aus. Gerade bei Web-Shops wird das Problem von Duplicate Content unterschätzt.

Bekanntlich begünstigen die Verwendung der richtigen Keywords und verlinkungswürdige Inhalte die Erreichung gut platzierter Suchergebnisse. Suchrelevante Begriffe in Inhalten und externen Linksignalen (Backlinks) gelten als Top-Faktoren für gute Suchmaschinen-Rankings. Dieser positive Effekt wird jedoch gehemmt, wenn das unterschätzte Thema des Duplicate Contents vorliegt.

Image

Duplicate Content im Shop – hier: verursacht über mehrere Navigationspfade

 

Duplicate Content beinhaltet sämtlichen…

 

gleichen Inhalt auf verschiedenen Webseiten

Gemeint ist, dass identische Textinhalte – komplett oder Teile davon – unter verschiedenen URLs aufrufbar sind – auf der eigenen Website oder einer fremden Domain.

Die Form von Duplicate Content kann verschieden sein:

  • Je nachdem, wo er auftaucht: auf der eigenen Domain oder Subdomain vs. andere Domains
  • Nach Ausmass der Duplizierung: wie viel Inhalt, z. B.: Text, ist auf mehreren URLs identisch?

Externer Duplicate Content kann vorhanden sein, wenn z. B. eine Content-Partnerschaft besteht, neue Inhalte aus anderen Quellen zusammengestellt werden (content syndication), oder eine externe Quelle die eigenen Inhalte ungefragt weiterverwendet.

Hier stellen sich Fragen nach der Inhaberschaft der Inhalte und/oder nach dem Mehrwert für den User. Denkbar ist auch teilweiser Duplicate Content, indem Hersteller-Informationen bei Produkten und Kategorien eingeblendet werden – Informationen, welche, höchstwahrscheinlich auch andere Shops verwenden.

Interner Duplicate Content ist vorhanden, wenn die Duplizierung der Inhalte Domain-intern angesiedelt ist (Top Level Domain www.beispiel.com oder Subdomains blog.beispiel.com). Interner Duplicate Content kann sehr schnell entstehen und kann tief ins grundsätzliche Design einer Website eingreifen: Die Informationsarchitektur oder CMS-spezifische Funktionsweisen und Settings verursachen die Doppelung von Inhalten.

Wieso ist Duplicate Content ein Problem?

Sind Inhalte unter mehreren URLs verfügbar, ergeben sich aus Sicht von Suchmaschinen Bewertungsprobleme:

  • Seiten unterscheiden sich nur gering von ihren Duplikaten.
  • Internes Linkgewicht wird nicht gebündelt.
  • Externes Linkgewicht wird nicht gebündelt.
  • Suchmaschinen verstehen nicht, welcher Inhalt der relevanteste ist.

Es ergeben sich damit Interpretationsprobleme für die Suchmaschine:

  • Durch die Zerstreuung von internen und externen Suchmaschinen-Signalen, laufen eigene Inhalte Gefahr, im Vergleich mit Domain-fremden Inhalten als weniger relevant eingestuft zu werden.
  • Es ist unklar, welcher Inhalt von Suchmaschinen gecrawlt (regelmässig abgerufen werden), in den Index aufgenommen und welcher Inhalt Usern angezeigt werden soll.

Es ergibt sich folgende Handlungskette: Der Verlust von organischen Suchmaschinen-Rankings führt zum Verlust der Sichtbarkeit in Suchmaschinen und damit zum Verlust von Impressionen, Besuchen und Konversionen.

Der Grundsatz – nur eine Seite (URL) pro spezifischem Inhalt (Thema) – wird verletzt und führt dazu, dass die Suchmaschinen-Performance für die Website suboptimal ausfällt. Und dies, obwohl User-freundliche Inhalte und tolle Produkte vorhanden sind. Der User müsste nur noch abgeholt werden.

Hinzu kommt, dass sehr viele URLs unnötig von Suchmaschinen gecrawlt werden. Das belastet den eigenen Server unnötig und neue URLs (neue Produkte) werden nicht schnellstmöglich von Suchmaschinen bewertet und ausgespielt.

Duplicate Content ist nicht weit verbreitet, oder?

Doch, doch. Schon. Die Ursachen können unbewusst verursacht und auch tief im Website-Design verankert sein. Im schlechtesten Fall sind sie wiederkehrend. Neben einem (gründlichen!) Check-Up der Informationsarchitektur und des CMS muss auch bei wiederkehrenden Ereignissen wie Umbenennungen von Kategorien oder beim Einbau und Wechsel von Produkt-Teasern besonders auf Duplizierungen geachtet werden (z.B. Relaunch, Saisonwechsel, etc).
Natürlich sind die Duplikate oft versteckt, indem eigentlich nur ein einzigartiger Inhalt vorhanden zu sein scheint – aber ist dies auch für Suchmaschinen so? Ein kurzer Blick auf…

Klassische Ursachen von internem Duplicate Content

  1. User können sich beliebig durch Kategorien navigieren: Marken, Sales-Angebote, Themen, Neuheiten
  2. User finden Angebote an verschiedenen Orten
  3. User können sich Produkte beliebig sortieren: Preis, Erscheinungsdatum
  4. User können in internen Listen blättern: paginierter Inhalt
  5. User können ihre Produkt-Suche über eine Facetten-Navigation eingrenzen

Was sich anhört wie eine Usability-Checkliste, kann – falls nicht beachtet – schnell zu Doppelungen führen. Eine Produkt-Übersicht kann leicht in verschiedenen Varianten angezeigt werden? = Duplicate Content Gefahr. Produkt-Neuheiten sind unter URLs wie www.example.com/neuheiten/prod… verfügbar und im normalen Sortiment auch vorhanden? = Duplicate Content Gefahr. Weitere klassische Doppelungs-Quellen sind: Druckansichten, Fliesstexte in PDFs, Archive etc.

Eine Möglichkeit, das Aufrufen von Inhalten über mehrere URLs zu vermeiden, kann sein, Produkte direkt im ersten URL-Verzeichnis abzulegen. Damit können keine Doppelungen, durch in URLs abgebildete URL-Pfade, entstehen, z.B.:

www.beispiel.ch/schuhe/sneakers/armani-jeans-sneaker
www.beispiel.ch/herren/schuhe/sneakers/armani-jeans-sneaker
www.beispiel.ch/marken/schuhe/sneakers/armani-jeans-sneaker
www.beispiel.ch/sale/sneakers/armani-jeans-sneaker

Alle hier aufgeführten URLs könnten entstehen, wenn der User-Pfad zum Produkt in der URL abgebildet ist.
Ob eine Lösung mit Produkten im Root technisch möglich und sinnvoll ist, hängt vom jeweiligen Webshop ab.
Erfolgreich eingesetzt wird dieser Ansatz von Zalando.

Image

Produkte sind bei zalando im Root (zalando.ch/Produkt-XY) angesiedelt

Sind kleine Unterschiede relevant?

Ja. Wo der Teufel in Details steckt, sind kleine Unterschiede eben auch Unterschiede:

  • URLs sind mit und ohne www erreichbar
  • URLs sind per http und https erreichbar
  • URLs können mit verschiedenen URL-Abschlüssen aufgerufen werden: mit Trailing Slash, mit .html, etc.
  • URL Parameter wie z.B.: http://www.zalando.ch/herrenschuhe-halbschuhe/?order=activation_date (Problem hier gelöst mit canonical tag)
  • Session IDs
  • Themen und Tags – oft sekundäre Zugänge zu Inhalten

Gleichzeitig kann Inhalt auch teilweise gedoppelt werden, indem man z. B.: Seiteninhalte von Subkategorien auf Kategorien anteasert und der Text auf beiden Seiten vorhanden ist. Dies ist an sich legitim, stellt gleichzeitig die Folgefrage danach, wie viel einzigartiger Text auf den Seiten vorhanden ist.
Schnell passiert ist eine Doppelung schliesslich auch bei sämtlichen Migrationen und Umbenennungen von Seiten: die alten URLs sind noch aufrufbar.

Prophylaxe, Monitoring & Behebung

Doppelungen vermeiden! Wie?

  1. Bereits bei der Wahl und Konfiguration des CMS die SEO Faktoren berücksichtigen.
  2. Beim Anlegen/beim Review der Informationsarchitektur, Quellen von Doppelungen identifizieren und Instrumente zur Behebung festlegen.
  3. Konzept zur URL-Kanonisierung erstellen: welche URLs sind für User und Suchmaschinen gedacht, welche sind überflüssig oder sekundär?
  4. Verwendung des Canonical Tags (link Element rel=”canonical”) – mit Vorsicht, weil unbeabsichtigt URLs aus dem Suchmaschinen-Index fallen können.
  5. In Seiten blättern – Paginierung: Element rel=”next” rel=”prev” verwenden.
  6. Länder und Sprachtargeting: Element hreflang
  7. Wiederkehrende Checks bei Umbenennungen und Migrationen (Stichwort: Saisonwechsel)

Und wenn drastische Mittel nötig werden (vor allem bei sehr grossem Sortiment):

  • Indexierungs-Ausschluss doppelter URLs per robots.txt
  • Indexierungs-Ausschluss doppelter URLs per meta tag „noindex, follow“

Identische Inhalte auf verschiedenen Sprachen anzubieten, muss nicht direkt Duplicate Content verursachen. Beim Ansatz, Usern die passende Variante einer Seite bereitzustellen, spielen jedoch korrekt eingesetzte Sprachversionen eine Kernrolle.

Ein Fazit zum Inhalts-Kloning

Doppelungen können strukturell bedingt sein und schnell entstehen. Ursachen für Duplicate Content sind vielfältig und gerade grössere Web-Shops sehen sich mit Fragen der Datenverwaltung konfrontiert. Aufgrund der hohen Relevanz für Suchmaschinen sind Ansätze zur Vermeidung und Behebung von Duplicate Content notwendig.

Konzepte zur Erkennung von Doppelungsquellen oder der Website-Gliederung und URL-Kanonisierung können entscheidend sein, Duplicate Content mit Instrumenten wie dem Canonical Tag anzugehen. Zweckmässig ist ebenso eine Art von Duplicate Content Monitoring.
Hinter diesbezüglichen Optimierungsmassnahmen stehen zwei grundsätzliche Fragen:

  • Ist die Verfügbarkeit von Inhalten unter verschiedenen URLs beabsichtigt, weil sie einen User-Mehrwert darstellt?
  • Und aus SEO-Perspektive: Welche URLs sollen für Suchmaschinen sichtbar sein, weil sie (unter verschiedenen eigenen oder Domain-fremden URLs) User-Bedürfnisse am besten bedienen?

Bisher erschienen zur Reihe «Optimierung von Web-Shops»:
1. Duplicate Content und Web-Shop Optimierung
2. Externe Verlinkung und Content Marketing für Online-Shops
3. Produkttexte im Online-Shop – das unentdeckte Wesen
4. Filtern, sortieren & blättern – SEO für Online-Shops
Demnächst: 5. «Datenauszeichnung mit schema.org»

 

Fragen? Wir sind hier, um zu helfen!

Hoppla!

If you're reading this, you unfortunately can't see the form that's supposed to be here. You probably have an ad blocker installed. Please switch off your adblocker in order to see this form.

Still encountering problems? Open this page in a different browser or get in touch with us: [email protected]