Duplicate Content

Duplicate Content: checken, oplossen en voorkomen

Duplicate content is niet handig om te hebben. Het zorgt voor een slechte gebruikservaring en Google raakt er ontzettend van in de war. Het beïnvloedt soms ook de ranking van je organische pagina’s. Des te belangrijker om te checken of jouw website duplicate content bevat, of een andere site je content gebruikt, en hoe je dubbele content oplost. 

 

Wat is duplicate content?

Duplicate content is, zoals de naam eigenlijk al weggeeft, dubbele content of tekst op jouw website (of vergeleken een website van een ander). Dat betekent concreet dat hetzelfde stukje content beschikbaar is via verschillende URL’s. Het maakt het ook onduidelijk welke URL de originele, en welke URL de gekopieerde content bevat.

Interne duplicate content

Wanneer verschillende pagina’s op jouw website precies over of dezelfde copy bevat, heeft je website last van duplicate content.

Wanneer je met verschillende mensen aan een website werkt en niet 100% in de gaten hebt welke pagina’s al bestaan, ontstaan er soms wel eens pagina’s met tekst die sterk op elkaar lijkt. Maar dit is slechts het topje van de ijsberg. Veel contentmanagementsystemen voegen automatisch tags toe en staan meerdere paden naar dezelfde content toe.

Dat is vervelend maar het goede nieuws is, is dat het vrij gemakkelijk op te lossen is. Je bezit immers zelfs al die pagina’s, waardoor je content snel en makkelijker kunt wijzigen en de duplicate content handmatig oplost.

Externe duplicate content

Bij externe duplicate content bevat jouw website sterk lijkende of exact dezelfde tekst vergeleken met een andere website. Denk aan een gastartikel die je voor een andere merk geschreven hebt en ook op je eigen website plaatst, of iemand die bewust je copy steelt en dat op zijn eigen site gebruikt.

 

Duplicate content en SEO

Google zal proberen de oorspronkelijke bron van de content te achterhalen en alleen de juiste bron weer te geven, waarbij eventuele duplicaten uit de zoekresultaten worden gefilterd of in ieder geval minder goed te ranken.

Duplicate content zorgt wel eens voor meerdere problemen als het gaat om SEO:

  • Google weet niet welke contentversie het moeten gebruiken
  • Google weet niet welke pagina het beste bij de zoekopdracht past en hoe ze de pagina moet ranken.

Google kiest de beste versie die bij de zoekopdracht past. Hoewel een minder wenselijke versie van content op de SERP terecht kan komen, is Google meestal redelijk goed in het vinden van de juiste site om weer te geven.

Wanneer een externe site een deel van je content heeft gekopieerd, hoef je daar dus niet direct iets van te voelen. Echter wil je misschien wel even uit principe vriendelijke verzoeken die content van de site af te halen.

 

Verschillende dubbele content misverstanden

Er circuleren nogal wat duplicate content misvattingen in de SEO-gemeenschap.

Nee, je krijgt geen penalty

Er wordt vaak gesteld dat Google meteen je site afstraft als er er duplicate content gevonden is, maar dit doen ze echt niet met een penalty. Dat komt echt maar heel zelden voor, dus daar moet je je echt geen zorgen voor maken. Het enige wat Google wél doet is de pagina met de duplicate content een stuk slechter laten ranken.

Nee, kleine exacte tekstkopieën zijn geen duplicate content

Denk hierbij aan één zin die toevallig ook op een andere externe bron te vinden is, of een alinea die op verschillende interne vacature URL’s staat. Bij duplicate content gaat het vaak om een grote hoeveelheid tekst en niet om dezelfde disclaimer of inleidende alinea op elke pagina. Je hoeft je dus geen zorgen te maken om die ene vacature inleidende alinea die op elke pagina hetzelfde is.

 

Hoe check je duplicate content?

Er zijn verschillende manieren waarop je duplicate content op je site kunt vinden.

1) Search Console

Met behulp van het tabblad Pagina’s onder Prestaties vind je URL’s die mogelijk duplicate content problemen veroorzaken.

Check vooral de volgende URL’s:

  • HTTP- en HTTPS-versies van dezelfde URL
  • Www- en niet-www-versies van dezelfde URL
  • URL’s met en zonder slash “/”
  • URL’s met en zonder parameters

2) Manueel zoeken

Check de tekst op je website gewoon in Google om te controleren of er andere sites zijn die exact dezelfde tekst gebruiken. Dat doe ik voor zelf voor mijn populairste blogs, en helaas ontdek ik vaak zo nieuwe copycats.

3) Site:’www.domein.nl’ zoekopdracht

Door naar Google te gaan en ‘site:’ in te typen, gevolgd door je website-URL (zonder https:// en www), zie je alle pagina’s die Google heeft geïndexeerd. Zo’n zoekopdracht gevolgd door het onderwerp waarvan je denkt dat deze vaker besproken wordt op je site, maakt inzichtelijk welke urls het onderwerp bevatten. Dan kunnen je daarna manueel checken of er niet te veel overlap is.

4) Duplicate Content checker

Online zijn er een aantal betaalde en gratis checkers te vinden die dergelijke content opsporen en verschillende websites automatisch met elkaar vergelijken.

 

Duplicate content oplossen

Het oplossen van duplicate content komt eigenlijk altijd op hetzelfde neer: ontdek het probleem en duidt aan welke content de juiste/originele content is.

Het oplossen van duplicate content kan op verschillende manieren. Interne duplicate content oplossen is relatief gemakkelijk.

  • Stel 301 redirects in, voor bijvoorbeeld verschillende dominversies (www. versus https://www.)
  • Gebruik de Canonical URL om de hoofdpagina (met de originele content) te benadrukken.
  • Minimaliseer sterk op elkaar lijkende pagina’s. Creëer altijd unieke content.

Als het gaat om externe duplicate content wordt het wat ingewikkelder.

  • Stuur de eigenaar van de externe website een bericht met het verzoek je content er binnen een bepaalde termijn af te halen. Stuur ook een screenshot mee van de pagina waar de plagiaat op te vinden is. Naar mijn ervaring reageert men daar vaak snel op, en voor je het weet is jouw tekst van hun site verwijderd.
  • Herschrijf de teksten op de pagina’s die te sterk op elkaar lijken.
0 antwoorden

Plaats een Reactie

Meepraten?
Draag gerust bij!

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *