Duplicate content en het toegevoegde zoekresultaten probleem
januari 8, 2007 6 reactiesJe vraagt je af waarom je site niet goed scoort in de zoekresultaten en je kijkt even hoeveel & welke pagina’s door google werden geïndexeerd. Op het eerste zicht zie je geen probleem en alle pagina’s blijken geïndexeerd te zijn…tot je de kleine lettertjes Toegevoegde zoekresultaten ziet staan naast je pagina. Houston we have a problem.
Defenitie van Duplicate content
Het is zoals het woord eigenlijk zegt..dubbele inhoud. Wanneer een pagina wordt beschouw als zijnde duplicate content is niet duidelijk. Er is geen magisch percentage die je kan verzekeren dat je pagina wel of niet duplicate content is. Maar als minder dan de helft van een pagina geen originele en unieke tekst heeft dan kan het wel eens warm worden.
Er zijn 2 types van duplicate content
- Interne Pagina duplicatie (de slechtste vorm die je kan hebben)
- Externe Pagina duplicatie
De interne pagina duplicatie komt voor wanneer je interne pagina’s (op dezelfde domeinnaam) als zijnde ‘hetzelfde’ worden aanzien door google en naar de SI worden verhuisd. Wanneer dat gebeurd worden je pagina’s uit de natuurlijke zoekresultaten gehaald en worden ze als minder relevant beschouwd voor de google zoekmachine gebruiker.
De externe pagina duplicatie kan bijvoorbeeld de oorzaak zijn wanneer je een press release schrijft en je artikel op tientallen of honderden andere sites terecht komt. Hetzelfde geld voor de RSS feed functie van een blog. Jouw artikel kan door ontelbaar veel andere blogs worden overgenomen.
In tegenstelling tot de interne duplicatie, waar het voor de google makkelijk is om duplicate content te vinden, ligt dat bij de externe duplicate content een stuk moeilijker omdat die bepaalde tekst op honderden zoniet duizenden verschillende sites staat en de hoeveelheid aan data werd verspreid over verschillende data centers.
Hoe kom je IN de SI terecht ?
Er zijn verschillende factoren die daar kunnen voor zorgen maar algemeen wordt aangenomen dat één of meerdere van deze factoren de oorzaak zijn :
- Duplicate content
- Pagina’s die te ‘diep’ in je site liggen en die enkel kunnen bereikt worden door diep te crawlen (door spiders) of pagina’s die helemaal niet bereikbaar zijn.
- Dynamische urls of url’s met teveel parameters erin . vb : http://www.amazon.com/Gamma-Bucket-of-Practice-Balls/dp/B000E7DRIG/sr=1-2/qid=1168214366/
ref=sr_1_2/105-0866159-5916403?ie=UTF8&s=sporting-goods - Slechte interne & externe link structuur. De slechte externe structuur kan mede veroorzaakt worden door teveel wederkerige links (met eventueel dezelfde ankerteksten), het linken naar ‘duistere & spammy’ sites en het kopen-verkopen van links.
Hoe kom je UIT de SI ?
Als je met een duplicate content zit binnen je site volstaat het meestal om genoeg originele content op je pagina’s te plaatsen. Maar wat is nu genoeg ? Als je de body van je pagina wegneemt dan hou je waarschijnlijk site hier over :
- Hoofd
- Navigatie
- Footer
En die kan je hoogstwaarschijnlijk op ALLE pagina’s van je site terug vinden. Je site template is dus hetzelfde op alle pagina’s.
Als je alle woorden van die template (navigatie, hoofd en footer) gaat optellen kom je aan een bepaald cijfer. Als je bijvoorbeeld aan 250 woorden komt, maak dan dat je body van je pagina minstens evenveel unieke woorden heeft bovenop de 250 van je template. Hoe meer unieke woorden je hebt hoe meer kans je maakt om uit de SI te blijven.
Eenmaal je dat hebt gedaan, zit niet te wachten tot google ooit weer eens langskomt ! Probeer nieuwe links te verkrijgen naar je herschreven pagina’s zodat je sneller uit de SI komt !
Zit je met Externe duplicate dan zal dat een stuk moeilijker worden om dat aan te pakken. In het geval van press releases zou ik zeggen, spin het artikel dat je hebt gemaakt, plaats het originele op je site en hou het gesponnen artikel voor de press release.
Verder kan je een sitemap op je home pagina plaasten zodat google ALLE pagina’s (ook diegene die diep in je site liggen) makkelijker kan vinden.
Laat je alles zoals het is en onderneem je geen actie dan zal je site langzaam “dood bloeden”.
Je vraagt je misschien af hoe slechte interne links kunnen leiden tot het ‘wegrotten’ van je site…
Je hebt een goed gestructureerde site met een hoop links naar interne pagina’s op je site.
Als al die pagina’s , waar je homepage naar linkt, in de SI staan….
En al die pagina’s linken op hun beurt terug naar je homepage…
Je snapt het al denk ik. Je homepage linkt naar pagina’s die volgens google nog weing waarde hebben en bijna als SPAM worden aanzien. En als je veel pagina’s in de SI hebt staan…
De links die naar je homepage linken krijgen van google zo goed als geen waarde aangezien die pagina’s in de SI voorkomen. Dus de PR die via die pagina’s word doorgegeven heeft bijlange niet de waarde als voorheen (toen die nog niet in de SI stonden).
Je homepage linkt naar pagina’s die door google in vraag worden gesteld en die pagina’s die in de SI staan en naar je homepage linken verliezen hun link kracht.. Je komt in een spiraal terecht die langzaam tot het einde van je site zal leiden.
Het is geen drama als pagina’s in de SI terecht komen maar doe er iets aan om die eruit te krijgen…