Written by on

Een manier om je website wat SEO betreft gezond te houden is door aan Google alleen maar relevante inhoud aan te bieden. Vaak zie ik Joomla websites waar dit niet goed gaat. Er zijn in hoofdlijnen 3 redenen waarom er iets fout gaat: echt slechte content (voorbeelddata, test-artikelen e.d.), zwakke artikelen met maar erg weinig tekst en daarnaast nog op zich nuttige pagina's, maar die je toch niet in Google wilt.

Misschien denk je dat dit niet voor je eigen site geldt, maar de kans dat er toch iets aan de hand is is best groot. Zorg datje dit eens goed checkt en los het probleem op door content te verwijderen danwel tegen Google te zeggen dat ze het niet moeten gebruiken:

Welke content is irrelevant?

Ik noemde al 3 redenen voor irrelevante content. In wat meer detail gaat het hierom:

  1. Echt slechte content: content die er helemaal niet zou moeten zijn. Ik zie vaak sites waar dit met name fout gaat. Vaak gaat het om de voorbeelddata die tijdens de Joomla installatie aan de site is toegevoegd. Best handig soms in eerste instantie, maar Google ziet het uiteindelijk ook. Soms denken mensen dat Google het toch niet ziet omdat er bijvoorbeeld geen menu-items naar deze artikelen zijn, maar dat is niet waar. Hetzelfde geldt voor bijvvoorbeeld test-artikelen of overbodig geworden artikelen.
  2. Slechte artikelen met erg einig tekst. Mogelijk zijn deze aangemaakt omdat je dacht dat een pagina over een bepaald onderwerp al helpt voor je SEO ls je er gewoon een hebt en heb je er wat simpele tekst voor geplaatst. Tegenwoordig ziet Google dit als zogenaamde thin-content, wat je een mogelijk slachtoffer maakt van het Google Panda algorithme.
  3. Tenslotte: Op zich relevante pagina's die nuttig zijn voor gebruikers die al op je site zitten, maar niet veel waarde bieden voor Google: Login-pagina's, registreer-een-account pagina's, maar ook bijvoorbeeld je algemene voorwaarden, enzovoorts. Deze categorie is minder ernstig, maar er wat aan doen helpt.

Items 1 en 2 moeten altijd vermeden worden, en voor item 3 moet je gewoon een paar simpele maatregelen treffen.

Joomla Hosting tip: Siteground

Joomlaseo.com laadt in 0.5 - 1 seconden en heeft een Pingdom score van 100%!!! Daarom bevelen we Siteground hosting aan. Snelle servers, goede support, gratis SSL, etc. En niet duur...

 

Hoe kom jer achter of je irrelevant content hebt?

Zelfs als je denkt dat je site gezond genoeg is zul je verbaasd zijn dat Google soms toch pagina's heeft geindexeerd waarvan je niet eens wist dat je ze had. Een van de redenen hiervoor zijn de non-SEF URL's die Joomla altijd aanmaakt voor bepaalde pagina's. Een voorbeeld is de login-pagina, die je altijd kunt bereiken via deze URL: /index.php?option=com_users&view=login. En zo zijn er nog wel wat. Zie bijvoorbeeld dit voorbeeld van een wachtwoord-vergeten pagina, gewoon in Google:

Er zijn meerdere manieren om er achter te komen of je dit soort problemen hebt:

  • Vraag het aan Google: tik bijvoorbeeld het volgende commando eens in het zoekvak: site:example.com
    Dit toont alle (of de meeste) van de URL's die Google kent voor je site. Naast verdere methodes gebruik ik deze optie altijd ook.
  • Gebruik een crawler om je site te checken. Je kunt bijvoorbeeld Screaming Frog SEO Spider tool gebruiken (gratis, desktop) of een online tool als Onpage.org (gratis voor 1 account).

Ik ben benieuwd of je nu toch niet een paar onbekende URL's voor je eigen site vindt....

Verwijder de rotzooi of vraag Google het niet te indexeren

Nu we weten wat er weg moet is het tijd om er wat aan te doen. Alles wet echt rotzooi is, zoals de voorbeelddata en dergelijke moet gewoon weg. Vergeet ook niet evenuele inerne links en menu-items naar deze data te verwijderen. Als je het simpelweg weggooit zal Google een tijdje 404-fouten tegenkomen, maar dat is prima. Een 404 is een geldige code die simpelweg betekend dat de pagina er niet meer is. Na een tijdje zal Google deze pagina's dan gewoon uit de index verwijderen. Eventueel kun jer er ook 301-redirects voor aanmaken naar geldige URL's.

Dan de meer relevante zaken van item 3 (sign-in, registreer, algemene voorwaarden: Natuurlijk moet je deze niet verwijderen. Maar de reden dat mensen naar je site komen zal de mooie content op je site zijn, bijvoorbeeld de mooie laptops uit je webshop. Als ze echt geinteresseerd zijn vinden ze de algemene voorwaarden wel ergens op je site. Je kunt dit soort pagina's het beste met een Noindex attribuut in de robots-metatag zeten. Daarmee zeg je simpelweg tegen Google dat deze URL niet in Google moet komen.

Vaak kun je dit uitvoeren binnen een Joomla artikel of menu, in het Publicatie of Metadata tabje, tenminste voor je artikelen. De uitzondering zijn de gekke non-SEF URL's voor zaken als inlog pagina's. Een mogelijke oplossing daarvoor is om ze toch toe te voegen aan een (verborgen) menu, en dan daarin de Noindex te zetten.

Voor meer leesvoer hierover verwijs ik je naar deze Moz.com blogpost. Deze post heeft me ook geinspireerd om dit stukje te schrijven ;)