Heb je wees-pagina's in je Joomla site?

logo pdb
Ryte.com (voorheen On-page.org) is een van de beste on-page SEO tools, aanbevolen door Joomlaseo.com (zie onze review). Gratis voor 1 account (voor altijd)!!!

Heb je ooit wel eens gehoord van orphan pages (wees pagina's)? Dit zijn pagina's die niet via de navigatie van je website te bereiken zijn. Crawlers die je site intensief doorzoeken (Google...) zullen ze echter wel vinden. In veel gevallen ben je je er mogelijk niet eens bewust van, maar ze kunnen een probleem voor je SEO zijn.

Ten eerste: het hebebn van orphan pages op zichzelf hoeft geen probleem te zijn, als je je er maar bewust van bent en goede maatregelen neemt. Misschien denk je dat je hier zelf geen last van hebt, maar als je verder leest zul je zien dat misschien toch anders ligt... Bijna elke site heeft er wel een paar, en dat is echt geen ramp. Als het er echter veel zijn is het dat mogelijk wel. 

Voorbeelden van Orphan pages

Er zijn verschillende voorbeelden van situaties met orphan pages:

  • Als je bepaalde artikelen of categorieeen gepubliceerd hebt, maar ze niet via een menu toegankelijk hebt gemaakt, dan hebben ze toch een URL die benaderd kan worden, en Google zal die vroeg of laat vinden en indexeren. Het feit dat je ze zelf niet eens belangrijk genoeg vond om ze in het menu op te nemen suggereert al dat ze niet heel belangrijk zijn, en dat zal Google ook vinden. Publiceer dus alleen maar echt waardevolle content, en zorg dan ook dat het via het menu benaderbaar is, hetzij als individueel artikel, hetzij in een blog- of lijst-weergave.
  • Sommige sites gebruiken artikelen om deze in module=posities te tonen, bijvoorbeeld met Articles Anywhere van Regularlabs of andere extensies / truuks. Dat kan bijvoorbeeld handig zijn als je eindgebruikers geen toegang wilt geven tot het module-beheer. Via zo'n constructie kunnen ze dan via het artikel toch de inhoud van de module aanpassen. Maar ook al wordt het artikel getoond in een module, het heeft ook hier een eigen URL. Google ziet het dus 2 keer: 1 keer als artikel en 1 keer op een andere pagina in een module. Dat is niet de bedoeling.
  • Hetzelfde kan bijvoorbeeld gebeuren als je een slider met inhoud van artikelen gebruikt in een module. De artikelen hebben eigen URL's.
  • Vanwege de architectuur van het CMS worden bepaalde pagina's standaard aangemaakt, zonder dat je er zelf iets aan doet. Het bekendste voorbeeld is een login pagina, of een pagina om je wachtwoord te resetten. Dat is eigenlijk ook een orphan page.
  • Tenslotte kan het ook door slechte extensies komen. Wat ik meerdere keren heb aangetroffen is een image slider die voor elk plaatje in de slider per plaatje een HTML pagina opbouwt. Dit is vaak het lastigst op te lossen. Het beste is dan ook om dit soort extensies gewoon helemaal niet te gebruiken.

Het grote probleem van al deze situaties is dat de Google index voor jouw site zwaar vervuild en verdund is met "waardeloze" of inieder geval dubbele content (thin-content genoemd). Dat haalt de SEO-waarde voor de hele site naar beneden.

Hoe spoor je Orphan pages op?

Simpel: vraag het gewoon aan Google... Je kunt dit op 2 manieren doen. Voor kleinere sites ga je gewoon naar Google.com en je typt de volgende query: site:example.com. Dat geeft je een lijst met alle URL's die Google van je site kent. Ook Google zal er vast wel eens een missen, maar voor dit doel is dit goed genoeg:

site google

Dit ziet er prima uit, Google start de lijst vaak met de belangrijke pagina's. Scroll je verder naar beneden, dan zie je misschien echter wel gekke dingen. Neem dit live-voorbeeld, wat er best verdacht uitziet:

orphan

In dit geval bleek het om een slecht gebouwde slider te gaan, met honderden waardeloze pagina's, tegenover slechts een paar dozijn "echte" pagina's. Doe hetzelfde maar eens voor jouw site en check eens of je zaken ziet die je niet verwachtte.

Voor kleinere sites werkt deze methode prima, maar voor grotere sites is een tool handig. Ik gebruik zelf Website Auditor van SEO Powersuite (met berkingen gratis te gebruiken). Het crawled standaard gewoon de links van je site, maar in de advanced settings kun je ook vragen om de Google index voor je site te checken. Pagina's die bij een gewone crawl niet gevonden worden, maar wel in Google staan (of in je sitemap) worden dan gemarkeerd als "Orphan pages":

seo powersuite website auditor

Je kunt de lijst ook exporteren naar Excel om verder te onderzoeken.

Wat zijn de volgende stappen?

Dat hangt af van de aard van de orphan pages die je vindt. Het voorbeeld van de slider is gelijk een hoofdpijn probleem en is niet simpel op te lossen. Dan moet je werken met allerlei 301-redirects en dergelijke. Dumpen, dit soort extensies dus.

Echter, het kan ook best zijn dat je bewust je site met orphan pages hebt opgebouwd. Een gelegitimeerd voorbeeld is bijvoorde de documentatie pagina van de PWT SEO extensie: extensions.perfectwebteam.com/pwt-seo/documentation:

Dit ziet er uit als 1 pagina of artikel, maar het is eigenlijk een blog-overzicht zonder links naar de onderliggende artikelen. Met de inhoudsopgave in de rechterbalk is op deze manier een interne navigatie opgebouwd. In werkelijkheid zijn er een stuk of 20 artikelen die hier allemaal getoond worden. De artikelen zelf worden niet getoond (er is geen lees-meer-link), maar ze zijn er wel. Met een eigen URL. Een simpele oplossing om Google te laten weten dat we zo op hun eigen URL niet geindexeerd willen is het configureren van de Robots-setting. Zet die op Noindex, Nofollow of Noindex, Follow (Publishing-tabje):

noindex robots

Je ziet: een heel simpele oplossing. Je kunt prima op de door jouw bekende manier je sites blijven opbouwen. Zolang je je dus maar bewust bent van dit issue en er iets aan doet. Zorg ook dat je sitemap extensie pagina's met een Noindex vlaggetje niet in de sitemp opneemt, anders geef je tegenstrijdige instructies aan Google.

Er zijn altijd weer andere situaties die je op weer andere manieren moet oplossen. Om nog maar eens een veel voorkomend probleem in Joomla sites te behandelen: elke Joomla pagina bouwt een URL om in te loggen op de front-end, ook al heb je er niks voor ingesteld en gebruik je het misschien niet eens . Ga maar eens naar jouw website met http://example.com/index.php?option=com_users&view=login. Dan krijg je gewoon de login-pagina, en Google heeft hem vaak netjes geindexeerd. Om dit te voorkomen kun je het beste een menu-item van het type login maken en dat dan weer op Noindex zetten.

Je ziet, er zijn allerlei situaties waarmee je dit probleem kunt krijgen, maar meestal is het goed op te lossen. Check je eigen site dus maar eens goed.

Over deze site

Joomlaseo.com is volledig gebouwd en geschreven door Simon Kloostra, SEO Specialist en Webdesigner uit Utrecht. Ik heb ook een boek geschreven en blogs voor bedrijven als OStraining, TemplateMonster, SEMrush en dergelijke.