De zin en onzin van metatags

Om maar met de deur in huis te vallen: veruit de meeste metatags zijn onzin. Het is veel nuttiger om je tijd te steken in metadata die wel belangrijk zijn; vergeet de rest van de metatags. Dat maakt metatag-generators ook overbodig. In dit artikel bespreek ik de meestgebruikte metadata. Daarbij geef ik aan welke daarvan wel of niet nuttig blijken. Ook geef ik alternatieven voor het gebruik van enkele bekende metatags.

Inhoud

Hoe het komt dat veel metatags onzin zijn

Veel metatags stammen nog uit de jaren ’90 van de vorige eeuw, toen er veel zoekmachines werden opgezet en elke zoekmachine haar eigen metatags bedacht. Daardoor ontstond er een wildgroei aan metatags. Omdat veel metatags slechts nuttig waren voor één zoekmachine (de andere zoekmachines negeerden die informatie gewoon) en bovendien de meeste zoekmachines uit die tijd inmiddels al jaren niet meer in gebruik zijn, hebben veel metatags hun nut verloren (of simpelweg nooit gehad).

Daarnaast gebruikten veel sitebouwers de meeste metatags niet, of gingen ze er verkeerd mee om. Een bekend voorbeeld van dat laatste is het keywords-attribuut, dat jarenlang werd gebruikt om de meest onzinnige keywords te verbinden aan een webpagina, om maar bezoekers binnen te halen. Veruit de meeste zoekmachines negeren daarom al jaren het keywords-attribuut (alleen voor Yahoo! dient het nog een kleine functie ook Yahoo negeert nu meta keywords).

Welke metadata zijn wel nuttig?

Aangezien de meeste metadata niet nuttig zijn, kan ik beter een lijstje maken met metadata die wel nuttig zijn, met een korte uitleg van het gebruik ervan.

Title
De titel van de pagina beschrijft in één kernachtige zin de inhoud van de pagina, ongeveer zoals de kop van een krantenartikel. Voorbeeld:

<title>De zin en onzin van metatags</title>

De title is geen zogenaamde ‘metatag’, maar is wel een uiterst belangrijk element in de head van je document, belangrijk voor bezoekers en zoekmachines (zie figuur 1). Gebruik voor elke pagina een unieke title (immers, als het goed is, is elke pagina uniek). Zorg dat de titel helder is en slaat op de paginatekst. En natuurlijk is belangrijk dat de tekst bezoekers binnenhaalt (door in te spelen op de informatiebehoefte). Is de titel vaag of nietszeggend, dan is de kans groot dat men liever een andere site bezoekt. Beperk de lengte van de title liefst tot 65 tekens. Gebruik geen decoratieve tekens in de title; die 65 tekens kun je beter gebruiken om bezoekers te informeren over de pagina.

zoekresultaat waarbij de title een cryptische bedrijfsnaam bevat en de description afwezig is
Figuur 1: Wat voor site zou dit zijn? Een hippe clubavond? Een site over etiquette? Een kledingwinkel?

Description
De description geeft een korte samenvatting van de pagina. Voorbeeld:

<meta name="description" content="Welke metatags zijn nou nuttig en welke niet? Een artikel over de meestgebruikte, onnuttige metadata en de belangrijkste metatags die essentieel zijn.">

De tekst in deze ‘meta-description-tag’ is dezelfde tekst die zoekmachinegebruikers zien in het zoekresultatenscherm als de omschrijving van de gevonden pagina’s (zie figuur 2). De description behoort daarom geen opsomming van losse trefwoorden te bevatten en ook geen omschrijving die slaat op de gehele site, maar een bondige samenvatting of inleiding van de inhoud van de betreffende pagina. Ook hier geldt: is de omschrijving vaag of nietszeggend, dan is de kans groot dat men liever een andere site bezoekt. Ook de description is zeer belangrijk, met name voor bezoekers via zoekmachines. Aanbevolen lengte van een description is doorgaans één of twee zinnen.

lijst van zoekresultaten die op het eerste gezicht allemaal naar dezelfde pagina verwijzen
Figuur 2: Zouden zowel de title en de description uniek zijn, dan kon je veel sneller zien waar de link naartoe leidt.

Robots
Met de ‘meta-robots-tag’ geef je aan of een pagina geïndexeerd (index/noindex) en/of de links erin gevolgd moet worden (follow/nofollow). Voorbeeld:

<meta name="robots" content="noindex, follow">

Standaard neemt een zoekmachine aan dat elke webpagina op ‘index, follow‘ staat ingesteld (dat hoef je dus niet extra aan te geven), tenzij expliciet aangegeven dat het niet geïndexeerd of gevolgd moet worden. Het gebruik van de meta-Robots-tag is essentieel wanneer de pagina gevoelige en/of persoonlijke gegevens bevat. Ook kun je hiermee aangeven of een kopie van de pagina in de cache van een zoekmachine mag belanden (content="noarchive"). Een relatief nieuwe functie van de meta-robots-tag is dat je kunt aangeven of Google de omschrijving van je site moet weergeven zoals die bij DMOZ bekend is, of dat jouw eigen description wordt gebruikt (content="noodp").

zoekmachine Ilse krijgt een omschrijving van DMOZ mee
Figuur 3: Wanneer je website in DMOZ staat vermeld, krijgt je site de omschrijving die bij DMOZ bekend staat, tenzij je een eigen meta-description schrijft en de noodp-waarde gebruikt.

Overige, veelgebruikte metadata

Content-type
Met content-type wordt o.a. aangegeven welke karaktercodering gebruikt wordt (bijvoorbeeld ISO-8859-1). Voorbeeld:

<meta http-equiv="content-type" content="text/html; charset=iso-8859-1">

Voor Netscape 4.7x en ouder was het belangrijk dat content-type de eerste regel in je head was. Aangezien die browser niet meer wordt gebruikt, is de plek van content-type niet meer van belang. Sterker nog, het is beter om het content-type via de server te regelen. In dat geval kun je die metatag helemaal uit je pagina verwijderen. Of je het nou via de server regelt of via je pagina, zorg in ieder geval dat je de UTF-8-karakterset gebruikt. Lees meer daarover in Anne van Kesterens artikel over UTF-8. Een kleine waarschuwing vooraf: let er bij bestaande websites wel op dat dit veel meer inhoudt dan ‘even’ ISO-8859-1 veranderen in UTF-8; je moet namelijk ook vreemde tekens in bestaande pagina’s handmatig omzetten en/of je database converteren…

Pragma en expires
Deze gebruikt men vaak om aan te geven dat een pagina niet door browsers gecached moet worden. Voorbeeld:

<meta http-equiv="pragma" content="no-cache">
<meta http-equiv="expires" content="Thu, 26 Feb 1998 01:00:00 GMT">

Net als content-type kun je ook dit beter via de server regelen.

Revisit-after
Deze wordt gebruikt om aan te geven hoe vaak een zoekmachine langs moet komen. Voorbeeld:

<meta name="revisit-after" content="7 days">

In de praktijk is revisit-after compleet nutteloos, want zoekmachines bepalen helemaal zelf wanneer ze langskomen; ze negeren deze metadata. Wil je toch enige invloed hierop uitoefenen, dan is het gebruik van een XML-sitemap nauwelijks een beter idee, want ook hier geldt dat zoekmachines uiteindelijk zelf bepalen hoe vaak ze langskomen.

Hiermee geef je aan wanneer de pagina is gemaakt en bij wie het auteursrecht ligt. Voorbeeld:

<meta name="author" content="roger">

Het is mij na enige research niet duidelijk of deze metatag nut heeft. Zorg in ieder geval dat je de copyright aanduidt in de paginatekst (bijvoorbeeld ‘© 2007 Frontaal.net’ in de footer) en/of gebruik een logo van Creative Commons (tenzij dat niet belangrijk voor je is).

Refresh
Dit is een veelgebruikt trucje om bezoekers door te sturen naar een andere pagina. Voorbeeld:

<meta http-equiv="refresh" content="10; url=http://frontaal.net">

Niet alleen is het onvriendelijk voor sommige bezoekers (niet iedereen heeft even snel door dat ze worden doorgestuurd), door het vele misbruik ervan stellen zoekmachines het ook niet op prijs. Beter is om ook dit via de server te regelen (verplaatste pagina’s verwijzen met een status 301-errorcode, verwijderde pagina’s met een 410-errorcode).

meta-redirect is in meerdere opzichten een slechte oplossing
Figuur 4: Vaak word je al doorgestuurd voordat je de tekst hebt kunnen lezen, zoals bij dit screenshot het geval was. (Screenshot alsnog genomen door meta-redirects uit te schakelen.)

Samenvattend

  • De enige metadata die belangrijk zijn voor je webpagina, zijn description en robots. Daarnaast is de title erg belangrijk.
  • Het aangeven van de karakterencodering, preventie van het gebruik van de browsercache en aangeven van verwijderde of verplaatste pagina’s regel je het beste via de server.
  • De rest van de metadata kun je gewoon weglaten: zonde van je tijd.

Het beste is om te zorgen dat elke pagina een passende en unieke titel en omschrijving krijgt. Alleen daarmee help je bezoekers en zoekmachines.

Welke metadata vind jij wel of niet nuttig en waarom?

Meer leesvoer

Update 28 januari 2008: suggesties van Ramon toegevoegd
Update 12 oktober 2009: tekst aangepast, Yahoo negeert nu ook de meta-keywords, net als Google.

  • http://www.monlog.nl ramon eijkemans

    Goed en uitvoerig artikel. Wellicht is een waarschuwing op z’n plaats voor degenen die hun content type willen veranderen naar UTF-8: doe het goed, want anders krijg je veel problemen. Niet alleen je html, maar ook de encodering van je bestanden zelf en zelfs (eventueel) de codering van de teksten in je database moeten omgezet worden.

    Bij het title-attribuut kun je eventueel nog toevoegen dat deze buiten uniek, ook zeer relevant moet zijn. Begin bijvoorbeeld altijd met het woord dat die betreffende pagina uniek maakt. Check dat vervolgens door in google: ‘site:je-url.nl’ in te tikken. Is zomaar een toevoeging hoor, maar ik vind dit een goed artikel!

  • http://frontaal.net Roger

    Als een seo’er het oké vindt, dan ben ik vast op de goeie weg :) Bedankt voor je compliment en input! Erg nuttig ook; heb het daarom meteen in mijn stuk verwerkt.