La balise Meta robots

La balise Meta robots est une balise HTML indispensable pour optimiser une indexation. Elle fournit des directives aux crawlers des moteurs de recherche et indique si une page peut être indexée ou pas. La maîtrise de cette balise est donc essentielle en SEO. Dans cet article, on vous explique tout ce qu’il y a à savoir sur la balise Meta robots.

Définition d’une balise Meta robots

La balise Meta robots se place dans l’entête du code d’une page. Elle a pour principal rôle de fournir des indications précises aux moteurs de recherche sur comment ils doivent procéder à l’exploration et à l’indexation du contenu d’une page web.

De par sa fonction, elle influence donc considérablement la visibilité et l’indexation SEO de chaque page. Il faut toutefois apprendre à utiliser la balise Meta robots en connaissance de cause.

 Il existe en effet des balises dont les directives empêchent l’apparition du contenu dans les résultats des moteurs de recherche. C’est pourquoi vous devez prendre connaissance des différentes directives existantes.

Les différentes directives de la balise Meta robots

Chaque page d’un site web peut avoir une balise Meta robots différente. Elle peut également être constituée d’une directive unique, ou de plusieurs directives, afin de donner des instructions plus précises aux moteurs de recherche. Voici donc les directives les plus importantes à connaitre.

Noindex et index

Avec la directive Noindex, vous indiquez aux bots qu’ils doivent ignorer la page, et qu’elle ne doit pas figurer dans leurs résultats. On l’utilise généralement pour empêcher l’indexation d’une page ayant un contenu dupliqué ou non finalisé. Cela évitera alors de se faire pénaliser par Google Panda.

La directive index donne l’instruction inverse : elle informe aux moteurs de recherche que l’url peut être indexée. A dire vrai, tant que vous ne précisez pas de consigne contraire (noindex), le spider va crawler la page par défaut. Il n’est donc pas absolument nécessaire de mentionner cette directive.

Nofollow et follow

La directive nofollow indique aux Google Bots s’ils peuvent ou non prendre en compte et suivre les liens figurant sur une page, notamment parce qu’ils n’ont aucune autorité ou aucun poids. En cas d’absence de directive nofollow, l’instruction est traduite en follow. Vous donnez ainsi aux robots l’autorisation de suivre tous les liens se trouvant dans votre contenu.

None et all

Au sein de la balise Meta robots, la directive none donne comme instruction aux robots SEO de totalement ignorer la page. Cette dernière ne sera donc pas indexée dans les SERPs. De même, les liens vers laquelle la page pointe ne seront pas suivis.

La directive All indique quant à elle aux bots qu’ils peuvent indexer la page et explorer les liens qu’elle contient. On peut ainsi la considérer comme étant l’équivalent des directives index et follow.

Noarchive et archive

La directive noarchive demande aux spiders de ne pas mettre la page en cache. En mettant cette instruction dans l’entête HTML, le lien en cache de votre document ne sera pas affiché dans les SERPs.

La directive archive ou l’absence de la directive noarchive indique que vous souhaitez que votre lien mis en cache soit accessible par les moteurs de recherche. Pour le moteur de recherche Bing, les directives à utiliser sont cache et nocache, au lieu de archive et noarchive.

Nosnippet et max-snippet

L’ajout de la directive Nosnippet en guise de balise Meta robots indique aux robots SEO de ne pas indexer les snippets dans les résultats de recherche, et de ne pas les mettre en cache. Cette directive permet ainsi de ne pas afficher la description de votre page dans les SERPs.

La max-snippet vise quant à elle à limiter la longueur de l’extrait à afficher dans les résultats de recherche. Elle s’exprime sous forme d’une valeur correspondant au nombre de caractères qui sera affiché dans votre méta-description.

Notranslate

Lorsqu’un internaute émet une requête, il arrive que Google affiche un lien menant vers la version traduite d’une page donnée. L’affichage de ce lien de traduction pour votre page dans les résultats de recherche peut être interdit en utilisant la directive notranslate.

Unavailable_after:{date}

Unavailable_after est une instruction qui indique aux spiders qu’ils peuvent indexer le contenu dans les SERPs, mais seulement à une heure et une date données. En dehors de la date spécifiée, le contenu ne sera plus accessible. Cette balise Meta robots peut par exemple être utilisée dans le cadre d’une vente flash par exemple.

Les raisons d’utiliser une balise Meta robots qui empêche l’indexation d’une page

En général, on cherche plutôt à ce que nos pages apparaissent dans l’index des moteurs de recherche et figurent dans leurs résultats afin de gagner en visibilité. Mais il existe toutefois des ressources de contenus dont l’indexation n’est pas nécessaire ou pas souhaitable. C’est notamment le cas pour :

  • les pages dupliquées
  • les pages non finalisées
  • les documents confidentiels
  • les contenus à faible valeur ajoutée

L’ajout d’une balise Meta Robots appropriée permet alors de préserver la qualité de votre site aux yeux des robots SEO.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *