Le Noindex

En SEO, il est possible d’empêcher l’indexation d’une page par les robots des moteurs de recherche en utilisant la balise noindex. Comment fonctionne cette instruction ? Et quel pourrait bien être l’intérêt d’empêcher une page d’être indexée ? Vous trouverez les réponses à ces interrogations dans la suite de notre article.

Qu’est-ce que le noindex

Noindex est une instruction SEO indiquant aux robots des moteurs de recherche de ne pas indexer une page web spécifique ou une ressource sur un site internet. En effet, certaines pages n’ont parfois pas besoin d’être indexées. C’est notamment le cas des pages avec un contenu non finalisé ou dupliqué.

Cette instruction se situe au sein de l’en-tête HTTP ou de la balise Meta Robots. Elle indique ainsi aux robots d’exploration qu’il ne faut pas qu’ils rajoutent la page spécifiée à leur index. Ainsi, les spiders ne vont pas afficher l’URL en question au sein de leurs pages de résultats.

Comment mettre en place la balise meta noindex

Les balises meta robots dont fait partie le noindex envoient des directives aux robots SEO des moteurs de recherche. Ils leur indiquent ce qu’ils peuvent faire ou ne pas faire. Ainsi, lorsque intègre la balise noindex au code source d’une page, elle bloque l’accès aux crawlers.

Les robots ne vont donc prendre aucune des informations présentes sur la page en question en compte. Même les composants et les instructions HTML comme la balise Title, la Meta Description, la balise Canonical ou autres directives incluses dans le code source ne seront considérés. En d’autres termes, aux yeux des moteurs de recherche, la page devient comme inexistante.

Pour empêcher les robots des moteurs de recherche d’indexer une page particulière, vous devez intégrer la balise meta noindex dans le code source de la page en question, notamment dans le champ (en-tête), et l’ajouter aux autres metadonnées. Le tag obtenu sera alors comme ceci :

<meta name= »robots » content= »noindex » />

Une fois cette balise mise en place, les robots ne vont plus indexer le contenu de la page, rendant alors ce dernier inaccessible par les SERPs.

Quelle est son utilité ?

En général, lorsqu’on crée un site web, on cherche à y attirer du trafic. Pour ce faire, on fait en sorte que les pages de son site soient bien visibles dans les résultats des moteurs de recherche, notamment en travaillant leur référencement naturel (SEO).

Et pourtant, on vient de voir que la balise noindex permet d’empêcher l’indexation d’une page, et donc de faire en sorte que celle-ci ne soit pas accessible par le public via les résultats des moteurs de recherche. Quel intérêt pourriez-vous donc avoir à cacher une ou plusieurs pages de votre site internet ?

En pratique, même si on recherche un maximum de visibilité pour la majorité de nos pages, certaines ressources de notre site peuvent être inutiles, voire même lui être nuisibles en termes de référencement. Ainsi, l’utilisation de la balise noindex permet d’empêcher l’accès des robots à ces ressources et l’archivage de ces informations.

L’utilisation du noindex dans des contextes particuliers offre plusieurs avantages :

  • Il permet de garantir la discrétion des informations et des données que l’on ne veut pas rendre visible dans les résultats des moteurs de recherche.
  • Il aide à optimiser le budget du crawl. En effet, en utilisant la balise noindex sur les ressources inutiles, les robots se concentreront toujours sur les ressources ayant le plus de valeur, ce qui leur fait gagner en efficacité.

L’importance du noindex pour le référencement

La directive noindex peut être bénéfique en termes de référencement, puisqu’elle offre une protection contre le duplicate content. On sait tous que les moteurs de recherche pénalisent les pages contenant des parties dupliquées.

Il est donc important d’être en mesure d’influencer l’indexation des pages. Notons que l’ajout de la directive « follow » dans le tag permet d’autoriser les robots SEO à suivre les liens dans les pages non-indexées.

De nombreux CMS ont tendance à créer une grande variété de pages d’archives automatiquement. Or, ces pages d’archives peuvent potentiellement être intégrées dans l’indexation si l’on ne donne pas d’instruction contraire.

Les robots peuvent alors dans des cas extrêmes considérer ces méthodes d’immersion dans l’indexation comme étant des spams. Afin d’éviter de telles confusions, il serait alors judicieux d’utiliser la balise noindex sur ces pages d’archives.

Le noindex peut aussi être d’une grande utilité pour relancer une page ou lors du chargement de la nouvelle version d’une page. Il est alors possible de tester en direct la fonctionnalité d’une nouvelle page. Aucun risque alors que certains domaines ne soient immédiatement indexés par un moteur de recherche.

Dans ce cas de figure, il ne faut pas oublier de retirer la balise noindex du code source après la relance, afin que les robots d’exploration puissent indexer la page. Les URLs indexés figureront alors bien dans les classements des moteurs de recherche.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *