Le duplicate content

Les moteurs de recherche accordent une attention particulière aux contenus des pages web. Outre la surveillance de la qualité de ceux-ci, ils traquent particulièrement la présence ou l’utilisation de duplicate content. Qu’est-ce que le duplicate content ? Quelles conséquences peut-il avoir sur le référencement d’une page ou d’un site Web ? C’est ce qu’on vous propose de découvrir à travers notre article.

Le duplicate content, c’est quoi ?

Le duplicate content, ou « contenu dupliqué », fait référence au contenu d’un site internet ou d’une page web qui est reproduit à l’identique ou fortement similaire sur une ou plusieurs pages web. En clair, les mêmes blocs de textes sont recopiés sur plusieurs pages d’une même URL ou avec des URL différentes.

En matière de référencement, le duplicate content est un véritable fléau. En effet, les moteurs de recherche l’ont en horreur, car il peut être considéré comme étant un plagiat, ou une façon de tricher sur leur algorithme. C’est pourquoi les moteurs de recherche comme Google traquent et sanctionnent les sites ou pages adeptes de cette pratique.

On peut distinguer deux types de duplicate content : le duplicate content interne à un site web, et le duplicate content externe.

Le duplicate content interne à un site web

Du contenu identique sur un même site internet ? Cette idée peut sembler saugrenue, et pourtant, il n’est pas si rare d’en retrouver, notamment sur les sites d’e-commerce. C’est par exemple le cas pour les descriptions des fiches-produits sur deux pages du site. Dans ce cas de figure, le terme « plagiat » ne s’applique pas vraiment.

Il se peut également que les meta descriptions et les balises titles de vos pages soient identiques sur deux pages différentes. On peut considérer deux URL identiques comme étant de la duplication.

Le duplicate content externe

Cette fois-ci, on parle d’un contenu identique sur deux pages web différents ou sur deux sites ayant des noms de domaine différents. Le terme « plagiat » peut dans ce cas être appliqué.

Notons toutefois qu’il est autorisé de citer ses sources lors de la rédaction d’articles de blog. Les sources doivent alors être citées par les balises <blockquote>. Ainsi, Google Panda ou tout autre algorithme chargé de traquer le duplicate content sera averti que vous citez un texte. Aucun plagiat ne sera alors signalé.

Que risque-t-on avec du duplicate content

A dire vrai, on ne risque pas de pénalité avec du duplicate content, au sens premier du terme « pénalité ». En revanche le positionnement et l’indexation des contenus peuvent en être négativement impactés.

Rappelons que tout moteur de recherche a pour objectif d’apporter le résultat le plus pertinent à la requête d’un internaute. Un moteur de recherche va alors indexer des milliards de pages web comportant du contenu.

Il va ensuite mettre en avant les résultats les plus pertinents pour apporter la meilleure réponse à la requête entrée dans sa barre de recherche. Tout cela a pour but d’offrir au visiteur une expérience utilisateur optimale, afin qu’il reste fidèle au moteur de recherche en question.

Des robots d’exploration seront ainsi utilisés par le moteur de recherche pour explorer toutes les pages publiées sur internet. Un duplicate content est signalé lorsque ces robots constatent que le contenu qu’ils sont en train d’explorer existe déjà. Ils vont alors analyser les pages afin de retrouver la version d’origine.

En général, les robots évaluent les contenus des sites internet à forte popularité comme constituant le meilleur résultat. De ce fait, les autres sites web avec du duplicate content seront jugés moins pertinents, et seront alors moins bien classés dans le moteur de recherche. Et oui, ce sera aussi le cas même si le site moins populaire est la version d’origine.

Ainsi, la réalisation volontaire du duplicate content n’apporte aucun intérêt aux sites web. Heureusement, plusieurs solutions permettent de l’éviter.

Comment faire pour éviter le duplicate content ?

Pour éviter le duplicate content, vous devez soigner chaque page, chaque description. Vous devez également prioriser la qualité à la quantité. En effet, les moteurs de recherche préfèreront toujours mettre en avant les sites et les pages proposant du contenu de qualité, capables de satisfaire les requêtes des internautes.

Pour un site d’e-commerce, en ce qui concerne la composition d’une fiche-produit, proposez un contenu authentique. En d’autres termes, tâchez de ne pas reprendre mot pour mot les descriptifs de votre fournisseur.

Pour les titres de page, il faut que chaque page ait un titre différent et une balise unique. En effet, les meta descriptions et les balises identiques peuvent être considérées comme étant du duplicate content.

Le choix de votre URL canonique doit être fait avec soin : vous n’avez pas à indexer toutes vos URL. Préférez plutôt choisir une URL unique pour l’indexation par le moteur de recherche. La détection d’un contenu identique pourrait pénaliser vos URL, et les rendre moins visibles.

Enfin, il est primordial de créer un contenu unique, afin de se différencier des autres sites/pages, et d’apporter une véritable valeur ajoutée au visiteur. Cela peut être fait grâce à une stratégie éditoriale qui porte l’identité et les valeurs de votre entreprise par exemple. Cette stratégie va alors vous permettre de définir le style et le ton à employer, ainsi que les sujets à aborder.