Lutter contre le duplicate content

5 astuces pour éviter le duplicate content

Le duplicate content nuit à la qualité de votre site. Vous serez pénalisés aussi bien par vos visiteurs que par les moteurs de recherche comme Google si votre site propose du contenu dupliqué. Vos visiteurs préféreront retourner sur un site proposant un contenu unique. De leur côté, les moteurs de recherche, afin de préserver la qualité de leurs résultats, vont pénaliser vos pages en mettant en avant des sites proposant un contenu non dupliqué. Il est donc important dans une stratégie SEO de mettre en place des solutions pour lutter contre le duplicate content.

Duplicate content : définition

Le contenu dupliqué, ou duplicate content, désigne un contenu présent en plusieurs exemplaires. Il existe différentes formes de duplicate content qui peuvent se retrouver en interne ou sur un nom de domaine différent.

Plusieurs noms de domaines peuvent pointer sur un même contenu. Il existe deux explications possibles : le contenu a été copié par une tierce personne ou alors le site en question est accessible via différents noms de domaines.

Il peut également s’agir d’une longue citation faite sur un site externe ou même sur votre site. Si cette citation représente l’essentiel du contenu sur la page, elle sera détectée comme une copie de la page originale.

Exemple : Sur un blog comme WordPress, la page d’accueil liste vos différents articles. Si vous ne tronquez pas le texte affiché, votre page d’accueil, vos pages de tags, vos pages catégories et votre page d’articles seront considérées comme des copies.

Une autre possibilité vient des URLs : pour Google chaque URL correspond à une page différente. Ainsi, si plusieurs URLs pointent vers un même contenu il pensera que ces pages sont des copies. Ce cas de figure peut, par exemple, arriver pour votre page d’accueil : si elle est accessible via http://monsite.com ou http://www.monsite.com ou encore http://www.monsite.com/index.php ces 3 URLs seront considérées comme des copies.

Enfin une autre forme de duplicate content vient des balises title et meta description. Si plusieurs pages utilisent ces balises à l’identique, les moteurs de recherche penseront à une forme de contenu dupliqué. Cette forme de duplicate content est également nuisible pour vos lecteurs : il s’agit des premières informations lisibles dans un moteur de recherche, si elles ne sont pas adaptées au contenu de votre page, vous ne susciterez pas l’intérêt de l’internaute.

Le duplicate content nuit à la qualité de vos contenus : il est un problème pour vos lecteurs mais également pour les moteurs de recherche. Afin de préserver des résultats de qualité, il faut noter que les moteurs de recherche luttent contre les doublons. Si votre site est victime de duplicate content il sera donc pénalisé.

5 conseils pour favoriser un contenu unique

Le contenu dupliqué nuit à la qualité de votre site. Il est donc primordial de mettre en place des solutions pour rendre vos contenus uniques. Voici quelques conseils pour vous aider à lutter contre le duplicate content :

1. Soignez vos balises title et meta description

La première chose à faire est de définir des balises title et meta description différentes pour chaque page. Si ces balises se répètent alors que le contenu des pages est différent, vos pages seront d’ores et déjà pénalisées par les moteurs de recherche. Par conséquent, prenez un minimum de temps pour les rédiger et ainsi proposer un contenu unique et décrivant le mieux possible le contenu de votre page.

2. Définissez une URL pour un contenu

Il est possible de rendre votre contenu accessible par différents chemins. Toutefois, il faut penser à indiquer lequel de ces contenus doit être indexé. Pour cela, vous pouvez utiliser la balise meta robots avec l’attribut rel= »nofollow » pour indiquer au moteur de recherche de ne pas suivre une URL. Ainsi pour un même contenu, l’URL ne possédant pas l’attribut rel= »nofollow » sera privilégiée.

S’il s’agit d’un contenu qui existait déjà mais que vous souhaitez modifier son URL, pensez à utiliser une redirection 301. Il s’agit d’une redirection permanente : elle permet d’indiquer que le contenu à changer d’adresse. Ainsi si la précédente URL était indexée, votre nouvelle URL pourra être indexée sans être considéré comme du duplicate content.

3. Indiquez l’URL canonique

L’en-tête de votre page, la partie <head>, contient de nombre balises. Parmi ces balises, il ne faut pas négliger celle-ci : link rel= »canonical ». Elle permet d’indiquer au moteur de recherche l’adresse du contenu source. Elle vous sera notamment utile face aux agrégateurs de contenu. Ces sites reprennent les articles de différents sites, souvent en totalité, en copiant le code. Grâce à l’url canonique, les moteurs de recherche sauront que votre article contient le contenu d’origine.

4. Renseignez le fichier Robots.txt

Le fichier robots.txt est le premier fichier que les robots des moteurs de recherche consultent lorsqu’ils se rendent sur un site. Ce fichier permet notamment d’indiquer aux moteurs de recherche de ne pas parcourir certaines pages et ainsi de ne pas les indexer. Pour cela, il vous faudra utiliser l’instruction Disallow pour chaque page à exclure.

Lorsque votre contenu est accessible via plusieurs URLs mais que vous souhaitez en indexer une seule, il est également possible d’utiliser la balise meta robots. Elle permet de définir si la page doit être indexée ou non. Ainsi il faudra jongler entre les valeurs index et noindex pour vous assurer qu’un contenu ne soit indexé qu’une seule fois.

5. Dernier recours en cas de duplicate content

Si malgré toutes les précautions prises vous êtes encore confrontés au duplicate content à cause d’un site externe, il vous faudra trouver une solution à l’amiable avec le propriétaire de ce site. Pour cela rendez-vous sur le site qui copie votre contenu et cherchez un moyen de contacter le webmaster. Si vous lui expliquez la situation, vous trouverez surement un arrangement pour qu’il supprime le contenu copié. Si vous n’arrivez pas à vous entendre avec le webmaster du site en question, vous pouvez également demander à Google la suppression d’un contenu dans son moteur de recherche.

N’oubliez jamais, Content is King – Et ça, l’article de la Licence e-MAT vous dévoile pourquoi !

Référenceur & rédacteur web de la promo 2011/2012. Actuellement référenceur dans une agence de communication à Nice.

8 commentaires

  • HenriBar5

    7 mars 2012, 16 h 33 min

    Merci pour ces super infos!
    En cas de DC, ne vaut-il mieux pas modifier un peu le contenu, histoire de passer inapercu…au moins chez Google? Sinon concernant le contenu, pensez-vous que les sites de redac web sont corrects…ou c´est à éviter? Car j´essaie actuellement independent-publishing.com, et cele ne me parait pas trop mal…. Qu´en dites vous?

  • Armand

    7 mars 2012, 19 h 09 min

    S’il s’agit de texte, effectivement mieux vaut le modifier. Cependant dans certains cas, comme les pages tags ou catégories sur des blogs comme WordPress, modifier le contenu n’est pas vraiment possible alors il faut trouver des techniques pour contourner ça.
    Pour la 2e question, je dirai que tout dépend de qui est derrière le site, c’est au cas par cas. S’ils offrent du contenu de qualité alors je pense que ça peut être une solution pour avoir un contenu adapté au web.

  • Nabil

    16 juillet 2012, 11 h 32 min

    merci pour cet article trés instructif.
    qu’en est il des articles de presse ? j’ai constaté que des sites réputés font du copier coller d’articles en citant la source et en pointant vers l’url de l’article original.
    Merci

  • Kalyss

    19 juillet 2013, 13 h 53 min

    Bonjour,

    Merci pour cet article qui m’éclaircie sur le sujet!

    Je suis styliste et viens de lancer mon site. Je suis sjustement en train de rédiger mes balises sur prestashop.
    J’ai une question, j’ai 3 balises à remplir
    Tittle
    Méta description
    pour ses 2 ça va grâce à votre article!
    En revanche pour la dernière balise « mots clés » j’ai des produits qui ont les mêmes caractéristiques type: jupe longue, jupe noire, jupe femme
    du coup est-il déconseillé d’utiliser des mots clés similaire sur cette 3ème balise aussi?

    Merci beaucoup de votre aide je suis plus artiste que geek 😉

  • julien

    19 août 2013, 12 h 47 min

    il y a un site pas mal pour checker le duplicate content, cest

    duplicate-content.co

  • MIRIBEL

    10 mars 2015, 14 h 51 min

    Bonjour,
    Que faire pour les annonces immobilières qui sont diffusées simultanément sur des centaines de sites ? Ne vaudrait-il pas mieux étaler cette diffusion dans le temps ? Merci

  • Bruce

    6 janvier 2016, 19 h 24 min

    Pour ceux qui sont intéressés nous proposons un outil de simple et efficace de vérification de duplicate content à l’adresse suivante http://duplicate.primaweb.fr.

Les commentaires ne sont pas autorisés