Le duplicate content (en anglais), c’est du contenu dupliqué, c’est-à-dire des copies de vos documents et pages web, que d’autres copient collent et s’approprient sur leur propre site, souvent sans en citer l’auteur.
Le duplicate content, c’est con, car ça peut pénaliser l’auteur originel au niveau de Google (même si apparemment, Google sait filtrer ce genre de choses) et ça ne permettra jamais à un site qui pratique cette technique de copie, de ressortir efficacement. Bref, c’est perdant perdant des 2 côtés. (sauf dans certains cas bien tordus ;-)).
Essai avec l’un de mes articles
Tout ça pour dire que si vous faites la chasse au contenu qu’on vous vole agrège, il existe un petit soft Windows qui s’appelle Desktop Plagiarism Checker, qui permet simplement en lui donnant un court extrait de votre contenu, de trouver qui sont les pompeurs.
Pour cela, Plagiarism checker utilise Bing, Yahoo et Google et si vous avez Tor, vous pouvez lui dire de passer par ce dernier, histoire d’anonymiser (relativement, on est d’accord) vos vérifications. Il est aussi possible de chercher les plagiats sur Google Scholar et Google Books… Pratique pour voir sur quels auteurs sera pompé le prochain best-seller de Frédéric.
Plagiarism checker propose 2 types de vérification… La vérification « exacte »… mot pour mot donc. Et la vérification « normale », c’est-à-dire un peu plus souple sur les tournures de phrase.
Les profs utilisent aussi souvent ce genre de logiciels pour détecter les tricheurs (ou plutôt les feignants qui ne savent pas reformuler).
Plagiarism propose aussi une version en ligne qui permet (en plus) d’envoyer curement des fichiers Word, txt…etc. ou d’entrer des URL pour en vérifier le contenu.
Seul hic avec le logiciel Windows et le site, c’est qu’il faut s’inscrire pour en profiter pleinement. Bon, c’est gratuit et ça prend 30 secondes, mais quand on a la flemme …