David De Azevedo 10 janvier 2025 IA

Tout savoir sur les détecteurs d'IA

Avec l’explosion des IA génératives, produire du contenu n’a jamais été aussi facile. Cette accessibilité a conduit à un véritable spam sur le web de contenus variés générés par intelligence artificielle : images, contenus textuels, posts sur les réseaux sociaux, playlists musicales, et bien plus encore. Certaines personnes en dépendent même aujourd’hui pour leurs besoins les plus simples : rédaction d’e-mails, de messages, de rapports, de dissertations, etc.

Face à ces nouveaux comportements et usages, une question se pose lorsque nous consommons un contenu : avons-nous affaire à une création humaine ou générée par une machine ? Pour y répondre, un nouveau type d’outil a vu le jour : le détecteur d’IA.

Comment ces détecteurs fonctionnent ils ? Sont-ils fiables ? Et quels sont les outils les plus performants à ce jour ? J’y réponds dans cet article.

Détecteur d’IA : une réponse aux contenus générés par IA

Aujourd’hui, de plus en plus de contenus sont générés par des intelligences artificielles. Les détecteurs d’IA sont une réponse à cette nouvelle réalité. Leur rôle est simple : analyser un contenu pour vérifier s’il a été créé par un humain ou par une machine.

Ils permettent de confirmer si un contenu est organique, authentique et non le résultat d’un algorithme génératif, souvent utilisé pour produire du contenu en masse et peu qualitatif.

Ils trouvent actuellement leur utilité dans des domaines variés, entre autres :

  • Éducation : pour vérifier le travail des étudiants ;
  • Monde professionnel : par les ressources humaines pour vérifier CV et lettre de motivation d’un candidat ;
  • Journalisme : pour vérifier l’authenticité des sources en ligne ;
  • Modération : commentaires sur les réseaux sociaux, blogs, etc.

Cela dit, leurs usages vont certainement s’intensifier à mesure que l’écosystème Internet continue d’être surchargé de contenus générés par des IA. En effet, selon une étude réalisée par une équipe de chercheurs d’Amazon Web Services publiée en juin 2024, on estime que 57 % du contenu textuel que l’on trouve déjà sur Internet serait rédigé, totalement ou partiellement, par des intelligences artificielles, renforçant la théorie d’un « dead Internet » à l’aube de 2025.

Dans ce contexte, il est possible d’imaginer que de plus en plus d’internautes chercheront à utiliser des détecteurs d’IA pour vérifier l’authenticité des contenus qu’ils consomment en ligne.

Fonctionnement d’un détecteur d’IA

Les détecteurs d’IA sont capables de faire la distinction entre un contenu humain et IA grâce au machine learning.

Pour faire simple, ils sont à la fois :

  • Entraînés à partir de contenus créés par des IA comme ChatGPT, Gemini, Claude etc. Ainsi, ils peuvent identifier les schémas caractéristiques propres à ces modèles, comme les structures répétitives ou les enchaînements trop prévisibles.
  • Alimentés par des contenus produits par des humains, qui servent de référence en termes de style, tonalité, nuances, etc. Ces détecteurs s’appuient sur une base de données alimentée de contenus multiples, divers et variés. Ces données couvrent un large éventail de domaines (éditorial, artistique, professionnel, académique, etc.) permettant une analyse adaptée à différents contextes.

Grâce à cette base de données qui agrège des contenus IA et humains, combinée à des algorithmes d’apprentissage automatique, les détecteurs d’IA parviennent donc à distinguer les créations humaines de celles issues des machines.

Pour arriver à une conclusion, ils se basent sur un ensemble de facteurs analysés :

  • Sémantique : analyse de la richesse lexicale, les IA ayant tendance à se répéter.
  • Orthographe, syntaxe et grammaire : les IA font rarement des fautes, contrairement aux productions humaines qui comportent souvent quelques coquilles.
  • La perplexité : mesure de la prévisibilité d’un contenu, caractéristiques des textes générés par les intelligences artificielles.
  • L’éclatement : niveau de variation dans la longueur et structure des phrases.
Infographie - fonctionnement d'un détecteur d'IA
Infographie – fonctionnement d’un détecteur d’IA

Est-ce que les résultats sont fiables ?

À mon sens, les détecteurs d’IA ne sont pas encore totalement fiables. Je m’explique :

Beaucoup de faux positifs

Souvent, les détecteurs d’IA produisent ce qu’on appelle des « faux positifs ». C’est à dire qu’ils vont considérer qu’un contenu a été produit par une IA alors qu’il est bien d’origine humaine.

En cause probable : les facteurs de perplexité et d’éclatement pris en compte par l’outil dans son analyse. Par exemple, des contenus factuels ou rédigés avec des phrases courtes et simples peuvent être considérés à tort comme prévisibles par les détecteurs. On peut retrouver cela dans des domaines précis, comme la santé, où le ton est souvent très factuel, direct et concis (lorsqu’il s’agit de décrire une pathologie, ses symptômes, ses traitements, etc. le contenu sera forcément « prévisible » et « uniforme »).

Des faux négatifs également

Certains détecteurs d’IA manquent de précision dans des langues autres que l’anglais. Ainsi, un texte en français peut être jugé à tort comme 100 % humain simplement parce que l’outil n’a pas été suffisamment entraîné pour cette langue, alors qu’il peut avoir été généré dans son intégralité par un chatbot IA.

Des résultats variables d’un détecteur à l’autre

Les résultats varient d’un détecteur à l’autre en raison de différences dans leur base d’entraînement ou les critères qu’ils analysent. Cette disparité complique l’évaluation de leur fiabilité.

Résultats différents pour chaque détecteur d'IA
Des résultats différents pour un même contenu analysé

En conclusion, ces outils ne peuvent pas encore être considérés comme entièrement fiables pour le moment. Toutefois, il faut remettre les choses dans le contexte actuel : il s’agit d’une technologie émergente, qui évolue rapidement grâce aux avancées en IA et machine learning.

Quels sont les outils disponibles ?

Après avoir essayé quelques détecteurs d’IA, voici une liste d’outils sur lesquels j’ai eu les meilleurs résultats, gratuits comme payants :

Outils gratuits / freemium

  • Quillbot : offre des résultats fiables et fonctionne bien avec des contenus en français. Il n’y a pas de limites sur le nombre de mots ou de caractères à analyser et il permet aussi la reformulation du contenu, la traduction en plusieurs langues et la correction grammaticale. Des extensions sont disponibles pour Chrome, Edge et Word, ce qui le rend très accessible.
  • Isgen : fonctionne bien avec les contenus en français, mais il est plus limité dans le nombre de mots et de caractères à analyser par rapport à Quillbot (12 000 mots ou 6 000 caractères maximum par scan). Il ne propose pas d’options supplémentaires de traduction, de réécriture ou de correction.

Outils payants

  • Lucide : l’outil « Made in France », et donc naturellement très efficace pour les contenus en français. Ce détecteur va plus loin en identifiant les contenus hybrides (IA + humain) et en précisant leur proportion tout en donnant une interprétation. Il analyse aussi la qualité du contenu généré, pouvant distinguer une IA produisant un contenu médiocre d’une IA plus performante. En plus de la détection, on y trouve aussi un détecteur de plagiat et une API. Chaque analyse coûte des crédits, qui peuvent s’acheter en « one shot » ou via un abonnement.
  • Winston.ai : présenté comme le « détecteur d’IA le plus fiable », Winston.ai analyse le contenu phrase par phrase et détecte les modèles IA avec une grande précision. Il inclut aussi des fonctions de détection de plagiat et de contenu dupliqué, ce qui en fait un outil complet pour l’analyse de textes. Il peut aussi délivrer une certification web attestant que le contenu d’un site est majoritairement humain (certification HUMN-1).

De Azevedo David, consultant freelance en webmarketing

Depuis 2017, j’aide les entreprises à gagner en visibilité sur le web en construisant avec elles des stratégies webmarketing adaptées à leurs besoins.

Mon but est simple : vous accompagner de façon personnalisée pour mettre en place des actions de référencement efficaces, pensées pour vos objectifs. Mon parcours, entre agences, annonceurs et projets variés (médico-social, éducation, banque, assurance, loisirs, immobilier…), m’a permis de développer une vraie polyvalence et une bonne compréhension des défis propres à chaque secteur.

Besoin d’améliorer votre présence en ligne ? Je suis disponible pour en discuter !

Contact
De Azevedo David - Consultant Webmarketing
Vous seriez aussi intéressé par