Le 31 janvier 2023, l’OpenAI a lancé un outil de classification de textes d’IA visant à détecter si les passages ont été écrits par un humain ou un système d’IA. Ce lancement devait changer la donne en matière de détection des contenus synthétiques et aider les institutions à signaler ce type de contenu. Cependant, quelques mois seulement après sa sortie, OpenAI a brusquement abandonné l’outil en raison de son taux décevant de précision dans la différenciation des écritures humaines et des écritures de l’IA.
Le classificateur d’OpenAI et ses lacunes
L’outil de classification de texte de l’OpenAI vise à détecter les contenus générés par l’IA en analysant les caractéristiques linguistiques des passages de texte. Il attribue une « note de probabilité » pour indiquer si le système a déterminé que le texte a été écrit par un être humain ou par une IA. Après son lancement, l’outil a gagné en popularité grâce à l’intérêt croissant pour la détection de l’IA.
Cependant, quelques mois plus tard, le 20 juillet 2023, OpenAI a annoncé l’abandon du classificateur en raison de son faible taux de précision. Dans la pratique, le système a eu beaucoup de mal à différencier de manière fiable l’écriture humaine de celle de la machine. Malgré l’analyse des schémas linguistiques, le classificateur n’a souvent pas réussi à identifier correctement si les passages étaient générés par l’IA ou non. Nos recherches approfondies sur les meilleurs détecteurs d’IA ont révélé un taux de détection étonnamment faible pour l’outil déployé par Open AI.
Le défi plus large de l’amélioration des détecteurs d’IA
L’échec brutal du classificateur d’OpenAI souligne les défis permanents que pose le développement de systèmes de détection d’IA précis. Des recherches récentes ont révélé des faiblesses et des biais importants parmi les vérificateurs d’IA actuels.
Des études ont montré que ces outils étiquettent souvent de manière erronée des textes écrits par des humains comme étant générés par l’IA.
En outre, de nombreux logiciels de détection d’IA ne sont pas formés aux nouveaux LLM et sont incapables de les détecter. Ils peuvent également être facilement contournés par des outils de paraphrase tels que Quillbot.
Les progrès rapides de l’IA générative signifient également que les outils de détection sont souvent dépassés, ce qui permet de les contourner plus facilement. L’objectif principal de Winston AIest d’améliorer continuellement son modèle pour détecter les écrits de l’IA, tout en minimisant les occurrences de faux positifs.
La nécessité de meilleures solutions
Si la technologie de détection de l’IA reste d’une importance cruciale pour la responsabilisation face à la propagation des contenus artificiels, des exemples comme celui d’OpenAI montrent que la tâche n’est pas aisée. La mission principale de Winston AI est de détecter l’IA, tandis que de nombreux autres détecteurs d’IA alternatifs sont fournis dans le cadre d’un projet secondaire. L’OpenAI s’est engagée à développer des techniques de provenance plus robustes, mais l’échec rapide de son classificateur révèle qu’il reste difficile de perfectionner de tels systèmes.
Certains affirment que le rythme de développement de l’IA générative dépasse actuellement l’innovation dans les méthodes de détection, mais Winston AI dispose de loin du modèle de détection de l’IA le plus précis qui soit.
Conclusion
L’arrêt brutal du classificateur de textes d’IA d’OpenAI après seulement quelques mois démontre les défis considérables qui subsistent dans le développement d’outils de détection d’IA fiables. Leur classificateur a rapidement échoué alors qu’il visait à différencier l’écriture humaine de l’écriture mécanique en analysant les schémas linguistiques.
De grandes entreprises à la tête du mouvement de l’IA, dont Amazon, Anthropic, Google, Inflection, Meta, Microsoft et Open AI, ont rencontré l’administration Biden-Harris et se sont engagées volontairement à favoriser le développement d’une IA sûre, sécurisée et transparente. Il s’agit notamment d’ajouter des filigranes afin de garantir la capacité de détection de l’IA, en particulier des contrefaçons profondes.
À mesure que le contenu artificiel se répand, le développement d’une technologie de détection de l’IA plus robuste devient de plus en plus crucial pour le maintien de la transparence et de la confiance. Bien qu’ils soient loin d’être parfaits, il est essentiel d’améliorer ces outils grâce à des recherches et des progrès continus.
FAQ
Le classificateur de texte d’OpenAI était un système d’IA lancé le 31 janvier 2023 et destiné à détecter si des passages de texte ont été écrits par un humain ou par un système d’IA. Il a été conçu pour analyser les caractéristiques linguistiques des écrits et attribuer une « note de probabilité » pour indiquer si le contenu a été généré par l’IA. L’objectif était de contribuer à répondre au besoin croissant d’identifier les contenus artificiels à mesure que les systèmes d’IA générative deviennent plus avancés.
OpenAI a abandonné son classificateur de texte en juillet 2023, quelques mois seulement après son lancement, en raison de son taux de précision décevant pour différencier les écrits humains de ceux de l’IA. Dans la pratique, le système a eu du mal à distinguer de manière fiable les contenus rédigés par des humains de ceux rédigés par des machines grâce à son analyse linguistique.
Bien qu’il soit difficile de mettre au point une détection précise de l’IA, cela reste d’une importance capitale pour l’obligation de rendre des comptes à mesure que le contenu artificiel se répand. Des outils comme celui d’OpenAI, malgré leurs défauts, visent à maintenir la transparence sur la provenance des textes et autres médias. À mesure que l’IA générative progresse, de meilleures solutions sont essentielles, même si les progrès sont lents.
Les grandes entreprises d’IA se sont engagées à promouvoir un développement sûr et transparent de l’IA, notamment en améliorant les capacités de détection du contenu de l’IA. Les recherches en cours visent également à renforcer les outils de détection et à minimiser les fausses identifications de contenus créés par l’homme. Toutefois, le perfectionnement de ces systèmes reste un défi, car les capacités de l’IA se développent rapidement.