Depuis un an, OpenAI dispose d'un outil efficace pour détecter si un texte a été généré par ChatGPT. Son utilisation pourrait s'avérer très utile dans certains cas, mais la startup débat encore de l'opportunité de le lancer.
Développé depuis deux ans et prêt depuis un an, cet outil de détection est capable de repérer, avec un taux de certitude de 99,9 %, si un texte ou une large portion de celui-ci a été produit par ChatGPT, révèle le Wall Street Journal. On imagine sans peine l'intérêt de ce détecteur pour le milieu éducatif où des élèves et étudiants ont tout de suite vu l'intérêt du service d'OpenAI pour écrire à leur place.
Lorsqu'il génère un texte, ChatGPT prédit des mots ou suites de mots qui peuvent être utilisés pour former une phrase. L'outil d'OpenAI change quelque peu la manière dont sont sélectionnés ces mots, laissant une trace dans le résultat offert à l'utilisateur. Une marque que le détecteur peut ensuite repérer. Même en paraphrasant les passages de ChatGPT, l'outil peut en déceler l'origine artificielle. Cette altération dans le fonctionnement de ChatGPT n'aurait pas d'incidence sur la qualité du texte généré.
À la suite de la publication de l'article, OpenAI a confirmé dans un billet qu'il avait bien développé de tels outils, mais qu'il continuait d'évaluer d'autres solutions. Car il est possible de tromper ce détecteur. Si l'utilisateur fait traduire dans une autre langue le texte de ChatGPT puis le remet dans la langue de départ, cela peut affecter l'analyse. Tout comme de demander à ChatGPT d'insérer un caractère spécial — comme un émoji — entre chaque mot puis de les retirer manuellement.
OpenAI dit craindre aussi que cette mise à l'index de textes sortis de ChatGPT ne jette l'opprobre sur des utilisateurs qui ont expressément besoin de l'assistant pour rédiger un texte dans une langue étrangère qu'ils ne maîtrisent pas.
Le Wall Street Journal cite un autre argument pour expliquer l'hésitation d'OpenAI à lancer cet outil : le risque de perdre un volume non négligeable d'utilisateurs. Un sondage effectué auprès d'utilisateurs fidèles à ChatGPT a révélé qu'un tiers d'entre eux quasiment seraient prêts à aller voir ailleurs si ce détecteur était mis à disposition.
Là où les tenants et les opposants à son lancement s'accordent, c'est sur la difficulté à choisir les utilisateurs qui pourraient s'en servir. Si trop peu de personnes peuvent l'avoir, l'outil perd tout intérêt. Si tout le monde y a droit, c'est le risque que son fonctionnement soit percé à jour. Il pourrait alors n'être proposé qu'à des utilisateurs qui en ont le plus besoin, comme les enseignants ou les groupes de lecture de travaux de recherche, par exemple.
Le sujet est revenu sur la table en juin sans qu'une décision soit prise par les responsables et les chercheurs d'OpenAI. Cela pourrait arriver d'ici l'automne prochain, d'aucuns chez OpenAI estimant qu'il devient urgent de proposer quelque chose, tant pour la crédibilité de la start-up que pour éviter que cela lui soit imposé par une loi.