Roman accusé d’être écrit par ChatGPT : ces indices troublants à traquer… et la vraie limite des détecteurs d’IA sur un livre entier

Par Paul Graph - Publié le

Sur les réseaux, chaque nouveau livre peut être accusé d’avoir été écrit par une IA, au risque de briser la confiance entre lecteurs et auteurs. Quels indices observer et quels pièges éviter avant de croire ou d’alimenter la rumeur ?

Roman accusé d’être écrit par ChatGPT : ces indices troublants à traquer… et la vraie limite des détecteurs d’IA sur un livre entier

Un roman à peine sorti, et déjà les commentaires s’enflamment : « C’est écrit par ChatGPT, c’est sûr ». Sur les réseaux sociaux, la rumeur d’un roman écrit par l’IA suffit désormais à jeter un doute sur l’auteur, l’éditeur et même le prix littéraire obtenu. L’affaire de l’écrivaine japonaise Rie Kudan, qui a reconnu avoir utilisé ChatGPT pour une partie de son livre récompensé par le prix Akutagawa, a encore entretenu cette méfiance.

Entre œuvres assumées comme « co-écrites » avec une intelligence artificielle et faux livres générés à la chaîne pour être vendus en ligne, le lecteur se retrouve face à une question simple mais angoissante : comment savoir si un roman a été écrit par une IA ou si ce n’est qu’une rumeur de plus ? La réponse n’est ni évidente ni binaire, et c’est justement là que ça devient intéressant.

Pourquoi il est si difficile de trancher noir sur blanc

Premier point à avoir en tête : même les spécialistes de la détection de contenu généré par IA restent prudents. La Fondation Mozilla rappelle que « il n’est pas toujours possible de savoir si une IA a écrit un texte », en expliquant que les outils disponibles ne fournissent que des probabilités et non des preuves. Le site Wikipédia, dans son article consacré à la « détection de contenu généré par intelligence artificielle », insiste sur le fait que ces systèmes peuvent se tromper dans les deux sens.

L’exemple de Rie Kudan illustre aussi une réalité plus nuancée que le fantasme du roman 100 % robotique. L’autrice a expliqué que ChatGPT avait contribué à environ 5 % de son texte, avant de préciser que cela correspondait plutôt à l’équivalent d’une page sur 143, pour des passages où un personnage discute avec une IA. Un même livre peut donc mêler écriture humaine, suggestions générées, puis réécriture, ce qui complique beaucoup toute tentative de verdict catégorique.

Les indices dans le texte : ce que votre lecture peut vraiment révéler

Face à un livre « suspect », la première piste reste la lecture attentive. L’agence éditoriale Squid Impact décrit les textes d’IA comme souvent très lisses, avec « un style qui paraît correct, mais sans anecdotes personnelles, sans expérience vécue et avec peu de détails concrets ». Sur un roman entier, cela peut se traduire par des chapitres qui se ressemblent beaucoup, un rythme de phrases très régulier et des émotions décrites de façon générale, sans ces petites aspérités qui trahissent d’habitude la vie d’un auteur.

Autre signe fréquemment observé par des formateurs comme ObjetConnecte : un vocabulaire soutenu mais étonnamment uniforme, des phrases bien structurées mais assez courtes, et surtout des formulations passe-partout. Quand les débuts de chapitres pourraient convenir à n’importe quel autre livre du même genre, quand les personnages semblent interchangeables et que les lieux manquent de détails précis, certains y voient la patte d’un modèle de langage. A l’inverse, les « fausses notes » humaines, les tics d’écriture, les prises de position très personnelles sont plus difficiles à simuler de manière crédible sur des centaines de pages.

Outils de détection, rumeurs et rôle du lecteur : jusqu’où aller ?

Il existe aujourd’hui des détecteurs de texte IA comme GPTZero ou Copyleaks, qui s’appuient sur des mesures de « perplexité » (le degré de surprise du modèle face au texte) et de « burstiness » (la variabilité entre les phrases). Certains services commerciaux annoncent des taux de précision très élevés, parfois « jusqu’à 99 % », mais leurs résultats sont obtenus dans des conditions de test très cadrées. OpenAI elle-même avait mis en ligne un classificateur qui ne parvenait à identifier comme « probablement écrits par une IA » qu’une partie limitée des textes générés, tout en produisant des faux positifs sur des écrits humains.

Pour un roman publié, ces limites sont encore plus marquées : le texte peut avoir été relu, coupé, réécrit par l’auteur ou par un éditeur, ce qui brouille les signaux détectables. Des travaux de recherche montrent certes qu’il est possible d’atteindre de bons scores sur des corpus courts et contrôlés, mais cela ne se traduit pas par une certitude juridique sur un livre entier trouvé en librairie. En pratique, les experts recommandent d’utiliser ces détecteurs comme un indicateur parmi d’autres, jamais comme seule « preuve » pour accuser un auteur d’avoir triché.

Reste alors tout ce qui entoure le texte. Quand un inconnu publie en auto-édition des dizaines de « romans » en quelques mois, dans des genres très variés, sans aucune présence littéraire antérieure, le lecteur peut légitimement se poser des questions. Des enquêtes ont déjà révélé des ouvrages générés par IA attribués abusivement à des personnalités, vendus sur les plateformes sans leur accord, ce qui alimente la méfiance. A l’opposé, certains écrivains et éditeurs choisissent d’indiquer clairement l’usage d’outils d’IA dans les remerciements ou les interviews, jouant la carte de la transparence.

Au bout du compte, la seule chose que vous puissiez vraiment faire en tant que lecteur, c’est croiser ces différents signaux : le style du roman, la cohérence de l’intrigue, le profil de l’auteur, le discours de l’éditeur et, éventuellement, les résultats prudents d’un détecteur. Ni panique, ni naïveté : il s’agit moins de traquer chaque phrase générée que de vérifier si l’œuvre que vous achetez et prenez le temps de lire correspond bien à la promesse affichée sur la couverture.

En bref

  • À l’heure où l’IA générative et les cas médiatisés comme celui de Rie Kudan bousculent le monde du livre, de plus en plus de romans sont soupçonnés d’avoir été écrits par une machine.
  • L’article explique comment lire un roman suspect en repérant certains indices stylistiques, en combinant ces observations avec les détecteurs d’IA et en tenant compte des limites techniques de ces outils.
  • Entre faux livres générés à la chaîne et œuvres co-écrites avec IA, il propose une méthode nuancée pour enquêter sans chasse aux sorcières et exiger davantage de transparence éditoriale.