Certaines personnes sollicitent l’IA pour des recettes de cuisine, d’autres pour rédiger des comptes rendus ou accomplir de petites tâches du quotidien. Mais derrière ces usages apparemment anodins, beaucoup d’utilisateurs se confient à l’intelligence artificielle et partagent des informations personnelles, persuadés que leurs échanges resteront strictement privés.

Or, plusieurs de ces conversations ont récemment été divulguées, mettant au jour des milliers d’échanges avec des chatbots. Le 30 juillet, le magazine américain Fast Company révélait que ChatGPT, très populaire, était concerné. Quelques jours plus tard, 404Media annonçait avoir consulté plus de 130 000 pages archivées de discussions provenant d’autres plateformes comme Grok ou Claude.

d’IA. Plusieurs chatbots offrent une fonction « partager » qui génère un lien permettant de transmettre la conversation à un tiers. Dans certains cas, ces liens n’étaient pas sécurisés et pouvaient être indexés par des moteurs de recherche comme Google. Une fois repérés, ces moteurs les ont analysés et enregistrés dans leurs bases de données, rendant accessibles au public des échanges initialement privés.

Des conversations archivées et consultables publiquement

Une fois qu’une discussion devient publique, il est très difficile de revenir en arrière. Outre les robots d’indexation de Google, ceux d’Internet Archive entrent également en jeu. Fondée en 1996, cette bibliothèque numérique capture chaque jour près de 100 millions de pages web à travers le monde, permettant de consulter l’état passé des sites et leur évolution. Mais dans le cas d’une fuite de conversations avec des chatbots, cela pose problème : si un lien public est enregistré par Archive.org, la discussion reste consultable même si la plateforme originale la supprime.

OpenAI, propriétaire de ChatGPT, a indiqué avoir supprimé l’option rendant les discussions « découvrables sur le Web » et collabore avec les moteurs de recherche pour retirer les échanges sensibles de leurs bases. Pour les archives, la situation est plus complexe : Internet Archive n’est pas tenu de supprimer un contenu qui était public lors de sa capture. Et si la page provient d’un site externe à OpenAI, la suppression ne peut intervenir qu’après une demande émanant du propriétaire de ce site.

Même lorsque toutes les conditions sont réunies pour supprimer un contenu, il faut considérer le temps nécessaire à la bibliothèque numérique pour le retirer définitivement. Pendant cette période, des copies peuvent continuer de circuler ailleurs, sur d’autres sites d’archives ou sous forme de captures d’écran partagées entre internautes.

Ces échanges peuvent contenir des informations personnelles ou professionnelles sensibles. Sur certaines plateformes, des utilisateurs sollicitent l’IA pour améliorer leur CV, en fournissant parfois leur adresse ou leur identité complète. D’autres vont jusqu’à partager leurs coordonnées bancaires. Cette situation rappelle une règle fondamentale du monde numérique : sur Internet, dans un environnement où la moindre URL peut être copiée ou archivée, rien ne disparaît jamais complètement.

Medi