OpenAI a déployé de nouveaux systèmes de marquage invisible dans les images produites par ses outils d’intelligence artificielle. Ces filigranes, basés sur deux technologies distinctes – SynthID de Google DeepMind et le standard C2PA – permettent désormais de détecter l’origine artificielle d’une image, même après certaines modifications. Un outil de vérification public est également annoncé.
OpenAI s’appuie sur deux approches pour tracer ses images générées par IA. La première, SynthID, est une technologie développée par Google DeepMind qui inscrit un signal numérique imperceptible directement dans les pixels de l’image. L’utilisateur ne voit rien à l’écran, mais un outil spécialisé peut détecter ce marquage même après certaines modifications légères comme le recadrage, le changement de luminosité ou la compression. La seconde approche repose sur le standard C2PA (Coalition for Content Provenance and Authenticity), qui encode dans les métadonnées de l’image l’historique complet de sa création : quel modèle l’a produite, à quelle date, sur quelle plateforme.
Un outil de vérification accessible au public
OpenAI a présenté en avant-première un outil de vérification en ligne permettant à n’importe quel utilisateur de télécharger une image et de savoir si elle a été générée via ChatGPT, l’API OpenAI ou Codex. L’outil détecte la présence de signaux de provenance, qu’il s’agisse des Content Credentials C2PA ou de la signature SynthID. Cette démarche s’inscrit dans une tendance de fond portée par plusieurs acteurs majeurs de l’IA, qui cherchent à lutter contre la prolifération des deepfakes et des manipulations d’images dans les médias et sur les réseaux sociaux. OpenAI rejoint ainsi Adobe, Microsoft et d’autres membres de la C2PA dans cet effort de transparence.
Des limites réelles malgré les progrès
Ces technologies de marquage ne sont toutefois pas infaillibles. Les métadonnées C2PA sont fragiles : une simple capture d’écran ou un enregistrement depuis un appareil tiers suffit à les effacer, car elles ne sont pas inscrites dans les pixels mais dans l’enveloppe du fichier. SynthID résiste mieux aux transformations légères, mais des modifications lourdes, une regénération avec un autre modèle ou des attaques adversariales ciblées peuvent affaiblir le signal. La communauté de recherche en sécurité informatique a déjà documenté plusieurs méthodes permettant de contourner ces systèmes. L’efficacité des filigranes reste donc conditionnée à la bonne foi des utilisateurs et à la rapidité de détection par les plateformes.
Un contexte réglementaire qui pousse à l’action
Le déploiement de ces systèmes n’est pas seulement une démarche volontaire. Le règlement européen sur l’IA (AI Act), entré en vigueur en 2024, impose aux systèmes d’IA générateurs de contenu de rendre identifiable la nature artificielle des productions. Les plateformes qui diffusent ces contenus sans marquage s’exposent à des sanctions. OpenAI, en intégrant SynthID et C2PA de manière systématique à ses outils grand public comme ChatGPT et DALL-E 3, anticipe ces exigences tout en cherchant à restaurer une forme de confiance dans les contenus visuels circulant en ligne.
Le marquage des images générées par IA représente une avancée technique significative dans la lutte contre la désinformation visuelle. Mais la course entre les créateurs de filigranes et ceux qui cherchent à les contourner ne fait que commencer. L’arme la plus fiable restera longtemps l’esprit critique de ceux qui regardent les images.
Source : ZDNet France

X-Pression Impact
Régie publicitaire indépendante. Touchez une audience engagée sur les thèmes de l’IA, du numérique et de l’innovation médiatique. Formats éditoriaux, sponsoring et partenariats.