Avec Veo 3, Google dévoile une nouvelle frontière de l’intelligence artificielle générative. Ce modèle, pas encore disponible en France, permet de créer des vidéos entières à partir de simples descriptions textuelles — incluant images, mouvements, voix, sons et dialogues cohérents. Un bond technologique qui pose de nombreuses questions comme en témoigne une vidéo générée à l’aide de ce modèle.

Alors qu’en 2024, le projet Lumiere de Google ne proposait encore que des clips muets et imparfaits, Veo 3 franchit un cap majeur : il intègre des dialogues synchronisés, des bruitages réalistes, des ambiances sonores et même une narration de type documentaire.

Là où les autres modèles d’IA se limitaient à des clips silencieux comme Sora d’OpenAI ou très encadrés, Veo 3 intègre désormais la synthèse vocale et sonore, ainsi qu’un niveau de cohérence visuelle encore jamais atteint. Il est capable de générer des scènes réalistes, avec des personnages parlant entre eux, animés avec fluidité, et des ambiances sonores crédibles. Le tout, à partir d’un simple prompt textuel.

https://t.co/S0v2poZ4jS
— Dylan (@DylanWeaver) May 22, 2025

Des outils pensés pour les créateurs

Veo 3 combine plusieurs modèles internes de Google : Lyria pour l’audio, Chirp pour les voix et un système de synchronisation labiale avancée.

Google propose deux interfaces : Flow, une application simplifiée destinée aux créateurs de contenu et au monde éducatif et Vertex AI, pour les professionnels de la production audiovisuelle.

Les utilisateurs peuvent : définir des mouvements de caméra, imposer un style cinématographique, injecter des références visuelles ou stylistiques, gérer des transitions entre plans et même travailler plan par plan pour une narration plus précise. Il est aussi possible de générer des vidéos dans plusieurs langues.

🐸☕️ #Veo3 can generate videos in other languages too!https://t.co/c9YzPFSLbp pic.twitter.com/ygjNR7w5ks
— Aleksander Holynski (@holynski_) May 20, 2025

Les résultats dépassent tout ce qui avait été vu jusqu’ici : images ultra réalistes, fluidité des mouvements, gestion cohérente de la physique, cinq doigts par main, etc. Les courts-métrages créés avec Veo 3 témoignent d’une capacité quasi professionnelle de production.

Before you ask: yes, everything is AI here. The video and sound both coming from a single text prompt using #Veo3 by @GoogleDeepMind .Whoever is cooking the model, let him cook! Congrats @Totemko and the team for the Google I/O live stream and the new Veo site! pic.twitter.com/sxZuvFU49s
— László Gaál (@laszlogaal_) May 21, 2025

Une vidéo troublante : « Nous ne sommes pas un prompt »

Parmi les démonstrations proposées par Google, une vidéo en particulier retient l’attention. Elle met en scène des personnages générés par IA, convaincus d’exister vraiment. Face caméra, ils dénoncent ce que certains appellent la “théorie du prompt”, selon laquelle ils ne seraient que le fruit d’une requête. Pour eux, cette idée est une insulte à leur expérience subjective. « Nous pensons, donc nous sommes », semble être leur credo.

Une mise en abyme vertigineuse, qui interroge le spectateur : et si nous vivions nous même dans un univers modélisé ? La vidéo joue habilement sur l’ambiguïté entre simulation et conscience, avec une réalisation si réaliste qu’on en vient à douter du caractère généré des protagonistes.

Prompt Theory (Made with Veo 3)

What if AI-generated characters refused to believe they were AI-generated? pic.twitter.com/GJSRCXp3JP
— Hashem Al-Ghaili (@HashemGhaili) May 22, 2025

Un réalisme bluffant, presque inquiétant

Ce qui frappe dans cette création, c’est la qualité de l’interprétation émotionnelle des personnages. Leur regard, leur diction, leur hésitation parfois, rendent la scène d’autant plus troublante. Google n’a pas seulement généré des visages ou des voix : Veo 3 semble avoir généré une forme de présence. Et c’est là que l’expérience interpelle. Ces personnages « fictifs » tiennent un discours philosophique et existentiel sur leur propre condition.

Pas encore disponible en France… mais déjà au cœur des débats

Actuellement, Veo 3 est disponible uniquement aux États-Unis, pour les abonnés au forfait Google One AI Premium (199 $/mois). En France, le modèle reste inaccessible, même si certaines vidéos circulent déjà sur les réseaux sociaux.

Conscient des dérives potentielles (deepfakes, désinformation, usurpation d’image), Google a intégré un filigrane numérique SynthID pour authentifier chaque vidéo générée, des filtres de sécurité pour bloquer les contenus sensibles, illicites ou violant le droit d’auteur.

D’autres se demandent si Google a entraîné son IA sur les milliards de vidéos présentes sur YouTube, une plateforme qui lui appartient ? La question des droits d’exploitation, bien que couverte par les conditions d’utilisation, reste sensible.

Toujours est-il qu’avec Veo 3, le cinéma muet de l’IA appartient au passé. Google pose les bases d’une nouvelle ère, où l’on peut imaginer, scénariser et produire sans caméra ni studio.

Veo 3, prompt: A person standing in front of multiple mirrors, while rapping about how this is not a challenging task for Veo 3 #veo3 pic.twitter.com/24a7RNB5IB
— Hernan Moraldo (@hhm) May 21, 2025

Les possibilités offertes sont également immenses. Il est déjà possible de générer des vidéos rivalisant avec les studios d’effets spéciaux. Les usages à venir — publicité, prototypage, éducation, fiction, documentaire — sont nombreux.

My Favorite #Veo3 Generation So Far!
Hollywood level VFX! #aivideo #Gemini pic.twitter.com/CJIHtNBDw0
— Mentor (@Mentor) May 21, 2025

Mais cette technologie bouleverse aussi notre rapport au réel : si même des personnages générés peuvent nous convaincre de leur existence, comment faire la différence entre fiction et réalité ?

Actualités :

Veo 3 : le nouveau générateur de vidéos de Google repousse les limites du réel

Des outils pensés pour les créateurs

Une vidéo troublante : « Nous ne sommes pas un prompt »

Un réalisme bluffant, presque inquiétant

Pas encore disponible en France… mais déjà au cœur des débats

Laisser un commentaire Annuler la réponse

Liens utiles :

Nos réseaux sociaux

Des outils pensés pour les créateurs

Une vidéo troublante : « Nous ne sommes pas un prompt »

Un réalisme bluffant, presque inquiétant

Pas encore disponible en France… mais déjà au cœur des débats

Vous devriez également aimer

Modèles d’IA : Google, Microsoft et xAI testés par Washington

Images satellites : l’Ukraine frappe la Russie 90 % plus vite grâce aux satellites de l’entreprise américaine Vantor

12 outils d’intelligence artificielle à découvrir absolument

Laisser un commentaire Annuler la réponse