You are currently viewing Veo 3 : le nouveau générateur de vidéos de Google repousse les limites du réel
Image capture d'écran.

Veo 3 : le nouveau générateur de vidéos de Google repousse les limites du réel

Avec Veo 3, Google dévoile une nouvelle frontière de l’intelligence artificielle générative. Ce modèle, pas encore disponible en France, permet de créer des vidéos entières à partir de simples descriptions textuelles — incluant images, mouvements, voix, sons et dialogues cohérents. Un bond technologique qui pose de nombreuses questions comme en témoigne une vidéo générée à l’aide de ce modèle.

Alors qu’en 2024, le projet Lumiere de Google ne proposait encore que des clips muets et imparfaits, Veo 3 franchit un cap majeur : il intègre des dialogues synchronisés, des bruitages réalistes, des ambiances sonores et même une narration de type documentaire.

Là où les autres modèles d’IA se limitaient à des clips silencieux comme Sora d’OpenAI ou très encadrés, Veo 3 intègre désormais la synthèse vocale et sonore, ainsi qu’un niveau de cohérence visuelle encore jamais atteint. Il est capable de générer des scènes réalistes, avec des personnages parlant entre eux, animés avec fluidité, et des ambiances sonores crédibles. Le tout, à partir d’un simple prompt textuel.

Des outils pensés pour les créateurs

Veo 3 combine plusieurs modèles internes de Google : Lyria pour l’audio, Chirp pour les voix et un système de synchronisation labiale avancée.

Google propose deux interfaces : Flow, une application simplifiée destinée aux créateurs de contenu et au monde éducatif et Vertex AI, pour les professionnels de la production audiovisuelle.

Les utilisateurs peuvent : définir des mouvements de caméra, imposer un style cinématographique, injecter des références visuelles ou stylistiques, gérer des transitions entre plans et même travailler plan par plan pour une narration plus précise. Il est aussi possible de générer des vidéos dans plusieurs langues.

Les résultats dépassent tout ce qui avait été vu jusqu’ici : images ultra réalistes, fluidité des mouvements, gestion cohérente de la physique, cinq doigts par main, etc. Les courts-métrages créés avec Veo 3 témoignent d’une capacité quasi professionnelle de production.

Une vidéo troublante : « Nous ne sommes pas un prompt »

Parmi les démonstrations proposées par Google, une vidéo en particulier retient l’attention. Elle met en scène des personnages générés par IA, convaincus d’exister vraiment. Face caméra, ils dénoncent ce que certains appellent la “théorie du prompt”, selon laquelle ils ne seraient que le fruit d’une requête. Pour eux, cette idée est une insulte à leur expérience subjective. « Nous pensons, donc nous sommes », semble être leur credo.

Une mise en abyme vertigineuse, qui interroge le spectateur : et si nous vivions nous même dans un univers modélisé ? La vidéo joue habilement sur l’ambiguïté entre simulation et conscience, avec une réalisation si réaliste qu’on en vient à douter du caractère généré des protagonistes.

Un réalisme bluffant, presque inquiétant

Ce qui frappe dans cette création, c’est la qualité de l’interprétation émotionnelle des personnages. Leur regard, leur diction, leur hésitation parfois, rendent la scène d’autant plus troublante. Google n’a pas seulement généré des visages ou des voix : Veo 3 semble avoir généré une forme de présence. Et c’est là que l’expérience interpelle. Ces personnages « fictifs » tiennent un discours philosophique et existentiel sur leur propre condition.

Pas encore disponible en France… mais déjà au cœur des débats

Actuellement, Veo 3 est disponible uniquement aux États-Unis, pour les abonnés au forfait Google One AI Premium (199 $/mois). En France, le modèle reste inaccessible, même si certaines vidéos circulent déjà sur les réseaux sociaux.

Conscient des dérives potentielles (deepfakes, désinformation, usurpation d’image), Google a intégré un filigrane numérique SynthID pour authentifier chaque vidéo générée, des filtres de sécurité pour bloquer les contenus sensibles, illicites ou violant le droit d’auteur.

D’autres se demandent si Google a entraîné son IA sur les milliards de vidéos présentes sur YouTube, une plateforme qui lui appartient ? La question des droits d’exploitation, bien que couverte par les conditions d’utilisation, reste sensible.

Toujours est-il qu’avec Veo 3, le cinéma muet de l’IA appartient au passé. Google pose les bases d’une nouvelle ère, où l’on peut imaginer, scénariser et produire sans caméra ni studio.

Les possibilités offertes sont également immenses. Il est déjà possible de générer des vidéos rivalisant avec les studios d’effets spéciaux. Les usages à venir — publicité, prototypage, éducation, fiction, documentaire — sont nombreux.

Mais cette technologie bouleverse aussi notre rapport au réel : si même des personnages générés peuvent nous convaincre de leur existence, comment faire la différence entre fiction et réalité ?

Laisser un commentaire