You are currently viewing Sora 2 : la vidéo générative passe la seconde et continue de poser des questions éthiques
Image : Capture d'écran.

Sora 2 : la vidéo générative passe la seconde et continue de poser des questions éthiques

OpenAI a récemment lancé Sora 2, un nouveau modèle de génération de vidéo et d’audio via l’intelligence artificielle qui prend la forme d’un réseau social défiant TikTok et Méta, provoquant une réaction immédiate et explosive sur Internet. En moins d’une journée, le lancement est devenu un mélange de démonstration technologique révolutionnaire et de chaos de mèmes absolu. D’un côté, on observe des simulations physiques de niveau olympique et des plans vidéo de qualité cinématographique, et de l’autre, des parodies et des détournements. Ce lancement illustre à la fois la puissance du modèle et la rapidité avec laquelle les LMS spécialisés dans la création d’image évoluent.

Le premier modèle Sora, lancé en février 2024, avait été décrit par OpenAI comme le moment « GPT-1 pour la vidéo », marquant le point où la génération vidéo a cessé de ressembler à une expérience ratée pour commencer à montrer des comportements fondamentaux, comme la permanence des objets.

Sora 2 est comparé au moment « GPT-3.5 ». Bien qu’il ne soit pas parfait, il représente un saut technologique majeur.

Les points forts de Sora 2

Simulation Physique Approfondie : Sora 2 excelle dans la simulation de la réalité physique. Il peut générer des saltos arrière de gymnastique sur des planches à pagaie où la flottabilité et la rigidité sont modélisées correctement ou des sprints.

Les erreurs commises par le modèle sont devenues plus réalistes, ressemblant aux erreurs d’un agent réel dans le monde (par exemple, un ballon de basket rebondissant sur le panneau au lieu de se téléporter dans le panier). L’objectif d’OpenAI est de former des modèles qui comprennent réellement le monde, dans le but à long terme de construire des systèmes pouvant opérer dans le monde physique, tels que des robots et des simulateurs de monde.

Qualité Cinématique et Audio : Le modèle gère une variété de styles, y compris le style cinématographique, l’anime et le réalisme. Il suit des instructions multi-plans complexes et maintient l’état du monde. De plus, il génère désormais de l’audio synchronisé, y compris des dialogues et des effets sonores d’une qualité excellente.

La Fonctionnalité Cameo et le Risque des Deepfakes

OpenAI a intégré une fonctionnalité nommée Cameo, qui permet d’injecter soi-même, ses amis ou n’importe qui, dans une scène Sora avec une fidélité remarquable. Pour ce faire, l’application prend un court enregistrement de la voix et du visage.

Dès la sortie publique, il a fallu environ cinq minutes pour que le PDG d’OpenAI, Sam Altman, devienne la « figurine préférée d’Internet ». Des clips générés montraient Altman volant des GPU dans des magasins, essayant d’embrasser des utilisateurs, ou jouant dans des mèmes Skippy Toilet. Bien qu’Altman ait réagi calmement, cela a immédiatement soulevé des questions éthiques.

Certains experts ont immédiatement demandé : « Est-ce que cela ne fait que normaliser les deepfakes ? ». La préoccupation majeure est de savoir à quel point le consentement cesse d’être pertinent si l’avatar d’une personne peut être jetée dans n’importe quelle narration. De plus, une fois que l’avatar se propage, il est difficile de le récupérer.

L’application iOS, qui ressemble à TikTok, demande aux utilisateurs de créer leur propre avatar numérique en parlant et en tournant la tête. L’utilisateur peut ensuite contrôler qui est autorisé à utiliser son avatar (tout le monde, seulement les amis, ou personne).

Le Droit d’Auteur et les Frontières du Contenu

Le volet du droit d’auteur est considéré comme « encore plus explosif ». En quelques heures, des utilisateurs ont produit des scènes directement inspirées de franchises protégées telles que Cyberpunk 2077, Rick et Morty, Naruto, Disney et Studio Ghibli.

La politique d’OpenAI est que le matériel protégé par le droit d’auteur est inclus par défaut, à moins que les détenteurs de droits ne choisissent de se désinscrire (opt-out). Ce mode de fonctionnement est un renversement total de la manière dont le droit d’auteur fonctionne habituellement. Rouslen Vulkov, un développeur IA, a déclaré sans détour que si le droit d’auteur passe de l’adhésion (opt-in) à la désinscription (opt-out), « la loi sur le droit d’auteur cesse pratiquement d’exister ».

Concernant les restrictions de contenu, OpenAI a mis en place des filtres contre le contenu sexuel, la violence graphique, la propagande extrémiste et l’automutilation. Cependant, ces filtres sont loin d’être complètement hermétiques. Des failles ont toutefois été trouvées : il est impossible de générer une scène en bikini, mais il est possible de se générer en train de fumer des gros blunts au bureau.

La frénésie du lancement et l’écosystème de l’application

Sora 2 a été lancé sous la forme d’une application iOS complète, ressemblant et fonctionnant beaucoup comme TikTok, avec un flux de vidéos IA défilables.

Le lancement a généré une demande immédiate. Au départ, l’accès était limité, chaque nouvel utilisateur recevant quatre codes d’invitation à partager. Le jour suivant, eBay comptait plus de 20 ventes complétées de codes Sora, allant de 10,99 $ à près de 45 $. OpenAI a rapidement averti que la vente de codes était contraire à ses conditions d’utilisation.

L’application a connu un succès fulgurant : en une seule journée, Sora était déjà la troisième application gratuite la plus populaire sur l’App Store d’Apple, derrière ChatGPT et Google Gemini.

OpenAI ne considère plus Sora comme une simple nouveauté ; il s’agit d’une plateforme de médias synthétiques. L’accent est mis sur la création plutôt que sur la consommation. L’entreprise a également des objectifs à long terme : Sora vise à devenir un moteur vidéo et audio à usage général, orienté vers le développement de simulateurs de monde et d’agents robotiques.

En conclusion, Sora 2 a brouillé les pistes entre la parodie, le vol d’identité et les mèmes. Il représente à la fois une poussée créative majeure tout en posant des questions en matière de droit.

Laisser un commentaire