OpenAI présente Sora, son modèle d’IA générative pour la vidéo

OpenAI présente Sora

Extrait d'une vidéo réalisée par l'intelligence artificielle générative Sora 

(© OpenAI )

La maison mère de ChatGPT a présenté dans un billet de blog sa dernière nouveauté : Sora. Ce modèle de conversion de texte en vidéo permet de générer des vidéos d'une durée maximale d'une minute. Le modèle est aussi capable de prendre une image fixe existante et de générer une vidéo à partir d’elle. “Le modèle a une compréhension approfondie du langage” précise la firme, même si “le modèle actuel présente des faiblesses”. OpenAI cite l’exemple d’une personne qui mord dans un biscuit, mais après coup, le biscuit peut ne pas avoir de trace de morsure ou une confusion du modèle entre la gauche et la droite.

Sora est accessible en phase de test à un groupe de"red teamers", des experts dans la désinformation, les contenus haineux et les préjugés. Mais également à des créateurs, dont des artistes visuels, des concepteurs et des cinéastes. “Nous partageons nos progrès de recherche très tôt afin de commencer à travailler avec des personnes extérieures à l'OpenAI et d'obtenir leurs commentaires”, précise OpenAI.

Des mesures de sécurité

Sora s'appuie sur les technologies des modèles DALL-E et GPT. L’entreprise explique aussi être en train de développer des “outils pour aider à détecter les contenus trompeurs, tels qu'un classificateur de détection capable de déterminer si une vidéo a été générée par Sora."

En parallèle, OpenAI a aussi mis en place d’autres mesures de précautions. Les contenus de “violence extrême, un contenu sexuel, une imagerie haineuse, l'image d'une célébrité ou la propriété intellectuelle d'autrui” ne pourront pas être générés.

À lire aussi

Filtrer par