L’année dernière, l’intelligence artificielle s’est développée au point de pouvoir générer des images et des vidéos qui semblent avoir été prises par des humains.

Will Smith dévorant une assiette de spaghetti
L'année dernière, un utilisateur de Reddit a partagé une curieuse vidéo réalisée avec l'intelligence artificielle de Will Smith mangeant des spaghettis d'une manière quelque peu grotesque.
Pour y parvenir, il a utilisé le modèle Modelscope text2video avec la commande « Will Smith mangeant des spaghettis » . Il a ensuite ajusté le nombre d'images par seconde de 15 à 24 FPS et a utilisé le logiciel Flowframes pour augmenter cette fréquence de 24 à 48 images par seconde, ajoutant enfin un effet de ralenti.
Le résultat a été assez surprenant en raison de la capacité de l'IA à créer des vidéos qui, à l'époque, semblaient réelles.
Il aura fallu près d'un an pour que la communauté internet soit à nouveau surprise par Sora, l'outil OpenAI, capable de créer des vidéos que l'on peut qualifier d'hyperréalistes.

Avec la popularité de Sora et cette vidéo publiée en 2023, Will Smith a décidé de voir la situation d'un point de vue plus comique : il a réalisé un live action de la scène de lui mangeant des spaghettis.
"Cela nous échappe", a déclaré l'acteur américain en faisant référence (en plaisantant) à l'avancée des vidéos générées par l'IA.
Peut-être que cela pourrait être vrai, car les utilisateurs distraits ne manquaient pas et pensaient qu'il s'agissait effectivement d'une autre vidéo réalisée avec une technologie avancée.
Même le créateur de contenu Deji Adebola a commenté : « Il m'a fallu une seconde pour réaliser que la vidéo n'était pas une IA et que j'étais juste sur la page officielle de Will . »

Sora, des vidéos hyperréalistes réalisées avec l'IA
OpenAI, l'entité dédiée à la recherche en intelligence artificielle et créatrice de ChatGPT, a fait des progrès significatifs avec le développement de Sora, son nouvel outil qui transforme les descriptions textuelles en vidéos.
Ces progrès élargissent non seulement les possibilités de génération de contenu numérique , mais offrent également un regard fascinant sur l'avenir de l'interaction texte-image et sur son potentiel pour changer l'utilisation de l'intelligence artificielle aujourd'hui.
Sora, qui est actuellement en test comme l'indique la société dirigée par Sam Altman, est capable de générer des vidéos d'une durée allant jusqu'à une minute, étonnamment réalistes et fidèles aux instructions spécifiques des utilisateurs, tout en conservant une haute qualité d'image.
Le fonctionnement de Sora est basé sur un concept similaire à celui d'autres modèles OpenAI qui convertissent des textes en images, permettant aux utilisateurs de créer des indications ou des « invites » très précises pour définir le contenu visuel souhaité dans la vidéo.
À l'heure actuelle, Sora est testé exclusivement par un groupe limité d'individus appartenant à l'équipe rouge d'OpenAI, dont la mission principale est de découvrir tout défaut, préjudice ou risque associé à l'outil.
La équipe rouge est un groupe d'experts dont le rôle essentiel est d'examiner et de tester des systèmes, des logiciels ou des applications pour détecter des vulnérabilités, des erreurs ou des menaces potentielles. Pour ce faire, ils adoptent le point de vue d’adversaires potentiels, imitant les stratégies et tactiques qu’utiliserait un véritable attaquant.
De plus, OpenAI a donné accès à Sora à un petit groupe d'artistes visuels, de designers et de cinéastes , afin d'obtenir leurs commentaires et, ainsi, d'affiner et d'ajuster le modèle pour le rendre encore plus bénéfique pour les acteurs du secteur créatif. .