Programmeur.chprogrammeur.ch
  • Intelligence artificielle

Découvrez l'IA de Google qui donne vie aux photos : les gens parlent et bougent

Publié le 03.04.2024

Qu'est-ce que VLOGGER et comment ça marche ?

VLOGGER est le dernier projet d'IA développé par Google, conçu pour convertir des photos statiques en vidéos dynamiques avec audio . Cette technologie utilise des algorithmes avancés d'apprentissage automatique pour analyser les images et générer des images vidéo avec des détails de mouvement, en ajoutant du son pour créer une expérience plus immersive.

VLOGGER est l'IA qui permet à une photo d'avoir du mouvement et de parler. (X/@hey_madni)

Selon les détails révélés par une équipe de chercheurs de Google, ce système est basé sur des modèles de diffusion, une technique d'IA qui s'est avérée très efficace pour générer des images réalistes à partir de descriptions textuelles.

Cette technique permet à VLOGGER de reproduire de manière convaincante des personnes gesticulant et parlant en vidéo, donnant ainsi vie à des photographies statiques.

Ce projet est en développement depuis longtemps et grâce à ce qui a été réalisé avec Bard et Gemini, l'entreprise a permis d'obtenir les améliorations nécessaires à la mise en œuvre de cette technologie, qui peut être utilisée dans de multiples domaines.

De plus, il a la particularité de ne pas nécessiter de formation spécifique pour générer le contenu de chaque photographie, mais plutôt que la création se fasse grâce à sa base de connaissances, née après l'analyse de 2 200 heures de vidéo et de 800 000 identités, genres, âges et races divers, de un ensemble de données appelé MENTOR.

L'une des fonctions de cette IA est de permettre d'ajouter différentes langues à une même image afin qu'elle adapte ses gestes. (Reuters)

Caractéristiques principales du VLOGGER

VLOGGER offre un certain nombre de fonctionnalités qui en font un outil qui peut changer la façon dont vous éditez des vidéos et créez du contenu numérique aujourd'hui. En voici quelques-uns :

  • Conversion de photos en vidéos : VLOGGER est capable de prendre une photo fixe et de la transformer en une vidéo dynamique avec audio, en utilisant sa technologie IA pour ajouter des détails de mouvement et de son.
  • Traduction vidéo : en plus de convertir des photos en vidéos, VLOGGER a également la possibilité de traduire des vidéos dans d'autres langues. Cela signifie que vous pouvez télécharger une vidéo dans une certaine langue et ajouter de l'audio dans une autre langue, et l'IA ajustera les mouvements de la bouche des personnes dans la vidéo pour correspondre à la nouvelle langue.
  • Montage vidéo avancé : Il offre également des fonctionnalités avancées de montage vidéo, telles que la modification des expressions faciales et des mouvements de l'orateur dans la vidéo finale. Cela peut devenir un outil qui ouvre de nombreuses options de créativité et permet aux créateurs de contenu de personnaliser différentes vidéos de la même image.
VLOGGER est l'IA qui permet à une photo d'avoir du mouvement et de parler. (Image d’illustration Infobae)

Malgré tous ces développements, des inquiétudes subsistent quant à une éventuelle utilisation abusive de cette technologie. La capacité de VLOGGER à générer des vidéos réalistes à partir d'images fixes soulève des inquiétudes quant à la création de deepfakes, de fausses vidéos créées à des fins malveillantes telles que la désinformation et la fraude. Quelque chose qui peut être amélioré en n'ayant pas besoin d'une formation préalable pour générer le contenu.

Bien que VLOGGER soit encore en développement et non accessible au grand public, il a un grand potentiel. Google et d'autres développeurs partenaires travaillent pour perfectionner cette technologie d'intelligence artificielle et la commercialiser le plus rapidement possible. En espérant que son lancement se fasse avec la plus grande responsabilité pour éviter une multiplication des cas d'arnaques et de tromperies sur le web.

Lisez aussi

foxconn-annonce-que-lusine-pour-les-superpuces-de-nvidia-est-en-construction-au-mexique
Foxconn annonce que l'usine pour les superpuces de Nvidia est en construction au Mexique.

08.10.2024

taiwan-bat-son-record-dexportations-au-troisieme-trimestre-grace-a-lessor-de-lia
Taïwan bat son record d'exportations au troisième trimestre grâce à l'essor de l'IA.

08.10.2024

le-prix-nobel-de-physique-va-a-hopfield-et-hinton-pour-avoir-contribue-a-lapprentissage-des-machines
Le prix Nobel de physique va à Hopfield et Hinton pour avoir contribué à l'apprentissage des machines.

08.10.2024

© 2025 programmeur.ch - Mentions légales

Abonnez-vous !

Recevez les actualités sur l'intelligence artificielle en avant première.