Cette Meta AI peut générer des vidéos à partir de texte, et son potentiel est stupéfiant

Il y a quelques mois à peine, nous parlions avec excitation et surprise de ces IA capables de générer des images à partir de textes. Aujourd’hui, il semble que la technologie ait progressé à pas de géant, et c’est que… nous avons déjà des modèles capables de créer des vidéos basées sur le même principe Meta nous présente donc son intelligence artificielle Make-A-Video, et les vidéos qu’elle génère sont aussi surprenantes qu’effrayantes.

Comme c’est déjà le cas pour d’autres modèles similaires, Make-A-Video vous invite à entrer une description de ce que vous voulez générer.  Ainsi, après avoir tapé « Un chien portant une cape de super-héros rouge et volant dans le ciel, vous obtiendrez le résultat escompté. Gardez à l’esprit que cette technologie n’en est qu’à ses débuts, et que les vidéos générées pourraient être pour le moins intéressantes.

Make-A-Video n’est pas encore disponible pour le public. Cependant, certains ont déjà pu l’essayer. Malgré son caractère récent, les résultats sont impressionnants, et nous sommes impatients de voir comment cette intelligence artificielle va progresser au fil des ans. Comme les IA génératrices d’images, elles pourraient bientôt remplacer certains des domaines les plus populaires de l’internet, comme les banques d’images et de vidéos.

Hé, Make-A-Video, je veux que tu dessines un couple sous la pluie

Meta a réussi à développer un outil puissant. Cependant, pour que cette intelligence artificielle fonctionne, il faudrait utiliser des ordinateurs très puissants. N’oubliez pas que ces IA capables de générer des images nécessitaient déjà beaucoup de ressources techniques ; maintenant, un appareil capable de transformer du texte en vidéo nécessite bien plus.

👉​A lire également  La canicule est si forte que Google et Oracle ont dû fermer leurs serveurs

Pourquoi tant de puissance ? N’oubliez pas que les vidéos sont simplement une série d’images assemblées, avec du son intégré. Maintenant, imaginez le temps qu’il faut à une IA pour générer une seule image, et multipliez-le par le nombre d’images présents dans une minute de vidéo (il peut s’agir de milliers). Ajoutez à cela le fait que toutes ces images générées doivent être rassemblées dans un seul fichier. C’est définitivement de la folie.

Selon Tanmay Gupta, chercheur en vision par ordinateur à l’Allen Institute for Artificial Intelligence, les résultats obtenus par l’IA Make-A-Video de Meta sont très prometteurs. En outre, il est démontre la capacité du modèle à capturer des objets 3D. Lorsque la caméra tourne, de nouveaux détails du sujet et de l’arrière-plan apparaissent. Il démontre également que l’IA est capable de différencier la profondeur et les sources de lumière.

Toutefois, M. Gupta ajoute que la communauté des chercheurs a encore beaucoup de progrès à faire, surtout si ces systèmes doivent être utilisés pour le montage vidéo professionnel et la création de contenu. Il ajoute également, que la technologie peine encore à générer des interactions entre les objets de la scène.

La recherche Make-A-Video s’appuie sur les récentes avancées de la technologie text-to-picture, conçue pour permettre la génération de text-to-video. Le système utilise des images accompagnées de descriptions pour apprendre à quoi ressemble le monde et comment il est habituellement décrit.

Il utilise également des vidéos non étiquetées pour apprendre comment le monde bouge. Grâce à ces données, Make-A-Video vous permet de donner vie à votre imagination en générant des vidéos fantaisistes et uniques avec seulement quelques mots ou lignes de texte.

L’un des aspects les plus surprenants de cette intelligence artificielle est sa capacité à créer sans avoir besoin de données textuelles et vidéo appariées. Jusqu’à présent, de nombreux générateurs d’images étaient basés sur des galeries de contenu, qui associaient déjà texte et vidéo Make-A-Video, cependant, ne nécessite pas autant d’informations pour fonctionner, ce qui démontre un avantage significatif.

👉​A lire également  Logitech G Cloud : nous connaissons désormais toutes ses caractéristiques, son prix et sa date de sortie.

Cette IA peut être utilisée de plusieurs façons. Qu’il s’agisse de donner du mouvement à une simple image ou de remplir de mouvement une séquence d’images. En outre, vous pouvez également créer des variantes de vidéos à partir d’un original. Le style que vous exigez, comme pour DALL-E ou Midjourney, dépend de votre imagination.