Microsoft annonce son propre DALL-E : ce qui est surprenant, c’est qu’il peut même créer des vidéos ou développer des images

DALL-E d’OpenAI n’est pas la seule intelligence artificielle capable de générer des images à partir d’une brève description textuelle. Il y a quelques semaines, Google a également présenté  » Image « , une alternative à l’IA de l’entreprise fondée par Elon Musk (entre autres) qui, selon la firme de Mountain View elle-même, est capable de créer des designs beaucoup plus réalistes et de meilleure qualité. Aujourd’hui, Microsoft a rejoint la compétition. Il le fait avec NUWA-Infinity une IA qui n’est pas seulement capable de produire des images à partir de textes, mais aussi de convertir un dessin statique en vidéo.

Microsoft décrit NUWA comme « un modèle génératif multimodal conçu pour générer des images et des vidéos de haute qualité à partir d’un texte, d’une image ou d’une vidéo donnés ». Son fonctionnement n’est donc pas très différent de ce que peut faire DALL-E ou même Image (Google). Cependant, elle présente un certain nombre d’avantages par rapport aux deux modèles d’intelligence artificielle. C’est la seule IA capable de générer une vidéo à partir d’une image créée par une description textuelle. L’IA, en outre, peut également générer une vidéo directement à partir d’une description.

Par rapport à DALL-E, Imagen et Parti, NUWA-Infinity peut générer des images haute résolution de taille arbitraire et prendre également en charge la génération de vidéos longues.

NUWA, l’IA de Microsoft peut également étendre tout type d’image

NUWA Microsoft
NUWA, l’IA de Microsoft qui génère des images et des vidéos à partir d’une description textuelle, est également capable de… « étirer » n’importe quelle image et créer une image plus grande et de plus haute résolution. L’intelligence artificielle, en particulier, détecte les informations figurant sur la photographie originale et, en fonction de ses paramètres, en génère une autre beaucoup plus complète. NUWA, par exemple, peut prolonger la « Nuit étoilée » de Vincent van Gogh. Il le fait, en outre, avec un détail identique à celui présenté dans le design original et une continuation très précise.

👉​A lire également  L'achat de Twitter par Elon Musk est une fois de plus compromis à cause de la même chose

Pour le moment, Microsoft n’a pas donné plus de détails sur NUWA, au-delà de quelques exemples qui montrent le potentiel de cette IA et comment elle est capable de convertir un texte en image, une image en vidéo ou un texte en vidéo, ainsi que la possibilité d’étendre n’importe quel design. Il s’agit certainement d’une alternative intéressante à DALL-E et Imagen, bien que ces deux algorithmes aient également leurs avantages.

Image, par exemple, génère des dessins beaucoup plus réalistesbien qu’il ne soit pas encore disponible pour les utilisateurs. DALL-E, quant à lui, offre des images moins réalistes, mais est plus accessible aux utilisateurs, car il est disponible par le biais d’une bêta publique bien qu’avec un accès limité.