30/03/2025

Web

ChatGPT : oubliez Dall-E, OpenAI améliore la génération d’images avec GPT-4o

OpenAI a dévoilé "4o Image Generation", une extension de GPT-4o, qui se présente comme une alternative plus performante à Dall-E, capable de produire des images de meilleure qualité et de répondre plus précisément aux requêtes des utilisateurs.

Une nouveauté intégrée directement à ChatGPT

Dall-E 3, sorti en 2023, n'a jamais réussi à s'imposer face à des concurrents plus performants dans la génération d'images, comme Aurora de xAI ou Imagen 3 de Google. OpenAI l'a bien compris, et avec l'arrivée de "4o Image Generation", le géant américain mise sur une refonte stratégique de sa fonctionnalité de génération d'images. Ce nouveau modèle n'a pas de nom et n'est pas une simple évolution de Dall-E, mais plutôt une exploitation des capacités de GPT-4o.

L'avantage de cette nouveauté, c'est qu'elle est directement intégrée à la plateforme ChatGPT et qu'elle devient dès à présent la solution par défaut pour générer des images. Dall-E reste toujours accessible à ceux qui le souhaitent. Tous les utilisateurs peuvent utiliser ce générateur d'images sans abonnement supplémentaire : une bonne nouvelle !

Un des points forts de cet outil est sa capacité à comprendre des instructions complexes en langage naturel. Contrairement à ses prédécesseurs, qui nécessitaient parfois un prompt très précis, "4o Image Generation" se veut plus intuitif : l'internaute n'a qu'à écrire ou dicter une idée pour qu'elle prenne vie.

Source : OpenAI

Autre évolution intéressante : la génération de texte dans les images, un point faible notable de Dall-E 3. Désormais, il devient possible de créer des affiches, des logos, d'ajouter des légendes précises, ou encore de générer une bande dessinée.

Source : OpenAI

GPT-4o peut éditer des images plus efficacement

La fonction de génération d'images de GPT-4o est aussi capable d'éditer des images. L'utilisateur peut envoyer une photo et demander des modifications sur celle-ci, comme l'ajout d'objets ou la modification du décor. Ce système exploitant la "mémoire" de GPT-4o autorise jusqu'à 15 images en entrée pour enrichir le contexte.

Source : OpenAI

Reste à voir dans quelle mesure il sera possible de générer des images réalistes avec des humains, voire des personnalités publiques. Une chose est sûre, OpenAI va adopter une politique plus stricte que Grok, l'IA d'Elon Musk, qui ne fixe que peu de limites...

Vous pouvez consulter le site d'OpenAI pour voir d'autres exemples d'utilisation de ce nouveau modèle.

Source

author avatar
Florian BURNEL Co-founder of IT-Connect
Ingénieur système et réseau, cofondateur d'IT-Connect et Microsoft MVP "Cloud and Datacenter Management". Je souhaite partager mon expérience et mes découvertes au travers de mes articles. Généraliste avec une attirance particulière pour les solutions Microsoft et le scripting. Bonne lecture.
Partagez cet article Partager sur Twitter Partager sur Facebook Partager sur Linkedin Envoyer par mail

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.