Jusqu’à présent, il faut dire, le générateur d’images deOpenai était loin d’être unanime. Avec Dall-E, les visuels avaient souvent des défauts visibles, des problèmes d’intégration de texte ou même des erreurs grossières dans les proportions. Face à MidJourney, Grok ou Imagen de Google, l’écart était flagrant. Mais c’était avant.
Openai vient de déployer tout son Nouveau générateur d’images basé sur GPT-4Oson modèle multimodal. Et autant à dire tout de suite: le changement est radical. Nous avons testé cet outil et les résultats sont beaucoup plus convaincants qu’auparavant.
Un outil plus précis et plus efficace
Cette nouvelle génération d’images n’est plus basée sur Dall-E, mais sur les capacités de GPT-4O. L’avantage? Un modèle qui comprend mieux les instructions Et qui gère le texte intégré dans les images beaucoup mieux. Les signes illisibles sont terminés. GPT-4O affiche désormais un Rendu propre et lisibley compris pour logosLE affiches ou le infographie.

OpenAI met également en évidence la possibilité de chaîner plusieurs demandes complexes dans une seule demande. Le modèle est capable de gérer jusqu’à 20 objets différents dans une imagetout en respectant leurs caractéristiques et leurs relations entre eux. Un exploit qui ouvre la porte à des créations beaucoup plus riches et détaillées.
L’édition d’image est invitée dans le chatppt
Une autre nouveauté intéressante: l’outil permet maintenant Modifier les images existantes. Vous pouvez télécharger une photo, demander des ajustements, ajouter des éléments ou même transformer complètement la scène. Cette fonction ouvre de nouvelles possibilités, en particulier pour Création de mèmes ou le Création d’assemblages d’autonomisation.

Intégration totale et accès à tout le monde
Ce Nouveau générateur d’images devient la solution par défaut dans le chatgpt. Pas besoin de jongler entre différents outils ou d’activer Dall-E: tout se passe directement dans la conversation. Mieux encore, la fonctionnalité est Disponible pour tout le mondey compris dans la version gratuite de Chatteavec quelques limitations sur le nombre d’images par jour.
Dans le Version de chatpt gratuitevous pouvez générer jusqu’à trois images par jour. Pour les abonnés à plus, les offres professionnelles et l’équipe, les quotas sont plus élevés, permettant une utilisation plus intensive de l’outil.
Petite clarification: ce générateur d’images est également intégré dans SoraOutil de génération de vidéos d’Openai. Il peut donc être utilisé pour illustrer le contenu vidéo avec la même qualité de rendu.

Plus de cas d’utilisation professionnelle
OpenAI cible clairement une utilisation plus large avec GPT-4O. L’outil gère visuels promotionnelsLE infographieLE bandes dessinées Et même le diagrammes. Il est également capable de produire Images avec un fond transparentParfait pour la création de logos ou d’autocollants.
Du côté de la sécurité, Openai spécifie que Les images sont marquées avec des métadonnées C2PA afin d’identifier leur origine. Des filtres sont également en place pour empêcher la génération de contenu sensible ou inapproprié.

Notre opinion sur la génération d’images GPT-4O
Après plusieurs tests, il doit être admis: GPT-4O modifie la situation. Les visuels sont plus propres, les détails beaucoup mieux gérés et le texte parfaitement lisible. L’outil ne rivalise pas encore entièrement avec MidJourney sur certains aspects artistiques, mais pour une utilisation générale, la qualité est là.
En intégrant la génération d’images directement dans le chatgpt, Openai réussit un bon coup et remplit enfin son retard sur la concurrence. Une nouveauté qui devrait séduire à la fois curieuse et des professionnels à la recherche d’un outil polyvalent et facile d’accès.
Source : Openai