Générer des images avec l’IA : rédiger de bons prompts pour DALL-E, Firefly, Midjourney & Co.
Si « autrefois » on voulait des images adaptées pour illustrer un site web, on avait le choix entre utiliser des images stock ou engager un designer pour créer un graphisme personnalisé. Mais désormais, on peut également avoir recours à la génération d’images par IA, qui jouit d’une popularité croissante. Dans cet article, nous présentons différents outils de génération d’images par IA et vous donnons des astuces pour écrire des prompts qui vous donneront le résultat désiré.
ChatGPT d’OpenAI – peut-être l’outil d’IA le plus connu – n’est pas seulement capable de générer du texte, mais également des images sur demande, grâce à l’intégration de DALL-E 3. Adobe Firefly et Midjourney sont également de solides concurrents à DALL-E. Toutes ces IA de génération d’images ont un point commun : la qualité de l’image générée dépend directement de la qualité du prompt.
Comment fonctionne la création d’images générées par IA ?
Lors de la phase d’entraînement, les technologies d’IA actuelles utilisent un très grand nombre d’images qui viennent nourrir leur réseau neuronal. Ainsi, il est possible pour une IA générative d’apprendre les caractéristiques essentielles des images et de les classer de manière logique. Ces caractéristiques sont par exemple des arêtes, formes, couleurs, scènes et objets divers.
Afin de générer une image inédite, le modèle d’IA doit recevoir une instruction spécifique, appelée prompt. Plus la formulation est exacte, meilleur est le résultat. Si l’image ne vous plaît pas, vous pouvez donner davantage d’instructions et exprimer des souhaits d’amélioration explicites.
Optimiser les prompts : voici comment obtenir l’image souhaitée
Les systèmes d’IA n’ont pas de compréhension du monde : ils reconnaissent et reproduisent des modèles en se basant sur des données d’entraînement, sans comprendre la relation entre les différents objets. C’est pourquoi ils ont besoin de prompts ciblés.
L’IA est déjà capable de créer une image lorsque vous lui donnez de petits mots-clés courts comme « un chat ». Dans ce cas de figure, vous donnez trop de marge de manœuvre au programme – l’IA décide de manière relativement aléatoire les détails non spécifiés.
Voici quelques astuces pour améliorer vos prompts :
- Donner des informations spécifiques : plus elles sont précises, plus l’IA est capable de « comprendre » vos désirs. Au lieu d’écrire « trois chats », décrivez plutôt de manière plus détaillée : « Un chat de gouttière noir sur une chaise longue sur un balcon ».
- Contexte et ambiance : donnez du contexte et une ambiance souhaitée, par exemple « un chemin forestier paisible avec des arbres verts et quelques rayons de soleil ».
- Éclairage et couleurs : décrivez l’environnement chromatique et la lumière. Par exemple « un portrait vivant d’une femme blonde, éclairée par le soleil avec des tons orangés et bleus saturés ».
- Style artistique : Si vous désirez obtenir un style artistique en particulier, spécifiez-le. Par exemple : « dans le style impressionniste » ou « Peint avec des coups de pinceau rapides », « un portrait vivant d’une femme blonde avec un chat noir dans les bras, éclairée par le soleil avec des tons orangés et bleus saturés peint avec des coups de pinceau rapides ».
- Réalisme ou abstraction : déterminez si l’image doit être abstraite ou réaliste. Cela a une influence sur l’interprétation de l’IA.
- Un langage riche en adjectifs : utilisez des qualificatifs comme « contemplatif, effrayant, romantique, esthétique, radieux » pour donner des indications plus spécifiques à l’IA.
Astuce : les prompts en anglais sont souvent mieux compris, étant donné que la plupart des IA sont développées en anglais. Ainsi, on laisse moins de place à l’interprétation.
Texte vers image et image vers image
Aujourd’hui, la plupart des IA génératives utilisent la technologie texte vers image. Vous saisissez vos souhaits en langage naturel (avec des mots) et le programme les transforme en image. Exemple de prompt : « Trois chats se promenant sur une colline verdoyante ». Un générateur image vers image fonctionne à partir d’une entrée visuelle. Vous donnez à l’IA une image qui devra ensuite être adaptée.
Attention : les outils d’IA ne peuvent pas reproduire des personnes réelles en version IA, étant donné que cela pourrait porter atteinte aux droits de la personne. De même, les personnes réelles ou les logos de marques ne doivent pas être utilisés comme modèle pour les images IA pour des raisons légales.
DALL-E, Midjourney & Firefly : Les IA de génération d’images que vous devez connaître
Il existe de nombreux outils capables de générer des images de bonne qualité. Voici quelques recommandations :
- DALL-E : L’outil de génération d’image d’OpenAI est intégré dans la version Pro de ChatGPT et génère des images d’apparence artificielle. Malgré une fonctionnalité pour ajuster des détails, sa mise en œuvre n’est pas toujours fiable.
- Midourney : Connu et apprécié, Midjourney est payant (dès 10.- par mois) et peut être utilisé via un serveur Discord. Outre la génération d’image à partir de texte, Midjourney peut combiner deux images ou améliorer des images existantes. Conseil de pro : utilisez le paramètre « -no » pour exclure certains éléments des images ou séparez les termes avec « :: » pour les voir séparément.
- Adobe Firefly : Firefly a été entraîné avec des données issues d’Adobe Stock et peut-être combiné idéalement avec d’autres programmes Adobe, par exemple pour remplir des arrière-plans par l’IA. L’utilisation est gratuite pour de nombreux utilisateurs.
Prêt à créer avec Adobe Firefly ? |
Améliorez vos compétences en rédaction de prompts avec Digicomp |