Comment générer des images époustouflantes à l’aide de Stable Diffusion
Stable Diffusion est un modèle texte-image. Il est principalement utilisé pour générer des images détaillées basées sur des descriptions textuelles. Stable Diffusion est une excellente alternative aux outils comme midjourney et DALLE-2. Et la grande chose à propos de cet outil est que vous pouvez l’exécuter localement sur votre ordinateur ou utiliser des services comme Dream Studio ou Hugging Face .
Dans ce guide, je montrerai comment utiliser les paramètres individuels de Stable Diffusion pour obtenir d’excellents résultats dans la génération d’images. Et j’utiliserai Dream Studio.
Ce guide est également disponible sous forme de vidéo :
Rapide
La première chose que nous devons faire est d’écrire la bonne invite. L’invite est une chaîne de texte que nous soumettons au système afin qu’il puisse créer une image pour vous.

Généralement, plus vous fournissez de détails précis, meilleurs seront les résultats que le système générera pour vous. Mais trouver la bonne invite peut être difficile.
Pour faciliter les choses, vous pouvez utiliser des ressources comme Lexica pour trouver une invite pertinente.

Ainsi, une fois que vous avez trouvé une image pertinente, vous pouvez cliquer dessus pour voir l’invite.

Copiez l’invite, collez-la dans la diffusion stable et appuyez sur Générer pour voir les images générées.

Cependant, comme vous pouvez le constater, l’outil n’a pas généré une copie exacte de l’image d’origine. Au lieu de cela, vous voyez quelques variations de l’image. Et c’est ainsi que fonctionne Stable Diffusion. Si vous voulez une copie proche de l’image originale trouvée chez Lexica, vous devez spécifier la graine (vous pouvez en savoir plus sur la graine ci-dessous).
Conseil : si vous soumettez une longue invite et que vous souhaitez dire à l’IA de se concentrer sur un mot particulier, vous pouvez mettre les mots en surbrillance à l’IA en utilisant des parenthèses. Mettez des parenthèses autour des mots très importants, et cela accentuera ces mots à la Diffusion Stable afin que cette combinaison de mots ait plus de poids pour le générateur d’images.

Modèle
Les résultats que vous obtiendrez à l’aide d’une invite peuvent différer selon les modèles de diffusion stable. Actuellement, deux versions majeures et quelques versions de Stable Diffusion sont disponibles dans chaque version.

La dernière version stable est la version 2.1. Si vous souhaitez en savoir plus sur la différence entre les modèles, consultez l’article Stable Diffusion 1 vs 2 .

Pas
Considérez les étapes comme des itérations du processus de création d’image. Au cours des premières étapes, l’image ressemble plus à un bruit visuel où les éléments individuels sont flous. À chaque itération, le système modifie l’image en ajoutant plus de détails à la composition visuelle existante ou en modifiant l’image elle-même.

Le pas d’échantillonnage par défaut est 30. Il s’agit d’un nombre de pas relativement faible. Voyons à quoi ressemble notre image avec 30 pas d’échantillonnage, et maintenant regardons 70 pas.

Planter
La graine est l’un des paramètres les plus critiques de la diffusion stable. Une fois que vous avez généré une image que vous aimez et que vous souhaitez l’ajuster un peu pour la rendre parfaite, vous ne pouvez pas simplement relancer Dream car Stable Diffusion produira probablement une image complètement nouvelle. Vous devez enregistrer le nombre d’images dans le champ Seed .

Lorsque vous conservez le nombre et que vous le saisissez dans le champ de saisie Seed et exécutez à nouveau Stable Diffusion avec une invite légèrement différente, vous verrez une version alternative de l’image d’origine.

Par exemple, voici ce que nous verrons si nous ajoutons une nouvelle propriété à l’invite, telle que « avec deux lunes ».

Largeur et hauteur
Largeur et Hauteur définissent la taille de l’image générée.

Par défaut, Stable Diffusion génère des images dans des tailles de 512 à 512 pixels. Vous obtiendrez le résultat le plus cohérent lorsque vous utilisez cette taille. Vous pouvez modifier la taille, mais cela nécessitera plus de puissance de calcul. Vous pouvez donc remarquer que lorsque nous modifions la taille de l’image, le coût de fonctionnement (crédits en haut à droite) augmente.
Échelle CFG
Ce paramètre indique à quelle distance la diffusion stable écoutera votre invite. Utilisons la même invite mais jouons avec l’échelle CFG. Abaisser l’échelle à zéro signifie que l’IA ne prendra en compte que certaines parties de l’invite.

Lorsque nous augmenterons l’échelle au maximum, l’IA suivra strictement l’invite.

En règle générale, il est préférable de ne pas augmenter l’échelle trop haut et de choisir une valeur comme 15.
Génération d’image à image (img2img)
Nous pouvons utiliser une image comme source pour la diffusion stable afin que le système puisse créer des images à partir de celle-ci.

Allons à Lexica pour trouver notre image et invite.

Téléchargez l’image et invitez-la et collez-la dans Dream Studio. Vous pouvez voir le nouveau paramètre appelé Force de l’image.

Plus la force de l’image se rapproche de 0 %, moins l’IA s’appuie sur l’image d’origine.

Plus la force de l’image se rapproche de 100 %, plus l’IA copie l’image d’origine.
