Stable Diffusion

Comment générer des images époustouflantes à l’aide de Stable Diffusion

Stable Diffusion est un modèle texte-image. Il est principalement utilisé pour générer des images détaillées basées sur des descriptions textuelles. Stable Diffusion est une excellente alternative aux outils comme midjourney et DALLE-2. Et la grande chose à propos de cet outil est que vous pouvez l’exécuter localement sur votre ordinateur ou utiliser des services comme Dream Studio ou Hugging Face .

Dans ce guide, je montrerai comment utiliser les paramètres individuels de Stable Diffusion pour obtenir d’excellents résultats dans la génération d’images. Et j’utiliserai Dream Studio.

Ce guide est également disponible sous forme de vidéo :

Rapide

La première chose que nous devons faire est d’écrire la bonne invite. L’invite est une chaîne de texte que nous soumettons au système afin qu’il puisse créer une image pour vous.

Chaîne d’invite dans l’interface utilisateur de Dream Studio.

Généralement, plus vous fournissez de détails précis, meilleurs seront les résultats que le système générera pour vous. Mais trouver la bonne invite peut être difficile.

Pour faciliter les choses, vous pouvez utiliser des ressources comme Lexica pour trouver une invite pertinente.

Lexica est une collection d’images avec des invites.

Ainsi, une fois que vous avez trouvé une image pertinente, vous pouvez cliquer dessus pour voir l’invite.

Chaîne d’invite avec le modèle et le numéro de graine.

Copiez l’invite, collez-la dans la diffusion stable et appuyez sur Générer pour voir les images générées.

Images générées par Stable Diffusion en fonction de l’invite que nous avons fournie.

Cependant, comme vous pouvez le constater, l’outil n’a pas généré une copie exacte de l’image d’origine. Au lieu de cela, vous voyez quelques variations de l’image. Et c’est ainsi que fonctionne Stable Diffusion. Si vous voulez une copie proche de l’image originale trouvée chez Lexica, vous devez spécifier la graine (vous pouvez en savoir plus sur la graine ci-dessous).

Conseil : si vous soumettez une longue invite et que vous souhaitez dire à l’IA de se concentrer sur un mot particulier, vous pouvez mettre les mots en surbrillance à l’IA en utilisant des parenthèses. Mettez des parenthèses autour des mots très importants, et cela accentuera ces mots à la Diffusion Stable afin que cette combinaison de mots ait plus de poids pour le générateur d’images.

Utiliser des parenthèses autour de la partie « art conceptuel ».

Modèle

Les résultats que vous obtiendrez à l’aide d’une invite peuvent différer selon les modèles de diffusion stable. Actuellement, deux versions majeures et quelques versions de Stable Diffusion sont disponibles dans chaque version.

Numéro de modèle pour Stable Diffusion.

La dernière version stable est la version 2.1. Si vous souhaitez en savoir plus sur la différence entre les modèles, consultez l’article Stable Diffusion 1 vs 2 .

Différentes versions du Modèle en Diffusion Stable.

Pas

Considérez les étapes comme des itérations du processus de création d’image. Au cours des premières étapes, l’image ressemble plus à un bruit visuel où les éléments individuels sont flous. À chaque itération, le système modifie l’image en ajoutant plus de détails à la composition visuelle existante ou en modifiant l’image elle-même.

Étapes d’échantillonnage en diffusion stable.

Le pas d’échantillonnage par défaut est 30. Il s’agit d’un nombre de pas relativement faible. Voyons à quoi ressemble notre image avec 30 pas d’échantillonnage, et maintenant regardons 70 pas.

Modification des étapes dans Dream Studio. 

Planter

La graine est l’un des paramètres les plus critiques de la diffusion stable. Une fois que vous avez généré une image que vous aimez et que vous souhaitez l’ajuster un peu pour la rendre parfaite, vous ne pouvez pas simplement relancer Dream car Stable Diffusion produira probablement une image complètement nouvelle. Vous devez enregistrer le nombre d’images dans le champ Seed .

Le numéro de départ devient disponible lorsque vous passez la souris sur l’image.

Lorsque vous conservez le nombre et que vous le saisissez dans le champ de saisie Seed et exécutez à nouveau Stable Diffusion avec une invite légèrement différente, vous verrez une version alternative de l’image d’origine.

Par exemple, voici ce que nous verrons si nous ajoutons une nouvelle propriété à l’invite, telle que « avec deux lunes ».

Utilisation du numéro de départ pour générer une nouvelle version de l’image d’origine. 

Largeur et hauteur

Largeur et Hauteur définissent la taille de l’image générée.

Largeur et Hauteur pour une image générée.

Par défaut, Stable Diffusion génère des images dans des tailles de 512 à 512 pixels. Vous obtiendrez le résultat le plus cohérent lorsque vous utilisez cette taille. Vous pouvez modifier la taille, mais cela nécessitera plus de puissance de calcul. Vous pouvez donc remarquer que lorsque nous modifions la taille de l’image, le coût de fonctionnement (crédits en haut à droite) augmente.

Échelle CFG

Ce paramètre indique à quelle distance la diffusion stable écoutera votre invite. Utilisons la même invite mais jouons avec l’échelle CFG. Abaisser l’échelle à zéro signifie que l’IA ne prendra en compte que certaines parties de l’invite.

Résultat de la génération utilisant l’échelle CFG égale à 1.

Lorsque nous augmenterons l’échelle au maximum, l’IA suivra strictement l’invite.

Résultat de la génération utilisant l’échelle CFG égale à 18.

En règle générale, il est préférable de ne pas augmenter l’échelle trop haut et de choisir une valeur comme 15.

Génération d’image à image (img2img)

Nous pouvons utiliser une image comme source pour la diffusion stable afin que le système puisse créer des images à partir de celle-ci.

Cliquez sur cet élément pour télécharger l’image qui sera utilisée comme source.

Allons à Lexica pour trouver notre image et invite.

Invite et image que nous utiliserons comme source. 

Téléchargez l’image et invitez-la et collez-la dans Dream Studio. Vous pouvez voir le nouveau paramètre appelé Force de l’image.

Le paramètre Force de l’image devient visible une fois que vous téléchargez l’image.

Plus la force de l’image se rapproche de 0 %, moins l’IA s’appuie sur l’image d’origine.

Réglage de la force de l’image sur 5 %.

Plus la force de l’image se rapproche de 100 %, plus l’IA copie l’image d’origine.

Réglage de la force de l’image sur 99 %.
Retour en haut