Grâce aux nouvelles technologies, 2022 a vu une vague d’images artificielles. 

Qu’il s’agisse de Kermit dansBlade Runner , un grizzly confus  ou de Walter White en tant que muppet , la dernière technologie a un talent remarquable pour créer des images artistiques et réalistes. 

QU’EST-CE QUE L’INTELLIGENCE ARTIFICIELLE ?

L’intelligence artificielle est une branche de l’informatique qui s’intéresse à la construction de machines intelligentes capables d’effectuer des tâches nécessitant généralement l’intelligence humaine.

Les développements sont rapides ; possibilités inimaginables. A chaque changement, un assortiment de nouveaux jouets émerge, avec un cortège de consommateurs enragés prêts à franchir le pas. 

Le processus est simple. L’IA est un générateur de texte en image, ce qui signifie que l’utilisateur saisit une invite et que l’IA la visualise. Par exemple, cette image utilisait l’invite : Chat lapin. Assez simple.

Avec l’essor de Midjourney et de DALL-E, nous devons nous demander comment l’IA fait-elle ? Que se passe-t-il dans les choix techniques et créatifs derrière chaque création ? Et surtout,  peut-on l’essayer ?

PLUS DE JACOB VAUSIl y a une déchirure numérique dans ma bière virtuelle : écrire une chanson country avec l’IA

 

Comment fonctionne la génération d’images AI ?

Imaginez la différence entre un sandwich et un ananas. Bien que la distinction visuelle puisse être claire pour vous, c’est une tâche plus délicate pour un ordinateur. 

Pour la génération d’images , les chercheurs alimentent les machines avec des millions et des millions d’images. Ils annotent les ensembles de données, de sorte que la machine dispose d’une référence textuelle, et l’appareil est modifié et calibré jusqu’à ce qu’il puisse reconnaître les photos. Ainsi, il commence à analyser les ananas des sandwichs et peut commencer à fabriquer le sien.

Ces nouveaux outils sont époustouflants. Et publique . Le 28 septembre, OPEN AI faisait une annonce fracassante : DALLE-2 est ouvert et accessible à tous, avec des options d’abonnement pour une utilisation continue, bien sûr.

Cette année seulement a vu la montée en puissance de DALL-E 2 , Midjourney , Craiyon et le souvent controversé Stable Diffusion . Chacun développe des images stupéfiantes (souvent incroyables).  

Bonne nouvelle : si vous recherchez un peu d’expérimentation, ces programmes proposent des essais gratuits. Une fois épuisé, vous devrez vous abonner à Midjourney ou acheter le système de jetons de DALL-E.

 

Comment utiliser Midjourney

Le générateur d’images de Midjourney passe par le très populaire Discord . 

Pour certains, cela suscite la réaction : comment puis-je utiliser cela ? Pour les autres : C’est aussi simple que ça ?

Une fois que vous aurez rejoint le serveur officiel , vous devrez naviguer vers le serveur débutant de Midjourney. L’espace peut être écrasant au début, car une série de nouveaux utilisateurs génèrent tout ce qu’ils peuvent. 

Heureusement, vous pouvez aussi. À partir de là, le processus est aussi simple que de taper, avec de l’imagination pour démarrer. 

Tapez « / imagine » dans la barre de discussion et entrez votre invite – ce signal indique au serveur que vous recherchez une image. Pour nos besoins, essayons : « Homer Simpson dans une salle d’arcade ».

« / imaginez Homer Simpson dans une salle d’arcade. » 

Dès que vous appuyez sur Entrée, Midjourney commence à se générer. Contrairement aux autres générateurs d’IA, vous regardez Midjourney se développer en temps réel, probablement environ 30 secondes. 

Au premier coup, les résultats peuvent être déroutants. Midjourney vous donne une grille d’images avec plusieurs commandes en dessous. 

Milieu du voyage Homer Simpson original
Image: Jacob Vaus / Midjourney

U signifie « haut de gamme » et V signifie « Variation ». Le numéro correspond dans le sens des aiguilles d’une montre. Le coin supérieur gauche est U1 et le coin inférieur droit est U4. 

Si vous aimez une image et que vous voulez qu’elle soit en HD, vous pouvez choisir le U correspondant pour ajouter une définition accrue. Si vous aimez l’ idée d’une image, mais que vous voulez voir ce qu’elle peut faire d’autre, cliquez sur le V correspondant. Midjourney créera quatre images différentes avec la même ligne de base.

Cliquer sur V4 me présente quatre nouvelles options : 

Variations de Homer Simpson à mi-parcours
Image: Jacob Vaus / Midjourney

Remarque : les générations de Midjourney ne sont pas aussi réalistes que celles de DALL-E. Bien que vous puissiez personnaliser l’entrée avec des mots spécifiques, par exemple « photoréaliste », « 35 mm » ou « HDR », j’ai trouvé Midjourney bien mieux adapté à l’art.

Si j’aime le haut à gauche, je sélectionne « U1 » pour monter en gamme. 

Midjourney Homer Simpson avec mise à l'échelle
Image: Jacob Vaus / Midjourney

Encore une fois, je peux faire des variations. Cependant, si j’aime l’image, je peux « Upscale to Max » pour la rendre aussi HD que possible. Voici le résultat final de haute qualité : 

Résultat final de Homer Simpson à mi-parcours
Image: Jacob Vaus / Midjourney

Ne vous laissez pas décourager par les résultats moins que photoréalistes de Midjourney. Bien que ce programme ne soit peut-être pas aussi prêt pour la supercherie visuelle, il génère de belles illustrations intrigantes. 

 

Comment utiliser DALL-E 

DALL-E  est le roi du réalisme et de la simplicité. C’est le programme que vous démarrez avec vos amis le vendredi soir pour leur montrer ce que l’IA peut faire. Les résultats sont souvent moins cérébraux et artistiques et plus carrément amusants. 

Le processus lui-même est assez simple. Vous arriverez à la barre de génération d’images lorsque vous créerez un compte pour Open AI . 

À partir de là, tout ce que vous avez à faire est de taper. Si vous ne pensez à rien, cliquez sur Surprenez-moi 

Essayons notre ancienne invite : « Homer Simpson dans une arcade ». Générer. Plutôt que de regarder la forme des images, vous suivrez une barre de chargement, avec quelques images de référence ci-dessous. Dans les 30 secondes, vous aurez votre sortie. 

DALL-E Homer Simpson dans un premier essai d'arcade
Image : Jacob Vaus / DALL-E

Les résultats sont généralement choquants. Après le premier combat de : Comment ça fait ça ? Vous vous demandez peut-être :  que peut-il faire d’autre ?

En entrant la même invite, vous pouvez voir les possibilités illimitées. 

DALL-E Homer Simpson dans un deuxième essai d'arcade
Image : Jacob Vaus / DALL-E

Les mots seront souvent confus, les chiffres déments, mais c’est un petit prix à payer pour des images de cette qualité. 

DALL-E Homer Simpson dans une salle d'arcade, troisième tentative
Image : Jacob Vaus / DALL-E

Il est important de noter que DALL-E s’en sort beaucoup mieux avec les personnages qu’avec les humains. Le programme reconnaît mieux les icônes de la culture pop et a apparemment du mal à créer des personnages réalistes avec des visages clairs. 

Par exemple, l’invite : « Un homme de cinquante ans joue au double néerlandais. »

Image DALL-E d'une femme jouant à la double corde à sauter hollandaise
Image : Jacob Vaus / DALL-E

Dérangeant, je sais. 

Comment utiliser la diffusion stable

La diffusion stable est un autre processus simple – avec une torsion. Votre invite est ce que vous voulez voir dans l’image, tandis que votre invite négative est ce que vous ne voulez pas voir. Si je veux une image de nuit miteuse, j’essaierai « Lumière du jour » comme invite négative. L’écran de chargement crée une sortie dans un laps de temps similaire. 

4 images Stable Diffusion montrant Homer Simpson dans une salle d'arcade
Image: Jacob Vaus / Stable Diffusion

Moche, non ?

Pourtant, nous avons les moyens de l’amener là où nous voulons. C’est là qu’intervient l’espace négatif. Sous l’étape de génération, vous pouvez filtrer les exemples d’invites réussis de Diffusion.

Dans l’invite d’exemple suivante, ils ont écrit : « Une petite cabane au sommet d’une montagne enneigée dans le style de Disney, artstation » avec l’invite négative : « de mauvaise qualité, moche ».

Images de diffusion stable d'une cabane enneigée à la Disney dans les bois
Image: Jacob Vaus / Stable Diffusion

En disant à Stable de ne pas être de mauvaise qualité ou laid, le programme a créé une image soignée et belle. Essayons la même invite négative sur la nôtre.

Stable Diffusion image irréaliste et de mauvaise qualité d'Homer Simpson dans une salle d'arcade
Image: Jacob Vaus / Stable Diffusion

Un peu mieux, mais toujours pas génial. Essayons de sortir du domaine animé.

Dans l’espace négatif, j’ai entré : « animé » « dessiné à la main » « irréaliste » « dessin animé ». Idéalement, nous pouvons éliminer le look moche de Cartoon Network du début des années 2000. J’aimerais un peu plus d’art, comme les résultats Midjourney ou DALL-E. 

Image dessinée à la main par Stable Diffusion d'Homer Simpson dans une salle d'arcade
Image: Jacob Vaus / Stable Diffusion

Un peu mieux. Comme Midjourney et Dall-E, vous devrez apprendre la langue du programme. Quel que soit le logiciel que vous choisissez, leurs communautés offrent une vaste richesse de connaissances et de conseils.

 

Analyse des résultats 

De toute évidence, l’IA ne tire pas des paniers à chaque fois. Les générations m’ont pris plus d’une heure, et je n’ai peut-être toujours pas les images que je veux. 

Quelle que soit l’image que vous trouvez, l’humain doit trier la sortie. Bien que l’incitation puisse devenir plus spécifique et codée (guidée vers les tailles d’objectif et les rapports d’aspect) et que chaque programme ait une communauté d’utilisateurs prêts à aider, il existe des limites naturelles. 

Dans l’ensemble, les images ne pourraient exister sans direction humaine. L’humain doit avoir la vision, l’idée et le goût de savoir ce qui marche et ce qui ne marche pas. De cette façon, l’outil est toujours un outil, et l’humain est toujours le façonneur, le créateur de goût. 

PLUS DE LECTURE SUR L’ART GÉNÉRÉ PAR L’IALes photos générées par l’IA de Lensa prennent d’assaut les réseaux sociaux

 

Art généré par l’IA : une explosion de créativité

Il est difficile de nier le talent artistique de ce que fait l’IA. AI tire sur un réservoir de grands artistes et d’œuvres emblématiques, les référençant comme un artiste le fait, mais de manière exaspérante, tout à la fois. L’éthique est inconnue : droits d’auteur douteux , exactitude entachée . 

Maintenant, n’importe qui peut créer des images d’art AI . Bien que cela ouvre Internet à des contenus amusants, le monde de l’art de l’IA évolue si rapidement que nous avons peu de temps pour distinguer ses possibilités de ses conséquences.

Plus tôt cette année, une peinture générée par une machine intitulée Work theatre d’opera spatial a remporté le Colorado State Fair Art Show, suscitant la controverse dans le monde de l’art. Son créateur, Jason M. Allen, n’a vu aucun problème. Déjà, la distinction entre l’art humain et l’IA s’estompe. En 2018, l’artiste Edward Bellamy a vendu aux enchères de l’art de l’IA à un musée pour 432 000 $ .

Mais pour l’instant, le train ne s’arrête pas. Nous regardons seuls la forme future, image par image. Si l’on en croit les derniers mois, l’avenir sera une succession d’images toujours plus nettes et toujours plus réalistes de Pikachu et Peter Griffin . 

En attendant, démarrez DALL-E, imaginez une invite – et voici.