Microsoft Designer 

Microsoft Designer : principes de conception d’invites d’IA

Microsoft Paint a toujours été là pour nous, alors quand j’ai entendu l’annonce de « Microsoft Designer », il y a eu une excitation naturelle. Combinez cela avec l’IA, et le battage médiatique était réel – Microsoft apporte l’IA aux masses ! Non seulement avec Microsoft Designer , mais ils saupoudrent l’IA sur de nombreux produits Microsoft.

Par exemple, même l’ancienne recherche Bing a déjà un Image Creator . Microsoft intègre massivement les gens à une nouvelle façon de travailler avec les ordinateurs via des « invites » formulées de manière robotique. Mais comment tout cela fonctionnera-t-il ?

C’est un art d’écrire la chaîne d’invites qui peut produire ce que vous voulez de ChatGPT, DALL-E 2 et Midjourney. ( Fast Co )

Si vous avez déjà essayé un générateur d’images AI, ainsi que les préoccupations éthiques de l’art généré par l’IA, vous savez peut-être à quel point les créations d’images sont imprévisibles . Cela peut aussi prendre des années pour générer une image avec le bon look et le bon style. Parfois, cela nécessite beaucoup d’essais et d’erreurs lors de la création de la bonne instruction pour l’IA – un processus connu sous le nom de « ingénierie rapide » ou « conception rapide ».  

Principes de conception d’invites utilisateur

Avec l’imprévisibilité des générateurs d’IA et les nuances autour de l’ingénierie des invites, cet article observe les approches de Microsoft pour guider les nouveaux utilisateurs vers la création d’invites qui obtiennent des sorties plus fiables, sans perdre beaucoup de temps. 

Vous pouvez le considérer comme des principes pour la conception d’invites utilisateur, ou un point de départ pour eux (puisque l’IA est encore précoce, et d’autres exemples suivront). Quoi qu’il en soit, les observations peuvent vous guider si vous créez votre propre application alimentée par l’IA, en particulier lorsque vous abordez l’intégration et l’introduction de nouveaux concepts.

Créateur d’images Microsoft Bing

Microsoft, DALL-E 2 et l’utilisateur

Pour commencer, il est utile de connaître la technologie et le public concernés. L’aspect IA de Microsoft Designer n’est pas une nouvelle technologie de Microsoft, mais une autre implémentation du DALL-E 2 d’OpenAI :

Générateur d’images Microsoft Designer AI : créé avec DALL-E 2

Microsoft Designer lui-même est un outil destiné aux spécialistes du marketing qui créent des bannières de médias sociaux – c’est comme Canva mais saupoudré d’IA – rien de proche de Figma ou de tout ce qu’un concepteur d’interface utilisateur utiliserait pour la conception d’applications et de sites Web.

En plus de MS Designer, Microsoft lance également Microsoft Bing Image Creator . C’est comme Bing Image Search, mais vous générez des images à partir d’invites au lieu de les rechercher.

Voici quelques techniques que Microsoft utilise pour introduire la conception d’invites et l’IA pour les nouveaux utilisateurs :


1. Fournir un contexte familier (heuristique de familiarité)

Les humains associent souvent de nouvelles choses au risque et à l’incertitude, et un générateur d’images d’IA pourrait créer ces sentiments comme étant quelque chose de nouveau.

Les humains préfèrent naturellement les choses avec lesquelles nous sommes familiers, qu’il s’agisse de mots, de produits ou d’expériences. ( Indices d’application )

Pour le rendre plus familier, Microsoft Designer affiche le générateur d’images AI en option avec d’autres méthodes de téléchargement d’images :

Microsoft Designer Wizard : l’option AI est affichée à côté des options de téléchargement d’images familières

Voici les options :

  • Télécharger depuis votre appareil
  • Ton téléphone
  • Ouvrez vos médias
  • Générez-en un avec l’IA

     

De cette façon, l’IA s’intègre dans un flux similaire qui aurait pu être utilisé même s’il n’était pas là. C’est presque comme un téléchargement d’image.

Au lieu de plonger tête première dans les algorithmes, réfléchissez à la façon dont les gens font la tâche aujourd’hui

Dans le cas de Bing Image Creator, les fonctionnalités d’IA donnent l’impression d’utiliser un moteur de recherche classique pour lequel les gens connaissent Bing. Cependant, la barre de recherche est utilisée comme une entrée rapide et les résultats d’image générés ressemblent à une page de résultats de recherche. Le tout ressemble à une recherche.

Bing Image Creator : les résultats de la génération d’images ressemblent aux résultats d’image des moteurs de recherche

2. Soyez transparent : l’IA n’est pas magique

De nombreux outils ne mentionnent évidemment pas la technologie d’intelligence artificielle qu’ils utilisent pour générer des images et du texte – vous devez creuser un peu pour le savoir.

Microsoft Designer affiche la technologie même qu’ils utilisent dans l’info-bulle d’information, là où vous créez l’invite :

Info-bulle MS Designer, montrant clairement que DALL-E 2 est utilisé.

Bien que DALL-E 2 sonne comme un jargon inconnu, il semble judicieux de l’inclure, contrairement à la référence à l’IA comme une sorte de « magie ». Cela peut également transmettre la compréhension et le souci de Microsoft pour l’utilisation éthique de la technologie de l’IA en montrant ce qui se cache derrière.

Aujourd’hui, trop de gens considèrent l’intelligence artificielle (IA) comme une autre technologie magique qui est mise en œuvre avec peu de compréhension de son fonctionnement . – L’IA n’est pas magique, IBM

Enfin, mettre ces informations derrière une info-bulle signifie également que le jargon technique ne gêne pas, mais il est toujours facilement accessible car le style de l’option est différent et l’icône attire l’attention.


3. Mettre l’accent sur l’utilisation éthique de l’IA

L’IA est nouvelle et incertaine, et peut facilement être utilisée de manière contraire à l’éthique. Ce qui est considéré comme éthique est également encore flou, car l’espace génère de nouveaux cas d’utilisation et applications du jour au lendemain. Les artistes sont toujours scandalisés par le vol de leurs styles, mais les générateurs d’art IA ne ralentissent pas.

Pour aider à empêcher DALL∙E 2 de fournir des résultats inappropriés dans l’application Designer et Image Creator, nous travaillons nous-mêmes et avec notre partenaire OpenAI, qui a développé DALL-E 2, pour prendre des mesures et continuerons à faire évoluer notre approche selon les besoins.

Avec cette incertitude, l’info-bulle de Microsoft Designer est répétée à l’étape suivante au moment de générer des images, de demander des commentaires et de rendre les attentes réalistes :

Une deuxième info-bulle dans Microsoft Designer, demandant des commentaires et définissant les attentes des utilisateurs.

Bing Image Creator suit la même approche – une icône d’aide est affichée à côté de toutes les images générées par l’IA, qui renvoie à une FAQ incluant l’éthique :

FAQ Bing Image Creator : Comment Microsoft aborde-t-il l’IA responsable avec Image Creator dans Bing ?

4. Expliquez les résultats

Suite aux préoccupations éthiques, et selon l’ amorce UX of AI , permettre à l’utilisateur de votre application de retracer une image générée par l’IA jusqu’à des points de données, ou de comprendre d’une manière ou d’une autre comment sa création contribue également à la transparence.

Si vous agrégez des données provenant de plusieurs sources, décomposez-les pour permettre à l’utilisateur de reproduire le résultat. Ces informations doivent être disponibles dans le cadre du flux utilisateur via une interface cohérente. ( UX de l’IA )

La plupart des sites d’IA, de la propre application DALL-E d’OpenAI à Prompt Hero (un site d’inspiration rapide), affichent l’invite originale utilisée pour créer chaque image ouvertement sur l’image. Microsoft Designer le fait de la même manière. Lorsque vous survolez une image ou un exemple généré par l’IA, l’invite utilisée pour la créer s’affiche :

Les invites s’affichent sur Microsoft Designer lorsque vous survolez une image générée par l’IA.

Sur le côté droit de l’assistant (dans l’image précédente), la copie et les images sont également utilisées pour souligner cela. Le texte « Nous utilisons votre contenu et l’IA pour générer des conceptions pour vous » illustre d’une certaine manière d’où proviennent les entrées pour les images.

Cependant, ils ne montrent pas les points de données utilisés pour créer les images, ni le fonctionnement de l’IA. Voici un bon exemple de la façon dont les résultats de l’IA peuvent être expliqués , mais ce n’est probablement pas possible avec DALL-E 2, et hors de portée pour l’afficher dans une interface utilisateur d’un produit commercial.


5. Guidez l’utilisateur avec des suggestions

L’écriture d’invites d’IA peut être un peu étrangère, car les invites doivent être écrites dans un style avec lequel l’IA peut être efficace. OpenAI fournit même un guide des « meilleures pratiques pour une ingénierie rapide » , les règles empiriques pour GPT-3 étant :

  • Soyez précis, descriptif et aussi détaillé que possible sur le contexte souhaité, le résultat, la longueur, le format, le style, etc.
  • Articuler le format de sortie souhaité à l’aide d’exemples
  • Commencez par zéro coup, puis quelques coups, aucun d’eux n’a fonctionné, puis ajustez

Saisie automatique

Lorsque vous utilisez AI pour la première fois, l’écriture rapide n’est pas familière, donc une autre chose utile que fait Microsoft Designer est de fournir des invites de saisie semi-automatique :

Microsoft Designer suggère des invites écrites dans un style pour Open AI

Comme l’heuristique de familiarité, nous sommes également habitués aux suggestions de recherche, nous savons donc que celles-ci sont recommandées pour de meilleurs résultats.

Une observation technique ici est qu’il doit y avoir beaucoup de travail et d’exemples en coulisses pour créer de telles suggestions – peut-être qu’ils utilisent ChatGPT pour ceux-là ? 👀


6. Gardez le contrôle de l’utilisateur

Même si diriger l’utilisateur aide, cela doit être fait de manière à garder le contrôle de l’utilisateur. Tant que le produit ne dépend pas entièrement de l’IA, il est bon de permettre aux utilisateurs d’ignorer toute interaction avec lui. L’utilisateur doit pouvoir travailler avec l’IA et l’utiliser pour améliorer son flux de travail en cas de besoin, plutôt que de laisser l’IA prendre le relais. 

Par exemple, l’utilisateur peut préférer continuer à créer et à utiliser ses propres images si l’IA ne répond pas à ses besoins. Dans MS Designer, en plus de télécharger vos propres images sur le premier écran, il y a toujours une option pour sortir. Ici, même lorsque les résultats générés sont affichés, il existe toujours une option pour « commencer à partir d’un canevas vierge »:

Option pour commencer avec une toile vierge dans Microsoft Designer.

Il est même possible d’utiliser l’application sans IA car le flux général est le même que celui de la plupart des créateurs de bannières de médias sociaux.


Sur les principes de conception de l’IA

Même si j’ai appelé les idées ci-dessus des principes, elles ressemblent plus à des concepts et à des exemples à suivre comme source d’inspiration, plutôt qu’à réinventer la roue si vous venez de concevoir pour l’IA. 

L’IA est encore très jeune, donc les meilleures pratiques continueront de se former à mesure que les applications deviendront plus utiles. Pour plus d’UX dans l’IA , consultez l’ incroyable introduction de Lennart Ziburski qui a été utilisée comme guide tout au long de cet article.

Si vous avez d’autres ressources, partagez-les également. Nous n’avons pas encore de commentaires sur Prototypr, alors n’hésitez pas à écrire un post sur la plateforme ! 

Retour en haut