Guide pratique de l’API DALL-E avec 5 exemples de code pratiques
OpenAI a rendu son modèle d’IA texte-image DALL-E disponible via l’API DALL-E .
Les développeurs d’applications peuvent commencer à utiliser l’API DALL-E pour intégrer la fonctionnalité de conversion de texte en image dans leurs applications Web ou mobiles existantes ou nouvelles.
Dans cet article, voyons comment appeler l’API DALL-E à partir de votre code.
Table des matières
Accéder à l’API DALL-E
Pour utiliser l’API DALL-E, vous devez obtenir une clé API OpenAI. Si vous avez un compte OpenAI, vous devriez déjà avoir accès à VOTRE clé API.
Sinon, créez un nouveau compte OpenAI.
Connectez-vous et visitez la page de l’API OpenAI .
Vous devriez voir votre clé API répertoriée ici.
Utilisation de l’API DALL-E pour générer une nouvelle image
Afin de générer une nouvelle image à l’aide de l’API DALL-E, vous devez appeler le point de terminaison images/générations OpenAI.
Ouvrez un programme de ligne de commande comme Terminal (Mac, Linux) ou PowerShell (Windows)
Configurez votre clé API OpenAI en tant que variable d’environnement OPENAI_API_KEY
Exécutez la commande ci-dessous pour créer votre première image à l’aide de l’API DALL.
curl https://api.openai.com/v1/images/generations -H "Content-Type: application/json" -H "Authorization: Bearer $OPENAI_API_KEY" -d '{ "prompt": "a photo of a happy corgi puppy sitting and facing forward, studio light, longshot","n":1, "size":"1024x1024", }'
Assurez-vous de la remplacer $OPENAI_API_KEY
par votre propre clé API ou configurez la variable d’environnement.
La réponse de l’API DALL-E transformera l’image dans l’un de ces deux formats
- une URL temporaire pointant vers l’image (expire dans 1 heure)
- et une chaîne base64 que vous pouvez utiliser pour afficher l’image ou effectuer un traitement dessus.
Une réponse typique ressemblera à ceci.
{ "créé": 1667535394, "données": [ { "url": "https://oaidalleapiprodscus.blob.core.windows.net/private/org-ijavQk2ZbRYXuXDmFYAvdb43/user-KMVVQrU7JmET33KPBfD2i9mB/img-bejG7RRQdZFQyR6shxtDxCIg.png?st=2022-11-04T03%14Z&%3A3 -04T05%3A16%3A34Z&sp=r&sv=2021-08-06&sr=b&rscd=inline&rsct=image/png&skoid=6aaadede-4fb3-4698-a8f6-684d7786b067&sktid=a48cca56-e6da-484e-a814-9c849652bcb3&skt=2022-11-04T00%3A57 %3A32Z&ske=2022-11-05T00%3A57%3A32Z&sks=b&skv=2021-08-06&sig=Jdq2HuseDiaOcFeI94c3lXESy/a9FEdE1AzHoT7iscw%3D" } ] }
Comme nous n’avons pas précisé si nous voulons l’image dans l’URL ou la chaîne base64, l’API renvoie l’URL par défaut. N’oubliez pas qu’il s’agit d’une URL temporaire et qu’elle expire bientôt.
Afin d’obtenir l’image au format de chaîne base64, vous devez mentionner un autre paramètre à l’appel d’API appelé response_format. Voyons un exemple.
curl https://api.openai.com/v1/images/generations -H "Content-Type: application/json" -H "Authorization: Bearer $OPENAI_API_KEY" -d '{ "prompt": "a photo of a happy corgi puppy sitting and facing forward, studio light, longshot","n":1, "size":"1024x1024", "response_format":"b64_json" }'
Cela nous renvoie l’image sous la forme d’une chaîne base64 que vous pouvez utiliser de nombreuses manières différentes pour la convertir en une image visible réelle.
Notez que nous avons un nouveau paramètre "response_format":"b64_json"
vers la fin de la commande
Vous pouvez également contrôler le nombre d’images que vous souhaitez en passant le nombre sous la forme « n ».
De plus, la taille de l’image de sortie peut être contrôlée en passant un paramètre size avec des valeurs telles que "1024x1024"
, "512x512"
ou"256x256".
Notez bien que chaque appel API vous coûte et que ce coût dépend du nombre d’images que vous voulez et de la taille de l’image. Les prix sont détaillés plus loin dans l’article.
Utiliser l’API DALL-E pour éditer une image
OpenAI a également mis à disposition le point de terminaison d’édition pour DALL-E. C’est ainsi que vous l’appelez en utilisant CURL.
#edits
curl https://api.openai.com/v1/images/edits \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-F image="@/Users/openai/happy_corgi.png" \
-F mask="@/Users/openai/mask.png" \
-F prompt="a photo of a happy corgi puppy with fancy sunglasses on sitting and facing forward, studio light, longshot" \
-F n=1 \
-F size="1024x1024"
Générer des variantes d’une image à l’aide de l’API DALL-E
On peut également générer des variations d’une image à l’aide de l’API DALL-E.
#variations
curl https://api.openai.com/v1/images/variations \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-F image="@/Users/openai/corgi_with_sunglasses.png" \
-F n=4 \
-F size="1024x1024"
assurez-vous de changer le chemin d’accès à l’image pour l’image réelle que vous souhaitez utiliser à partir de votre ordinateur.
Appel de l’API DALL-E depuis Python
C’est ainsi que vous appelez l’API DALL-E en Python pour générer une nouvelle image à partir d’une invite de texte
réponse = openai.Image.create( prompt="un chat siamois blanc", n=1, taille="1024x1024" ) image_url = réponse['données'][0]['url']
Appel de l’API DALL-E depuis JavaScript (NodeJS)
L’appel de l’API DALL-E à partir de JavaScript (NodeJS) fonctionne comme ceci
réponse const = attendre openai.createImage({ invite : "un chat siamois blanc", n: 1, taille : "1024x1024", }); image_url = réponse.données.données[0].url ;
Tarification de l’API DALL-E
L’API DALL-E est facturée à votre compte par OpenAI sur la base d’un appel par API. Cela signifie que chaque appel d’API réussi est facturé
Cette charge est basée sur deux choses :
- Combien d’images vous vouliez créer dans cet appel d’API, et
- quelle était la taille de l’image ou des images que vous vouliez ?
Vous trouverez ci-dessous le prix par image.
RÉSOLUTION | PRIX |
---|---|
1024×1024 | 0,020 $ / image |
512×512 | 0,018 $ / image |
256×256 | 0,016 $ / image |