L'IA de Stable Diffusion en version Python

Image illustrant l'article : L'IA de Stable Diffusion en version Python

L'IA de Stable Diffusion en version Python

Le 8 novembre 2022 par Korben -

Je vous en ai parlé à plusieurs reprises de StableDiffusion et je vais continuer aujourd’hui en vous présentant ImaginAIry.

ImaginAIry est un script python qui utilise Stable Diffusion et permet une fois installé, de générer des images directement en ligne de commande. Pour en profiter, vous devez avoir au moins 10 GB de stockage libre pour récupérer les modèles, ainsi qu’un ordinateur pas trop pourri.

Pour installer ImaginAIry, ouvrez un terminal et entrez la commande suivante :

pip3 install imaginairy

Ensuite, pour générer votre image, c’est simple, il suffit d’appeler ImaginAIry comme ceci, en mettant entre guillemets, toutes les images dont vous avez besoin :

imagine "A picture of an Icelandic landscape" "A picture of a Hitler cat" "A picture of a smart troll" "A picture of a hunter threatened by a rabbit"

La première fois, ça va prendre un peu de temps, car le script va récupérer tous les modèles nécessaires à la génération. Ensuite, ce sera un peu plus rapide, mais tout dépendra de la puissance de votre machine.

Les résultats sont à la hauteur de ce que Stable Diffusion est capable de générer, mais également en fonction de la qualité de vos prompts.

ImaginAIry supporte des tas de paramètres qui vous permettront d’ajouter ou d’enlever des choses de vos images, mais également, de repartir d’une image existante pour la faire modifier par Stable Diffusion. Vous pouvez par exemple faire du masking, c’est à dire prendre une image, lui retirer des éléments et faire des déclinaisons de cette image.

Par exemple, je prends la photo de la Joconde, je lui retire ses cheveux (la pauvre) et j’en fais une Joconde Présidente ou une Joconde docteur.

Capture d’écran montrant la page d’accueil de Stable Diffusion

Capture d’écran montrant la documentation de Stable Diffusion

Voici la commande utilisée pour faire ça :

imagine --init-image 5449.jpg --mask-prompt "face AND NOT hair" --mask-mode keep --init-image-strength .2 --fix-faces "a modern female president" "a female doctor"

L’option –fix-faces est également intéressante puisqu’elle permet de “réparer” les visages, notamment les glitchs dans les yeux.

Image montrant une équipe travaillant sur un ordinateur

Vous pouvez également faire de l’agrandissement d’image sans perte de qualité (upscaling)

imagine "Laurent in jail" --steps 40 --upscale

Et bien d’autres choses sympas. On peut par exemple faire l’inverse et laisser l’IA décrire ce qu’elle voit sur une image. Pour cela, lancez la commande “aimg” et entrez ceci :

describe CHEMIN-VERS-IMAGE.jpg

Et comme c’est du Python, vous pouvez également l’appeler comme lib dans vos scripts.

Bref, on est bien sûr loin de la qualité d’un Midjourney, mais avec beaucoup de temps et les bons mots clés, vous arriverez quand même à faire des choses correctes. Et le fait de pouvoir intégrer ça dans vos scripts peut vous permettre d’ajouter certaines fonctions sympas relatives à la compréhension / taggage d’une image ou tout simplement à la génération d’avatars ou d’images diverses.

À découvrir ici.