
Stable Diffusion
Le modèle de génération d'images open-source le plus populaire
Presentation
Stable Diffusion est un modèle de génération d'images open source développé par Stability AI. Sa nature ouverte permet à n'importe qui de l'utiliser, le modifier et l'héberger en local.
C'est l'outil de choix quand tu veux un contrôle total, des personnalisations poussées (LoRAs, ControlNet) ou générer sans restrictions.
La dernière version majeure reste **Stable Diffusion 3.5**, en trois variantes : **Large** (8 milliards de paramètres, architecture MMDiT, le plus qualitatif avec un bien meilleur rendu de texte), **Large Turbo** (qualité en seulement 4 étapes) et **Medium** (2,5 milliards de paramètres, prévu pour tourner sur des GPU grand public). **SDXL** et **SDXL Turbo** restent très utilisés, surtout pour leur écosystème de LoRAs et de modèles communautaires, le plus mature de tous.
En 2026, Stable Diffusion reste excellent mais n'est plus le premier choix automatique : les meilleurs modèles propriétaires (GPT Image, Gemini Image) le devancent au classement Elo. Son avantage reste imbattable : c'est gratuit, local, ouvert et infiniment personnalisable. À noter, Stability AI a aussi élargi son offre au-delà de l'image (modèles audio).
Comment utiliser
Via DreamStudio (stability.ai), Clipdrop, ou de nombreuses interfaces tierces.
Installez Automatic1111, ComfyUI, ou Fooocus pour une utilisation locale gratuite et sans limites.
- LoRA : Petits modèles additionnels pour des styles spécifiques
- ControlNet : Contrôle précis de la pose, profondeur, contours
- Embeddings : Concepts personnalisés
Astuces & conseils
Optimiser le prompt
Commencez par un prompt positif précis et ajoutez un prompt négatif pour exclure les défauts. Testez des modèles personnalisés (checkpoints) pour des styles spécifiques.
Maîtriser les paramètres
Réglez le CFG Scale entre 7 et 12 pour un bon équilibre créativité/précision. Gardez les steps entre 20 et 50 pour des résultats rapides et propres.
Utiliser les LoRA
Intégrez des LoRA pour styliser vos images sans réentraîner le modèle. Un poids de 0.7-0.9 suffit souvent pour un effet naturel.
Contrôler la composition
Employez ControlNet avec des images de référence pour guider la pose ou la perspective. Cela garantit une cohérence parfaite dans vos séries.
Économiser la VRAM
Activez --medvram ou --lowvram au lancement si votre GPU a moins de 8 Go. Cela ralentit mais permet d'utiliser SD sur des configs modestes.
Fonctionnalites cles
Modeles IA
Stable Diffusion 3.5 Largev3.5
RecommandeMeilleure qualité et suivi des prompts (8B)
Le modèle le plus puissant de la famille : architecture MMDiT 8 milliards de paramètres, meilleur rendu de texte. La référence open source en 2026.
Stable Diffusion 3.5 Large Turbov3.5
Vitesse (génération en 4 étapes)
Variante distillée de SD 3.5 Large, optimisée pour générer une image de qualité en seulement 4 étapes.
Stable Diffusion 3.5 Mediumv3.5
Tourner sur du matériel grand public (2.5B)
2,5 milliards de paramètres, pensé pour les GPU grand public tout en restant personnalisable.
Stable Diffusion XLvSDXL
Écosystème LoRA/ControlNet le plus mature
3,5 milliards de paramètres. La base de l'immense bibliothèque de LoRAs et de modèles communautaires.
Stable Diffusion XL TurbovSDXL
Génération temps réel
Variante SDXL ultra-rapide (Adversarial Diffusion Distillation) pour du rendu quasi instantané.
Tarifs & plans
Local
Gratuit
- Installation sur votre PC
- GPU 8GB+ recommandé
- Illimité
DreamStudio
Crédits
- 1000 crédits = 10$
- ~5000 images
- SD 3.5, SDXL
Questions frequentes
Glossaire associe
Checkpoint
Fichier contenant le modèle entraîné de Stable Diffusion, déterminant le style et la qualité des images générées.
LoRA
Petit module qui s'ajoute au modèle pour apprendre un style ou un sujet spécifique sans modifier le checkpoint principal.
CFG Scale
Paramètre qui contrôle à quel point l'image doit respecter strictement votre prompt textuel.
Sampling method
Algorithme qui détermine comment le bruit est retiré progressivement pour créer l'image finale (Euler, DPM++, etc.).
ControlNet
Extension qui permet de guider la génération en utilisant des images de référence pour la pose, la profondeur ou les contours.
Prompt négatif
Liste de mots ou phrases à exclure de l'image, utile pour éviter les défauts comme des mains déformées.
Upscale
Processus d'augmentation de la résolution d'une image générée via des modèles spécialisés comme ESRGAN ou SwinIR.