Logo Stable Diffusion

Stable Diffusion

Le modèle de génération d'images open-source le plus populaire

FreemiumRoyaume-Uni

Presentation

Stable Diffusion est un modèle de génération d'images open source développé par Stability AI. Sa nature ouverte permet à n'importe qui de l'utiliser, le modifier et l'héberger en local.

C'est l'outil de choix quand tu veux un contrôle total, des personnalisations poussées (LoRAs, ControlNet) ou générer sans restrictions.

La dernière version majeure reste **Stable Diffusion 3.5**, en trois variantes : **Large** (8 milliards de paramètres, architecture MMDiT, le plus qualitatif avec un bien meilleur rendu de texte), **Large Turbo** (qualité en seulement 4 étapes) et **Medium** (2,5 milliards de paramètres, prévu pour tourner sur des GPU grand public). **SDXL** et **SDXL Turbo** restent très utilisés, surtout pour leur écosystème de LoRAs et de modèles communautaires, le plus mature de tous.

En 2026, Stable Diffusion reste excellent mais n'est plus le premier choix automatique : les meilleurs modèles propriétaires (GPT Image, Gemini Image) le devancent au classement Elo. Son avantage reste imbattable : c'est gratuit, local, ouvert et infiniment personnalisable. À noter, Stability AI a aussi élargi son offre au-delà de l'image (modèles audio).

Comment utiliser

Via DreamStudio (stability.ai), Clipdrop, ou de nombreuses interfaces tierces.

Installez Automatic1111, ComfyUI, ou Fooocus pour une utilisation locale gratuite et sans limites.

  • LoRA : Petits modèles additionnels pour des styles spécifiques
  • ControlNet : Contrôle précis de la pose, profondeur, contours
  • Embeddings : Concepts personnalisés

Astuces & conseils

Optimiser le prompt

Commencez par un prompt positif précis et ajoutez un prompt négatif pour exclure les défauts. Testez des modèles personnalisés (checkpoints) pour des styles spécifiques.

Maîtriser les paramètres

Réglez le CFG Scale entre 7 et 12 pour un bon équilibre créativité/précision. Gardez les steps entre 20 et 50 pour des résultats rapides et propres.

Utiliser les LoRA

Intégrez des LoRA pour styliser vos images sans réentraîner le modèle. Un poids de 0.7-0.9 suffit souvent pour un effet naturel.

Contrôler la composition

Employez ControlNet avec des images de référence pour guider la pose ou la perspective. Cela garantit une cohérence parfaite dans vos séries.

Économiser la VRAM

Activez --medvram ou --lowvram au lancement si votre GPU a moins de 8 Go. Cela ralentit mais permet d'utiliser SD sur des configs modestes.

Fonctionnalites cles

Modeles IA

Stable Diffusion 3.5 Largev3.5

Recommande

Meilleure qualité et suivi des prompts (8B)

Le modèle le plus puissant de la famille : architecture MMDiT 8 milliards de paramètres, meilleur rendu de texte. La référence open source en 2026.

Stable Diffusion 3.5 Large Turbov3.5

Vitesse (génération en 4 étapes)

Variante distillée de SD 3.5 Large, optimisée pour générer une image de qualité en seulement 4 étapes.

Stable Diffusion 3.5 Mediumv3.5

Tourner sur du matériel grand public (2.5B)

2,5 milliards de paramètres, pensé pour les GPU grand public tout en restant personnalisable.

Stable Diffusion XLvSDXL

Écosystème LoRA/ControlNet le plus mature

3,5 milliards de paramètres. La base de l'immense bibliothèque de LoRAs et de modèles communautaires.

Stable Diffusion XL TurbovSDXL

Génération temps réel

Variante SDXL ultra-rapide (Adversarial Diffusion Distillation) pour du rendu quasi instantané.

Tarifs & plans

Populaire

Local

Gratuit

  • Installation sur votre PC
  • GPU 8GB+ recommandé
  • Illimité

DreamStudio

Crédits

  • 1000 crédits = 10$
  • ~5000 images
  • SD 3.5, SDXL

Questions frequentes

Minimum 6GB VRAM pour SD 1.5, 8GB+ recommandé pour SDXL. Les GPU NVIDIA sont préférés (CUDA), mais AMD fonctionne aussi avec ROCm.
Low-Rank Adaptation - Un petit fichier (~100MB) qui modifie le comportement du modèle pour un style ou sujet spécifique, sans remplacer le modèle entier.

Glossaire associe

Checkpoint

Fichier contenant le modèle entraîné de Stable Diffusion, déterminant le style et la qualité des images générées.

LoRA

Petit module qui s'ajoute au modèle pour apprendre un style ou un sujet spécifique sans modifier le checkpoint principal.

CFG Scale

Paramètre qui contrôle à quel point l'image doit respecter strictement votre prompt textuel.

Sampling method

Algorithme qui détermine comment le bruit est retiré progressivement pour créer l'image finale (Euler, DPM++, etc.).

ControlNet

Extension qui permet de guider la génération en utilisant des images de référence pour la pose, la profondeur ou les contours.

Prompt négatif

Liste de mots ou phrases à exclure de l'image, utile pour éviter les défauts comme des mains déformées.

Upscale

Processus d'augmentation de la résolution d'une image générée via des modèles spécialisés comme ESRGAN ou SwinIR.

4/5
MAJ : 7 juin 2026
Fonde en 2022
663 vues

Ressources connexes