Guides

Técnicas de Prompts para Stable Diffusion: Guía Avanzada

M
Mourad Z.AI & Prompt Engineering Specialist
3 de enero de 2025
5 min de lectura

Domina Stable Diffusion con estas técnicas avanzadas de prompting. Aprende sintaxis, pesos, prompts negativos y estrategias específicas por modelo.

Técnicas de Prompts para Stable Diffusion: Guía Avanzada
Compartir:

Dominando los Prompts de Stable Diffusion

Stable Diffusion ofrece un control sin igual sobre la generación de imágenes con IA, si sabes cómo usarlo. A diferencia de interfaces más simples, Stable Diffusion recompensa el conocimiento técnico con resultados precisamente adaptados. Esta guía cubre las técnicas avanzadas de prompting que elevarán tus creaciones en Stable Diffusion.

Ya sea que uses la interfaz web de AUTOMATIC1111, ComfyUI u otra interfaz, estas técnicas se aplican de forma general. Cubriremos sintaxis de prompts, ponderación, prompts negativos, estrategias específicas por modelo y flujos de trabajo avanzados.

Entendiendo la Sintaxis de Prompts

Stable Diffusion interpreta los prompts de forma diferente al lenguaje natural de la IA. Comprender su sintaxis es crucial:

Estructura básica: Los prompts se procesan como conceptos separados por comas. Cada concepto se interpreta individualmente y luego se combina. "a red car, sunset, beach" procesa tres elementos distintos.

El orden de las palabras importa: Los tokens anteriores generalmente reciben más atención. Coloca tus conceptos más importantes primero.

Paréntesis para énfasis: (word) aumenta la atención en 1.1x. ((word)) la aumenta en 1.21x (1.1 al cuadrado). Puedes anidar hasta 3-4 niveles antes de obtener rendimientos decrecientes.

Corchetes para de-énfasis: [word] disminuye la atención en 0.9x. [[word]] la disminuye en 0.81x. Útil para elementos sutiles del fondo.

Pesos explícitos: (word:1.5) establece el peso de atención exacto. Típicamente usa un rango de 0.5-1.5. Ir más allá de 2.0 a menudo causa artefactos.

SyntaxEffectMultiplierExample
(word)Increase attention1.1x(beautiful landscape)
((word))Strong increase1.21x((detailed eyes))
(word:1.5)Explicit weight1.5x(golden hour:1.5)
[word]Decrease attention0.9x[background trees]
[word:0.5]Explicit reduction0.5x[clouds:0.5]
[word1:word2:0.5]Prompt switchingAt 50% of steps[cat:dog:0.5] blends concepts

Recommended Sampler Settings

For photorealism: DPM++ 2M Karras, 25-30 steps, CFG 7-8

For artistic/stylized: Euler a, 20-25 steps, CFG 7-9

For speed: DPM++ SDE Karras, 15-20 steps, CFG 7

For maximum detail: DPM++ 2M Karras, 40-50 steps, CFG 7-8, with Hires. fix

Dominando los Prompts Negativos

Los prompts negativos son donde Stable Diffusion realmente brilla. Le indican al modelo qué evitar, mejorando drásticamente la calidad.

Base esencial de prompt negativo: Comienza con negativos basados en calidad: "blurry, low quality, lowres, bad anatomy, bad hands, cropped, worst quality, low quality, normal quality, jpeg artifacts, watermark, text, signature"

Negativos específicos por estilo: Añade negativos según tu estilo objetivo:

Para fotorrealismo: "cartoon, anime, illustration, painting, drawing, art, sketch"

Para anime/ilustración: "photorealistic, photograph, 3d, 3d render, realistic"

Para imágenes limpias: "busy background, cluttered, noisy, grainy"

Negativos de anatomía: "bad anatomy, bad hands, missing fingers, extra fingers, extra limbs, missing limbs, fused fingers, too many fingers, mutated hands, malformed limbs, extra arms, extra legs"

Negativos faciales: "deformed face, ugly face, asymmetric eyes, bad eyes, cross-eyed, blurry face"

Ponderación Avanzada de Prompts

La ponderación estratégica crea resultados con matices:

Énfasis en el sujeto: Da a tu sujeto principal un peso mayor que a los elementos del fondo. "(beautiful woman:1.3), garden background, soft lighting" centra la atención en el sujeto.

Equilibrio de estilos: Al combinar estilos, pondera cada uno: "portrait, (oil painting:0.8), (impressionist:0.6)" crea una mezcla sutil de estilos.

Control de detalles: Pondera las palabras clave de detalle: "landscape, mountains, (intricate details:1.2), (8k:1.1)" sin excederte.

Mezcla de prompts: Usa la sintaxis [from:to:when] para transiciones: "[day:night:0.5]" transiciona de día a noche en el paso 50%.

Estrategias Específicas por Modelo

Diferentes modelos de Stable Diffusion responden a diferentes enfoques:

SDXL: Maneja el lenguaje natural mejor que SD 1.5. Puede usar prompts más largos y descriptivos. Se beneficia de descripciones detalladas de escenas. Resolución recomendada: 1024x1024 o similar.

Modelos SD 1.5: Prefieren prompts estilo palabras clave. Los prompts más cortos y enfocados funcionan mejor. Muchos están entrenados en estilos específicos: usa sus palabras de activación. Resolución común: 512x512.

Modelos realistas (como Realistic Vision): Se benefician de términos fotográficos: "DSLR, 85mm, f/1.8, bokeh". Incluye descripciones de iluminación: "studio lighting, natural light, rim light". Referencia configuraciones de cámara para autenticidad.

Modelos de anime: Usa etiquetas de calidad específicas de anime: "masterpiece, best quality, highly detailed". Incluye referencias de estilo artístico: "by (nombre del artista)". Las palabras clave de descripción del personaje importan más que el lenguaje natural.

Control de Composición y Diseño

Guía la composición de la imagen a través de los prompts:

Palabras clave de perspectiva: "wide shot, close-up, medium shot, bird's eye view, worm's eye view, Dutch angle, straight-on, profile view"

Encuadre: "centered, rule of thirds, symmetrical, asymmetrical, full body, portrait, headshot"

Relaciones espaciales: Sé explícito sobre el posicionamiento: "woman standing in foreground, mountains in background, river between them"

Consideraciones de relación de aspecto: Ajusta tu prompt a la proporción de salida. Los retratos funcionan mejor en proporciones verticales; los paisajes en horizontales.

Palabras Clave de Mejora de Calidad

Estas palabras clave mejoran los resultados de forma consistente:

Calidad general: "masterpiece, best quality, highly detailed, sharp focus, professional, high resolution, 8k, 4k"

Iluminación: "beautiful lighting, dramatic lighting, soft lighting, volumetric lighting, cinematic lighting, golden hour, rim light"

Renderizado: "detailed, intricate, elaborate, highly detailed, fine details, sharp, crisp"

Calidad artística: "award-winning, trending on artstation, artstation quality, deviantart quality"

Nota: La efectividad varía según el modelo. Prueba qué funciona para tu checkpoint específico.

Técnicas de Flujo de Trabajo Avanzadas

Sube de nivel con estos enfoques avanzados:

Refinamiento progresivo: Genera primero a menor número de pasos/resolución para iterar rápidamente. Una vez que encuentres una buena composición, regenera a mayor calidad.

Manipulación de semilla: Bloquea las semillas para mantener la composición mientras ajustas los prompts. Usa seed+1, seed+2 para encontrar variaciones similares pero diferentes.

Programación de prompts: Cambia los prompts durante la generación: "[detailed background:simple background:0.6]" comienza detallado y cambia a simple.

Comodines: Usa la sintaxis de comodines para variedad: "a __color__ __animal__ in a __setting__" extrae de listas predefinidas.

Integración con ControlNet: Combina prompts de texto con ControlNet para un control preciso sobre la pose, composición y estilo mientras mantienes la influencia del prompt.

Solucionando Problemas Comunes

Sobresaturación/Artefactos: Reduce los pesos de énfasis. Baja la escala de CFG. Añade negativos de calidad.

Ignora partes del prompt: Aumenta el peso en los conceptos ignorados. Mueve los elementos importantes al principio. Simplifica el prompt: demasiados conceptos diluyen la atención.

Estilos inconsistentes: Usa palabras clave de estilo más específicas. Prueba modelos diferentes mejor adaptados a tu estilo objetivo. Aumenta los pesos relacionados con el estilo.

Anatomía incorrecta: Añade negativos de anatomía completos. Prueba modelos diferentes. Usa ControlNet para guía de pose. Genera a resoluciones más altas.

Conclusión

La complejidad de Stable Diffusion es su fortaleza: dominar estas técnicas te da un control creativo inigualable comparado con plataformas más simples. Empieza con los fundamentos, incorpora técnicas avanzadas gradualmente y experimenta siempre.

Recuerda que diferentes modelos responden de forma distinta. Lo que funciona para un checkpoint puede necesitar ajustes para otro. Construye tu biblioteca personal de prompts efectivos para tus modelos preferidos y sigue refinando tu enfoque a medida que aprendes qué funciona.

La comunidad de Stable Diffusion descubre constantemente nuevas técnicas. Mantente involucrado en foros, servidores de Discord y repositorios de GitHub para mantener tus habilidades actualizadas. ¡Feliz generación!

M

Mourad Z.

AI & Prompt Engineering Specialist

Mourad is a prompt engineering specialist and co-founder of Reprompte. With deep expertise in AI image generation tools like Midjourney, Stable Diffusion, and DALL-E, he helps creators unlock the full potential of AI art through effective prompting techniques.

Artículos relacionados

¿Listo para crear prompts increíbles?

Pon estos consejos en práctica con nuestro generador de prompts de IA gratuito. Transforma tus ideas en prompts optimizados al instante.