Video IA Desde Imagen: El Flujo de Trabajo de Producción Completo
Hay una brecha masiva de calidad entre alguien que sube una imagen de IA a Runway y hace clic en "generar" versus alguien que sigue un flujo de trabajo de producción adecuado. La diferencia se nota en el producto final: uno se ve obviamente generado por IA, el otro podría pasar por metraje real en la mayoria de las plataformas.
Este artículo desglosa el flujo de trabajo profesional de 5 fases que uso para cada video que produzco. Cada fase incluye herramientas específicas, ajustes y parametros. Esto no es teoria - es el proceso exacto detrás del contenido que he estado publicando durante el último ano.
Preparacion de Imagen
Esta fase toma 15-20 minutos pero previene horas de generaciones de video desperdiciadas. Saltala y quemaras creditos regenerando clips que fallan porque la imagen fuente tenía problemas.
Escalado
Cada imagen fuente debería escalarse al menos 2x su resolución de generación antes de entrar al pipeline de video. Si generaste a 768x1344, escala a 1536x2688. La razon: los modelos de IA de video extraen detalle de la imagen de entrada para informar los frames generados. Más detalle en la fuente significa video de mayor calidad y mas estable.
Mejores herramientas de escalado:
- Topaz Gigapixel AI - $99 pago único. La mejor calidad para rostros fotorrealistas. Usa el modo "Standard" con "Recover Original Detail" al 50%.
- Real-ESRGAN (via Automatic1111 o ComfyUI) - Gratis. Usa el modelo "4x-UltraSharp". La calidad es aproximadamente el 85% de Topaz pero no cuesta nada.
- Magnific AI - $39/mes. Mejor para agregar detalle durante el escalado. Puede realmente mejorar la calidad facial, no solo agrandarla. Excesivo para la mayoria de los casos pero vale la pena para imágenes principales.
Correccion de Relación de Aspecto
Si tu imagen no esta ya en la relación de aspecto objetivo, recortala ahora. No confies en que la herramienta de video maneje la conversion de relación de aspecto - la mayoria estira o agrega letterboxing feo.
| Reels / TikTok | 9:16 (1080x1920 o 1536x2688) |
| YouTube Shorts | 9:16 (1080x1920) |
| YouTube Estandar | 16:9 (1920x1080 o 2560x1440) |
| Feed de Instagram | 4:5 (1080x1350) |
Eliminacion de Artefactos
Revisa cada imagen y corrige:
- Anomalias en manos - Dedos extra, dedos fusionados, poses antinaturales. Usa el relleno generativo de Photoshop o inpainting SDXL con un LoRA específico para manos.
- Distorsion de joyeria - Aretes, collares y anillos frecuentemente tienen artefactos de IA. Repintalos o eliminalos completamente.
- Inconsistencias de fondo - Arquitectura deformada, objetos flotantes, reflejos imposibles. Estos se amplifican en video.
- Problemas de textura de piel - Piel excesivamente suavizada o areas con aspecto plastico. "Recover Face" de Topaz Photo AI puede ayudar, o usa la técnica de separacion de frecuencias de Photoshop.
Consejo para ahorrar tiempo: Crea una accion de Photoshop o un flujo de trabajo de ComfyUI para tus pasos de limpieza. Despues de unos pocos videos, notaras los mismos problemas cada vez. Automatizar las correcciones ahorra 5-10 minutos por imagen.
Generación de Video
Selección de Herramienta por Tipo de Toma
Elige tu herramienta basandote en la toma específica, no en lealtad a una sola plataforma:
- Primeros planos (rostro ocupa 40%+ del frame): Runway Gen-3 Alpha. Usa el modo "Turbo". Ajusta la intensidad de movimiento a 3/10.
- Tomas medias (de cintura para arriba): Kling AI 1.6 o Runway. Kling maneja mejor los gestos de brazos; Runway maneja mejor la calidad facial.
- Tomas de cuerpo completo: Kling AI 1.6. Sin discusion aquí. Ajusta el modo de movimiento a "Standard" e intensidad de movimiento a 5/10.
- Cabeza parlante: HeyGen. Sube la imagen, ingresa el guion, selecciona la voz. 5 minutos máximo por clip.
- Atmosferico/ambiente: Luma Dream Machine. La calidad cinematografica es inigualable para contenido sin dialogo.
Creación de Prompts por Herramienta
Prompts para Runway Gen-3 Alpha: Mantenlos cortos y enfocados en movimiento. Runway responde mejor a prompts de menos de 30 palabras. Ejemplo: "Woman slowly turns head right, natural blink, wind moves hair, soft lighting, static camera, photorealistic." Runway ignora palabras clave de estilo como "4K" o "cinematic" - genera a su calidad nativa independientemente.
Prompts para Kling AI 1.6: Kling maneja prompts mas largos y descriptivos. Incluye el movimiento de camara explicitamente. Ejemplo: "A woman walks slowly toward the camera on a city sidewalk, natural stride, arms relaxed at sides, slight smile. Camera: slow dolly backward at matching pace. Photorealistic, natural lighting, shallow depth of field." El modo "Professional" de Kling agrega unos 30 segundos al tiempo de generación pero mejora notablemente la calidad.
Prompts para Luma Dream Machine: Luma prospera con la atmosfera. Ejemplo: "Golden hour light wraps around a woman standing on a rooftop, wind moves her dress and hair, city skyline blurred in background, cinematic depth of field, slow camera push-in." Luma aplica automáticamente correccion de color cinematografica, así que no luches contra ello; acompanalo.
Parametros de Control de Movimiento
| Movimiento sutil (respiracion, pelo) | Intensidad: 2-3/10 |
| Giros de cabeza, expresiones | Intensidad: 3-4/10 |
| Gestos de parte superior del cuerpo | Intensidad: 4-5/10 |
| Caminata, cuerpo completo | Intensidad: 5-6/10 |
| Accion dinámica (evitar) | Intensidad: 7+/10 (alto riesgo de artefactos) |
Genera 2-3 versiones de cada clip. Tu tasa de éxito a intensidad 3-4 es aproximadamente 80%. A intensidad 6+, baja a 40-50%. Presupuesta tus creditos en consecuencia.
Posproduccion
Edicion: Recortar y Ordenar
Importa todos los clips generados a tu editor. Uso DaVinci Resolve para cualquier cosa de más de 30 segundos y CapCut para Reels/TikToks rapidos. Primer pasada:
- Recorta los primeros 0.3-0.5 segundos de cada clip (el artefacto de "morph-in")
- Recorta los ultimos 0.3-0.5 segundos (zona de degradacion)
- Ordena los clips en orden narrativo
- Agrega transiciones cross-dissolve de 0.3-0.5 segundos entre clips
Correccion de Color
Las herramientas de video IA producen temperatura de color inconsistente entre clips. Incluso generaciones consecutivas de la misma herramienta pueden verse diferentes. En DaVinci Resolve:
- Elige tu clip "heroe" - el que tiene el mejor color
- Usa "Shot Match" para igualar cada otro clip al grado del clip heroe
- Ajuste fino: sube ligeramente las sombras (Lift: +0.02), reduce los highlights (Gain: -0.03) y agrega una sutil curva S a la curva Lum vs. Sat para un look pulido
- Aplica un LUT consistente si tienes un look de marca. FilmConvert y Dehancer tienen presets populares.
En CapCut, los "Filtros" integrados son una aproximacion mas rápida. Las categorias "Film" y "Retro" tienen varias opciones que aplican correccion de color consistente en todos los clips.
Estabilizacion
Algunos clips generados por IA tienen un temblor sutil, especialmente a intensidades de movimiento mas altas. Aplica estabilizacion en DaVinci Resolve (página Edit > Inspector > Stabilization) con modo "Translation" y suavidad a 0.5. No sobre-estabilices - crea un aspecto flotante y antinatural.
Audio
Grabacion y Generación de Voz en Off
Para contenido de influencers de IA, tienes dos opciones:
- Voz en off con IA (ElevenLabs): Usa el modelo Turbo v2.5. Ajustes: Stability 0.50, Similarity Boost 0.75, Style 0.00 (manten el estilo en cero para habla natural). Exporta como WAV para mejor calidad. Costo: aproximadamente $0.01-0.02 por oracion.
- Voz en off humana: Contrata en Fiverr ($15-50 por video). Mas natural pero agrega costo y tiempo de entrega. Algunos creadores usan su propia voz - esto funciona si te sientes comodo con que el influencer de IA tenga "tu" voz.
Selección de Música
Superpone música bajo la voz a -15 a -20 dB respecto a la voz en off. Para videos sin voz, la música se ubica a -6 a -10 dB. Iguala el BPM a tus cortes de edicion - si cortas cada 3 segundos, una pista de 100 BPM te da un ritmo natural para cortar.
Fuentes: Suno v4 para generación personalizada, Epidemic Sound ($15/mes) para pistas de biblioteca profesional, o Artlist ($17/mes) para música y efectos de sonido.
Diseño de Sonido
Tres capas hacen que el contenido se sienta pulido:
- Cama ambiental - Tono de sala, ambiente exterior o sonido específico de ubicacion. -20 a -25 dB. Constante durante todo el clip.
- Efectos foley - Pasos, crujido de ropa, sonidos de puerta, tintineo de vasos. -10 a -15 dB. Sincroniza con la accion en pantalla.
- Efectos de transición - Sonidos whoosh en cortes, caidas de bajo en revelaciones. -8 a -12 dB. Usa con moderacion.
Exportacion y Optimización por Plataforma
Ajustes de Exportacion por Plataforma
| Instagram Reels | 1080x1920, H.264, 30fps, 10-15 Mbps, AAC 320kbps |
| TikTok | 1080x1920, H.264, 30fps, 8-12 Mbps, AAC 256kbps |
| YouTube Shorts | 1080x1920, H.264, 30fps, 12-18 Mbps, AAC 320kbps |
| YouTube (estandar) | 2560x1440, H.264, 30fps, 25-35 Mbps, AAC 320kbps |
Siempre exporta archivos separados para cada plataforma. Nunca confies en el recorte integrado de la plataforma. TikTok comprime mas agresivamente que Instagram, así que de hecho exporto las versiones de TikTok con un poco más de enfoque (+10-15 en el enfoque de salida de DaVinci Resolve) para compensar.
Optimización de Tamano de Archivo
Instagram recomienda archivos de menos de 250MB. TikTok menos de 287MB. Para videos de 15-30 segundos, no alcanzaras estos limites con los bitrates anteriores. Para contenido mas largo, usa bitrate variable (VBR) con codificacion de 2 pasadas en DaVinci Resolve o HandBrake para compresion mas ajustada sin perdida de calidad visible.
Miniatura / Frame de Portada
Tanto Instagram como TikTok te permiten seleccionar un frame de portada. Elige el frame mas visualmente impactante de tu video - generalmente el angulo mas favorecedor de tu influencer de IA con la mejor iluminación. En Instagram, también puedes subir una imagen de portada personalizada. Genera una portada dedicada usando tu herramienta de imagen IA; no necesita ser un frame del video.
Verificacion de calidad antes de publicar: Ve la exportacion final en tu teléfono a pantalla completa. No en tu monitor, no en una tablet - en un teléfono. Así es como el 90%+ de tu audiencia lo vera. Revisa: artefactos visibles, balance de audio, legibilidad de subtitulos y si los primeros 3 segundos captan la atención.
Optimiza Tu Flujo de Trabajo de Producción
AI Influencer Tools genera conjuntos de prompts optimizados para cada fase de producción - desde generación de imagen hasta prompts de video y guiones de audio.
Empieza Tu Prueba Gratis