Daniel Estrella

Sitio personal y reflexiones ✨

🗄️ Archivo

En busca del generador perfecto de stochastic motion

Ya llevo un tiempo generando imágenes con Stable Diffusion y, después de varias vueltas, encontré un flujo que me agrada en gran medida. Siento que ya no estoy solamente apretando botones al azar: hay un proceso, una intención y un resultado que se parece bastante a lo que traía en la cabeza.

El siguiente paso lógico, al menos para mí, era animar esas fotos. Algo sencillo, tipo live photos o las fotos animadas de la saga de Harry Potter: un parpadeo, un gesto leve, un airecito de vida. Nada de convertirlas en tráiler de película, solo darles ese pequeño movimiento que hace que la imagen respire.

Primero vinieron los intentos fallidos con plugins para A1111 y luego las frustraciones interminables con ComfyUI. Por un momento desistí, hasta que salió Grok y su habilidad para animar imágenes. Ahí sí me divertí un rato: subía algunas imágenes, probaba resultados y de pronto parecía que la búsqueda iba por buen camino.

Hasta que volvieron de pago la funcionalidad y ahí se acabó lo divertido. Entonces empecé a probar Meta, que funciona decentemente, pero con demasiada frecuencia me topé con el mensaje:

No pude animar esa foto. Algo en la imagen activó los filtros del sistema y no se pudo procesar 😅

Y claro, uno se queda viendo la imagen pensando: ¿pero qué viste que yo no vi?

Al final me animé a probar RunwayML con mis créditos de bienvenida. Subí una de las imágenes que había generado error en Meta, le puse un prompt y... mm, medio feo el resultado. Después dejé solo la foto, sin prompt, y mejoró bastante. De hecho sí me gustó; luego ChatGPT me dijo que eso se llama stochastic motion / idle animation synthesis, que suena muy técnico para decir: se mueve poquito, pero bonito.

Tristemente, los créditos de bienvenida de RunwayML son poquitos, así que seguiré en mi búsqueda del generador perfecto de stochastic motion. Por ahora me quedo con este experimento como prueba de que el camino va tomando forma.

Imagen generada con Stable Diffusion y preparada para una live photo.
LIVE
Imagen generada con Stable Diffusion y animada en RunwayML, sin prompt adicional.