Cómo crear con IA generativa imágenes realistas
Cada vez más, los modelos de Inteligencia Artificial generativa para la creación de imágenes como Midjourney y Dall-E o Bing/Copilot, permiten producir en segundos imágenes y fotografías con cada vez mayor realismo y calidad técnica y estética. Y en ese proceso creativo la película fotográfica química tiene un papel influyente en el resultado de las imágenes digitales producidas con IA generativa.
De hecho, la película fotográfica tiene una influencia significativa y visible en la fotografía digital actual. Muchas cámaras digitales, filtros como los de Instagram, o ajustes de programas como Adobe Lightroom permiten emular cualidades estéticas que tienen su origen en la película fotográfica convencional, incluyendo sus imperfecciones y limitaciones; primero para que no resultaran tan digitales, y ahora para que no parezcan tan artificiales.
A lo largo de siglo y medio la imagen fotográfica resultante, en términos técnicos y estéticos, como de estilo y carácter, ha dependido en buena parte de la película elegida.
Factores como el fabricante de la película, su propósito y características técnicas, el proceso de fabricación o los materiales y químicos utilizados han dejado a lo largo de la historia de la fotografía rasgos característicos en millones de imágenes. Rasgos que pueden aplicarse a las imágenes creadas mediante IA generativa.
En IA generativa indicar un tipo de película química ayuda a simplificar el proceso de generación de imágenes realistas y de aspecto más natural. También permite desarrollar un estilo personal en la creación de imágenes, o tener mayor control sobre el resultado técnico y estético aprovechando el tipo de escena y las características más reconocibles de esa película. Vamos a ilustrar esto en este post generando con IA imágenes de ejemplo.
Impacto de la película química en la IA generativa
La IA generativa emplea instrucciones de texto (prompts) para crear imágenes digitales. Al especificar tipos de película fotográfica en el prompt es posible influir en mayor o menor medida en el estilo y la estética de las imágenes generadas, acotar los modelos de referencia y ordenar implícitamente un tipo de imagen realista.
Por ejemplo, un prompt que incluya el estilo Fujifilm Velvia 400 generará imágenes realistas con colores vivos y contrastes pronunciados sin necesidad de indicarlo en la instrucción, ya que son rasgos característicos de las fotografías tomadas con esa película.

Sin embargo, el mismo prompt virado a estilo Kodak Tri-X producirá una imagen en blanco y negro sin necesidad de indicarlo, resultando en una imagen digital de alto contraste, grano fino y gran nitidez característico de esa película.

La IA generativa puede interpretar el tipo o estilo de película y tenerla en cuenta a la hora de generar la imagen, simulando su estilo visual y características.
Simplificación de la creación de imágenes
De este modo mencionar estilos de película química en la IA generativa ahorra especificar otros parámetros que ya van implícitos en el estilo de la película mencionada: colores y tonos, saturación, grano, rango dinámico y contraste, textura y hasta la calidad general de la imagen generada.
Aunque no es necesario, describir estos u otros parámetros (como el tipo de luz o el ángulo de la cámara) sí ayuda al modelo a interpretar el tipo de imagen y a responder a la petición con más precisión.

Otro ejemplo sería indicar en el prompt estilo Kodak Professional Ektachrome E100, una película especialmente apreciada para capturar escenas que requieren alta precisión en la reproducción de colores brillantes y vívidos con gran precisión cromática y detalles finos, incluso en situaciones de poca luz.

Muy característico es también el resultado de añadir en el prompt estilo Polaroid, la película que ya en los años de 1970 permitía tener las fotografías en papel a los pocos segundos de haberla tomado sin pasar por el laboratorio de revelado.

La película Kodak Portra 400 es especialmente apreciada por su versatilidad, ya que puede utilizarse en una amplia variedad de condiciones de iluminación, incluyendo situaciones de poca luz. Además, ofrece un rango tonal excepcionalmente amplio, lo que permite obtener imágenes con una gran cantidad de detalles tanto en las luces como en las sombras.
Película Kodachrome 64
Kodachrome 64, de Kodak, fue una película fotográfica conocida por su precisión de color y baja sensibilidad (ISO 64) muy adecuada para condiciones de mucha luz. Se fabricó entre 1935 y 2009.
En 1984 Steve McCurry usó película Kodachrome 64 para tomar su icónica foto de Sharbat Gula, "la niña afgana", que fue portada de la revista National Geographic en 1985. Esta imagen destaca por la intensidad de sus colores. En el contexto de la IA generativa, Kodachrome 64 sería una buena elección para generar un retrato digital realista con colores naturales intensos.
Otros parámetros de fotografía que influyen en la IA generativa
Además de la elección de película fotográfica, hay otros parámetros y ajustes de cámara de la fotografía convencional que también pueden influir en la apariencia y resultado final de las imágenes generadas con IA:
- Sensibilidad ISO: La mención de un ISO alto en el prompt puede resultar en imágenes con más ruido o grano, similar a las fotografías tomadas en condiciones de baja luz o con un ISO alto.
- Apertura: Incluir una apertura amplia como f/2 en el prompt probablemente generará imágenes con un fondo desenfocado, lo que enfatizará el sujeto principal. Por otro lado, una apertura pequeña, como f/11, dará lugar a una mayor profundidad de campo y una imagen global más enfocada y plana.

- Velocidad de obturación: Indicar una velocidad de obturación alta o baja (o de forma numérica) afectará a la captura del movimiento. Esto puede traducirse en imágenes que congelan la imagen o en imágenes que por el contrario 'capturan' el movimiento, como en una fotografía de larga exposición.

- Balance de blancos y contraste: Estos parámetros también influyen en la apariencia de la imagen. Un balance de blancos cálido dará tonos más amarillos, mientras que uno frío dará tonos más azules. El contraste alto producirá sombras más oscuras y luces más brillantes, mientras que el contraste bajo suavizará las sombras y las luces brillantes.
- Saturación y HDR: La saturación alta generará colores más vivos e intensos, mientras que la saturación baja dará lugar a colores más apagados. HDR puede resultar en más detalle en luces y sombras.

Además de estos parámetros, la IA generativa también puede interpretar y tener en cuenta otros detalles relacionados con la fotografía, como el tipo de objetivo (gran angular, teleobjetivo, ojo de pez, macro), la iluminación, incluyendo uso de flash, el enfoque selectivo, el ángulo de la cámara o la distancia en metros, entre otros. Estos ajustes proporcionan más información al modelo, resultando en un mayor control sobre el resultado final.
Más allá de la fotografía digital, la película fotográfica química mantiene su influencia en la creación de imágenes digitales mediante IA generativa. La elección de un estilo de película fotográfica en los prompts de IA generativa influye en el tipo y apariencia de la imagen final, a la vez que define aspectos técnicos y estéticos clave, proporcionando un mayor control y participación en el resultado final de las imágenes generadas.
🎞️ Todas las imágenes de este post están generadas con IA (Dall-e + Magnific.ai) para mostrar con ejemplos los posibles resultados, aunque el mismo concepto puede aplicarse a otros modelos de IA generativa. Dall-e, de OpenAI, se puede utilizar también a través de ChatGPT o Bing y Copilot, de Microsoft.