Últimos posts
Tema - diseño
Tema - Fotografía
Tema - Investigación
Tema - Pensamiento y crítica

El futuro de la Arquitectura es de los escritores

3 grandes reflexiones al generar imágenes con IA

En las últimas semanas múltiples paisajes fantásticos, casas imposibles y animales estrambóticos han llenado nuestros stories de Instagram o nuestras timelines en Twitter. ¿De dónde salen estas barbaridades? Nada más y nada menos que de la inteligencia artificial (IA).

La tecnología está avanzando a un ritmo exponencial y existen una serie de generadores de imágenes que usan la IA como motor; los más reconocidos son DALL-E 2 y Midjourney. Estos días hemos tenido acceso a la beta de los dos y ha sido una agradable sorpresa ver su potencial de uso en nuestro sector. ¿Puede llegar a sustituir, de forma más asequible, los rénderes, los collages, y hasta en algún momento, las plantas y secciones?

Gracias a esta experiencia nos planteamos 3 reflexiones para el uso futuro de la generación de imágenes con Inteligencia Artificial en la Arquitectura.

Imagen generada con DALL-E 2. Descripción: “Sydney Opera Constructivist Painting”

Pero primero, un poco de contexto.

Poco a poco se están abriendo estas plataformas al público en general y esto no podía ser mejor noticia para el mundo de la Arquitectura. Todos los generadores funcionan de manera muy similar: se introduce una palabra, una letra, un número, un emoji, o un texto, y al cabo de pocos segundos aparecen en pantalla las cuatro imágenes que la IA considera más acertadas. Hay otra manera de empezar a generar las imágenes: aportando una imagen propia. En ambos casos se puede seleccionar una área y se puede completar la imagen, incluso se puede “inventar” otra zona. ¿Y lo mejor de todo? Estas imágenes se pueden ampliar a alta resolución.

¿Cómo pueden llegar a reconstruir imágenes o hasta copiar estilos pictóricos? Estos sistemas se entrenan con bases de datos de millones de imágenes que la IA analiza para obtener patrones, y a través de Deep Learning encuentra las variables que le permiten organizar y categorizar cada uno de los elementos que conforman las imágenes. Básicamente, es como tener una gran red de referencias a nuestro lado organizada por múltiples variables, tantas que se escapa de la capacidad intelectual del ser humano.

Ahora mismo existen distintos generadores, algunos opensource como Crayon (que se basa en la tecnología de DALL-E Mini) y otros, como en el caso de DALL-E 2 y Midjourney, los más avanzados y rápidos, que tienen una beta gratuita pero con créditos hasta un límite de varias decenas de creaciones. Aun así, se puede ampliar estos límites pagando únicamente 13 céntimos por cada generación de un bloque de cuatro imágenes.

Los créditos vuelan rápido, la emoción puede con nosotros al inicio. Genera mucha adicción recibir unos resultados, más que interesantes, al escribir cualquier tontería. Al hacer pruebas más serias, la cosa empieza a tomar sentido. Tanto que hasta la revista Cosmopolitan ha usado DALL-E 2 para diseñar una de sus portadas. Este hito cambia completamente la manera que tenemos de pensar en imágenes.

Vídeo resumen del proceso de diseño de la portada de la revista Cosmopolitan

Estas son las tres reflexiones que nos planteamos al usar intensamente los generadores de inteligencia artificial durante unos días:

#1 – Refuerza el peso de la imagen

Si las imágenes ya tienen un peso muy especial en nuestro sector, aún lo tendrán más. Y sí, existe el eterno debate de si la Arquitectura se debe proyectar desde los ojos o desde las sensaciones (véase Juhani Pallasmaa).

Pero la realidad en nuestra disciplina es que las imágenes estan al orden del día. ¿Podemos utilizar el mismo sistema de trabajo que han utilizado en Cosmopolitan junto a la artista Karen X Cheng para la Arquitectura? ¿Se ha terminado la era de los rénderes o empieza otra era en que tanto los clientes, como los propios arquitectos tendremos una herramienta de discusión nueva?

La facilidad de uso de estos generadores de imágenes, así como el bajo coste, puede llevar a que la imagen tome aún más relevancia.

Seven Lives de Anna & Eugeni Bach. Fotografía original. ©Anna&Eugeni Bach

Imagen modificada con DALL-E 2 a partir de la original de Anna & Eugeni Bach. Selección de los edificios adyacentes y descripción: “imaginative building in the style of magritte”

#2 – Tenemos unx nuevx compañerx

Con esta tecnología nos aparece un personaje nuevo en el estudio. Puede aportar nuevas referencias visuales y ser un sparring en este campo, casi como si tuviéramos una persona más contratada.

Imagen generada con Midjourney con la descripción: “Building, magritte style”

Imagen generada con Midjourney con la descripción: “Building, magritte style”

Evidentemente, no es oro todo lo que reluce. Estamos en una sociedad occidental, blanca y heteropatriarcal; y el mundo de internet tiene una situación similar, sumando la prevalencia de la lengua inglesa. Por lo tanto. las bases de datos con las que se ha entrenado a estos generadores estan sesgadas y, en consecuencia, sus resultados también. Funciona como un espejo de las lacras de nuestra sociedad y muestra la falta de diversidad de género y cultural. Por ejemplo, si se introduce el concepto “CEO” aparece un hombre blanco vestido con camisa y americana; y si se introduce el término “nurse”, infermerx en inglés, aparece siempre una mujer.

Esperamos que la base de datos se vaya diversificando y acoja todas las diversidades. Por ahora, el único mecanismo de control somos los propios usuarios.

#3 – Renacimiento de la precisión

Los escritores serán más importantes que nunca. El peso de la palabra será muy alto. Hacen falta buenas indicaciones a la IA que permitan traducir lo que uno tiene en la cabeza en imágenes. Es muy diferente escribir un paisaje oscuro, que un paisaje sombrío.

En un momento en que tendemos a uniformizar y simplificar el lenguaje, esta herramienta nos pide precisión en los términos usados en la descripción. Cada matíz es un mundo y cambia radicalmente los resultados. De hecho, la misma descripción puede dar lugar a infinitud de resultados diferentes.

Tomas descartadas de la portada de Cosmo, con el texto de “a strong female president astronaut warrior walking on the planet Mars, digital art synthwave.”

Tomas descartadas de la portada de Cosmo, con el texto de “a strong female president astronaut warrior walking on the planet Mars, digital art synthwave.”

Portada de la Cosmopolitan Magazine: “wide-angle shot from below of a female astronaut with an athletic feminine body walking with swagger toward camera on Mars in an infinite universe, synthwave digital art”

Portada de la Cosmopolitan Magazine: “wide-angle shot from below of a female astronaut with an athletic feminine body walking with swagger toward camera on Mars in an infinite universe, synthwave digital art”

Conclusión

¿Es el fin de los renderistas? ¿La renovación de los escritores? Lo que está claro es que esta herramienta ha llegado aquí para quedarse y nos brinda a los profesionales de la arquitectura una gran oportunidad para utilizarla en nuestros proyectos, sea como concepto inicial, para un dibujo de proceso, o para una imagen finalista; y quien sabe si en algún momento podrá llegar a hacer plantas, secciones o hasta un proyecto al completo.

¿Qué os parece? ¿Lo utilizaríais en vuestro estudio? ¡Mostradnos en los comentarios vuestras creaciones!

Referencias

https://www.cosmopolitan.com/lifestyle/a40314356/dall-e-2-artificial-intelligence-cover/

Por:
Eduard Llorens-Pomé es arquitecto, estudiante del máster habilitante en la ETSAB y cofundador de @comma_edit. En 2020 co-creó el ciclo de conferencias “CdeConfinament” que fue finalista en la BEAU, y finalista y mención especial del jurado en los Premios FAD de Pensamiento y Crítica.

Deja un comentario

Tu correo no se va a publicar.

Últimos posts