Últimos posts

… Y el tiempo se desenmarañó sin sonido por el suelo, como ovillos de lana.

¿Cuánto tiempo tarda una patera, con cincuenta o cien personas a bordo, viajando,(...)

Podcast: Fuera de tiempo, con Rodrigo Delso

Desde hace unos meses llevamos en este blog dando vueltas al tiempo, un tiempo que se enuncia siempre en múltiple, atmosférico,(...)

Trabajo, tiempo, crítica

La eliminación de cualquier discernimiento entre tiempo de trabajo y tiempo de vida es un significativo logro del(...)

Cartografías de un lunes

Los ritmos circadianos operan en nosotres aunque les aplastemos con la babucha de la urgencia-capital cada día laborable de la semana.(...)

Tema - diseño

O río do esquecemento: descentralización del paisaje gallego

Desde hace siglos, el territorio gallego ha sido utilizado como zona de extracción y(...)

Píxeles y paredes

En el verano de 2014 se publicó en la BBC una entrevista a un joven soldado de ISIS donde expresaba que su «vida es mejor que Call of(...)

Arquitectura-cuerpo-cerebro: Un baile que mide la IA

Zygmunt Bauman popularizó el término «contexto líquido» para describir la dinámica de la sociedad contemporánea. En este contexto,(...)

Tema - Fotografía

Podcast: Visión enmarcada, con Luis Díaz Díaz

Nos interesa encontrar las coordenadas del presente que habitamos para recorrer los múltiples futuros que contiene en su interior y(...)

Situatedness 100D, posibilidades de tridimensionalidad

El objetivo de un blog es la conversación. Aunque no he sido usuaria habitual de las informaciones compartidas en blogs fuera de fotolog o(...)

Mi propia razón

Creo que para hacer buena fotografía de arquitectura se necesita un conocimiento profundo de la materia. En este respecto, hay un par de(...)

Tema - Investigación

Sobre el proyecto «Campos. Despoblación, escuela rural y práctica espacial crítica»

Allá por el 2017, todavía una etapa postcrisis que queríamos pensar pasajera o(...)

¿Quién habita las fotovoltaicas?

“Están alicatando el campo” “Esterilizan el suelo y aumenta el riesgo de incendios” “Donde se planta una placa solar no vuelve a(...)

Arquitectura inadvertida: más allá del propio objeto.

En Arenys de Mar (el Maresme, Barcelona), existe una larga tradición conventual. En 1940, con una población de 6.000 habitantes, había(...)

Tema - Pensamiento y crítica

… Y el tiempo se desenmarañó sin sonido por el suelo, como ovillos de lana.

¿Cuánto tiempo tarda una patera, con cincuenta o cien personas a bordo, viajando,(...)

Podcast: Fuera de tiempo, con Rodrigo Delso

Desde hace unos meses llevamos en este blog dando vueltas al tiempo, un tiempo que se enuncia siempre en múltiple, atmosférico,(...)

Podcast: Amargor con Susana Cámara Leret

Entre los ríos Esla y Órbigo, en León, en una de las áreas más planas de la península ibérica, se extienden no tan extensos pero sí(...)

Por Eduard Llorens-Pomé

Publicado el 25.08.2022 en diseño, Fotografía, Investigación, Pensamiento y crítica

6 minutos

El futuro de la Arquitectura es de los escritores

3 grandes reflexiones al generar imágenes con IA

En las últimas semanas múltiples paisajes fantásticos, casas imposibles y animales estrambóticos han llenado nuestros stories de Instagram o nuestras timelines en Twitter. ¿De dónde salen estas barbaridades? Nada más y nada menos que de la inteligencia artificial (IA).

La tecnología está avanzando a un ritmo exponencial y existen una serie de generadores de imágenes que usan la IA como motor; los más reconocidos son DALL-E 2 y Midjourney. Estos días hemos tenido acceso a la beta de los dos y ha sido una agradable sorpresa ver su potencial de uso en nuestro sector. ¿Puede llegar a sustituir, de forma más asequible, los rénderes, los collages, y hasta en algún momento, las plantas y secciones?

Gracias a esta experiencia nos planteamos 3 reflexiones para el uso futuro de la generación de imágenes con Inteligencia Artificial en la Arquitectura.

Imagen generada con DALL-E 2. Descripción: “Sydney Opera Constructivist Painting”

Pero primero, un poco de contexto.

Poco a poco se están abriendo estas plataformas al público en general y esto no podía ser mejor noticia para el mundo de la Arquitectura. Todos los generadores funcionan de manera muy similar: se introduce una palabra, una letra, un número, un emoji, o un texto, y al cabo de pocos segundos aparecen en pantalla las cuatro imágenes que la IA considera más acertadas. Hay otra manera de empezar a generar las imágenes: aportando una imagen propia. En ambos casos se puede seleccionar una área y se puede completar la imagen, incluso se puede “inventar” otra zona. ¿Y lo mejor de todo? Estas imágenes se pueden ampliar a alta resolución.

¿Cómo pueden llegar a reconstruir imágenes o hasta copiar estilos pictóricos? Estos sistemas se entrenan con bases de datos de millones de imágenes que la IA analiza para obtener patrones, y a través de Deep Learning encuentra las variables que le permiten organizar y categorizar cada uno de los elementos que conforman las imágenes. Básicamente, es como tener una gran red de referencias a nuestro lado organizada por múltiples variables, tantas que se escapa de la capacidad intelectual del ser humano.

Ahora mismo existen distintos generadores, algunos opensource como Crayon (que se basa en la tecnología de DALL-E Mini) y otros, como en el caso de DALL-E 2 y Midjourney, los más avanzados y rápidos, que tienen una beta gratuita pero con créditos hasta un límite de varias decenas de creaciones. Aun así, se puede ampliar estos límites pagando únicamente 13 céntimos por cada generación de un bloque de cuatro imágenes.

Los créditos vuelan rápido, la emoción puede con nosotros al inicio. Genera mucha adicción recibir unos resultados, más que interesantes, al escribir cualquier tontería. Al hacer pruebas más serias, la cosa empieza a tomar sentido. Tanto que hasta la revista Cosmopolitan ha usado DALL-E 2 para diseñar una de sus portadas. Este hito cambia completamente la manera que tenemos de pensar en imágenes.

Vídeo resumen del proceso de diseño de la portada de la revista Cosmopolitan

Estas son las tres reflexiones que nos planteamos al usar intensamente los generadores de inteligencia artificial durante unos días:

#1 – Refuerza el peso de la imagen

Si las imágenes ya tienen un peso muy especial en nuestro sector, aún lo tendrán más. Y sí, existe el eterno debate de si la Arquitectura se debe proyectar desde los ojos o desde las sensaciones (véase Juhani Pallasmaa).

Pero la realidad en nuestra disciplina es que las imágenes estan al orden del día. ¿Podemos utilizar el mismo sistema de trabajo que han utilizado en Cosmopolitan junto a la artista Karen X Cheng para la Arquitectura? ¿Se ha terminado la era de los rénderes o empieza otra era en que tanto los clientes, como los propios arquitectos tendremos una herramienta de discusión nueva?

La facilidad de uso de estos generadores de imágenes, así como el bajo coste, puede llevar a que la imagen tome aún más relevancia.

Seven Lives de Anna & Eugeni Bach. Fotografía original. ©Anna&Eugeni Bach

Imagen modificada con DALL-E 2 a partir de la original de Anna & Eugeni Bach. Selección de los edificios adyacentes y descripción: “imaginative building in the style of magritte”

#2 – Tenemos unx nuevx compañerx

Con esta tecnología nos aparece un personaje nuevo en el estudio. Puede aportar nuevas referencias visuales y ser un sparring en este campo, casi como si tuviéramos una persona más contratada.

Imagen generada con Midjourney con la descripción: “Building, magritte style”

Imagen generada con Midjourney con la descripción: “Building, magritte style”

Evidentemente, no es oro todo lo que reluce. Estamos en una sociedad occidental, blanca y heteropatriarcal; y el mundo de internet tiene una situación similar, sumando la prevalencia de la lengua inglesa. Por lo tanto. las bases de datos con las que se ha entrenado a estos generadores estan sesgadas y, en consecuencia, sus resultados también. Funciona como un espejo de las lacras de nuestra sociedad y muestra la falta de diversidad de género y cultural. Por ejemplo, si se introduce el concepto “CEO” aparece un hombre blanco vestido con camisa y americana; y si se introduce el término “nurse”, infermerx en inglés, aparece siempre una mujer.

Esperamos que la base de datos se vaya diversificando y acoja todas las diversidades. Por ahora, el único mecanismo de control somos los propios usuarios.

#3 – Renacimiento de la precisión

Los escritores serán más importantes que nunca. El peso de la palabra será muy alto. Hacen falta buenas indicaciones a la IA que permitan traducir lo que uno tiene en la cabeza en imágenes. Es muy diferente escribir un paisaje oscuro, que un paisaje sombrío.

En un momento en que tendemos a uniformizar y simplificar el lenguaje, esta herramienta nos pide precisión en los términos usados en la descripción. Cada matíz es un mundo y cambia radicalmente los resultados. De hecho, la misma descripción puede dar lugar a infinitud de resultados diferentes.

Tomas descartadas de la portada de Cosmo, con el texto de “a strong female president astronaut warrior walking on the planet Mars, digital art synthwave.”

Portada de la Cosmopolitan Magazine: “wide-angle shot from below of a female astronaut with an athletic feminine body walking with swagger toward camera on Mars in an infinite universe, synthwave digital art”

Conclusión

¿Es el fin de los renderistas? ¿La renovación de los escritores? Lo que está claro es que esta herramienta ha llegado aquí para quedarse y nos brinda a los profesionales de la arquitectura una gran oportunidad para utilizarla en nuestros proyectos, sea como concepto inicial, para un dibujo de proceso, o para una imagen finalista; y quien sabe si en algún momento podrá llegar a hacer plantas, secciones o hasta un proyecto al completo.

¿Qué os parece? ¿Lo utilizaríais en vuestro estudio? ¡Mostradnos en los comentarios vuestras creaciones!

Referencias

https://www.cosmopolitan.com/lifestyle/a40314356/dall-e-2-artificial-intelligence-cover/

Tags:

Arquitectura generada por ordenadorCrítica de arquitecturaDALL-EMidjourney

Por:

Eduard Llorens-Pomé Eduard Llorens-Pomé es arquitecto, estudiante del máster habilitante en la ETSAB y cofundador de @comma_edit. En 2020 co-creó el ciclo de conferencias “CdeConfinament” que fue finalista en la BEAU, y finalista y mención especial del jurado en los Premios FAD de Pensamiento y Crítica.

Deja tus comentarios