Entre algoritmos y diagramas

Durante la última década, el desarrollo de algoritmos de aprendizaje automático [machine learning] y redes neuronales [neural networks] ha posibilitado avances muy significativos en el campo del reconocimiento automático de imágenes. Reconocimiento facial, automóviles de conducción autónoma, líneas de producción completamente automatizadas, diagnósticos médicos, cámaras de seguridad sin operador humano, drones y misiles capaces de operar de manera automática; el rango de aplicabilidad de estas “máquinas de visión” es enorme y promete transformar radicalmente nuestra relación con las imágenes. También artistas visuales están comenzando a utilizar algoritmos de aprendizaje automático como parte de su proceso creativo, muchas veces para enfatizar nuevas (pero también viejas) dificultades éticas y sociales a las que nos exponen estas.

En 2019, Kate Crawford y Trevor Paglen realizaron un estudio sobre algunos de los principales problemas éticos y políticos presentes en estos sistemas de reconocimiento algorítmico de imágenes.[1] Un tema central en el que se concentraron estos autores fue el análisis de las bases de datos con las que estos algoritmos de aprendizaje automático son entrenados. En los discursos a favor de estas tecnologías, por lo general se enfatizan aspectos como su neutralidad y objetividad, su efectividad, y su velocidad. En todas estas dimensiones, estas tecnologías superarían supuestamente a un operador humano, propenso al cansancio, al error, al prejuicio. El problema, sin embargo, es que estas tecnologías dependen directamente de las bases de datos utilizadas en su entrenamiento. Esto significa que los juicios aparentemente neutrales y objetivos ofrecidos por estos algoritmos son en realidad el resultado de patrones pasados contenidos en dichas bases de datos. Con ello se genera una naturalización y objetivación de ciertas conductas o fenómenos, lo que a su vez invisibiliza su dimensión histórica y social. Más aún, la aplicación de estas tecnologías no solo invisibiliza el carácter contextual de todo juicio, sino que muchas veces reproduce los sesgos existentes en estas bases de datos. Como sugiere Wendy Chun, las tecnologías algorítmicas funcionan como grandes dispositivos de “homofilia” o “amor por lo mismo”, es decir, generan espacios de “retroalimentación positiva” [positive feedback] en los cuales “elementos similares entran en conexión”.[2] Con ello, estas tecnologías refuerzan sesgos y patrones sociales, excluyendo al mismo tiempo la posibilidad de emergencia de lo nuevo y, por ende, la posibilidad de interrumpir dichos sesgos y patrones. Por estas razones, Crawford y Paglen concluyen que una de las tareas fundamentales para comprender las consecuencias políticas, éticas y sociales de estas tecnologías consiste en abrir su “caja negra” y examinar las bases de datos con las que estos algoritmos están siendo entrenados.[3] Como ha señalado Dan McQuillan, sin embargo, esta tarea crítica de abrir la caja negra de los algoritmos de aprendizaje automático debe tener en cuenta dos dificultades significativas.[4] Por un lado, la tecnología misma de aprendizaje automático implica una opacidad que le es estructural (sea por su escala o por su arquitectura). Esto significa que aun cuando sea posible abrir la caja negra del algoritmo, esto no asegura que aquello que encontremos en su interior sea inteligible para un observador humano.[5] Por otro lado, y en directa relación con lo anterior, McQuillan sugiere que la opacidad propia de la tecnología de aprendizaje automático responde a un tipo de “ciencia de los datos” que excede el marco “representacional” de las ciencias modernas.[6] A partir de estas dos observaciones, McQuillan sugiere que para comprender el funcionamiento de un algoritmo de reconocimiento de imágenes serían necesarias nuevas categorías que permitan pensar la ciencia de los datos desde una perspectiva no-representacional.

A la luz de lo anterior, el presente texto sugiere que las categorías de diagrama y cliché propuestas por Gilles Deleuze nos permiten complementar la tarea sugerida por Crawford y Paglen de “abrir la caja negra” de los algoritmos de visión maquínica, pero tomando en consideración las dos dificultades observadas por McQuillan. De este modo, la singularidad del enfoque ofrecido por Deleuze es que nos ofrece un punto de vista no-representacional, es decir, un análisis que explora las relaciones de fuerza que componen un determinado fenómeno (sea un hecho pictórico como la obra de Francis Bacon o una tecnología de poder como aquellas estudiadas por Michel Foucault). Este enfoque permite explorar el funcionamiento de estos algoritmos aun cuando dicho funcionamiento se mantenga opaco desde el punto de vista de una lógica no-representacional.

En su curso sobre pintura en 1981, Gilles Deleuze definió el concepto de diagrama como aquella operación de remoción, de limpieza, destinada a despojar a la imagen de sus clichés.[7] Como tal, el diagrama es un momento intermedio entre una “tela en blanco atestada de clichés” y lo que Deleuze llamará el “hecho pictórico”.[8] “Vivimos en un mundo de clichés”, nos dice Deleuze: afiches, publicidades, películas, series de televisión, ideologías, etc. contaminan todo con moldes pre-fabricados que impiden imaginar y decir nada nuevo.[9] En relación a la noción de “homofilia” mencionada más arriba, hoy podríamos agregar a esta lista también los algoritmos de aprendizaje automático que imponen sobre el mundo los clichés extraídos de las bases de datos de entrenamiento, lo que a su vez impide la emergencia de lo nuevo. “Clichés por todas partes, clichés que flotan, que se transforman en clichés mentales, que devienen clichés físicos”.[10] Enfrentado a todos estos clichés, el artista debe asumir la difícil tarea de producir una imagen, un hecho pictórico, que escape a ellos.[11] ¿Cómo se consigue esto, cómo se logra salir del cliché? Para Deleuze la respuesta se encuentra en el diagrama. Para ello el diagrama debe realizar una serie de operaciones: luchar contra “toda referencia narrativa y figurativa”[12]; “suprimir la ilustración”[13]; “deshacer la semejanza”[14]; “interrumpir la ilusión de totalidad”[15]; y “hacer visibles las relaciones invisibles que constituyen una imagen”[16]. A través de los conceptos de diagrama y cliché, Deleuze se propuso la tarea de definir una teoría no-representacional de la pintura. Al mismo tiempo, Deleuze utilizó el concepto de cliché para realizar un análisis no-representacional de las imágenes cinematográficas.[17] El objetivo de este texto es utilizar los conceptos de diagrama y cliché para realizar un análisis no-representacional de los algoritmos de reconocimiento de imágenes. Con ello se busca ampliar una investigación en proceso que utiliza ciertos conceptos de Gilbert Simondon y Gilles Deleuze para examinar la relación entre imagen y poder en el contexto de las nuevas máquinas de visión algorítmica.[18] Las hipótesis que se quieren poner a prueba son las siguientes: los algoritmos de reconocimiento de imágenes operan en una dimensión no-representacional; el análisis de su funcionamiento requiere, por lo tanto, de categorías que piensen los fenómenos visuales desde una perspectiva no-representacional; las categorías de diagrama y cliché de Deleuze ofrecen un punto de partida importante para dicha tarea.

Figura 1 – Felipe Rivas San Martín, El sueño neoliberal (2015)

Para poner a prueba estas hipótesis, este texto utilizará como caso de estudio la obra El sueño neoliberal (2015) del artista visual chileno Felipe Rivas San Martín [Figura 1]. En esta obra, el artista utilizó la aplicación Deep Dream de Google para generar una serie de 17 imágenes a partir de la conocida fotografía del bombardeo al Palacio de La Moneda el 11 de septiembre de 1973 [Figura 2].

Figura 2 – Bombardeo al Palacio La Moneda, 11 de septiembre 1973

A través de este gesto, Rivas San Martín establece un contraste entre el carácter documental de la imagen fotográfica original y el estilo psicodélico de la imagen generada por el algoritmo de Google. Más aún, el título de la obra establece un juego de palabras entre el “sueño profundo” de los algoritmos de Google y el régimen neoliberal instalado en Chile por la dictadura de Pinochet posterior al golpe de estado representado por la imagen del bombardeo a La Moneda. A partir de la elección tanto de la imagen original como del título, Rivas San Martín nos interpela a preguntar por los vínculos entre régimen económico, régimen escópico, y régimen tecnológico. Ahora bien, al examinar la obra de Rivas San Martín a la luz de las nociones de diagrama y cliché, será posible identificar una serie de elementos que exceden la interpretación simbólica que podamos realizar de ella. De hecho, estas categorías nos permitirán apreciar que los algoritmos de reconocimiento de imágenes son indiferentes respecto del peso histórico, narrativo y figurativo de la imagen inicial, desarticulando así los clichés contenidos en ella. Al mismo tiempo, sin embargo, el algoritmo de Google vuelve a imponer nuevos clichés sobre la imagen, pero lo hace no en función del valor figurativo de la imagen inicial sino en relación a las relaciones de fuerza que la componen (a la “homofilia” que refuerza los patrones preexistentes en las bases de datos). Como veremos a través del análisis de la obra de Rivas San Martín, pareciese que el algoritmo organiza su “interpretación” de la imagen original no en función de su contenido figurativo sino a partir de lo que Deleuze definió como el “sistema trazo/mancha” propio del diagrama. Todo esto será central para avanzar en la importante tarea de “abrir la caja negra” de los algoritmos de aprendizaje automático desde una perspectiva que se ajuste mejor al funcionamiento no-representacional y asignificante de la visión artificial. Con ello se quiere evitar, tal como sugieren Paglen y McQuillan, interpretar estas tecnologías a la luz de la categoría de representación que ha definido por tanto tiempo el marco de comprensión de la visión humana.[19]

Google Deep Dream

Deep Dream es un algoritmo de procesamiento de imágenes desarrollado por Google. Está formado por una red neuronal artificial entrenada para reconocer y clasificar imágenes. El 2014 fue puesto en línea por sus realizadores, posibilitando que cualquier usuario pudiese ingresar al sitio web, cargar una imagen y generar con ello una nueva. Esta nueva imagen generada permitía a los usuarios humanos aproximarse al “sueño profundo” de la máquina, haciendo visible los procesos invisibles detrás de los sistemas algorítmicos de reconocimiento de imágenes.

Una red neuronal es un tipo de algoritmo que se entrena de manera automática. Esto se logra a través de la alimentación de millones de ejemplos que permiten el ajuste gradual de sus parámetros hasta acercarse lo suficiente al resultado. Se denomina red neuronal porque se compone de fragmentos de software que emulan el funcionamiento de una neurona: una señal de entrada, un umbral de activación y una señal de salida. Esta tecnología también se conoce como “aprendizaje profundo” [deep learning] debido a que estas neuronas están organizadas en “capas ocultas”. En el caso del algoritmo de reconocimiento de imágenes de Google, por ejemplo, la red consta de 10 a 30 de estas capas de neuronas artificiales ocultas. Durante el proceso de entrenamiento de una red neuronal como esta, una gran cantidad de ejemplos es alimentada al algoritmo para que cada una de estas capas vaya ajustando sus pesos y se termine por “extraer la esencia del asunto en cuestión”.[20]

Si bien las redes neuronales “son herramientas muy útiles y están basadas en métodos matemáticos bien conocidos”, una vez que comienzan a realizar asociaciones de manera autónoma es un enigma entender cómo opera cada modelo.[21] Como proponen los desarrolladores de Deep Dream, uno de los desafíos que nos impone esta tecnología

es comprender qué sucede exactamente en cada una de sus capas. Sabemos que después del entrenamiento, cada capa extrae progresivamente las características del nivel inferior de la imagen, hasta que la capa final esencialmente toma una decisión sobre aquello que muestra la imagen. Por ejemplo, la primera capa puede buscar bordes o esquinas. Las capas intermedias interpretan las características básicas para buscar formas o componentes generales, como una puerta o una hoja. Las pocas capas finales las agrupan en interpretaciones completas: estas neuronas se activan en respuesta a cosas muy complejas como edificios o árboles.[22]

Ante esta dificultad para comprender los pasos que sigue una red neuronal para clasificar una imagen particular, los desarrolladores Mordvinstev, Olah y Tyka decidieron “invertir” el algoritmo inicial y poder de este modo visualizar las operaciones que ocurren en su interior. Tomando prestadas las palabras de Vilém Flusser, se podría decir que Deep Dream busca “abrir la caja negra” de los algoritmos de reconocimiento de imágenes:

Una forma de visualizar lo que sucede es poner la red ‘de cabeza’ y pedirle que intensifique una imagen de entrada de tal manera que genere una interpretación particular. Digamos que quiere saber qué tipo de imagen resultaría de la clasificación ‘banana’. Comenzamos con una imagen de ruido aleatorio, luego ajustamos gradualmente la imagen hacia lo que la red neuronal considera una ‘banana’.[23]

Uno de los descubrimientos de estos programadores fue que la información extraída de las enormes bases de datos de entrenamiento y contenida en la red neuronal no solo sirve para clasificar imágenes ya dadas, sino que permite también generar nuevas imágenes [Figura 3]. Deep Dream es un modo de hacer visible las capas de la red neuronal, mostrando cómo estas funcionan al clasificar una imagen determinada. Esto significa que cualquier imagen, ya sea figurativa, abstracta o un mero ruido aleatorio, es susceptible de ser sometida a una “interpretación” por parte de Deep Dream.

Figura 3 – Imagen generada en Google Deep Dream [Fuente]

Pero los resultados variarán considerablemente según la imagen utilizada. Esto se debe a que, tal como las características de las imágenes en las bases de datos han generado sesgos particulares en la red neuronal, también las particularidades de la nueva imagen que ingresa a Deep Dream crearán un sesgo de la red hacia ciertas “interpretaciones”. Por un lado, el algoritmo ofrecerá al usuario una nueva imagen que se vincula, aunque de manera opaca, a la imagen inicial (la cual delimitará el rango de sus posibilidades interpretativas). Por el otro, y aun cuando la nueva imagen generada por Deep Dream conserve ciertos aspectos formales de la imagen inicial, el resultado excederá sus límites e identificará en ella elementos que permanecían invisibles al ojo humano. Como sugieren sus desarrolladores,

los resultados son intrigantes: incluso una red neuronal relativamente simple se puede utilizar para interpretar en exceso una imagen, al igual que cuando éramos niños disfrutamos mirando nubes e interpretando formas aleatorias. Esta red se entrenó principalmente en imágenes de animales, por lo que, naturalmente, tiende a interpretar las formas como animales. Pero debido a que los datos se almacenan en una abstracción tan alta, los resultados son una mezcla interesante de las características aprendidas.[24]

Este carácter intrigante de las imágenes producidas por Deep Dream proviene de nuestra incapacidad para comprender plenamente de qué manera los algoritmos están asociando unas imágenes con otras al momento de realizar una interpretación. La red neuronal está identificando patrones allí donde nosotros somos incapaces de verlos. Esto recuerda, nos dicen sus autores, a la identificación de rostros o figuras en las nubes. Felipe Rivas San Martín llama a este tipo de interpretaciones “pareidolias”, las cuales define como “percepciones erróneas de ciertos estímulos visuales que se perciben como objetos o figuras reconocibles sin estar realmente presentes allí”.[25] En el caso del funcionamiento de Deep Dream, estas figuras o patrones son generados “en referencia a las imágenes de entrenamiento con las que se ha abastecido a la red de servidores”.[26] El encuentro entre la imagen introducida en el algoritmo y las miles o millones de imágenes de entrenamiento que han dado forma a las múltiples capas de la red neuronal hace emerger una nueva imagen que nos puede parecer aleatoria pero que revela los sesgos contenidos en las bases de datos. Según Adam Greenfield, “el filtro original Deep Dream fue entrenado exclusivamente en el Stanford Dogs Dataset, una serie de imágenes producida para una competencia en la que los algoritmos de visión artificial debían distinguir entre 120 razas caninas diferentes”.[27] Esto explicaría por qué en las imágenes generadas por Deep Dream suelen aparecer perros, especialmente cuando la imagen es sometida iterativamente al algoritmo, intensificando con ello los patrones inicialmente identificados por este.

De manera similar, Hito Steyerl ha utilizado el término “apofenia” para definir esta “percepción de patrones dentro de un conjunto de datos aleatorios”.[28] Este término, al igual que el de pareidolia, se utiliza para referir a la interpretación de rostros o figuras en las nubes. Con él, Steyerl quiere enfatizar la capacidad tanto de los humanos como de las redes neuronales para establecer relaciones que permitan extraer conclusiones generales, aun cuando los elementos puestos en relación no tengan conexión directa alguna. Para Steyerl, Deep Dream constituye un “notable ejemplo de apofenia pura y consciente” ya que las operaciones que realiza parecen establecer conexiones que responden a cierto parentesco que excede lo que nosotros, los humanos, somos capaces de captar en las imágenes.[29]

Para Steyerl, sin embargo, estas imágenes generadas por Deep Dream están lejos de ser alucinaciones aleatorias: “si son sueños, esos sueños pueden ser interpretados como condensaciones o desplazamientos de la tendencia tecnológica actual”.[30] Así, ellas revelan las preferencias e ideologías contenidas en las bases de datos utilizadas para su entrenamiento. Tal como el material onírico humano sirve al psicoanálisis para abrir la caja negra del inconsciente psíquico, los sueños generados por Deep Dream permiten visualizar el inconsciente de las redes digitales en las que habitan nuestras imágenes. Y así como el “inconsciente óptico” de Walter Benjamin refería al proceso técnico que hace visible todo aquello que escapa al ojo desnudo, Deep Dream hace visible el inconsciente de las “imágenes computacionales”.[31] Con ello, esta tecnología de reconocimiento de patrones termina “identificando una nueva totalidad de relaciones estéticas y sociales”.[32]

Ahora bien, esta identificación de patrones por parte de los algoritmos de aprendizaje automático funciona a través de un proceso de “retroalimentación positiva” que intensifica los rasgos iniciales visualizados por la máquina: “si una nube se parece un poco a un pájaro, la red hará que se parezca más a un pájaro. Esto a su vez hará que la red reconozca al ave aún más fuertemente en la próxima iteración y así sucesivamente, hasta que aparezca un pájaro altamente detallado, aparentemente de la nada”.[33] En resumen, para hacer visible el funcionamiento interno de una red neuronal, Deep Dream le ordena: “¡Lo que sea que veas allí, quiero más!”.[34]

El sueño neoliberal

Este proceso de intensificación por repetición es precisamente lo que está a la base de la operación realizada por Felipe Rivas San Martín en El sueño neoliberal (2015). En su propia descripción del proceso, el artista sostiene que al introducir la fotografía inicial a la aplicación Deep Dream, “el resultado fue el esperado, la imagen icónica del bombardeo a La Moneda –otrora en blanco y negro– fue leída por el algoritmo que hizo aparecer ciertas figuras con algunos toques de color: perros, pagodas, edificios”.[35] Este proceso fue repetido 17 veces. En cada nueva iteración, el algoritmo no generó nuevas variaciones, sino que intensificó y profundizó “la idea que ya se había hecho en una primera instancia. Visualmente, eso implicaba que las figuras que en esa primera lectura aparecían como vagas, en esta segunda lectura se hacían más claras y definidas”.[36] La obra final se compone así de 18 imágenes: la fotografía original que fue sometida a la lectura de Deep Dream y las 17 imágenes producidas por dicho algoritmo a través de un proceso de iteración o retroalimentación positiva.

Figura 4 – Felipe Rivas San Martín, El sueño neoliberal (2015)

Para nuestro análisis tomaremos como punto de partida la visión comparativa que ofrece el propio artista en su página web, la cual reúne a la primera y a la última imagen de esta serie [Figura 4]. La imagen de la izquierda corresponde a una fotografía análoga en blanco y negro que muestra el bombardeo al palacio presidencial de Chile, con un punto de vista picado y sesgado respecto del frontis original del edificio. Esta imagen opera como un registro documental del golpe de Estado del 11 de septiembre de 1973 perpetrado por las Fuerzas Armadas de Chile contra el gobierno de Salvador Allende. Más aún, esta imagen simboliza el inicio de la dictadura militar que se extendió durante 17 años con Augusto Pinochet a la cabeza. La imagen de la derecha, por su parte, corresponde al resultado final del proceso en el cual la imagen original es interpretada por el algoritmo de Google Deep Dream un total de 17 veces, simbolizando los 17 años de la dictadura de Pinochet. La imagen de la izquierda representa un momento en la historia de Chile con fuertes implicancias políticas, sociales y culturales, símbolo de la memoria nacional que reviste tanto los horrores cometidos por la dictadura como la implementación de un modelo neoliberal que perdura hasta hoy. Desde la perspectiva de Gilles Deleuze, sería posible sostener que esta imagen ha devenido un “cliché” de la historia reciente de Chile. Para Deleuze, el cliché es un lugar de identidad donde una relación de fuerzas es fijada, estabilizada.[37] Decir que la imagen de la izquierda ha devenido cliché significa que dicha imagen ha fijado una multiplicidad de relaciones moleculares (históricas, sociales, económicas, en fin, micro-políticas) bajo la figura de la identidad. Al someterla al algoritmo de Deep Dream, Rivas San Martín lucha contra su “referencia narrativa y figurativa”. El algoritmo, ciego a su peso histórico, ejerce sobre ella una operación diagramática que la desarticula como tal. Así, la imagen resultante aparece indiferente respecto de la historia y sus clichés. Impone sobre ellos un sinfín de formas abstractas, algunas de las cuales asemejan perros, automóviles, pagodas, etc. Con ello desarticula los clichés que se han ido anquilosando en la imagen canónica del bombardeo a La Moneda. De este modo, la operación de Rivas San Martín funciona como aquello que Deleuze ha definido bajo el nombre de diagrama: el acto de deshacer los clichés, “anulándolos”, “huyendo” y “luchando” contra ellos.[38] Como sugiere Kamini Vellodi, el concepto de diagrama en Deleuze no refiere a un esquema representacional, sino más bien a un acto que busca hacer visible “un mapa de sensaciones, materia y fuerza, más que de forma”.[39]

A partir de estas nociones de cliché y diagrama, este texto intentará demostrar que la operación realizada por Rivas San Martín genera un mapa no visual de los procesos que hacen posible el reconocimiento maquínico de imágenes en el algoritmo de Google Deep Dream. Como se mencionó anteriormente, en el entrenamiento algorítmico de reconocimiento de imágenes las redes neuronales extraen de las bases de datos la “esencia” de la categoría a identificar. Esta esencia sería el equivalente al cliché tal como es pensado por Deleuze. Al invertir este proceso, Google Deep Dream opera de manera análoga al diagrama, haciendo visible las relaciones de fuerza que estaban en juego en el proceso de entrenamiento. Al mismo tiempo, sin embargo, el algoritmo de Deep Dream impondrá otra serie de elementos que vuelven a capturar las fuerzas que componen la imagen (y que han sido hechas visibles por el diagrama), fijándolas bajo nuevas identidades. El algoritmo vuelve así a imponer una serie de clichés. Estos clichés, sin embargo, no responden ya al carácter figurativo de la imagen original, sino a los patrones contenidos en las bases de datos de entrenamiento. La obra de Felipe Rivas San Martín pone en escena la tensión entre estos dos movimientos: del cliché al diagrama y del diagrama al cliché.

Para desarrollar una lectura de esta obra a través de los conceptos de diagrama y cliché, un primer paso necesario consiste en suspender las dimensiones histórica y simbólica que definen nuestra relación con la imagen. Estamos conscientes de las dificultades que esto presenta, precisamente cuando estas dimensiones han sido constitutivas de nuestra relación con las imágenes y con el arte en general.[40] Aun así, y considerando las observaciones de McQuillan mencionadas más arriba sobre los límites del pensamiento “representacional” para comprender estas tecnologías, nos parece que un análisis crítico de los algoritmos de reconocimiento de imágenes exige al menos el esfuerzo de pensar desde nuevas perspectivas no-representacionales. Esto significa aproximarnos a la imagen enfocándonos no en su dimensión narrativa (“bombardeo a La Moneda”), sino en lo que nos muestra, aprehendiendo con ello su espacialidad particular. Lo que se nos aparece es un edificio principal con distintos focos de humo, principalmente en su techo (que se extiende hacia arriba) y en su frontis (que se extiende hacia adelante, sobre la calle). Este conjunto conformado por el edificio y las concentraciones de humo abarca la mayor parte de la composición y es lo que captura nuestra mirada [Figura 5].

Figura 5 – Intervención nuestra sobre la obra de Felipe Rivas San Martín

Vale mencionar, además, que esta parte de la composición es la que engloba el sentido narrativo de la imagen en tanto “bombardeo de La Moneda”. Así, en relación con este foco de atención, el resto de la imagen se nos aparece como el fondo que lo contiene [Figura 6].

Figura 6 – Intervención nuestra sobre la obra de Felipe Rivas San Martín

En términos de construcción espacial, por su parte, la imagen produce una perspectiva lineal organizada en torno a dos puntos de fuga ubicados cada uno a un costado de la imagen, fuera del encuadre. Esta construcción espacial responde al hecho de que se trata de una fotografía, es decir, una imagen producida por un proceso técnico que ha automatizado el procedimiento de la camera obscura del Renacimiento, reemplazando la mano del pintor por una superficie fotosensible.[41] En resumen, despojada de sus dimensiones narrativa y simbólica, la imagen del bombardeo a La Moneda nos revela dos relaciones principales: una relación de figura y fondo (entre el edificio principal, con las manchas de humo, y los edificios que lo enmarcan), y una relación espacial que produce una perspectiva lineal organizada en torno a dos puntos de fuga.

Ahora bien, como sugiere Jakub Zdebik, el diagrama tampoco comprende la imagen en términos de figura y fondo o en términos de una perspectiva lineal, sino simplemente como un campo inmanente de relaciones de fuerzas que de otro modo permanecería invisible.[42] En términos generales, esto significa que un análisis diagramático en el sentido propuesto por Deleuze debe superar cualquier noción de semejanza. Según Deleuze “el diagrama es la instancia a través de la cual deshago la semejanza para producir la imagen presencia”.[43] Por ello que para descubrir la “operatividad de las relaciones de fuerzas” que componen la imagen del bombardeo a La Moneda debemos remover no solo sus dimensiones narrativa y simbólica, sino también su dimensión representacional, llevándola así a un estado en el cual “no se asemeje a lo que presenta”.[44] Para conseguir esto, nos dice Deleuze, debemos “pasar” por el diagrama y “derrumbar” la semejanza. En otras palabras, la operación diagramática consistirá en remover la historia, la figuración y la narración.[45] Lo que aquí se sugiere es que esta lectura posibilitaría una reflexión no-representacional acerca de las operaciones detrás de los algoritmos de aprendizaje automático, ofreciendo un nuevo marco de análisis de estas tecnologías que tenga en consideración la opacidad que es inherente a su arquitectura.

Figura 7 – Francis Bacon, Painting (1946)

Antes de enfocarnos en el análisis diagramático de la obra de Rivas San Martín, y en vistas a esclarecer aún más el carácter no-representacional del diagrama, nos gustaría mencionar el ejemplo que el propio Deleuze ofrece a partir de una entrevista realizada a Francis Bacon por David Sylvester.[46] Deleuze se concentra en particular en la descripción que en dicha entrevista Bacon realiza del proceso detrás de su obra Painting de 1946 [Figura 7]. En la entrevista citada, Bacon declara haber tenido la intención inicial de “pintar un pájaro que se posaba en un campo”.[47] Sin embargo, una vez que comenzó a pintar, Bacon nos dice que se le ha “impuesto una cosa totalmente diferente, y de esto que se ha impuesto surgió la imagen final”.[48] El periodista entonces pregunta a Bacon “¿Del pájaro ha surgido el paragua?”, a lo que Bacon responde: “no, el pájaro no ha sugerido el paragua; el pájaro ha sugerido de golpe la imagen completa”.[49] Para Deleuze, este diálogo ilustraría de manera ejemplar la distinción entre la comprensión representacional de la imagen (la del periodista) y la comprensión no-representacional, diagramática, que tiene de la pintura el propio Bacon. Mientras el periodista quiere comprender la relación entre el pájaro y el paragua en términos figurativos (como una continuidad evolutiva de semejanzas e identidades), Bacon le responde en términos diagramáticos: el pájaro se dispersa en la totalidad del cuadro, definiendo no las nuevas figuras, sino las relaciones de fuerza “constituyentes” de todos los elementos de lo componen.[50] Se trataría de la oposición de dos tipos de analogía: una vulgar y otra estética. La analogía vulgar, aquella establecida por el periodista, nos dice Deleuze, es representacional y “se define por la similitud”.[51] La analogía estética, en cambio, es no-representacional y asignificante: “no se define por la similitud puesto que produce la semejanza, pero la produce por medios totalmente diferentes”.[52] La analogía estética corresponde al diagrama, y produce la semejanza por medios no figurativos.

Figura 8 – Radiografía de la pintura de Bacon realizada por investigadores del MoMA [Fuente]

Pero la referencia a Bacon no acaba allí. En 2015, mismo año de Google Deep Dream y de El sueño neoliberal, Painting de Bacon ingresó al estudio de conservación de pinturas del MoMA para que se le realizase una radiografía.[53] El objetivo era obtener una imagen radiográfica de la obra [Figura 8] que pudiese “proporcionar evidencia material para respaldar los recuerdos de Bacon sobre las primeras etapas del desarrollo de la pintura”.[54] Se trata precisamente de los recuerdos que Bacon menciona en su entrevista con David Sylvester, en los que describe la intención inicial de pintar un pájaro posando sobre el campo. Por un lado, el gesto de realizar una radiografía de la obra de Bacon es similar al realizado por Rivas San Martín: en ambos casos se trata de la utilización de un “aparato técnico” (en el sentido de Vilém Flusser) para hacer visibles aspectos de la imagen que no aparecen en su superficie. Tal como la publicación del MoMA indica, “la radiografía es una técnica común para revelar capas de pintura debajo de la superficie, que a menudo pueden sugerir alteraciones en la composición que ocurrieron durante la creación o posterior restauración de una obra de arte”.[55] Por otro lado, y como veremos a continuación, la operación realizada en el MoMA es contraria a la de Rivas San Martín ya que sigue motivada por una analogía figurativa entre la intención original y el cuadro final. Lo que Deleuze destaca en la obra de Bacon es precisamente la operación de una analogía diagramática, no figurativa, es decir, cómo el pájaro posando sobre el campo estructura la totalidad de las relaciones de fuerza que constituyen el cuadro final. Como veremos en la sección siguiente, en El sueño neoliberal Rivas San Martín utiliza un aparato técnico, la aplicación Deep Dream de Google, para hacer visible una analogía estética, diagramática, no-representacional. Tal como la relación entre el pájaro y el cuadro final en el ejemplo de Bacon establece una relación no-figurativa y no-representacional, la obra producida por Rivas San Martín deja ver una relación no-figurativa entre la imagen original y la imagen generada por el algoritmo de Google [Figura 4]. Todo esto pareciera entregarnos claves importantes para un análisis no-representacional del funcionamiento de la caja negra de los algoritmos de aprendizaje automático.

La operación diagramática

Hemos dicho ya que el análisis diagramático de la obra de Rivas San Martín debe evitar tanto la narración (su dimensión histórica, figurativa y simbólica). También debe evitar su análisis en términos de figura y fondo [Figuras 5 y 6] y de una perspectiva lineal. En su lugar, el proceder diagramático debe hacer visible las relaciones de fuerza a través de la identificación y proyección de direcciones, pesos visuales y tensiones. En primer lugar, se establecerá una posible relación entre “trazos y manchas”, en un ejercicio que extiende el carácter esencialmente manual del diagrama descrito por Deleuze.[56] En segundo lugar, se realizará un análisis de la proyección de direcciones de acuerdo con los diferentes elementos que operan al interior de la imagen. El objetivo de ambas operaciones es hacer visible la coexistencia de las diferentes tendencias que habitan al interior de la imagen. Con ello se espera avanzar en la tarea de abrir la caja negra del algoritmo de reconocimiento de imágenes desde una perspectiva no-representacional.

Para Deleuze, uno de los rasgos fundamentales del diagrama es su carácter “esencialmente manual”.[57] Para explicar esto, Deleuze establece una oposición entre la dimensión visual de la imagen y la dimensión manual del diagrama. En el diagrama se trata de una relación de fuerzas que no ha sido subordinada al ojo, sino que, por el contrario, se encuentra desencadenada de este.[58] Esto permitiría, agrega Deleuze, distinguir entre un análisis representacional de la imagen, guiado por el sistema “línea/color”, y un análisis diagramático, guiado por un sistema “trazo/mancha”.[59] Como se ha dicho, de lo que aquí se trata es principalmente de realizar un análisis diagramático y no figurativo de la obra de Rivas San Martín. Uno de los pasos para ello es identificar la tensión trazo/mancha que antecede a la dimensión figurativa y a la construcción espacial de las imágenes que la componen.

Figura 9 – Intervención nuestra sobre la obra de Felipe Rivas San Martín

Respecto de la imagen original, la fotografía del bombardeo a La Moneda, es posible sostener que la rigidez y estabilidad estructural de los edificios pueden ser ubicadas del lado del trazo. Tanto La Moneda (que anteriormente asociamos a la figura) como los edificios colindantes (que anteriormente asociamos al fondo) poseen contornos claramente contrastados (como por ejemplo en la relación de ventanas y muros) los cuales permiten proyectar líneas rectas que organizan reticularmente la composición. En esta proyección notamos que los trazos se cruzan y forman una serie de cuadrículas. Por otra parte, la irregularidad y volatilidad de humo permite asociarlo a la manera en que se despliega orgánicamente una mancha. En el caso particular de la explanada, ésta manifiesta ciertos rasgos asociables al trazo, pero su ubicación y superficie plana se proyecta como una extensión de la mancha. De esta manera, los edificios –como trazos–, y el humo (que incluye la explanada) –como mancha–, coexisten en una incesante tensión debido a la marcada diferencia entre uno y otro [Figura 9]. La proyección de los trazos que componen los edificios abarcaría el total de la imagen si no fuese por la mancha de humo que la interrumpe, recorta, y borra mediante su forma irregular y sus diferentes densidades.

Figura 10 – Intervención nuestra sobre la obra de Felipe Rivas San Martín

Ya realizada la analogía entre la imagen del bombardeo de La moneda y la diagramación de trazos y manchas, y para seguir avanzando en la tarea de deshacer la semejanza, nos queda realizar una proyección de las direcciones en la imagen en cuestión. Para ello tomaremos como referencia la manera en que los diferentes elementos que componen la imagen se distribuyen e inciden como pesos visuales más allá de las líneas que componen la perspectiva central. En primer lugar, podemos decir que la dirección principal de la composición es la diagonal descendente, de izquierda a derecha, visible mediante el bloque que forma el Palacio de La Moneda [Figura 10].

Figura 11 – Intervención nuestra sobre la obra de Felipe Rivas San Martín

Además, el frontis del edificio se estructura por verticales formadas por las ventanas, columnas y balaustres que operan como patrones regulares. Estas verticales se cruzan con la diagonal descendente, principalmente en la parte inferior derecha de la imagen [Figura 11]. Ahora bien, esta repetición de verticales y la conformación de retículas mediante patrones regulares también están presentes en la parte superior izquierda y, en un grado menor, en la parte superior derecha, correspondiente a los otros edificios.

Figura 12 – Intervención nuestra sobre la obra de Felipe Rivas San Martín

En segundo lugar, en cuanto a la relación entre los diferentes focos de humo, podemos considerar que estos sugieren una diagonal ascendente que se cruza con la diagonal descendente ya descrita [Figura 12]. Adicionalmente, la irrupción del humo en el frontis del edificio (que se desplaza hacia la calle) potencia las verticales en tanto manifiesta un fuerte contraste entre las áreas negras, grises y blancas, lo que genera cierta proyección deformada de los patrones regulares del edificio. Esta sección de la fotografía constituye uno de los focos visuales con mayor peso en la composición y coincide, casi por completo, con el área de intersección de las tres direcciones.

Hasta el momento, el análisis se ha concentrado en la imagen del bombardeo a La Moneda con el objetivo de deshacer la semejanza y hacer visible las fuerzas que la componen más allá de las dimensiones narrativa, figurativa y simbólica. Como se ha dicho ya, en El sueño neoliberal de Rivas San Martin, la imagen del bombardeo a La Moneda es sometida 17 veces a la interpretación algorítmica de Google Deep Dream mediante un proceso de retroalimentación positiva [Figura 1]. En términos de la operación algorítmica que aquí opera, es importante considerar que Deep Dream necesita siempre de una imagen de entrada para realizar una interpretación. Es decir, como toda interpretación requiere de algo para interpretar. Además, el modo en que el algoritmo va a interpretar la imagen de entrada está condicionado por las bases de datos con las que fue entrenado. Así, el resultado final en El sueño neoliberal surge a partir de la colisión entre la imagen del bombardeo que solicita interpretación y el set de datos sumidos en el despliegue de un entrenamiento que es puesto en práctica en un ciclo de retroalimentación positiva.

En la relación comparativa [Figura 4], podemos notar que, por una parte, la interpretación algorítmica le añadió color a la imagen inicial. Por otra, el ciclo de retroalimentación positiva, en que cada nueva imagen intensificó el resultado de la imagen anterior y que fue aplicado 17 veces a la imagen del bombardeo a La Moneda, generó, en la imagen final, figuras definidas y pregnantes tan reconocibles como extrañas. Esto se debe al principio de “apofenia” mencionado más arriba: la identificación en la imagen de patrones invisibles al ojo desnudo pero que se intensifican y profundizan a través de la iteración del proceso. Ahora bien, si aplicamos la misma operación diagramática utilizada ya en la imagen del bombardeo a la imagen de la derecha, podemos avanzar en la identificación del diagrama común a ambas imágenes.

Figura 13 – Intervención nuestra sobre la obra de Felipe Rivas San Martín

En primer lugar, podemos identificar que la diagonal descendente (de izquierda a derecha) aun funciona como una dirección importante en la articulación de las relaciones de fuerza que componen la imagen [Figura 13]. Esta diagonal está marcada principalmente por un conjunto de formas similares a automóviles, que se proyecta de derecha a izquierda y que concluye en el límite superior izquierdo de la composición donde observamos un conjunto de figuras monstruosas que generan la impresión de una gran cabeza de perro junto al retrato de un hombre de perfil.

Figura 14 – Intervención nuestra sobre la obra de Felipe Rivas San Martín

También podemos identificar la dirección vertical como una constante en la composición [Figura 14]. Esta se marca repetidas veces mediante la proyección de lo que parecen ventanas, neumáticos y cúpulas en la parte inferior derecha. Lo mismo ocurre en la parte superior donde formas que parecen árboles erguidos y edificaciones del tipo faro marino organizan verticalmente la composición. Más aún, en la parte superior izquierda, las verticales se intensifican a partir del conjunto que podemos identificar como edificios con cúpulas, en la disposición de las ventanas, en la relación entre ventanas de automóviles y neumáticos, y en el conjunto que incluye el automóvil y la gran cabeza de perro.

Vale destacar que la serie de formas contrastantes relativamente regulares formadas principalmente por ventanas de diferente tipo y neumáticos que se sitúan en las verticales (tanto en la parte inferior derecha como en la parte superior izquierda) generan una sensación repetición, como si hubiese allí un mismo patrón operando –aun cuando este patrón sea menos estable que la retícula que hemos identificado en el palacio presidencial y en los edificios de la imagen del bombardeo a La Moneda [Figura 11]. Se podría sugerir que, en relación con el diagrama de la imagen del bombardeo, la imagen producida por Deep Dream mantiene la diagonal descendente, las verticales, y un efecto de repetición de patrones [Figura 15].

Figura 15 – Intervención nuestra sobre la obra de Felipe Rivas San Martín

Ahora bien, en la experiencia de la imagen generada por Deep Dream nuestra mirada es capturada inevitablemente por el elemento con mayor pregnancia en esta composición: la figura en la parte inferior izquierda, la cual identificamos como un perro aun cuando tenga tres orejas y seis patas. Esta figura posee contornos definidos que la distinguen del fondo y le otorgan un rasgo de superficialidad. El cliché, de los cuales el diagrama había intentado huir, vuelve a imponerse. Esta vez, sin embargo, se trata de una imagen distorsionada. Este nuevo cliché desestabiliza la diagonal descendente que componía el diagrama compartido entre ambas imágenes. Es decir, las características diagramáticas en la imagen resultante final comienzan a diferir de los elementos identificados en la imagen inicial. En específico, la relación entre “humo denso” de mayor contraste y “humo ligero” de menor contraste difiere considerablemente de la relación entre “el perro de tres orejas y seis patas” y las figuras dispuestas a modo de paisaje correspondientes a explanadas, árboles, nubes, automóviles y edificios con cúpula. De este modo, no se consigue un balance entre la esquina superior derecha y la esquina inferior izquierda. El “perro de tres orejas y seis patas”, debido a su definición y cualidades figurativas, se instala como el elemento de mayor peso visual de la composición y el más estático, interrumpiendo la analogía entre ambos diagramas.

Figura 16 – Intervención nuestra sobre la obra de Felipe Rivas San Martín

Resulta aquí pertinente volver al sistema propuesto por Deleuze de trazos y manchas. Anteriormente, aplicamos este sistema manual a la imagen del bombardeo a La Moneda con el objetivo de hacer visible la coexistencia de dos fuerzas diferentes que se tensionan la una a la otra (entre la regularidad de los edificios, asimilable a una serie de cuadrículas, y los parches de humo, asimilables al carácter irregular y orgánico de la mancha) [Figura 9]. Ahora bien, si superponemos el diagrama de trazos y manchas rastreado en la imagen del bombardeo a la imagen generada por Deep Dream se nos revelan ciertos aspectos que permiten reflexionar respecto al modo en que el algoritmo realiza su interpretación [Figura 16].

En términos generales, el diagrama superpuesto a la imagen algorítmica en cuestión nos revela una fuerte coincidencia formal en la parte compuesta por la retícula. Esto puede observarse en varias zonas a través de las formas contrastantes que dan lugar a ventanas, puertas y ruedas. En la imagen del bombardeo, estas formas contrastantes inscritas en las retículas trazadas consistían en ventanas y otras formas arquitectónicas. En este sentido, podemos considerar que se mantienen ciertos aspectos formales de la imagen inicial y, también, ciertos aspectos figurativos. Por ejemplo, en la esquina inferior derecha, la fachada de La Moneda sufre una metamorfosis en otro tipo de fachada que mantiene la ubicación de ventanas y balaustradas. De igual modo, en la parte superior izquierda, los edificios del fondo mutan en otro tipo de edificios, esta vez con cúpulas. En este sentido, podemos considerar que ciertas cualidades figurativas se mantienen, en cuanto a que el diagrama parece ajustar la interpretación de las formas a ciertas cualidades formales. Esto no quiere decir que las figuras se asemejen totalmente, sino solo en ciertas características específicas. Ahora bien, también podemos observar un conjunto de figuras que no se asemejan en lo formal (y menos en lo figurativo) como el conjunto que involucra un auto, el retrato de un hombre de perfil y un rostro de perro en el extremo izquierdo (a la altura del eje central horizontal).

La masa principal de humo de la imagen fotográfica inicial termina transformándose en un perro con tres orejas, de cuyo cuerpo se extienden seis patas y una especie de cola. Las manchas que permitieron el surgimiento de este “perro” en la imagen resultante final eran originalmente formas irregulares de fuerte contraste entre negro y gris alto, casi blanco, que daban consistencia visual al humo denso del frontis de La Moneda. Observado “a posteriori”, este contraste sugiere cierta forma sintetizada de cachorro. Ahora bien, esta apreciación está condicionada por la interpretación algorítmica, que luego de exhibirnos al “perro” en lugar del humo, nos susurra la forma “perro” como una “apofenia dirigida”. Se ha dicho ya que el algoritmo de reconocimiento de imágenes de Google fue entrenado inicialmente con una base de datos que contenía exclusivamente imágenes de perros clasificados según raza.[60] Por ello que en las producciones imaginarias de Deep Dream, la red neuronal tienda a identificar patrones de perros. En el caso de El sueño neoliberal, la red neuronal de Google interpreta la figura de un perro justamente en el área central de la mancha generada por el humo. Podemos decir, de este modo, que el algoritmo Deep Dream no responde al carácter narrativo de la imagen, sino a la tensión entre trazos y manchas que compone su diagrama [Figura 17].

Figura 17 – Intervención nuestra sobre la obra de Felipe Rivas San Martín

En la zona de trazos, el algoritmo se encuentra restringido por las formas pre-establecidas por las retículas identificadas, mientras que en la zona de manchas el algoritmo encuentra mayor libertad interpretativa. En este sentido es posible sostener que las figuras de la imagen resultante se organizan o disponen en el interior de la composición de acuerdo con el diagrama de la imagen original, que puede sintetizarse como la relación entre trazos y manchas y que emerge desde los aspectos formales de los elementos dispuestos de la composición original.[61]

Podemos, en este punto, regresar al ejemplo de Bacon rescatado por Deleuze y mencionado más arriba. Este ejemplo es ilustrativo precisamente porque refleja el mismo tipo de operaciones que hemos identificado en El sueño neoliberal. El humo no deviene perro en sentido figurativo (tal como el pájaro no ha devenido paragua). El perro surge del diagrama de la imagen inicial en la cual el humo funciona como mancha que interrumpe la retícula de trazos generada por los edificios. Dicho de otro modo, al igual que en la obra de Bacon referida por Deleuze, la relación analógica entre el humo y el perro no es figurativa sino diagramática. No es una analogía vulgar, sino una analogía estética.

Al mismo tiempo, es posible identificar un doble movimiento que la obra de Rivas San Martín hace visible: por un lado, el algoritmo Deep Dream gatilla una operación manual que libera a la imagen de su dimensión representacional (figurativa, narrativa, y simbólica) y la presenta como una relación asignificante de fuerzas; por otro lado, sin embargo, el algoritmo vuelve a capturar este diagrama manual, subordinándolo nuevamente a la dimensión visual. En este segundo movimiento, el algoritmo imprime nuevos clichés sobre la imagen, los cuales surgen del encuentro entre las bases de datos utilizadas para su entrenamiento y el diagrama de trazos y manchas presente en la imagen original.

Conclusión

Los algoritmos de aprendizaje automático funcionan como una objetivación de clichés: a través de su proceso de entrenamiento, estas redes neuronales extraen la “esencia” del set de datos utilizados, objetivando una determinada identidad que reduce toda diferencia entre los elementos particulares que componen dicha base de datos. En este sentido podemos decir que estos algoritmos construyen una función matemática del cliché. El proyecto Google Dream fue diseñado para hacer visibles dichas funciones matemáticas, es decir, para hacer visibles los clichés. Mientras el diagrama para Deleuze hace visible las fuerzas que desarticulan el cliché, Google Dream haría visible el cliché mismo. La apropiación de Google Dream por parte del artista visual Felipe Rivas San Martín consiste en tensionar esta relación entre cliché y diagrama. Por un lado, el algoritmo es indiferente respecto del peso histórico y narrativo, el cliché, de la imagen inicial. Como hemos visto, la imagen producida surge así del diagrama de fuerzas que es extraído de dicha imagen, en particular de la relación entre trazo y mancha que la atraviesa. Por otro lado, sin embargo, el algoritmo reemplaza los clichés de la imagen original por los clichés contenidos en el set de datos de entrenamiento.

En su libro sobre Michel Foucault, escrito algunos años después del curso de pintura aquí referido, Deleuze utiliza la noción de diagrama para explicar las relaciones de fuerza que componen una determinada formación social (diagrama soberano, diagrama disciplinar, diagrama de control, etc.).[62] Para Deleuze, tanto Bacon como Foucault realizan una misma operación: deshacer la semejanza para identificar las relaciones de fuerza que componen una determinada forma de organización (visual en un caso, social en el otro). Esta analogía entre Bacon y Foucault es significativa para valorar lo que está en juego en El sueño neoliberal de Rivas San Martin. El bombardeo a La Moneda simboliza, para la historia de Chile, el inicio de un nuevo diagrama social (neoliberalismo). Google Deep Dream, por su parte, parece transformar toda producción visual en una superficie espectacular, asignificante, despojada de historia y de densidad social.[63] Al mismo tiempo, el algoritmo impone nuevos clichés que naturalizan la ideología del capitalismo contemporáneo y sus diagramas. La obra de Rivas San Martín da cuenta de este doble pasaje y de sus tensiones: de un diagrama a otro; de un cliché a otro.


Refrencias
  1. Crawford, K. & Paglen, T. (2019) Excavating AI: The Politics of Images in Machine Learning Training Sets. https://www.excavating.ai/
  2. Chun, W. H. K. (2018). Queerying Homophily. In C. Apprich, W. H. K. Chun, F. Cramer, & H. Steyerl (Eds.), Pattern Discrimination (59-98). London: University of Minnesota Press, pp. 59-60.
  3. Crawford, K. & Paglen, T. (2019) Excavating AI: The Politics of Images in Machine Learning Training Sets. https://www.excavating.ai/
  4. McQuillan, D. (2018). Data Science as Machinic Neoplatonism. Philosophy & Technology (31), 253-272. https://doi.org/10.1007/s13347-017-0273-3
  5. McQuillan, D. (2018). Data Science as Machinic Neoplatonism. Philosophy & Technology (31), p. 259. https://doi.org/10.1007/s13347-017-0273-3
  6. McQuillan, D. (2018). Data Science as Machinic Neoplatonism. Philosophy & Technology (31), p. 259. https://doi.org/10.1007/s13347-017-0273-3
  7. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 51.
  8. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 52.
  9. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 55.
  10. Deleuze, G. (2009). Cine I: Bergson y las imágenes. Buenos Aires: Cactus, p. 490.
  11. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 56.
  12. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 65.
  13. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 66.
  14. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 100.
  15. Vellodi, K. (2018). Diagram: Deleuze’s augmentation of a topical notion. Word & Image, 34(4), p. 305. https://doi.org/10.1080/02666286.2018.1473145
  16. Zdebik, J. (2012). Deleuze and the Diagram. London: Continuum, p. 182.
  17. Deleuze, G. (1984). La imagen-movimiento: estudios sobre cine 1. Barcelona: Paidós; Deleuze, G. (2009). Cine I: Bergson y las imágenes. Buenos Aires: Cactus.
  18. Celis Bueno, C. (2021). Imagen y poder en la era de la visión artificial: una interpretación a partir de Gilbert Simondon y Gilles Deleuze. Revista Atena (523), pp. 193-212. http://revistas.udec.cl/index.php/atenea/article/view/4607
  19. Paglen, T. (2019). Imágenes invisibles: tus fotografías te miran. Revista La Fuga, 22. http://www.lafuga.cl/imagenes-invisibles/944; McQuillan, D. (2018). Data Science as Machinic Neoplatonism. Philosophy & Technology (31), p. 259. https://doi.org/10.1007/s13347-017-0273-3
  20. Mordvintsev, A., Olah, C., & Tyka, M. (2015). Inceptionism: Going Deeper into Neural Networks. Google AI Blog, https://ai.googleblog.com/2015/06/inceptionism-going-deeper-into-neural.html
  21. Mordvintsev, A., Olah, C., & Tyka, M. (2015). Inceptionism: Going Deeper into Neural Networks. Google AI Blog, https://ai.googleblog.com/2015/06/inceptionism-going-deeper-into-neural.html
  22. Mordvintsev, A., Olah, C., & Tyka, M. (2015). Inceptionism: Going Deeper into Neural Networks. Google AI Blog, https://ai.googleblog.com/2015/06/inceptionism-going-deeper-into-neural.html
  23. Mordvintsev, A., Olah, C., & Tyka, M. (2015). Inceptionism: Going Deeper into Neural Networks. Google AI Blog, https://ai.googleblog.com/2015/06/inceptionism-going-deeper-into-neural.html
  24. Mordvintsev, A., Olah, C., & Tyka, M. (2015). Inceptionism: Going Deeper into Neural Networks. Google AI Blog, https://ai.googleblog.com/2015/06/inceptionism-going-deeper-into-neural.html
  25. Rivas San Martín, F. (2019). Internet, mon amour. Santiago: Écfrasis, p. 255.
  26. Rivas San Martín, F. (2019). Internet, mon amour. Santiago: Écfrasis, p. 255.
  27. Greenfield, A. (2017). Radical Technologies: The Design of Everyday Life. London: Verso, p. 219.
  28. Steyerl, H. (2018). Arte Duty Free. Buenos Aires: Caja Negra, p. 74.
  29. Steyerl, H. (2018). Arte Duty Free. Buenos Aires: Caja Negra, p. 80.
  30. Steyerl, H. (2018). Arte Duty Free. Buenos Aires: Caja Negra, p. 82.
  31. Steyerl, H. (2018). Arte Duty Free. Buenos Aires: Caja Negra, p. 83.
  32. Steyerl, H. (2018). Arte Duty Free. Buenos Aires: Caja Negra, p. 83.
  33. Mordvintsev, A., Olah, C., & Tyka, M. (2015). Inceptionism: Going Deeper into Neural Networks. Google AI Blog, https://ai.googleblog.com/2015/06/inceptionism-going-deeper-into-neural.html
  34. Mordvintsev, A., Olah, C., & Tyka, M. (2015). Inceptionism: Going Deeper into Neural Networks. Google AI Blog, https://ai.googleblog.com/2015/06/inceptionism-going-deeper-into-neural.html
  35. Rivas San Martín, F. (2019). Internet, mon amour. Santiago: Écfrasis, p. 256.
  36. Rivas San Martín, F. (2019). Internet, mon amour. Santiago: Écfrasis, p. 257.
  37. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 42.
  38. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 43.
  39. Vellodi, K. (2018). Diagram: Deleuze’s augmentation of a topical notion. Word & Image, 34(4), p. 304. https://doi.org/10.1080/02666286.2018.1473145
  40. Paglen, T. (2019). Imágenes invisibles: tus fotografías te miran. Revista La Fuga, 22. http://www.lafuga.cl/imagenes-invisibles/944
  41. Hockney, D., & Gayford, M. (2018). Una historia de las imágenes. Madrid: Siruela, pp. 236-37.
  42. Zdebik, J. (2012). Deleuze and the Diagram. London: Continuum, p. 93.
  43. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 101.
  44. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 101.
  45. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 70.
  46. Sylvester, D. (1987). The Brutality of Fact: Interviews with Francis Bacon. New York: Thames and Hudson.
  47. Sylvester, D. (1987). The Brutality of Fact: Interviews with Francis Bacon. New York: Thames and Hudson, p. 11.
  48. Sylvester, D. (1987). The Brutality of Fact: Interviews with Francis Bacon. New York: Thames and Hudson, p. 11.
  49. Sylvester, D. (1987). The Brutality of Fact: Interviews with Francis Bacon. New York: Thames and Hudson, p. 11.
  50. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 86.
  51. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 135.
  52. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 135.
  53. Davis, E. (2015). Francis Bacon’s Painting (1946): Histories and Conservation. https://www.moma.org/explore/inside_out/2015/11/19/francis-bacons-painting-1946-histories-and-conservation-part-1/
  54. Davis, E. (2015). Francis Bacon’s Painting (1946): Histories and Conservation. https://www.moma.org/explore/inside_out/2015/11/19/francis-bacons-painting-1946-histories-and-conservation-part-1/
  55. Davis, E. (2015). Francis Bacon’s Painting (1946): Histories and Conservation. https://www.moma.org/explore/inside_out/2015/11/19/francis-bacons-painting-1946-histories-and-conservation-part-1/
  56. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 91.
  57. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 91.
  58. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 91.
  59. Deleuze, G. (2014). Pintura, el concepto de diagrama. Buenos Aires: Editorial Cactus, p. 93.
  60. Greenfield, A. (2017). Radical Technologies: The Design of Everyday Life. London: Verso, p. 219.
  61. Otra forma de entender esta relación entre trazo y mancha que articula el diagrama detrás de la operación interpretativa del algoritmo Google Deep Dream es a través de la distinción entre “espacio liso” y “espacio estriado” utilizada por Gilles Deleuze y Félix Guattari en Mil Mesetas (2002, Valencia: Pre-Textos; pp. 483-506). Desde esta perspectiva, el espacio liso sería análogo a la mancha, mientras que el espacio estriado sería análogo al trazo. La interpretación visual del algoritmo operaría entonces de modo no-representacional, es decir, no en función del carácter narrativo, simbólico o figurativo de la imagen inicial, sino en función de la relación de fuerza entre espacio liso y espacio estriado.
  62. Deleuze, G. (1987). Foucault. Buenos Aires: Paidós.
  63. Zylinska, J. (2020). AI Art: Machine Visions and Warped Dreams. London: Open Humanities Press, p. 76.