Los investigadores de Idiap y EPFL han estado trabajando con psicólogos para comprender cómo las personas se forman las primeras impresiones a partir de las fotos y se enfocaron en cómo responden las personas a las propiedades disponibles en Airbnb a través de las imágenes presentadas. El motivo es que un mejor análisis del comportamiento humano debería permitir a los científicos programar máquinas capaces de tomar decisiones más «humanas».
Las rápidas decisiones involucradas, basadas principalmente en imágenes, están lejos de ser triviales dada su importancia comercial y la revolución económica representada por el advenimiento de los sitios web de economía bajo demanda como Airbnb. ¿Pero de qué se trata una imagen que nos impulsa a describir un interior como «de moda», «colorido» o «práctico»? Para responder a esta pregunta, los investigadores del Instituto de Investigación Idiap y EPFL han estado trabajando con psicólogos de la Universidad de Lausana. Quieren obtener una mejor comprensión de las percepciones y el comportamiento de los usuarios de las redes sociales y luego utilizar este conocimiento para programar algoritmos capaces de tomar decisiones de una manera más humana.
«En la era del big data, las máquinas están cada vez más detrás de una gran cantidad de decisiones», explica Daniel Gatica-Perez, profesor adjunto de la Escuela de Ingeniería EPFL y del Instituto de Humanidades Digitales. «Nuestro objetivo es hacerlos lo más similares posible a las decisiones humanas «.
Para comprender cómo se forma una primera impresión, los investigadores empezaron llevando a cabo entrevistas con los huéspedes y viajeros, preguntándoles cómo seleccionaron los alojamientos. Usaron 350,000 imágenes de 22,000 propiedades enumeradas en Airbnb en Suiza y México, y les aplicaron un análisis algorítmico para verificar que fueran imágenes de interiores. Luego seleccionaron 200 propiedades al azar y enviaron una lista de adjetivos a los observadores en línea. Esos observadores tenían que decidir con qué precisión los adjetivos describían cada propiedad, en una escala de 1 a 7. Algunos adjetivos eran más fácticos (como «limpio» y «desordenado»), mientras que otros eran más subjetivos (como «bohemio» y «encantador»).
Esa etapa, llevada a cabo en colaboración entre psicólogos e ingenieros, reveló qué características todos los participantes estuvieron de acuerdo y en cuáles no estuvieron de acuerdo.
Para las propiedades descritas como «coloridas» u «oscuras», la mayoría de los encuestados estuvo de acuerdo con esos adjetivos y los puntajes fueron muy similares. Los puntajes para otros adjetivos, como «relajado» o «tradicional», variaron ampliamente dependiendo de la propiedad.
Luego, los científicos llevaron a cabo un modelado basado en los datos obtenidos. Intentaron detectar qué características de las fotos incitaban a los participantes a describirlas usando un adjetivo dado, para programar que las computadoras las reconocieran. Luego, analizaron en qué medida los adjetivos estaban interrelacionados. ¿Las personas que describen una propiedad como «colorida» también asocian el adjetivo «limpio» con esa propiedad? ¿Cuál es la conexión entre «pretencioso», «moderno», «organizado» y «grande»? ¿Cómo se relacionan los adjetivos positivos y negativos, y los adjetivos fácticos y subjetivos? ¿Y por qué el adjetivo «romántico» se asocia más estrechamente con «sofisticado»? que con «moda»? «Podríamos esperar ‘grande’ y ‘espacioso’ estar muy cerca en las mentes de las personas, y ‘desordenado’ y ‘vacío’ para estar muy separados «, dice Gatica-Pérez.» Pero las relaciones son más complejas. Usando nuestro sistema, si reconocemos una característica, también podemos asociar otros adjetivos conectados a ellos en las mentes de las personas «.
Finalmente, los investigadores tomaron las imágenes de la propiedad y aplicaron los algoritmos utilizados en el campo del Deep Learning, comparando los resultados con los obtenidos de los humanos.
Eventualmente, profesionales como arquitectos o diseñadores podrían aplicar los resultados a fotos de interiores.
El laboratorio también está monitoreando el desarrollo de sitios para compartir imágenes que, para un lugar determinado, muestran fotos muy diferentes, profesionales y de aficionados, lo que genera percepciones muy variadas. Sin embargo, el objetivo principal de los científicos es comprender las características de las imágenes y las conexiones que determinan la forma en que formamos las impresiones, de modo que puedan programar las computadoras para que las imiten. «A menudo escuchamos que las máquinas funcionan mejor que los humanos», concluye Gatica-Pérez. «Nuestro objetivo es diferente.
Fuente: École Polytechnique Féderañe de Lausanne
El estudio completo está disponible para descargar en IEEEXplore