Muchos dispositivos inteligentes utilizan sistemas de visión para recabar la información necesaria para la toma de decisiones. Desde sistemas de vigilancia a vehículos autónomos con cámaras conectadas o gadgets personales y domésticos. Un grupo de científicos ha desarrollado una nueva cámara basada en los ojos de los animales.
La Universidad de Glasgow ha presentado un nuevo método de captación de vídeo mediante cámaras de “un solo píxel” que da prioridad a los objetos de las imágenes utilizando un método similar a como el cerebro toma decisiones.

Fig. 1 Experimental setup. The scene is flood-illuminated and imaged onto a DMD, which operates as a dynamic mask: Light from a subset of the micromirrors is reflected to an avalanche photodiode (APD), which records the total intensity transmitted by each binary masking pattern. More details are given in Materials and Methods. (Universidad de Glasgow)
Visión priorizada en puntos de interés
Ojos y cerebro de los humanos y muchos animales trabajan en conjunto para priorizar áreas específicas de su campo de visión. Durante una conversación, por ejemplo, la atención visual se centra en el otro interlocutor principalmente y el cerebro dedica menos tiempo a detalles periféricos. Lo mismo ocurre con la visión en el algunos animales cazadores. Siguiendo esa teoría, el sensor del nuevo equipo utiliza un solo píxel sensible a la luz para construir las imágenes de los objetos colocados delante de él en movimiento. Estos sensores de un solo píxel son más baratos que los megapíxel que encontramos en las cámaras digitales actuales, pero son capaces de formar imágenes en longitudes de onda donde las cámaras convencionales o no pueden o resulta demasiado caro, como en las de infrarrojos o terahercios.
Las imágenes de salida de la cámara son cuadradas, con una resolución total de 1.000 píxeles.
En las cámaras convencionales esos mil píxeles se extienden uniformemente en una rejilla a través de la imagen. El nuevo sistema puede optar en cambio por asignar un “presupuesto de píxel” para dar prioridad a las áreas más importantes de la trama, poniendo más píxeles de resolución en esos lugares y afinar el detalle sacrificando otras zonas.Esta distribución de píxeles se puede cambiar de un cuadro a otro, similar a la forma en que funcionan los sistemas de visión biológica, por ejemplo, cuando la mirada humana se redirige de una persona a otra.

Fig. 2: Single-pixel imaging with spatially variant resolution. (Universidad de Glasgow)
Una solución encontrada buscando otro objetivo
En un principio, el problema que estaban tratando de resolver era cómo aprovechar al máximo la velocidad de fotogramas del sistema de un solo píxel para que la salida de vídeo fuera lo más suave posible. Sin embargo, empezaron a pensar un poco sobre cómo funciona la visión en los seres vivos y se dieroni cuenta de que el desarrollo de un programa que pudoera interpretar los datos del sensor de un solo píxel de forma similar podría resolver el problema.

Fig. 5: Detail estimation and infrared dual fovea reconstruction. (Universidad de Glasgow)
Al canalizar el “presupuesto de píxeles” hacia áreas tales como cuando se mueve un objeto, las resoluciones empleadas fueron un acierto y podrían indicar al sistema que prestara menos atención a las otras zonas de la imagen.
Al dar prioridad a la información del sensor de esta manera, han conseguido producir imágenes en una frecuencia de imagen mejorada pero también han enseñado al sistema una nueva y valiosa habilidad.
Ahora están dispuestos a seguir mejorando el sistema y explorar las oportunidades para el uso industrial y comercial, por ejemplo en las imágenes médicas.
Fuente: Science Advances.