El estudio del comportamiento humano colectivo no es nada nuevo y en ello trabajan sociólogos o antropólogos. Ahora, con las posibilidades que la tecnología aporta a la obtención de Big Data y su proceso, además de analizar las causas de lo que ha sucedido, estamos empezando a comprender los patrones que darán lugar a todo tipo de acontecimientos por venir. Estamos a las puertas de un conocimiento que nos hará predecibles como sociedad, desde los movimientos migratorios a la demanda de nuevos productos.
Analizando el rastro digital móvil
La Universidad Politécnica de Madrid logró demostrar la correlación entre el aumento de llamadas telefónicas desde móviles y los flujos migratorios en Senegal. Utilizando los datos generados por 9 millones de usuarios se estableció la relación con los movimientos colectivos. Sobre la base de esa información, generada por miles de millones de llamadas telefónicas, los investigadores del Grupo de Sistemas Complejos (UPM), detectaron la celebración de eventos masivos asociados a las fiestas religiosas rastreando los flujos migratorios producidos en Senegal mediante la evaluación del desplazamiento de los trabajadores de temporada,
Gracias a esta correlación, se podrían detectar a tiempo fenómenos excepcionales como desastres naturales, pero también optimizar los recursos locales ante los aumentos de población temporal.
Este tipo de datos generados por el uso de los dispositivos móviles en una red, Fingerprints o Huella Digital, ya se utiliza también en espacios más reducidos como centros comerciales para identificar el comportamiento de los consumidores cuando van de compras y optimizar el retail. Utilizados a gran escala, como en el estudio de la UPM, pueden evitar situaciones de riesgo o procurar la cobertura de servicios públicos de forma más eficaz.
Anticiparse a la demanda
Las posibilidades de los modelos predictivos no acaban en la optimización de recursos públicos, sino que son de gran utilidad en un nuevo enfoque de los estudios de mercado. Analizando 280.000 datos anónimos de compra en seis categorías (cervezas, panes, cafés, papel higiénico, detergentes y yogures) se ha desarrollado un modelo para predecir cuándo alguien está listo para probar un nuevo producto, o cambiar de marca. Así lo asegura el profesor de Psicología Brad Love, de la UCL tras las conclusiones del estudio publicado en Nature Human Behaoviour:
«Nuestro modelo muestra que mientras más gente compra un producto, más probabilidades hay de que continúen haciéndolo, hasta que se restablezca el ciclo mediante la exploración de un nuevo producto. Para probar nuestra teoría en el mundo real, enviamos cupones a miles de personas y se utilizó el modelo para predecir que los usarían. El modelo funcionó, personas que recientemente habían cambiado de marcas eran dos veces más propensas a usar los cupones para probar un nuevo producto «.
El reto de la rapidez en la predicción
El manejo de cantidades masivas de datos, aún con los actuales sistemas de supercomputación, conlleva un tiempo de estudio que merma en parte las posibilidades de anticipación. Científicos de Centro de Investigación Informática KAUST (King Abdullah University of Science and Technology) han desarrollado un patrón marco de data mining, que promete acelerar significativamente el proceso basado en gráficos.
«Los gráficos son ampliamente utilizados en muchas aplicaciones modernas, incluidas las redes sociales, redes biológicas como las interacciones proteína-proteína, y las redes de comunicación como Internet” —explica Panagiotis Kalnis, líder del equipo de investigación— «Un gráfico es una estructura de datos que muestra las relaciones complejas entre los modelos de objetos«.
Una de las operaciones más importantes es el proceso de encontrar los gráficos que se repiten y que revelan cómo los objetos tienden a conectarse entre sí. El proceso, que se denomina FSM (Frequent Subgraph Mining), es un componente esencial de muchas técnicas de extracción de conocimiento en materia de seguridad y detección de fraude social, la bioinformática y el procesamiento de imágenes. Sin embargo, los gráficos pueden contener cientos de millones de objetos y miles de millones de relaciones, lo que significa que la extracción de patrones recurrentes requiere recursos enormes de tiempo y de computación. Kalnis y sus colegas desarrollaron un sistema llamado ScaleMine que ofrece una aceleración de diez veces en comparación con los métodos existentes. El sistema se basa en la computación paralela. La búsqueda gráfica se divide en múltiples tareas y cada una se ejecuta simultáneamente en su propio procesador.
Si quiere conocer cómo la tecnología predictiva aplicada a los mapas puede predecir resultados electorales o alertar de la deforestación, esta entrevista a Sergio Álvarez, cofundador de CartoDB le interesará.
[youtube]https://www.youtube.com/watch?v=vyfywbAzdGI[/youtube]