Ciro Cattuto conversó con el diario El Sur de Concepción, sobre Data science, aprovechando su paso por Chile como invitado al primer Seminario Data Science UDD organizado en conjunto con Telefónica I+D, que se llevó a cabo en la capital de la Región del Bío-Bío.
El Sur (Concepción) – Conocer o interiorizarse acerca del comportamiento de las personas, las tendencias hacia las que van o simplemente qué están haciendo puede ayudar a anticiparse a situaciones complejas o también simples.
De eso de trata Data Science o ciencia de datos, que es el procedimiento de obtener información valiosa de los datos y está apareciendo debido a la necesidad de trabajar con conjuntos inmensos de datos (conocidos como Big data), formados tanto por datos estructurados como por datos semiestructurados o desestructurados.
Sobre esto Ciro Cattuto estuvo ayer en la Universidad del Desarrollo para dictar el seminario «El impacto de los datos en los procesos y decisiones de Ciencia, Gobierno e Industria» que realizó el nuevo Instituto Data Science de la Facultad de Ingeniería en conjunto con el centro Telefónica I+D.
El profesional es director del laboratorio de ciencias de datos de la Fundación ISI y su trabajo se centra en la medición y comprensión de los fenómenos complejos en los sistemas que enredan los comportamientos humanos y plataformas digitales.
En ese contexto vino a Concepción, ocasión en que conversó con este medio acerca de este fenómeno, que hoy es clave debido a la necesidad que hoy existe para manejar grandes volúmenes de datos, ya sea proveniente de investigaciones, personas, redes sociales aplicaciones, sensores, entre otros.
El experto afirmó que cuando se habla de big data por lo general se asocia a grandes datos de personas y su comportamiento. «Por eso hay que encontrar un buen balance entre lo que son los beneficios sociales colectivos con la privacidad de las personas. Entonces hay que hacer un uso ético de los antecedentes», remarcó.
Esto porque todo el mundo ingresa su cédula de identidad a algún portal, con el celular se sabe la ubicación o con el uso de la tarjeta de crédito se sabe qué y por cuánta cantidad compró. Por lo mismo, Cattuto afirmó que hay que tener cuidado con la privacidad, pero hoy hay una escala distinta y se debe aprovechar el conocimiento.
Además, hizo ver que existen leyes que protegen los datos de los ciudadanos. También, cuando se trabaja desde la academia, existen comités éticos que revisan que es lo que se va a hacer y como se utilizarán los datos.
«Lo que se espera con este gran nivel de datos es generar algoritmos a nivel de sociedad y como éstos van estar apoyando la toma de decisiones, dando información en tiempo real, es importante que los algoritmos representen los valores de la sociedad», apuntó.
En el fondo, explicó, Data Science es un nuevo instrumento para hacer nuevas preguntas y ver la sociedad desde un ángulo y posibilidades distintas. Uno de los ejemplos que planteó es el impacto que este método puede generar en la salud. Contando con toda la información de las personas, como a qué médico va o los remedios que ingiere y si eso se junta con mezcla con los datos de las redes sociales, se junta reseñas de muchos niveles, con lo cual se generan modelos que detectan con mucha anticipación cuando potencialmente hay un problema.
«La gracia es que no solo se puede captar con antelación, sino que también intervenir y la forma de interponerse es cambiando comportamientos. Esto se puede ver en las redes sociales, en que si se influencia a una persona dentro del grupo, ese individuo genera un cambio dentro de su entorno. Ahí hay una cantidad masiva de datos y todo eso se junta. Por ejemplo, ese clan necesita hacer más deporte para evitar riesgos de salud y mejore su calidad de vida», expuso.
Ciro Cattuto explicó que todo está orientado y la clave que todo está hecho en base a algoritmos y analiza los datos en forma masiva. Por ende, cuando se levanta una alarma para ayudar a una persona, no es que se estén mirando los antecedentes puntuales de ese individuo, sino al revisar todo en forma anónima y masiva, en el fondo se está viendo un comportamiento similar.
Además, al existir nuevas fuentes de información, hay señales, las cuales se pueden extraer y agregar a nivel de la población global. Cuando alguien se siente mal, va a Google y busca respecto a los síntomas que tiene.
«En el fondo, no importa quién hace la búsqueda, pero si hay si hay 100 click de Chile o 35 mil de otra parte, esa información la guarda Wikileaks en el momento y así se sabe dónde la gente está experimentando síntomas. Antes esto se hacía con encuestas que llenaba el doctor, la enviaba y en una semana estaban los datos, pero durante esos días hay epidemias que van mucho más rápido. Pero con Data Science está todo en el momento y se podría evitar la proliferación de una enfermedad», cerró.