En 2010, cuando Ciudad Juárez enfrentaba una ola imparable de feminicidios, Alejandro Maza no preveía que el proyecto en el que trabajaba cuando aún era un estudiante de la carrera de Matemáticas en el Instituto Tecnológico Autónomo de México (ITAM) ayudaría a generar mejores políticas públicas para atender el problema.

Al ver los buenos resultados del proyecto, Alejandro, en colaboración con compañeros de la universidad, vio que en México hacía falta una empresa que ayudara tanto al gobierno como al sector privado a sacar provecho de los miles y miles de datos que estaban ahí, flotando en internet o guardados en bases de datos, en espera de ser descubiertos.

Fue así como surgió OPI, una de las primeras startup en México expertas en Ciencia de Datos. Es en sus oficinas, detrás de sus computadoras, donde trabaja un equipo de científicos de datos, quienes con sus conocimientos en matemáticas, ingeniería y computación están cambiando la forma en que se maneja la exorbitante cantidad de información que se genera día con día.

Como su nombre lo señala, la Ciencia de Datos o Big Data se concibe como una disciplina que consiste en la capacidad de analizar y procesar grandes volúmenes de datos (números, direcciones, teléfonos, cifras) y en extraer gran cantidad de información, de distintas fuentes, para convertirla en un producto útil. Como experto en datos, Alejandro sabe que para las empresas u organizaciones, esto puede ser la diferencia entre ser bueno o ser el mejor.

“Fundamos OPI con la idea de generar información más completa para tomar mejores decisiones”, explica Alejandro.

“Veíamos que había muy buenas oportunidades que se dejaban pasar porque muchos datos no se estaban aprovechando, información que estaba flotando en internet y que no se usaba como se debía. Vimos que había una gran necesidad de decisiones mejor pensadas, de gente que analizara cosas que se estaban excluyendo por no saber de su existencia”, comenta.

Para cubrir esta necesidad, OPI trabaja con un equipo de científicos de datos cuyas habilidades les permiten sumergirse en ese océano de información y encontrar, y analizar aquella que marcará la diferencia. La mayoría de ellos son jóvenes aplicando conocimientos viejos a una nueva forma de mirar el mundo que los rodea.

Al respecto, Alejandro señala: “La Ciencia de Datos es relativamente nueva porque las tecnologías que permiten hacerlo también son nuevas. El análisis de datos y estadísticas ha existido desde hace mucho tiempo, la diferencia es que ahora hay más herramientas accesibles, que antes no lo eran”.

Esa diferencia es el hecho de que ahora Alejandro y su equipo pueden rentar “clósets de computadoras muy grandes” que les permiten trabajar grandes volúmenes de información sin necesidad de comprar el equipo. “Con una conexión a internet podemos tener acceso a un potencial de cómputo grandísimo que antes hubiera costado millones de dólares adquirir. Antes tenías que comprar granjas de servidores o supercomputadoras para poder hacer el tipo de procesamiento que hoy puedes rentar. Ese avance tiene apenas cinco años”, explica.

Soluciones concretas

Para Alejandro, el objetivo de un científico de datos es muy claro: se trata de gente capacitada para enfrentarse a los retos que exige la sociedad moderna. “Buscamos dar respuesta a problemas con base en información, problemas muy específicos de predicción, de toma de decisiones, de agilización o distribución. Usamos todos los datos, toda la información disponible, y los mejores modelos para poder dar una respuesta a ese problema”, asegura.

Para dedicarse a esto, además de estudios en áreas de matemáticas, computación o ingeniería, Alejandro, con más de cinco años de experiencia en Ciencia de Datos, considera que es esencial saber trabajar en equipo. Los retos son muy grandes cuando se trata de procesar montañas de datos. Algunos buscan la información, otros la procesan, otros hacen la visualización. La cantidad de trabajo sería casi imposible para una sola persona.

El equipo de OPI llama “producto de datos” al trabajo que realizan para las empresas que los contratan. Realizar este producto de datos tiene varias etapas que Alejandro, director ejecutivo de la startup, explica: “Lo primero es conseguir y transferir los datos que vas a utilizar, pasar esos gigabytes y gigabytes de información sin perder una sola cosa y crear una capa de seguridad. Se trata de datos que te pasa la empresa o que consigues por tu propia cuenta mediante información pública”.

Por ejemplo, una empresa puede darle a OPI su historial de ventas desde que inició. Si alguien compró un chicle en esa tienda hace 10 años, ellos lo saben. Eso, multiplicado por varios años, por cientos de tiendas, se vuelve una cantidad de información que ni la misma empresa ha logrado analizar, entonces, se la dan a los científicos de datos para que ellos lidien con los números.

“Pero quizá yo también quiero saber cuántos coches pasan enfrente de la tienda, cuántas transacciones en cajero automático hubo en esa colonia, cuánta población de 15 a 20 años está pasando por ahí o cuánta gente está tuiteando sobre esa empresa, entonces, tu información se multiplica y estás hablando de terabytes de información que puedes analizar”, señala este amante de los números.

Conseguir todo eso es parte del trabajo, pero también lo es saber qué hacer con tanta información. Esa es la parte más interesante para Jerónimo, quien con sólo 25 años y recién egresado de la carrera de Física, logró que le dieran una oportunidad de trabajar en OPI.

Aunque muchos asocian la creatividad con los pintores o músicos, un científico de datos debe ser muy creativo al momento de buscar soluciones a los problemas que se le presentan, explican en OPI.

Jerónimo sabe que hay momentos difíciles en los que no sabes cómo cruzar los datos o qué información te servirá para lograr los objetivos, pero encontrarla es una gran satisfacción.

“Un científico de datos es como un detective: vamos siguiendo pistas para encontrar lo que estamos buscando. A mí lo que más me gusta es esa parte de ensuciarte las manos, de aventarte un clavado a la información y ver cómo haces para sacar algo que realmente sea relevante para usarse”, comenta divertido y continua.

“A veces vas por un camino que parece muy prometedor y de pronto te topas con una pared después de haber dedicado días a un proceso que no te llevó a ningún lado. El problema es que tienes que recorrerlo para saberlo, eso puede ser algo frustrante. Muchas veces puedes ir tras una pista errónea, pero cuando estás siguiendo la pista correcta y encuentras cosas que ni te imaginabas, es la mejor sensación del mundo”, cuenta a EL UNIVERSAL.

Presentan resultados

Desde la terraza de las oficinas de OPI, Alejandro Maza, actual director ejecutivo de la empresa, explica que una vez que encuentran los datos que se deben analizar, y la información más relevante para las necesidades de sus clientes, es hora de empezar lo que llaman “modelaje”.

“Para modelar los datos es necesario generar las variables que te interesan. Por ejemplo, si la tienda quiere vender más, tengo que saber cuántos clientes potenciales hay o cuántos clientes hay a 20 minutos en coche. Eso datos no existen, se tienen que construir con lo que se consiguió al principio, es hacer las variables que vas a introducir para que tu modelo funcione bien. Una vez que lo tienes, metes los datos en algoritmos previamente diseñados y ellos te dicen con mucha precisión cómo se van a comportar esos datos en el futuro”, comenta.

La última parte del proceso es la cereza del pastel que ofrece un científico de datos. Para presentar los resultados se genera un sistema interactivo de visualización de datos, donde el cliente constantemente puede cruzar distintas variables para encontrar la información que le es útil.

Sobre esta última etapa habla Jessica Barbosa. Ella tiene 29 años, es la única mujer de un equipo de siete personas y formó parte de la primera generación de la maestría en Ciencia de Datos del ITAM.

Jessica asegura que las cosas que enseñan en la maestría han cambiado mucho en poco tiempo, puesto que ahora todo se encamina a mostrar a las nuevas generaciones de científicos de datos cómo hacer presentaciones atractivas de la información procesada.

“Al inicio lo que te enseñaban era a entregar productos aislados, pero ahora todo está encaminado a crear un producto de datos. En lugar de entregar un montón de información en un PDF, se trata de hacer una visualización dinámica. Ha habido un cambio de mentalidad sobre lo que se necesita para hacer Ciencia de Datos, hoy es mucho más valioso tener algo a lo que le puedes picar todo el tiempo que algo que imprimen y te dan en la mano”, asegura.

Una ciencia que llegó para quedarse

A pesar de los enormes beneficios que reporta el uso de Big Data para las empresas, Alejandro asegura que muchas siguen renuentes a aplicarlo. Hay quienes prefieren seguir presentimientos para tomar decisiones como dónde conseguir clientes o dónde poner una tienda. Sin embargo, este matemático confía en que en algunos años verán su potencial y la Ciencia de Datos estará en todos lados.

“Yo creo que todas las empresas la necesitan. Las que no apliquen la Ciencia de Datos se van a quedar atrás y sus competidores les van a ganar. Básicamente se trata de herramientas que te ayudan a tomar una mejor decisión. Si les dices: ‘oye, mira, puedes tomar una decisión buena o una decisión más o menos’, las empresas que agilicen el uso de datos van a poder tomar decisiones buenas y las que se queden sin aplicarlo van a quedarse con decisiones mediocres”, afirma.

Es así que cualquier empresa, en cualquier giro, debería empezar a considerar contratar los servicios de un experto en Ciencia de Datos.

A pesar de sus pocos años de existencia, OPI ha trabajado con importantes empresas a nivel nacional, pero también mejorando políticas públicas en colaboración con el gobierno. Un ejemplo de ello es el portal datos.gob, una plataforma que concentra información abierta de más de 219 instituciones gubernamentales.

“Es muy simple. Si quiero darle un mejor servicio a mis suscriptores, puedo preguntarle a un par o puedo analizar los patrones de millones de suscriptores minuto a minuto y decir ‘esto les está gustando, esto no’.

“Cualquier problema que requiera de información o que se pueda mejorar, es susceptible a ser resuelto por la Ciencia de Datos. Creo que en cinco años vamos a ver que la gran mayoría de las empresas y líderes lo van a estar usando de una forma u otra”, concluye este experto en Big Data.

Google News

TEMAS RELACIONADOS

Noticias según tus intereses