Periodismo de datos

Dime qué tuiteas y te diré qué tan feliz eres

Por primera vez una instancia gubernamental mexicana ocupa "big data" proveniente de las redes sociales para realizar un análisis de este tipo.

Foto: Archivo
21/10/2015 |12:07Alejandra Padilla |
Redacción El Universal
Pendiente este autorVer perfil

periodismodatos@eluniversal.com.mx

El Instituto Nacional de Estadística y Geografía (INEGI) analizó 63 millones de tuits para la elaboración del estudio "Estado de ánimo de los tuiteros en México", en el que se puede determinar qué tan felices son los mexicanos.

“En la Universidad de Pensilvania, en lugar de ir a preguntarle a la gente cómo se sentía, veían lo que la gente escribía en Twitter y a partir de ello hacían inferencias sobre sus estados de ánimo. Me decía (el profesor Martin Seligman, director del Centro de Psicología Positiva de esa universidad): 'yo no les pregunto, yo los veo en su estado natural'”, explica el doctor Gerardo Leyva Parra, director general adjunto de investigación del INEGI.

Newsletter
Recibe en tu correo las noticias más destacadas para viajar, trabajar y vivir en EU

Fue así como surgió la idea de analizar los tuits publicados en México y a partir de ellos crear un mapa para visualizar el estado de ánimo de los usuarios de esta red social a través del tiempo. “Este diluvio de información ha inquietado a las oficinas nacionales de estadística alrededor del mundo. Ahí hay una gran cantidad de información que puedes explotar para que te dé resultados útiles y de interés para el público”, asegura el doctor Leyva.

El INEGI decidió utilizar esta información y durante este año llevó a cabo un estudio basado en publicaciones georreferenciadas, es decir, aquellas en las que el usuario decide hacer públicas las coordenadas geográficas de su ubicación. El organismo advierte que no se tomó en cuenta la entidad habitual del usuario, sólo el lugar en donde fue generado el tuit.

La metodología consistió en asignarle una etiqueta a cada tuit que previamente había sido incluido en una muestra para analizar; la etiqueta podía ser positiva, negativa o neutra. Esta clasificación fue realizada de manera manual con la colaboración de 5 mil estudiantes de la Universidad Tec Milenio a quienes se les presentó cada tuit para que fuera etiquetado varias veces y eso hiciera posible llegar a un consenso.

También se clasificaron 512 emojis populares en cuatro clases: positivo, negativo, neutro y ninguna para reemplazarlos por estas. Por ejemplo, el emoji “ :) ” fue reemplazado por la etiqueta _positivo y así sucesivamente.

Además sólo fueron tomadas en cuenta las palabras que aportan significación al contenido: sustantivos, verbos, adjetivos, adverbios, interjecciones y etiquetas (hashtags); también fueron eliminados todos los símbolos diacríticos y de puntuación. Con base en esto se generó un algoritmo para una posterior clasificación de los tuits.

Como resultado, el INEGI determinó con 80% de precisión qué tan felices son los tuiteros mexicanos y diseñó un mapa interactivo que despliega los resultados de cada estado de la República Mexicana, en donde se indica con colores el estado de ánimo predominante en cada uno.

Jalisco, Guerrero y Oaxaca resultaron ser tres de los estados en donde los usuarios son más felices, mientras que en Sonora, Sinaloa y Coahuila sucede lo contrario.

No refleja el estado de ánimo de la sociedad

La muestra utilizada para este estudio no es representativa de la población mexicana, por lo que los investigadores advierten que el proyecto no pretende dar a conocer el estado de ánimo de todos lo mexicanos.

Además, los estados con el mayor índice de tuits positivos son estados en donde hay destinos turísticos. Por lo tanto, un proyecto a futuro del INEGI es “separar a los locales de los visitantes, eso seguramente dará otros mapas”, afirmó Gerardo Leyva.

Una vez concluida esta primera fase experimental, el INEGI sigue recibiendo todos los tuits georreferenciados publicados en México y analizándolos por medio de este sistema. “Prácticamente en tiempo real te puedo decir la carga emotiva de ese tuit”, explica el doctor Leyva.

“Esto que acabamos de publicar es una primera salida de información, pero lo que queremos hacer más adelante es generar una ventanilla en la página del INEGI en donde los usuarios puedan ver en tiempo real cuál es la evolución de la carga emotiva en los tuits. Cuando ocurre algún evento extraordinario, los estados de ánimo se mueven de manera irregular en Twitter,  de repente vas a ver picos de tendencias positivas o negativas violentas. Es la gente en su estado natural”, adelanta Leyva.

*Las publicaciones analizadas fueron hechas por usuarios de Twitter entre febrero de 2014 y mayo de 2015. El análisis estuvo a cargo de un grupo multidisciplinario conformado por personal del INEGI, INFOTEC, Centro de Investigación e Innovación en Tecnologías de la Información y Comunicación, el Centro Geo (centro público de investigación integrado al sistema Conacyt), el Centro de Psicología Positiva de la Universidad de Pensilvania y el Instituto de Ciencias de la Felicidad de la Universidad Tec Milenio.

El mapa interactivo está disponible en: http://www.inegi.org.mx/inegi/contenidos/investigacion/Experimentales/animotuitero/default.aspx