Demóscopos sin vergüenza

El Director Asociado de la compañía de Encuestas Parametría publicó un comentario a mis artículos sobre la tercera encuesta de Morena aparecidos en El Universal, en donde me llama “demóscopo diletante”. Y es que en esos artículos cuestiono la verosimilitud estadística de los resultados reportados para elegir nuevo presidente de Morena a través de una tercera encuesta de militantes y simpatizantes del partido. Lo que más me sorprende de su respuesta es lo endeble e inocuo de la misma. El Director Asociado no responde a los principales cuestionamientos en mis dos textos y más bien quisiera tender una cortina de humo sobre lo que ha sucedido. No tenemos por qué argumentar en el aire, como él hace, veamos los datos.

Había dos candidatos para la presidencia de Morena, Porfirio Muñoz Ledo (PML) y Mario Delgado (MD). El INE le encargó a tres empresas que hicieran encuestas independientes de preferencia de los dos candidatos. Estos son los resultados de las tres encuestadoras en sus respectivos reportes al INE:

Parametría: Encuestados, 1594; preferencia por PML, 40.44%; por MD, 59.56%; no sabía del proceso, 56.0%.

Covarrubias: Encuestados, 1628; preferencia por PML, 41.7%; por MD, 58.3%; no sabía del proceso, 57.0%.

Demotecnia: Encuestados, 1507; preferencia por PML, 41.7%; por MD, 58.3%; no sabía del proceso, 57.0%.

Tenga en cuenta el lector que se trata de encuestas a nivel nacional, es decir, de personas distribuidas por todo el territorio nacional. Todos sabemos que hay grandes diferencias regionales en nuestro país. Es normal que un candidato sea más conocido en alguna región que en otra.

La tabla es una sorpresa completa, ¡hay cero variabilidad entre los resultados que Covarrubias Asociados y Demotecnia reportan! Imagínese el lector a los esforzados encuestadores de Covarrubias y de Demotecnia recorriendo el país de punta a punta, cada quien por su parte y sin comunicarse. Por un lado, unos encuestadores entrevistan a 1628 personas y por el otro, independientemente y sin colusión, a 1507. Pero milagrosamente, exactamente el 57.0% de los encuestados en ambas muestras no sabía del proceso de selección en Morena. Milagrosamente, también, exactamente el 41.7% de los encuestados está por Porfirio Muñoz Ledo y exactamente el 58.3% está por Mario Delgado. Esa es una coincidencia de las tres proporciones a tres dígitos decimales significativos . Eso no sucede en el mundo real de las encuestas electorales.

Y que esto no sucede lo podemos ver simplemente tomando los resultados de Demotecnia. De las 1507 personas entrevistadas solo 862 personas escogieron candidato (el resto de la muestra se abstuvo, para todo efecto práctico). Resulta sin embargo que no existe una partición de la muestra de 862 personas en números enteros que pueda producir los resultados reportados por Demotecnia.

Que en dos encuestas independientes, en distritos distribuidos por todo el país, en la ciudad y en el campo, se produzca una coincidencia de tres porcentajes como la reportada por Covarrubias Asociados y Demotecnia es altamente improbable. Haciendo un poco de cálculos, bajo ciertas simplificaciones, resulta que una coincidencia así equivale a tirar una moneda al aire catorce veces y que siempre salga el “águila”.

En los reportes de las tres encuestadoras se menciona, de pasadita, que se utilizaron “factores de expansión”, es decir que aparentemente después de recabar las opiniones de las diversas personas entrevistadas se multiplicaron los resultados por factores numéricos aplicados por las encuestadoras. O sea que las personas entrevistadas votaron por candidatos y posteriormente las encuestadoras “ajustaron” las proporciones como mejor consideraron conveniente para alcanzar ciertas metas de proporción social. Eso, sin embargo, hace más improbable una coincidencia de los datos a tres dígitos significativos. Se trata aquí de muestras con diferente composición social y “ajustar” los datos, sin que en el reporte final se explique de manera exhaustiva como se aplicaron exactamente esos factores, deja la “manufactura” de los resultados finales a la arbitrariedad de las encuestadoras.

Las tres encuestadoras entregaron archivos con datos en tablas que deberían haber sido revisados por expertos independientes y anónimos para las encuestadoras antes de aceptar la encuesta. Examinando las tablas se descubren de inmediato inconsistencias con el reporte final. En el caso de Demotecnia, el número final de “votantes” (los que no se abstuvieron) coincide con el reporte. No es el caso de las otras dos encuestadoras, en un caso hay más votantes que los reportados, en el otro hay menos. Los porcentajes de abstención de dos encuestadoras no corresponden con los de sus reportes finales. Expandir datos de abstención sería absurdo y por eso no hay justificación para esa diferencia. Y lo más sorprendente: los porcentajes de votos de Parametría y Covarrubias tienen una diferencia de 0.2% tomando los datos de las tablas. Así que sin aplicar factores de expansión resulta que dos encuestadoras tienen una coincidencia de proporciones que es altamente improbable, y después de los factores de expansión ocurre el milagro estadístico adicional mencionado arriba, donde Demotecnia y Covarrubias coinciden en su estimación final a tres dígitos significativos. Tantas coincidencias entre tres encuestadoras que supuestamente trabajaron de manera independiente son inverosímiles.

Así que no soy yo el que tiene que aclarar ni reanalizar nada. Son las casas encuestadoras las que deben explicar fehacientemente cómo es que la variabilidad entre dos de ellas es un milagroso cero, mientras que la variabilidad con la tercera es tan pequeña que resulta también inverosímil. Deben detallar en su reporte cómo hicieron todos los cálculos y no dejarle a la ciudadanía la verificación de sus números con tablas que son inconsistentes y que no detallan el manejo numérico de los datos.

Critico en mis artículos además el “intervalo de confianza” de 2.3% reportado para los resultados de las encuestas. No es factible. Primero, por la gran variabilidad regional del país. Segundo, por la gran diferencia entre el reconocimiento de los nombres de los candidatos reportados en la primera encuesta de Morena, donde Muñoz Ledo salió vencedor, por mucho, frente a casi 20 personas. Tercero, porque la mayoría de los entrevistados no sabía del proceso de elección. Casi el 60% no estaba enterado por los diarios del proceso, es decir, se trata de personas mayoritariamente desinformadas, pero que al tener que elegir candidato, en tres muestras independientes, seleccionan entre los dos candidatos casi sin variabilidad alguna. Eso no sucede ni en Disneylandia. Aquí no se trata de sacar canicas de dos colores de una gran urna que sería el país. Se trata de procesos sociales muy complejos y de alta variabilidad.

El Director Asociado califica de falta de rigor académico lo que analizo. Pues bien, es muy fácil dirimir esto. Estoy dispuesto a discutir con él y las otras dos encuestadoras, en cualquier foro que escoja, a través de videoconferencia pública, los resultados que reportan.

A ver cómo explican muestras aleatorias de ciudadanos, en su mayoría desinformados, que sin embargo producen variabilidad cero. Durante la discusión podemos poner a alguien a arrojar una moneda al aire continuamente, para ver cuantas veces cae la misma cara de la moneda catorce veces consecutivas.

El INE, quien encargó y pagó por las encuestas, las debería someter a una exhaustiva auditoría de expertos. Ya basta de tomarle el pelo a la nación.

TEMAS RELACIONADOS

INE Raúl Rojas

Servicios

Club El Universal

Descubre y Compra

Aviso Oportuno

Empleos

Demóscopos sin vergüenza

Raúl Rojas

Raúl Rojas

El borrador de la reforma electoral consolida la sobrerrepresentación de Morena

México contra la Convención de Viena con sus licencias de manejo

Los libros de texto gratuitos: un suicidio en cámara lenta

TEMAS RELACIONADOS