¿Puede Twitter predecir los resultados de las elecciones europeas 2014?

Durante las primarias de EQUO parecía que si, pero ¿es extensible el método para predecir los resultados de unas elecciones a gran escala? Quien sólo tenga interés en la predicción en sí que baje al final de este texto. A continuación, las explicaciones.

La fórmula que ajustó mejor los resultados de las primarias fue “número de menciones + número de personas que interactuaron con las candidatas + el doble del número de menciones durante las últimas dos semanas”. Refleja por un lado el interés que una persona levanta en Twitter, combinado con el momento en el que solemos tomar nuestras decisiones, que es más bien a última hora. La correlación de este dato con respecto al resultado real fue muy alta (R2=0.95).

Para contar las menciones he utilizado dos herramientas: Tweetbinder (con la que puedo obtener el número de personas que interactúan, pero el número de menciones está limitado) y Topsy (que no ofrece el número de personas que interactúan, pero no tiene límite de menciones). La hoja con el resumen de datos (incluyendo ambas fases de las primarias) puede consultarse online.

A la hora de extrapolar estos datos al conjunto de la población, hay que calcular: qué porcentaje de los votantes usa Twitter, y cuantas interacciones se corresponden con un voto.

La Unión Internacional de Telecomunicaciones da como cifra oficial del uso de Internet en España el 72% en 2012.  De los usuarios de Internet en España, el 46% utiliza Twitter, según un estudio de IAB Spain. Una asunción clave en este cálculo es que Twitter refleja acertadamente el interés real, considerando a sus usuarios una muestra representativa del resto de la población. Ya que 0.72 * 0.46 = 0.3312 asumo que el 33,12% de la población usa Twitter, y para extrapolar los datos me bastará con obtener la parte proporcional.

Hasta aquí llega “lo fácil”. Ahora hay que calcular cuantas interacciones se corresponden con un voto, que en términos de analítica de redes sociales aplicada a la política es poco menos que el santo grial (también de ahí viene la gracia de esto). Según los datos que tenemos de la segunda vuelta de las primarias de EQUO, la relación entre voto conseguido y menciones en Twitter para el ganador fue de 1 a 4.75 (1 voto por cada 4.75 menciones). La pregunta es ¿cómo de diferente es la interacción de votante/candidato en unas primarias comparado con unas elecciones estatales? Aquí está el gran agujero de este método, ya que en función de cómo se responda a esta pregunta se pueden obtener los resultados que se quieran. Para este caso voy a asumir que en unas estatales se interactúa con el candidato la mitad de las veces que se haría en unas primarias. No tengo datos para sostener este argumento, es sólo una opinión más o menos informada.

Con esto ya se pueden obtener predicciones. Sin embargo, no voy a darlas de todos los partidos, sino sólo de aquellos que considero que basan su actividad en las redes sociales. Un partido con influencias sobre un medio de comunicación tiene una relación con Twitter totalmente diferente que la que tienen EQUO y Primavera Europea, Podemos, Partido X, Pacma y el Partido Pirata, que son los que he escogido. En casi todos ellos la actividad en Twitter de la cuenta oficial del partido ha sido más relevante que la de los candidatos, salvo en Podemos. Aun sí, he selecciondo para todos los casos la cuenta del partido para hacer la predicción. Estos son los resultados finales:

  • Podemos: 311.000 votos
  • Primavera Europea: 295.000
  • Partido X: 193.000
  • Pacma: 70.000
  • Piratas: 21.500

Los datos provienen de Topsy. Usando Tweetbinder que tiene mejor ajuste salen unos 15mil votos más a Primavera Europea (para los otros partidos no tengo datos adecuados en Tweetbinder).

Para Primavera Europea esto debería de significar 1 eurodiputado. En función del acuerdo con Compromís, este diputado ocuparía el tiempo proporcional a los votos obtenidos en la Comunidad Valenciana. Si se correspondiesen estos con la actividad en Twitter de Compromís, serían 75.000 votos. Florent Marcellesi sería eurodiputado a partir de septiembre de 2015.

Si alguien tiene sugerencias sobre como mejorar este análisis, son más que bienvenidos Mientras tanto… ¡que salgan ya los datos oficiales!

Nota: el seguimiento completo realizado con TweetBinder puede verse aquí para: @EuroPrimavera, @Equo, @juralde y @fmarcellesi. Si quieres analizar por tu cuenta los datos puedes descargarlos (van desde el 15/4 hasta el viernes 23/5) en este enlace (ZIP, OpenDocument, 3,1Mb).

Actualización 25/5 al 99,67% escrutado: 

  • Acertado: el número de votos de Primavera Europea. 295.000 predichos y 299.618 reales.
  • Fallado: todo lo demás. Podemos saca un millón de votos más de los que había proyectado. ¿Es por su presencia mediática, que estas fórmulas no incorporan? El Partido X saca 100.000 votos menos, y PACMA saca 100.000 votos más. ¿Es necesario dar un peso diferente a cada partido según cómo interactúa en Twitter?

Conclusión: puede que tengamos entre manos una buena fórmula, pero que sólo funciona bajo unas condiciones muy particulares y debe ser ajustada partido a partido. En cualquier caso, aquí se queda este experimento que espero pueda servir a quienes estudian el tema desde una perspectiva más rigurosa para sacar ideas. Volveremos a la carga en las municipales del próximo año, a seguir tratando de aprender.

2 comentarios en “¿Puede Twitter predecir los resultados de las elecciones europeas 2014?

  1. Pingback: Equo y Podemos: cooperar y/o competir | Rafa Font (eu)

  2. Carlos

    Hola!
    Estoy haciendo un estudio similar en Ecuador, quisiera saber si es posible, como llegaste a esaFORMULA?
    Es decir, en base a que parametros, o que otros casos de prueba determinaron la validez de la misma, debido al alto grado de correlación.

    Agradezco tu tiempo y la información de tu artículo. Saludos.

    Responder

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *