#ANÁLISIS Redes sociales serán la nueva arena electoral en 2018
Lun, 8 Ene 2018
A través de la ciencia de datos se puede dar un panorama sobre la situación de los precandidatos en las redes sociales
Por:
Dr. Robert Hernández Martínez, actuario y académico del Departamento de Física y Matemáticas de la Universidad Iberoamericana Ciudad de México
“Los datos masivos (Big Data), son el nuevo oro."
Viktor Schönberger (2013), "Big Data, la revolución de los datos masivos.”
ANTECEDENTES:
A menos de seis meses de la elección presidencial en México, que se llevará a cabo el 1 de julio de 2018, atendiendo al calendario electoral, cuyo periodo de precampaña inició el pasado 14 de diciembre de 2017 y concluirá el 11 de febrero próximo, para dar paso a tres meses de intensa campaña (del 30 de marzo al 27 de junio de 2018); resulta pertinente contribuir a la cultura cívica mediante el uso de las ciencias -en este caso, data science o ciencia de datos-, con objeto de que la ciudadanía participe e incida en la discusión pública que favorezca la convivencia democrática.
Para este análisis exploratorio, IBM Watson Analytics for Social Media es altamente efectivo en la transformación de grandes volúmenes de información provenientes de las redes sociales (Big Data), ya que es un servicio de inteligencia artificial para el descubrimiento, análisis y visualización inteligente de datos a través del tráfico en redes sociales, cuyo propósito ulterior es la toma de decisiones.
Pero, ¿qué es Big Data? IBM lo define como “toda aquella información que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales”. Se caracteriza por las cuatro V:
Volumen: Cantidades masivas de datos; en este sentido, lo que hoy se considera un 'volumen alto', mañana será aún más. Por ejemplo, actualmente se mide el volumen de la información en megabytes, pero ya es común utilizar gigabytes y terabytes con mayor capacidad. Imagine lo que vendrá en una década o incluso antes.
Variedad: Texto, datos web, tuits, datos registrados por sensores, audio, video, imágenes, secuencias de click, archivos de registro, etc. En suma, información producida en diversos formatos.
Velocidad: Datos en movimiento en tiempo real. La información es dinámica y por lo tanto; su análisis debe actualizarse con la misma rapidez para reflejar eficientemente los nuevos cambios.
Veracidad: Incertidumbre en los datos. La información se produce masivamente en múltiples fuentes; es tan diversa y se genera con gran velocidad, que resulta complejo verificarla en su totalidad.
¿Cómo funciona Watson Analytics for Social Media? Mediante la construcción de un Social Media Project, se pueden explorar los datos en profundidad eliminando el 'ruido'; y por lo tanto, entenderlos mejor para descubrir evidencias en la información sobre nuestro caso de estudio: el impacto en redes sociales de los precandidatos a la Presidencia de México en 2018, a saber:
- Andrés Manuel Lopez Obrador (Coalición Morena-PT-PES, 'Juntos Haremos Historia').
- Jose Antonio Meade Kuribreña (Coalición PRI-PVEM-Nueva Alianza, 'Meade Ciudadano por México').
- Ricardo Anaya Cortés (Coalición PAN-PRD-MC, 'Por México al Frente').
- Jaime Rodríguez Calderón 'El Bronco' (Independiente).
- Margarita Zavala de Calderón (Independiente).
- Armando Ríos Piter (Independiente).
- María de Jesús Patricio Martínez 'Marichuy' (Independiente).
- Édgar Ulises Portillo Figueroa (Independiente).
- Pedro Ferriz de Con (Independiente).
El proyecto se diseña filtrando la información generada en idioma español durante una ventana temporal que va del 1 de diciembre de 2017 al pasado 6 de enero de 2018, con el fin de enfocar el análisis de sentimientos en redes sociales respecto a los nueve tópicos o precandidatos mencionados; adicionalmente se destacan cuatro temas asociados al nombre de cada coalición de partidos (tres hasta el momento) más el tema de candidatos independientes.
A continuación, Watson Analytics busca en las fuentes de comunidades virtuales, foros, sitios de comentarios y reviews, páginas de Facebook, sitios de videos como YouTube, blogs y websites de noticias; descubriendo 21 mil 61 documentos con un total de 30 mil 476 menciones sobre los tópicos y temas indicados.
Con este modelo es factible visualizar cómo les ha ido a los precandidatos a la presidencia hasta el corte del Día de Reyes.
DESARROLLO:
El resultado del análisis arrojó que las principales palabras que por su recurrencia y semejanza se agrupan en conglomerados son conceptos como 'Presidente', 'gente', 'cambio', 'México', 'defender' y 'mejor'; con un total de menciones de ocho mil 658, equivalente a 28.4% del total; por lo que puede inferirse que casi un tercio de los usuarios que comenta en redes sociales, asocia la próxima elección con una oportunidad para el país.
Ver GRÁFICA 1
En cuanto al conocimiento de los precandidatos en las redes sociales, es evidente que el inicio del año marcó una actividad intensa; encabezando las menciones Andrés Manuel López Obrador, quien alcanzó un pico de nueve mil menciones el día 5 de enero de 2018, seguido de Jose Antonio Meade, con casi tres mil menciones; y Ricardo Anaya con aproximadamente dos mil menciones, en la misma fecha. No obstante, durante todo el periodo de estudio el precandidato con mayor presencia es nuevamente López Obrador.
Ver GRÁFICA 2
Ahora bien, si se enfoca la observación únicamente en los tres precandidatos Obrador, Meade y Anaya; se encuentra que López Obrador es mencionado 54.8% del total; mientras que José Meade, 24.4% y Ricardo Anaya, 11.5%.
Ver GRÁFICA 3
Por su parte, de los seis candidatos independientes, sólo dos cuentan con presencia activa en redes sociales: Margarita Zavala (5.9%) y 'El Bronco' (2.5%); sin embargo, aun considerando a todos los independientes, juntos acumulan dos mil 830 menciones, equivalente a 9.3% del total.
Ver GRÁFICA 4
Al analizar la base de datos desde la perspectiva del nombre de la coalición que postula al candidato, se observa nuevamente que a la fecha el precandidato con mayores menciones es López Obrador; por lo que se concluye que su nombre se asocia a los partidos que lo postulan (Morena-PT-PES) y al nombre de la coalición que lo encabeza, 'Juntos Haremos Historia'.
Ver GRÁFICA 5
Llama la atención que el candidato más mencionado (puede inferirse que es el más conocido), no necesariamente conserva dicha tendencia en el análisis de sentimientos en redes sociales, pues el porcentaje de sentimientos positivos hacia López Obrador es de 17.2%; mientras que el de José Antonio Meade es de 19.5% y Ricardo Anaya de 15.3%.
En cuanto a sentimientos negativos, Obrador y Anaya empatan con 10.9% y 10.8%, respectivamente; por su parte, Meade alcanza 9.6% de negativos. Vale la pena mencionar que los tres precandidatos mantienen entre 68% y 71% de sentimientos neutrales; por lo que ese margen amplio será el campo de batalla en los meses por venir.
Ver GRÁFICA 6
Respecto a los candidatos independientes, se observa que sólo registran sentimientos positivos Margarita Zavala, 'El Bronco' y 'Marichuy'; por su parte, Ferriz de Con no registra sentimientos positivos y en cambio reporta un alto sentimiento negativo, no obstante su trayectoria en medios de comunicación. Finalmente, el candidato independiente Édgar Ulises Portillo Figueroa no alcanza registro alguno. Nuevamente se aprecia que en cuanto al sentimiento 'neutral', todos los precandidatos tienen oportunidad para crecer.
Ver GRÁFICA 7
¿Cuáles son los términos de sentimientos positivos que se utilizan con mayor frecuencia en las redes sociales en el caso de estudio? Básicamente tres: 'mejor', 'claro' e 'importante'; por su parte, los sentimientos negativos – por cierto, más abundantes – se refieren a 'mal', 'fraude', 'corrupto', 'peor', 'cara', 'problema', 'falta', 'pobre', 'viejo', 'ignorante'; y una gran variedad de palabras soeces que dan cuenta de las batallas que se libran en redes sociales, en parte a causa del anonimato que brinda el internet.
Cabe recordar que Watson Analytics utiliza las fuentes de información tal como fueron generadas en la red por los usuarios; es decir, sin filtro alguno; ya que en esencia su objetivo es realizar un análisis de sentimientos positivos y negativos sobre un tema; en consecuencia, los cuadros se presentan tal como fueron obtenidos por el modelo.
Ver GRÁFICA 8
¿Dónde se da la pelea por la presencia en redes sociales? Básicamente en YouTube, Facebook y las páginas de noticias, donde nuevamente la escena es encabezada por López Obrador, seguido de José Antonio Meade y Ricardo Anaya. Es evidente que gran parte de la campaña electoral que se avecina tendrá lugar en internet.
Ver GRÁFICA 9
Por otro lado, resulta interesante conocer el perfil de las menciones por género; López Obrador es mencionado por 13.1% del público femenino y 54.6% masculino; mientras que José Antonio Meade es mencionado por 11.4% de mujeres y 41.1% de hombres; finalmente, las menciones de Ricardo Anaya provienen de 12.8% del sexo femenino y 39.6% de sexo masculino.
Ver GRÁFICA 10
CONCLUSIÓN:
Si bien aún transcurre el periodo de precampaña y la campaña formal iniciará el 30 de marzo de 2018, de acuerdo al calendario del Instituto Nacional Electoral (INE), el presente ejercicio presenta un panorama actualizado sobre la situación de los precandidatos en las redes sociales; las cuales indudablemente serán la nueva arena electoral.
A través de Watson Analytics for Social Media es factible explorar el impacto en redes sociales de los precandidatos a la Presidencia de la República, mediante la construcción de una base de datos no-estructurados proveniente de lo que el público comenta en videos, Facebook, noticias, blogs, comunidades y foros virtuales.
Cabe mencionar que la naturaleza masiva de los datos y las características de los mismos hacen a menudo imposible almacenarlos en la memoria de una sola computadora (las cuatro V del Big Data); por lo tanto, obligan al analista a mantener actualizado permanente el modelo con la información que se genera a cada momento y que influye en los sentimientos del público, con objeto de tomar mejores decisiones.
Así, la ciencia de datos cumple la función de limpiar y preparar Big Data, para su análisis y descubrimiento con objeto de extraer información de los datos y comprender mejor la realidad. De esta manera, el conocimiento e información objetiva fomentará el ejercicio responsable de la ciudadanía; favorecerá las prácticas democráticas y la promoción de la cultura cívica; y consecuentemente, el involucramiento de los ciudadanos en la solución de los problemas públicos del país.
Finalmente, la generación de análisis, estadísticas, reflexiones, indicadores e instrumentos para recuperar y procesar información cuantitativa y cualitativa, contribuyen a fortalecer la cultura democrática de México ante la elección de su futuro.
Las opiniones y puntos de vista vertidos en este comunicado son de exclusiva responsabilidad de quienes los emiten
y no representan necesariamente el pensamiento ni la línea editorial de la Universidad Iberoamericana.
Para mayor información sobre este comunicado llamar a los teléfonos: (55) 59 50 40 00, Ext. 7594, 7759
Comunicación Institucional de la Universidad Iberoamericana Ciudad de México
Prol. Paseo de la Reforma 880, edificio F, 1er piso, Col. Lomas de Santa Fe, C.P. 01219
COMPARTIR: