Nuevos resultados para la identificación de municipios con fosas clandestinas en México
En marzo de este año presentamos los primeros resultados de una investigación conjunta en la que hicimos públicos los primeros resultados de un modelo estadístico para predecir la existencia de fosas clandestinas en municipios de México. Los resultados de ese ejercicio pueden ser consultados en: HRDAG (https://hrdag.org/mx-fosas.html); Data Cívica (http://www.animalpolitico.com/blogueros-blog-invitado/2017/03/23/usar-da...); y PDH Ibero (http://ibero.mx/prensa/fosas-desenterrando-la-verdad-clandestina). Desde la última presentación del modelo estadístico de predicción de fosas clandestinas en México, el grupo de organizaciones (HRDAG, PDH Ibero y Data Cívica) ha trabajado en la mejora y ampliación de los mismos. A continuación se presentan los resultados de ese proceso.
El objetivo de este proyecto es generar una herramienta que permita identificar municipios de México en los que exista probabilidad de haber fosas clandestinas y, a partir de ello, ofrecer insumos para el diseño de políticas públicas en materia de búsqueda de personas desaparecidas en México.
Partimos del supuesto de que existe un universo de fosas en el país más amplio que el registrado por la prensa nacional y local e incluso por el gobierno federal y los gobiernos locales. En ese sentido, nuestro modelo estadístico predice municipios en los que probablemente hay fosas clandestinas similares a aquellas que han sido reportadas por la prensa y los gobiernos.
En otras palabras, a partir de la base de datos de registros hemerográficos de fosas clandestinas desarrollada por el PDH Ibero e información proporcionada por órganos gubernamentales, hemos identificado municipios en donde ninguna de estas fuentes ha registrado hallazgos de fosas clandestinas y, sin embargo, nuestros modelos estiman con probabilidades altas la existencia de las mismas.
Cabe aclarar que en una primera etapa del desarrollo de este modelo, nos limitamos a usar como insumo la base de registros hemerográficos del PDH Ibero. Las predicciones obtenidas a partir de este ejercicio para los años 2015 y 2016 fueron reportados en junio de 2017. En una segunda etapa, cuyos resultados reportamos ahora, hemos ingresado al modelo también la información proporcionada por órganos gubernamentales para esos mismos años, lo que nos permite comparar y someter a una nueva evaluación la eficacia de nuestro modelo.
¿Cómo funciona el modelo? ¿Cuáles son los nuevos resultados?
Inicialmente, asignamos tres valores a la lista de municipios en México: 1, 0 y -1. El 1 indica que sí hubo reportes en prensa sobre hallazgo de fosas clandestinas en ese municipio. El número 0 es un supuesto que el equipo estableció para fines estadísticos y significa que no hay fosas clandestinas en ese municipio (son 100 municipios en el país en los que con base en información de contexto y violencia creemos que la probabilidad de la existencia de fosas es cercana a cero). Al resto de los municipios se le asignó un valor -1, pues son aquellos que no fueron observados por la prensa. Estos son los municipios a los que el modelo asigna probabilidades con base en las características de los municipios clasificados con 0 y 1. Más adelante, se agregan las variables del contexto geográfico, sociodemográfico y de violencia para cada municipio. De esta forma, el modelo -llamado “bosques aleatorios” o random forest por su nombre en inglés- aprende a identificar municipios similares en las variables agregadas y, posteriormente, asigna probabilidades de existencia de fosas clandestinas.
Esta clasificación surge a partir del entrenamiento que recibe el modelo para identificar probabilidades de municipios con fosas clandestinas. Para ello, se muestra la mitad de las observaciones ordenadas de forma aleatoria. Si tuvieramos una muestra de 100 observaciones, le mostraríamos al modelo solamente 50 observaciones y esconderíamos las otras 50. Así, el modelo tiene una muestra con la que puede probar qué tan bien aprendió a identificar las primeras 50. De tal forma, con el entrenamiento el modelo genera árboles de clasificación para cada municipio, creando una combinación única de vairables para cada uno.
Una vez que el modelo ha sido entrenado con estas observaciones, se le muestra la otra mitad que había sido reservada para ver qué tan bien aprendió a clasificar municipios con hallazgos de fosas clandestinas. Así, obtenemos una lista de probabilidades para cada municipio en el que la prensa no reportó hallazgo de inhumaciones clandestinas. Para 2015, las predicciones pueden observarse en la siguiente tabla:
Como se puede observar, la figura anterior señala los municipios que tuvieron una probabilidad alta de tener fosas clandestinas, por ser similares a los que fueron observados por la prensa. Destaca que los primeros 5 municipios tuvieron una probabilidad mayor al 85% de tener una o más fosa clandestinas, siendo Apatzingán, Michoacán, el municipio con la probabilidad más alta (93%) de tener sitios de entierro clandestino.
A partir de este ejercicio, podemos confirmar que el modelo es capaz de encontrar municipios similares a los reportados por la prensa de manera certera. Esto ocurre, como ya se mencionó, entrenando al modelo a través de múltiples iteraciones para que con sólo la mitad de las observaciones sea capaz de identificar los municipios en los que la prensa registró fosas en 2015 y 2016. Con tan solo la mitad de información, el modelo debe ser capaz de clasificar municipios con fosas clandestinas de forma correcta.
Para los ejercicios de 2015 y 2016, se realizaron mil iteraciones para cada uno de los años. Los resultados para el primer año pueden observarse en la siguiente gráfica:
La figura anterior muestra el valor positivo de predicción para el modelo de prensa desarrollado para 2015. El valor positivo de predicción muestra la frecuencia con la que el modelo identifica de manera adecuada –con la mitad de la información- municipios con fosas clandestinas observadas. Esto significa que de 1000 reiteraciones que se realizaron, 335 veces se predijo con exactitud los municipios con valor de 1 en nuestras listas. Es decir, no se tuvieron “falsos positivos” (municipios que en realidad no fueron observados ). Además, se puede ver con el resto de la gráfica que más de la mitad de las veces podemos predecir de manera adecuada los municipios con fosas.
Nuevos resultados
En esta sección presentamos los nuevos resultados obtenidos para los años 2015 y 2016 habiendo agregado al modelo información recientemente proporcionada por órganos gubernamentales. Éstos se sintentizan de dos formas:
1) Con nueva información que recibimos[1] sobre hallazgos de fosas clandestinas observados por fiscalías o procuradurías estatales, confirmamos que municipios a los cuales nuestros modelos con información de prensa habían asignado una probabilidad alta, sí tuvieron fosas clandestinas posteriormente. Es decir, nuestras predicciones de municipios con fosas clandestinas para los años 2015 y 2016 fueron confirmadas con esta nueva información de carácter oficial, correspondiente a los mismos años. En otras palabras, confirmamos nuestro modelo estadístico funciona. Algunos de estos municipios fueron: Lázaro Cárdenas, Michoacán; San Fernando, Tamaulipas; y Nogales, Sonora (los primeros dos señalados con una probabilidad mayor al 80% en la tabla mostrada anteriormente).
2) Generamos modelos para los años 2015 y 2016, pero ahora con la información recibida por fiscalías. Luego comparamos los resultados con los que ya teníamos (es decir, las predicciones obtenidas a partir de registros de prensa) y encontramos que ambos identifican municipios que no han sido observados ni por la prensa, ni por las fiscalías, pero que tienen una probabilidad alta de tener fosas clandestinas. Esto se detallará más a continuación.
Las gráficas que presentamos a continuación muestran las probabilidades que los modelos usando ambas fuentes de información asignan a cada municipio, representado por puntos de colores. El eje horizontal muestra las estimaciones de probabilidad que asigna a cada municipio el modelo alimentado por información hemerográfica que recabó el PDH Ibero en su base de datos. El eje vertical muestra las estimaciones que asigna el modelo a nivel municipal utilizando información de fiscalías locales. La línea que cruza la gráfica muestra los puntos en los que ambos modelos asignan la misma probabilidad a un municipio.
En cada gráfica los municipios están representados por puntos. Los puntos de color rojo son municipios en los que hubo reportes de hallazgo de fosas que registró la prensa. Los municipios de color azul representan aquellos en los que las fiscalías locales han reportado el hallazgo de al menos una fosa clandestina. Los puntos blancos son municipios en los que suponemos no hay fosas clandestinas (determinados a partir de un análisis de contexto y con valor de 0 en los modelos ). Por último, los municipios que aparecen en color verde son aquellos en los que ni las fiscalías ni la prensa han reportado hallazgos de fosas clandestinas.
Los municipios, representados por puntos de distintos colores en las gráficas, que aparecen en la esquina superior derecha son aquellos a los que ambos modelos estiman probabilidades altas de existencia de fosas clandestinas. Del lado superior izquierdo de la gráfica aparecen los municipios para los que el modelo que utiliza información de fiscalías asigna probabildiades altas de existencia de fosas pero el modelo que utiliza datos hemerográficos, no. De forma contraria, el cuadrante inferior derecho muestra los municipios en los que el modelo que utiliza datos hemerográficos asigna probabilidades altas de existencia de fosas pero el modelo que utiliza información de las fiscalías asigna pocas probabilidades.
Entonces, a partir de las predicciones hechas a través del modelo usando dos fuentes de información distintas, tanto para 2015 como 2016 el cuadrante superior derecho muestra los municipios en los que hay que prestar atención. Ello en virtud de que se trata de municipios con altas probabilidades (asignadas por el modelo con ambas fuentes) de tener fosas clandestinas.
Estos municipios son interesantes ya que nos muestran dos posibilidades. La primera es que quizá han tenido hallazgos de fosas pero esta información no ha sido publicada o no la hemos recopilado nosotros. La segunda es que sí existan fosas clandestinas, pero que no han sido encontradas porque no se han realizado búsquedas en estas zonas. De encontrarnos ante la segunda posibilidad, dadas las probabilidades asignadas por nuestro modelo, tenemos razones estadísticas para creer que se trata de municipios en los que sería adecuado iniciar dichas búsquedas.
Algunos municipios en los cuales ni la prensa ni las fiscalías locales registraron fosas clandestinas en 2015 y, sin embargo, nuestro modelo estadístico les asignó una probabilidad alta de existencia de fosas clandestinas para dicho año, son: Cuauhtémoc, Chihuahua; Ahomé, Sinaloa y Apatzingán, Michoacán. En realidad no sorprende que estos municipios sean señalados por los modelos con probabilidad de tener fosas, dado los niveles de violencia que han experimentado, entre otros factores; lo importante es que no han sido observados por ninguna de las fuentes consultadas (prensa y fiscalías).
Algunos municipios en los cuales ninguna de las fuentes de información (prensa y fiscalías) registraron hallazgos de fosas clandestinas en 2016 y, sin embargo, nuestro modelo les asignó probabilidades de existencia de fosas por arriba de 75% son: González y Altamira, Tamaulipas; Asunción Cacalotepec, Oaxaca y Pueblo Nuevo, Durango.
En comparación con el año previo, nuestro modelo con ambas fuentes de información estima que en 2016 Cuauhtémoc, Chihuahua, por ejemplo, continúa siendo un municipio con probabilidades mayores a 82% de tener fosas clandestinas. Igualmente, Apatzingán, Michoacán, continúa con probabilidades mayores a 87%.
Además, para 2016 se observan nuevos municipios con mayores probabilidades como Españita, Tlaxcala (probabilidades de 92% en el modelo con información de fiscalías y 75% en el que utiliza datos hemerográficos), Atolinga, Zacatecas (91% y 85% de probabilidades en ambos modelos) y, Mazatlán, Sinaloa (78% y 93% también en ambos modelos).
Siguientes pasos
Hacer predicciones sobre municipios con probabilidades altas de tener fosas clandestinas limita la posibilidad de ejecutar acciones de búsqueda concretas. Ello debido a las variaciones de tamaño entre los municipios del país, así como la falta de información complementaria que posibilite precisar el lugar exacto de inhumación.
Por lo tanto, reconocemos la necesidad de recopilar información cualitativa sobre geografía a nivel local de lugares en los que han realizado exhumaciones de personas. Información sobre el tipo de terreno en el que ocurren, la cercanía (o ausencia) de caminos y carreteras, la presencia de ríos, barrancas, montañas, por mencionar algunas, es información que permitiría hacer estimaciones dentro de un municipio o localidad, sobre cuáles son los lugares específicos en los que hay mayor probabilidad de hallar fosas clandestinas. Además, es imprescindible seguir agregando al modelo municipios con sitios de inhumación que hayan sido registrados por otras fuentes.
En virtud de lo anterior, resulta fundamental incorporar a nuestro modelo información que provenga de otros sectores, por ejemplo: colectivos de familiares en búsqueda, periodistas, equipos forenses, instituciones de gobierno, entre otros, que han ido acumulando datos a lo largo de estos años de búsqueda.
Durante los próximos meses, nuestra investigación estará direccionada hacia la búsqueda y sistematización de estas nuevas fuentes de información cualitativa. Incorporar información cualitativa sobre geografías específicas en las cuales suceden las exhumaciones permitirá mejorar sustancialmente nuestros modelos en términos de cuáles son los lugares específicos en los que se tendrían que realizar nuevas búsquedas, y que no han sido observados por fuentes como la prensa o las fiscalías o procuradurías locales.
Para lograrlo, hacemos un llamado a colectivos de familias de personas desaparecidas, organizaciones de la sociedad civil, instituciones académicas, órganos gubernamentales y demás actores que deseen apoyarnos en esta tarea, se sirvan contactarnos a los siguientes correos: derechos.humanos@ibero.mx e info@datacivica.org. En la medida en que podamos alimentar el modelo estadístico con más datos, podremos obtener mejores predicciones y, con ello, mejores insumos para el diseño de políticas públicas en materia de búsqueda de personas desaparecidas en México.
[1] Agradecemos a la Comisión Mexicana de Defensa y Promoción de Derechos Humanos, y al periodista Darwin Franco, por la información actualizada que compartieron respecto a hallazgos de fosas clandestinas observadas en 2015 y 2016 por las fiscalías o procuradurías estatales. Esta información hizo posible generar los nuevos resultados presentados.
Las opiniones y puntos de vista vertidos en este comunicado son de exclusiva responsabilidad de quienes los emiten
y no representan necesariamente el pensamiento ni la línea editorial de la Universidad Iberoamericana.
Para mayor información sobre este comunicado llamar a los teléfonos: (55) 59 50 40 00, Ext. 7594, 7759
Comunicación Institucional de la Universidad Iberoamericana Ciudad de México
Prol. Paseo de la Reforma 880, edificio F, 1er piso, Col. Lomas de Santa Fe, C.P. 01219