Sin categoría

Un software para la verdad

Tiempo de lectura: ...

Investigadores de la Universidad Nacional de Córdoba diseñaron un novedoso programa que permite analizar documentos y relacionar datos para conocer el destino de detenidos-desaparecidos.

 

Memoria. El equipo de investigación procesará alrededor de un millón de documentos. (APM córdoba)

Actualmente se desarrollan unos 15 juicios por delitos de lesa humanidad en todo el país. De esta manera, el brazo de la Justicia intenta llegar a represores y apropiadores de menores en la Capital Federal, Córdoba, San Luis, Rosario, Mendoza, Jujuy, La Rioja, Salta y Formosa y en las ciudades de Bahía Blanca y las localidades bonaerenses de San Martín y San Nicolás.
En esta titánica tarea, sin dudas, los archivos de documentos vinculados con  las detenciones, secuestros, torturas y apropiaciones de menores durante los años de plomo juegan un rol fundamental. Así, en las provincias de Córdoba, Chaco, Buenos Aires, Chubut, Entre Ríos, Jujuy, La Pampa, La Rioja, Mendoza, Misiones, Río Negro, Santa Fe, Santiago del Estero, Tucumán y en la Ciudad de Buenos Aires existen archivos de la memoria, la gran mayoría abiertos al público, que son los encargados de resguardar millones de documentos plagados de rostros, fechas, lugares y nombres de personas detenidas-desaparecidas cuyo destino aún sigue siendo un doloroso signo de interrogación. Es incalculable la cantidad de documentación que existe descubierta hasta la fecha, solo en el archivo de la Comisión Provincial por la Memoria se encuentran digitalizadas hasta el momento 4 millones de fojas. En marzo de 2014, unos 7.000 legajos de personas detenidas durante la dictadura fueron hallados en el penal de Magdalena.
El análisis de toda esa documentación fue motivo de inquietud para un grupo de investigadores de la Universidad Nacional de Córdoba, más precisamente de la Facultad de Matemática, Astronomía y Física, FaMAF, quienes a través de un convenio con el Archivo Provincial de la Memoria cordobés se dispusieron a procesar mediante un software alrededor de un millón de documentos previamente escaneados.
«Son documentos de origen policial o militar, más de un millón de imágenes escaneadas, pero nosotros estamos trabajando con un subconjunto de esos documentos, unos 2 gigabytes de imágenes, menos del 20% de la totalidad, como para empezar. Estos documentos están hechos a máquina con lo cual se puede aplicar el Programa de Reconocimiento Óptico de Caracteres, OCR, especialmente diseñado. El OCR se pasa y tras este proceso se corrigen los errores ortográficos o se completan las palabras faltantes. Este primer módulo para perfeccionar los textos estuvo a cargo de la investigadora Paula Estrella. Luego se pasa a otra etapa del procesamiento que implica el etiquetado de personas, menciones de fechas y lugares en esos textos, con un segundo programa. Posteriormente viene la búsqueda de relaciones entre esas fechas, lugares y nombres de personas. Se pueden así relacionar los lugares y fechas en las que los documentos dicen que una persona estuvo presente. Esto permitiría hacer una línea de tiempo para saber, por ejemplo, por qué sitios y en qué momento pasó un detenido», explica Franco Luque, doctor en Ciencias de la Computación de la UNC y responsable científico del segundo prototipo.
Sin dudas la tarea no es sencilla aunque se ve facilitada por el hecho de que haya documentos escritos a máquina, ya que los manuscritos son más difíciles de procesar aún. «El estado de conservación y el género de los documentos es muy complejo: hay muchos nombres, modismos y alias que no necesariamente podemos diferenciar de cualquier otra palabra. A su vez, la gran variedad de información que se encuentra en los documentos –que pueden abarcar desde inventarios de muebles o instrumentos de oficina hasta traslado de prisioneros o legajos de integrantes de fuerzas de seguridad– complejiza el trabajo, ya que requiere de la confección de diccionarios específicos para cada lote de documentos», refiere Estrella, también doctora en Ciencias de la Computación e integrante del grupo de Procesamiento de Lenguaje Natural, de la FaMAF.
Según cuenta a Acción Luque, científico y docente comprometido con las causas sociales, el software diseñado por él también se podría aplicar a otros archivos. «El software que permite reconocer fechas, lugares y nombres de personas se puede aplicar en cualquier organización e institución. En las resoluciones universitarias, por ejemplo, se podría hacer una línea de tiempo del trayecto profesional de un docente o ver el crecimiento por facultades», asegura. Lo novedoso de este programa además es que permite interactuar con el usuario. «Esta herramienta le permite al usuario corregir cosas. Por ejemplo: el software puede llegar a confundir el nombre de una persona con el de un lugar, entonces el usuario puede corregirlo. No es una herramienta blindada, sino que esas correcciones que el usuario hace las incorpora y puede reentrenar su algoritmo», sostiene Luque.
No es la primera iniciativa vinculada con la búsqueda de la verdad ante los delitos de lesa humanidad en la que la Famaf se involucra. En 2006, la Agrupación Hijos de Córdoba le donó al Archivo Provincial la primera base de datos denominada «Presente», donde figuran miles de datos de personas detenidas, torturadas y desaparecidas de la provincia confeccionada de una manera tal vez artesanal. A partir de este material, los investigadores de la FaMAF en trabajo conjunto con el coordinador del Área de Informática del Archivo Provincia, Marcelo Yornet, se dispusieron a hacer una suerte de reingeniería de dicha base, actualizándola, sistematizándola y haciéndola más funcional. «Utilizando estos prototipos se ahorra un trabajo y un tiempo incalculables, porque es un cambio en el concepto y la forma de trabajar. Hasta ahora no nos han requerido para buscar datos por algún juicio por delitos de lesa humanidad, pero creemos que en cualquier momento puede pasar», afirma Luque esperanzado.

María Carolina Stegman

Estás leyendo:

Sin categoría

Un software para la verdad