Por Simon Rogers (The Guardian)
(Traducido por Ricardo García Pérez, de Rebelión)
La revelación de miles de archivos de la Guerra de Afganistán hecha por Wikileaks ha sido una labor de periodismo de datos. Con esto fue con lo que lo hicimos.
Bueno, siempre quisimos reportajes basados en datos: ahora los tenemos. En grandes cantidades. Los esperábamos con ansia. Los diarios de la Guerra de Afganistánde Wikileaksrepresentan una victoria fabulosa del periodismo sustentado en datos de investigación, no sólo para nosotros, The Guardian, sino también para The New York Timesy Der Spiegel.
También es una muestra de periodismo con datos en acción. Lo que quisimos fue posibilitar que nuestro equipo de reporteros especializados extrajera de la información historias cargadas de humanidad; y nos propusimos analizarla para dibujar una imagen global, para mostrar el desarrollo real de la guerra.
Ha sido un mes muy ajetreado para quienes hemos trabajado con los datos en The Guardian; así es como hemos llegado hasta aquí.
Lo que pretendíamos hacer nos dejó claro enseguida que no íbamos a publicar la base de datos completa. Wikileaks ya iba a hacerlo y nosotros queríamos estar seguros de no revelar los nombres de los informadores ni de poner en peligro innecesariamente a los soldados de la OTAN. Al mismo tiempo, debíamos facilitar la utilización de los datos a nuestro equipo de periodistas de investigación: David Leigh, Nick Davies, Declan Walsh, Simon Tisdally Richard Norton-Taylor. También queríamos que al lector le resultara más sencillo acceder a la información fundamental, la del mundo real, de forma tan clara y transparente como fuéramos capaces de presentarla.
Los datos nos llegaron en un archivo de Excel inmenso, compuesto por 92.201 filas de datos, algunas de ellas sin nada en absoluto o con los datos en un formato lamentable. Todo archivo de Excel que sobrepase las 60.000 filas ralentiza el programa de forma espectacular; guardar información cuesta un tiempo largo y penoso (seleccionar la primera fila, desactivar la función de guardado automático en las preferencias,…). No ayuda a los periodistas a tratar de buscar noticias entre los datos y resulta demasiado voluminosa para elaborar informes significativos.
Por fortuna, desde que existe COINS, los grandes grupos de datos no nos dan ningún miedo. Harold Frayman, que junto a John Houston suele ocuparse de lidiar con los datos de formatos pdf y otros para el Datablog, elaboró una base de datos interna muy sencilla. Ahora los periodistas podían buscar noticias por palabras o sucesos clave. De repente, el conjunto de datos se volvió asequible y resultó más fácil generar reportajes relevantes.
Los datos estaban bien estructurados (en este mismo artículo se puede leer más sobre el funcionamiento de esa estructura); por ejemplo, los sucesos estaban clasificados, unas veces de forma más fiable que otras.
También empezamos a filtrar los datos para que nos resultara más fácil relatar uno de los episodios más importantes de la guerra: el aumento de ataques con artefactos explosivos (por sus siglas en inglés, IED, Improvised Explosive Device): las bombas de fabricación casera que se depositan en las cunetas y cuya explosión es imprevisible e imposible de combatir. Este subconjunto de datos seguía siendo inmenso… pero más fácil de manejar. Entre 2004 y 2009 había en torno a 7.500 explosiones de artefactos o emboscadas (una emboscada es aquella situación en la que el ataque con explosivos se combina, por ejemplo, con fuego de armas cortas o lanzamiento de cohetes o granadas). Se encontraron y desactivaron otros 8.000 artefactos explosivos caseros. Queríamos ver la evolución de estos acontecimientos a lo largo del tiempo, así como la imagen comparativa que arrojaban.
El resultado son los datos que aparecen a continuación, que nos muestran lo siguiente:
- Los ataques con artefactos explosivos a lo largo del tiempo
- En qué regiones se produjeron
- Información sobre bajas recogida en la base de datos
Pincha aquípara descargar una vista completa de la plantilla de datos
Los datos de las bajas comportaban escollos especiales; a menudo se habían recopilado sin exactitud y estaban incompletos. Nosotros les hemos añadido, además, las bajas registradas por la OTAN para verificar la veracidad de los datos, y se verá cómo varían.
Pero esta panorámica general no transmite la enormidad de los millares de explosiones. Hay un lapso de tiempo concreto, los tres días previos a las elecciones presidenciales del año pasado, en el que se registró la explosión de más de 100 artefactos. ¿Se imagina cómo se vive en una situación así cada vez que hay que bajarse de un camión en mitad de la carretera?
Aquí es donde entró en escena el desarrollador Daithí Ó Crualaoich. Nos ayudó a señalar en un mapa la latitud y la longitud de cada uno de esos sucesos; y no sólo eso, sino que elaboró un mapa que se pudiera editar (los diseñadores lo llaman «mapa de vectores»). Y luego el diseñador gráfico Paul Scrutonconsiguió ponerlo bonito para el periódico. Se puede descargar desde Scrib’d: pincha aquípara ver los ataques con artefactos explosivos en Afganistán desde 2006 hasta 2009.
Lograr transmitir toda esa información a través de la red es un asunto distinto; Alastair Dant(con la ayuda de Igor Clark) elaboró dos gráficos interactivos para la página web:
- Una guía interactiva de todos los artefactos explosivos depositados, elaborada a partir de una base de datos que incorpora los datos geográficos (para la que Paddy Alleny Mark McCormickrealizaron las labores de diseño)
El equipo de investigadores seleccionó esos sucesos fundamentales porque los consideró particularmente relevantes; la guía de Alastair ayuda a navegar por ellos, y si se pincha en cada uno, conduce a una página elaborada por Harold (para la que Daithi y Lisa van Gelderrealizaron labores de desarrollo esenciales), donde los usuarios pueden leer el informe completo.
Queríamos sacar lo máximo posible de los datos brutos existentes y hemos publicado dos grandes grupos de datos:
Se da la inevitable circunstancia de que la labor que contribuye a perfilar una historia no es tan estimulante como el propio reportaje. Pero en el futuro, cuando se vayan haciendo públicos cada vez más conjuntos de datos, serán tareas a las que los periodistas tendrán que hacer frente. Como escribió Roy Grenslade hace un par de días,
la forma de revelación emergente a través de Internet, de la que con tanto éxito ha sido pionera Wikileaks en los últimos dos años, merece nuestro elogio y debe ser defendida frente a las fuerzas reaccionarias que pretenden evitar que se dé a conocer.
¿Hemos publicado lo suficiente? Por desgracia, no. ¿Hemos empezado a dar sentido a un conjunto de datos increíblemente complejo? Eso esperamos.
Ahora le toca a usted. ¿Puede ayudarnos a dar más sentido a esta información en bruto?