Data Workers' Inquiry

por Milagros Miceli, Investigadora Principal de DWI. (Publicado originalmente en inglés el 1 de Mayo de 2025)

Lejos de ser un estudio con límites definidos y respuestas claras, Data Workers‘ Inquiry es un intento, bastante desprolijo, de poner herramientas de investigación en las manos de quienes trabajan.

En esta pieza, Mila cuenta cómo se gestó esa idea.

Cómo hicimos Data Workers' Inquiry

A collage that merges circuit board patterns with textile motifs in a grid-like background of alternating black, grey, and white. Two hand-drawn arms are on each side of the image, positioned as if gently pulling on thin, white strings that cross the image diagonally. The hands appear soft and somewhat translucent, contrasting with the rigid lines of the circuit board patterns behind them. The strings are woven through both the hands and the background, symbolising the connection between traditional weaving and modern technology. The overall colour palette features muted earth tones, including browns, beiges, and grays, creating a sense of both history and continuity between the natural and technological worlds..
Hanna Barakat & Archival Images of AI + AIxDESIGN / https://betterimagesofai.org / https://creativecommons.org/licenses/by/4.0/

Al comienzo de mi carrera como investigadora, pasé años viajando de un lado al otro para recopilar historias sobre el trabajo invisible que alimenta las tecnologías de IA. En los barrios populares de Buenos Aires, me senté con pibes y pibas que etiquetaban datos mientras soñaban con mejores futuros que ese trabajo nunca les iba a dar. En Bulgaria, conocí a refugiados sirios, algunos apenas salidos de la niñez, etiquetando imágenes satelitales para drones y tecnologías de seguridad, que hoy, en tiempos de belicismo y vigilancia sin precedentes, patrullan los cielos sobre sus propios lugares de origen.

Publiqué artículos sobre estas investigaciones. Di charlas sobre estos encuentros. Gané premios y hasta un doctorado. Pero en algún momento, me di cuenta de que las palabras se me pudrían en la garganta. No importaba cuán cuidadosamente escribiera, cuán rigurosamente citara, cuán enfáticamente insistiera en la importancia política del trabajo de datos: algo no cerraba. Había construido una carrera sobre las historias de quienes trabajan pero esas personas no habían recibido nada a cambio. Mi investigación no había cambiado nada en sus condiciones laborales y mi documentación de sus luchas no había aportado nada a las mismas.

Así fue como empecé a pensar en crear Data Workers’ Inquiry (DWI), no como un estudio o un proyecto de investigación, sino como un acto de rechazo. Ya no quería hablar por ni sobre los trabajadores y trabajadoras de datos. Quería construir un espacio donde ellos y ellas mismas pudieran contar sus historias, y donde, lo más lejos posible de cualquier extractivismo epistémico, la investigación fuera una forma de pensar y organizarse colectivamente.

A mediados de 2023, DWI todavía era una idea desprolija en mi cabeza. Lo único que tenía claro era que no quería repetir aquellos patrones de investigación dañinos que veía en la academia, y que no podía encarar este proyecto sola. Entonces me acerqué a quien en ese momento era doctorando, Adio Dinika, que tenía mucha experiencia investigando el trabajo en plataformas en África subsahariana. Adio fue clave para ayudarme a ordenar esas ideas incipientes y convertirlas en un primer borrador del proyecto. Después se sumaron mis estudiantes Camilla Salim Wagner y Laurenz Sachenbacher, que se hicieron cargo de la operación del día a día y de resolver infinitos obstáculos administrativos para que DWI se hiciera realidad. Finalmente, se sumó la trabajadora de datos y organizadora Krystal Kauffman, que nos ayudó a mantenernos fieles a nuestro propósito original mientras intentábamos hacer que DWI no fuera completamente ajeno a las exigencias académicas.

En ese malabarismo de dar forma y adaptar, hubo algo que se mantuvo inamovible desde el día uno: las personas trabajadoras que se nos unieran iban a ser tratadas con la deferencia que se le brinda a un experto y remuneradas de manera justa, no como participantes sino como investigadores e investigadoras. Conseguir fondos para esto, y más específicamente para invitar a trabajadores y trabajadoras de datos a nombrar a las empresas que los explotan y a organizarse contra ellas si así lo elegían, no fue nada fácil. Presenté la idea ante representantes de organizaciones académicas y filantrópicas que, escépticos, asentían con amabilidad hasta que se daban cuenta de que esto no era otro proyecto para desarrollar “IA responsable” o promover el “uso ético de la IA”. Por suerte, mi visión sí conectó con algunas personas: la fundadora y directora ejecutiva de DAIR, Timnit Gebru, fue la primera en decir “Bueno, dale, te voy a ayudar a que DWI suceda”. Y así fue. Hace exactamente un año, el Primero de Mayo de 2024, anunciamos el proyecto con un breve trailer.

Encontrar personas que quisieran unirse al proyecto fue fácil y difícil a la vez. Me ayudó mucho el haber construido vínculos duraderos con trabajadores y trabajadoras de datos durante mis investigaciones anteriores. Pero explicar lo que estaba pensando para DWI fue complicado, sobre todo porque no había un modelo ni investigaciones previas a las que pudiera dar de ejemplo. Al principio, la convocatoria avanzó lenta, llena de conversaciones cuidadosas y dudas de ambos lados. Pero una vez que las primeras trabajadoras de datos dijeron que sí y se sumaron, algo cambió: la noticia empezó a circular de boca en boca por redes de solidaridad, y comencé a recibir mensajes de quienes querían sumarse como investigadores e investigadoras comunitarias.

Una vez en el proyecto, cada persona diseña su propia investigación, lo que significa que elige las preguntas que quiere responder, los métodos con los que va a investigarlas y la forma en que va a presentar sus hallazgos. Algunas decidieron usar sus nombres completos como autoras de sus investigaciones, mientras que otros prefirieron el anonimato total.

Cada investigador o investigadora comunitaria elige cómo presentar sus hallazgos dentro de una variedad de formatos que incluye podcasts, reportes, videoensayos, vlogs, documentales y videos animados. La diversidad de las piezas es hermosa. Pero también implicó desafíos a la hora de coordinar distintos tiempos, niveles de experiencia y sistemas de cuidado. Así fue que sumamos apoyo para edición, ilustración, traducción, subtitulado y animación para hacer que cada investigación cobrara vida. Antes de publicar, especialistas legales locales revisaron cada pieza para asegurarse de que ninguna de las personas investigadoras comunitarias —ubicadas en distintas regiones con marcos legales diversos— quedara expuesta a riesgos.

Mientras acompañaba la creación de estos trabajos, tuve momentos de duda casi todos los días. ¿Cuánto deberíamos intervenir en las creaciones de los y las investigadoras comunitarias? La idea era encontrar un equilibrio entre producir materiales que fueran legibles para un público amplio y, al mismo tiempo, conservar la crudeza con la que estas personas comunicaban sus experiencias. Cada sugerencia de edición se sintió como una pequeña traición, y como una tentación de hacer el trabajo “más prolijo” o “más aceptable” a costa de su autenticidad. Aprendí a reconocer cuándo hacía falta dar una mano y cuándo era mejor correrse y simplemente abrir espacio.

Más que hallazgos, las historias que salían a la luz eran heridas, y meterse en ellas no fue fácil para quienes investigaban. En un momento, me di cuenta de que el proceso de investigación estaba resultando retraumatizante para algunas de las personas trabajadoras que se nos habían unido, así que convoqué a una psicóloga para acompañarlas. No fue una solución perfecta, y me gustaría poder decir que esa contención estaba planeada desde el comienzo. Pero la verdad es que esta y varias otras cosas solo las advertí cuando ya estaba muy metida en el proceso.

Ese mismo proceso me enseñó que hay muchos momentos en los que la línea entre investigación y acción desaparece. Botlhokwa Ranta, investigadora comunitaria y ex moderadora de contenido, descubrió a través de su investigación que un grupo de exempleadas de la empresa tercerizadora Sama, en su mayoría mujeres migrantes, había quedado varadas en Nairobi tras ser despedidas sin cobrar. Para apoyar a estas trabajadoras, lanzamos una campaña de recaudación de fondos junto con nuestras aliadas de Superrr, y Ranta ayudó a once de esas mujeres a regresar a sus hogares. También acompañamos a los investigadores comunitarios de Alemania cuando fundaron un consejo de trabajadores y trabajadoras para enfrentar las condiciones laborales explotadoras en Telus, un proveedor de trabajo de datos para Meta y otros gigantes tecnológicos. Y cuando un grupo de trabajadores y trabajadoras de datos en Kenia decidió crear la Asociación de Etiquetadores de Datos y nos pidió apoyo, coorganizamos su evento de lanzamiento e invitamos a otras organizaciones amigas a sumarse y apoyar también.

A pesar de los pequeños logros y las buenas intenciones, hay límites. Y la existencia de esos límites fue una de las cosas más difíciles que tuve que aprender a aceptar. Por más que quisiéramos, DWI no cambia de forma estructural las condiciones materiales en las que vive la mayoría de las personas trabajadoras de datos. Por más bellos que sean nuestros principios, no podemos borrar la violencia de una industria construida sobre robo y explotación. Todo lo que tenemos para ofrecer es solidaridad con los y las trabajadores, y eso, la mayor parte del tiempo, es insuficiente.

Sin embargo, a un año de haber empezado el proyecto, tengo varias razones para estar orgullosa: creamos un repositorio con 16 piezas realizadas por trabajadores y trabajadoras de datos de Kenia, Venezuela, Siria, Líbano, Brasil y Alemania, cada una con un enfoque único. Y este año vamos a estar publicando ocho trabajos más. Hicimos que cada pieza fuera de acceso abierto bajo una licencia Creative Commons, para que pudiera ser reutilizada y remixada. El repositorio se volvió un recurso importante para quienes trabajan en investigación, periodismo, docencia y políticas públicas, y buscan relatos en primera persona sobre el trabajo de datos. Lo más importante es que el repositorio se volvió material de consulta para trabajadores y trabajadoras de todo el mundo que buscan información sobre luchas compartidas y estrategias de resistencia. Organizamos una serie de eventos online con nuestras investigadoras comunitarias que fue vista por miles de personas, y coorganizamos un panel de trabajadores y trabajadoras de datos que dio testimonio en el Parlamento Europeo. Hoy puedo decir con certeza que nuestro trabajo tuvo impacto.

DWI dejó al descubierto la explotación estructural en el corazón de la industria de la IA: el aprovechamiento de grupos vulnerables como migrantes, personas refugiadas y minorías de género, y el uso de tácticas como el robo de salarios, la discriminación en los pagos y las represalias laborales para sostener el sistema. Investigaciones como la de Fasica Berhane Gebrekidan mostraron cómo las redes sociales se convirtieron en instrumentos para la difusión de contenido genocida durante la guerra de Tigray (2020-2022), y cómo la falta de moderación y de condiciones para cuidar la salud mental de quienes hacían este trabajo hizo imposible frenar eficazmente la ola de odio, con consecuencias devastadoras, incluyendo linchamientos de civiles. Las piezas audiovisuales de Yasser Alrayes y del trabajador brasileño bajo el seudónimo “Ruba” mostraron el vínculo entre condiciones laborales explotadoras, alienación, falta de formación adecuada y la calidad de los datos con los que se entrenan sistemas de IA. El fanzine “The Unknown Women of Content Moderation” expuso los abusos sexuales, mentales y físicos sufridos por mujeres migrantes empleadas como trabajadoras de datos en Nairobi.

Estas piezas son solo algunas de las que forman el repositorio, pero creo que alcanzan para mostrar que hacemos un trabajo necesario. Sí, es desprolijo, lento y lleno de contradicciones y conflictos. Pero es un trabajo liderado por las propias personas cuyas realidades son el objeto de estudio. Se trata de un trabajo que prioriza la acción por sobre la publicación, y la solidaridad por sobre el prestigio.

El proyecto Data Workers’ Inquiry no solucionó el trabajo de datos ni transformó la industria de la IA. Pero sí abrió un espacio donde trabajadores y trabajadoras de todo el mundo pueden investigar su propia explotación, contar sus historias con sus propias palabras, organizarse y luchar. Todo esto en sus propios términos. Y eso, aunque parezca mentira, no es común dentro de la academia ni tampoco en la industria de la IA. Creamos un modelo para otros y otras que, como yo, no quieren reproducir la violencia de la investigación extractivista y están cansadas de entornos académicos que se visten con el lenguaje de la intelectualidad mientras extraen el dolor de las personas trabajadoras y lo reutilizan para su propio beneficio.

About the Author

Milagros Miceli

Como socióloga e ingeniera informática, Mila investiga cómo se producen los datos de entrenamiento para aprendizaje automático. Su foco está puesto sobre las condiciones laborales y las dinámicas de poder en el trabajo de datos. Desde 2018, trabaja con comunidades de trabajadores y trabajadoras de datos de todo el mundo.

Además de liderar Data Workers‘ Inquiry, Mila es resarch lead en el DAIR Institute, directora del grupo de investigación Data, Algorithmic Systems, and Ethics en el Weizenbaum-Institut y docente de la TU Berlin.