Título y resumen de propuesta

DATIFICACIÓN CRÍTICA DE LA VIOLENCIA. CONCEPTUALIZACIÓN, PROCESAMIENTO, VISUALIZACIÓN Y ANÁLISIS DE DATOS CON REGISTROS DE VIOLACIONES GRAVES A LOS DERECHOS HUMANOS EN COLOMBIA Y EN MÉXICO

Víctor Hugo Ábrego Molina

Los procesos contemporáneos de datificación de la realidad están siendo abordados desde los estudios críticos de datos, las humanidades digitales, los estudios de visualidades y otras áreas del conocimiento, para señalar las limitaciones, sesgos políticos, epistemológicos y culturales de los marcos dominantes en los que ocurren estos procesos. Esta propuesta condensa dichos abordajes para conceptualizar críticamente registros digitales de violaciones graves a los derechos humanos en Colombia y en México, y tiene como objetivo el diseño e implementación de mecanismos de procesamiento y visualización de datos cuyo análisis no busca medir la experiencia capturada en estos registros sino producir interpretaciones abiertas centradas en el abordaje de valores categóricos en estos conjuntos de datos. A partir de conceptos de los estudios de memoria, trauma y violencia, de la semiótica, la archivística y la estética forense emerge una datificación crítica de la violencia, basada en una metodología mixta que utiliza herramientas de lingüística de corpus, análisis de redes, métodos biográficos, sociolingüística y análisis crítico del discurso.

redmimama

Estado del arte

Aproximaciones críticas a la realidad datificada

La consulta de literatura alrededor de procesos de datificación de la realidad ha arrojado la siguiente categorización de énfasis, exploraciones y sesgos en diversos campos y áreas del conocimiento, así como evidencia de la incidencia cultural, epistemológica y política de dichos procesos en contextos determinados1.

Estudios Críticos de Datos

Los Estudios Críticos de Datos (ECD) son un campo interdisciplinario emergente alrededor de la problematización de los procesos de datificación de la realidad. ¿Cómo se producen y cómo se adquieren los datos? ¿De quiénes son los intereses alrededor de la inteligencia que producen los datos? ¿Cuáles son las implicaciones políticas y las consecuencias culturales y sociales alrededor del uso de los datos? Son algunas de las preguntas que condensan los intereses de este campo (Boyd & Crawford, 2012; Kitchin, 2022; Kitchin & Lauriault, 2014). Los énfasis conceptuales en este campo abarcan:

  • La vigilancia y el control social ejercidos desde la sistematización y la generación de inteligencia con datos (Mejias & Couldry, 2019; Thatcher et al., 2016; Yeung, 2018).
  • La predictibilidad de lo posible mediante formas de gubernamentalidad algorítmica (Rouvroy & Berns, 2018).
  • Las formas de datificación de la realidad como métodos actuales de extractivismo y fetichismo informacional contemporáneo (Milan & Treré, 2019; Ramos-Martín, 2022; Ricaurte, 2019).
  • Las tensiones entre estructura y agentes en forma de "ambivalencias" o tensiones y disputas alrededor de los datos (Hepp et al., 2022).
  • La observación y el análisis de las infraestructuras materiales y simbólicas de los datos y de los usos de estos por parte de gobiernos y ciudadanías (Barreneche, 2019; Barreneche et al., 2021).
  • Y un conjunto en particular que apunta no sólo al desarrollo conceptual sino también al de distintas formas de apropiación crítica de la datificación. Desde aquí se habla, por ejemplo, de literacidades de infraestructuras de datos (Gray et al., 2018), reimaginación de la analítica de datos (Selwyn, 2020), formas de contra-mapeo (Dalton & Stallmann, 2018), asequibilidades algorítmicas (Ettlinger, 2018), entre otras posibilidades que incentivan al desarrollo metodológico con datos.

Así, desde este campo emerge lo que podemos nombrar como datificación dominante, caracterizada por una ontología numérica, que remite a una cualidad mediante la cual el dato es capaz de aportar al conocimiento únicamente en tanto “mide” algo, una racionalidad predictiva, que más allá de controlar la ingente cantidad de información a la que tiene acceso y produce la datificación, busca controlar “lo por venir” en lo social a partir de registros digitales de la experiencia, un tipo de gubernamentalidad de vigilancia y control, que remite a un vicio institucional que amplía las posibilidades de perfilamiento de usuarios de tecnologías digitales con intenciones de producir a los sujetos como sospechosos o como consumidores, una ética comercial, que remite a una utilidad de los datos cifrada en las posibilidades de generar rendimiento económico, y una epistemología universalizante, que remite a un reforzamiento autorreferencial de la jerarquía ejercida por la lectura estrictamente numérica de la realidad a través de datos, por encima de otras posibilidades de producir conocimiento mediante el énfasis, por ejemplo, en valores categóricos en los mismos datos.

Visualización y representación crítica de datos

Por otro lado, hay una conversación a nivel interdisciplinar abierta alrededor de la problematización y la exploración de mecanismos de procesamiento y visualización de datos desde investigaciones provenientes de las ciencias sociales y las humanidades. Algunos referentes al respecto han apuntado que las herramientas más usadas de procesamiento y visualización de datos están construidas y concebidas desde marcos epistemológicos (y escópicos) de corte cuantitativo, que producen y condicionan el tipo de resultados que se pueden obtener con ellas, lo cual nos deja frente al cuestionamiento acerca de cuáles son las posibilidades de obtener resultados con fines cualitativos (y críticos) con el uso de estas herramientas (Masson, 2017). En esa misma línea, Johanna Drucker ha desarrollado una serie de principios para concebir una producción de conocimiento desde la visualización de datos que no parta ni tenga como objetivo la representación gráfica de significados pre-existentes en los datos. Para la autora, hay un tipo de conocimiento visual que no sólo es capaz de "reproducir" sino de "producir" significados. A este conocimiento le llama "Graphesis" y se distingue de la "Mathesis", que es el tipo de conocimiento visual que sí tiene como objetivo leer en las visualizaciones "la precisión" con la que éstas "representan" el significado preexistente en los datos, usualmente numéricos (Drucker, 2020). Drucker invita a pensar a las visualizaciones de datos como argumentaciones retóricas desplegadas en escenarios gráficos, cuyo objetivo es tener efectos de verdad en tanto flujo discursivo y no simple conjunto de información que acompaña una idea. A este respecto, Alberto Cairo ha señalado que usualmente los mecanismos de procesamiento y visualización de datos se dan por sentados desde la mirada cuantitativa e invisibilizan, o justifican por simple funcionalidad, las transformaciones y los sesgos epistemológicos y políticos que sus convenciones siguen y consolidan. Sin embargo, esta jerarquía de la lectura estrictamente numérica de los datos, fácilmente refuerza creencias y tiende a aumentar los sesgos de confirmación en quien los lee (Cairo, 2019).

Otro referente alrededor del abordaje crítico de datos es el de los métodos digitales, encargados de lo "nativamente digital" (Rogers, 2023), y desde donde se han desarrollado distintas herramientas de descarga y extracción de datos de plataformas digitales y motores de búsqueda (Rieder, 2015; Rogers, 2017), con la intención de analizar estos datos al menos desde dos dimensiones, a saber, desde los "datos sociales", referidos a las tendencias o temas sociales visibles en estos espacios, y desde los "datos semánticos", referidos a las conversaciones que componen dichas tendencias, presentes en distintos tipos de mensajes producidos por todo tipo de actores en estos escenarios. De corte mixto, los métodos digitales tienen un particular interés en la interpretación crítica de los valores cualitativos, es decir en los textos presentes en los conjuntos de datos a los que acceden.

Finalmente, distintos autores han abogado por la inclusión de herramientas y miradas etnográficas para el análisis de datos. Al respecto, Elisenda Ardévol ha identificado las coincidencias entre la ciencia de datos y los enfoques hermenéuticos, señalando que ambos están interesados en "hallar patrones para la investigación" que puedan ser tomados como insumos susceptibles de ser interpretados. Para la autora "modelizar el comportamiento humano" no es suficiente para llevar a cabo una interpretación de aspectos culturales a partir de patrones, sino que "sólo una descripción densa puede revelar el significado cultural, si tiene alguno, de estas conexiones" (Ardévol, 2017). A este respecto, César Rodríguez Cano (Rodríguez Cano, 2022) se ha pronunciado por evidenciar que "aunque sean inmensos, los datos se pueden interpretar cualitativamente", siempre y cuando se mantenga una vigilancia epistemológica y una actitud crítica permanentes frente a los datos, los métodos y los marcos interpretativos de los que se parta para trabajar con datos masivos.

Los default del tratamiento estadístico de los datos (disputar lo indisputable)

Los mecanismos de gestión y limpieza de datos desde la llamada ciencia de datos tienen como finalidad homogeneizar la información, ya sea para alimentar algún modelo de análisis a partir de los patrones numéricos identificados en los datasets o ya sea para presentar informes (con visualizaciones integradas) que integren las cualidades medibles de los valores que componen un archivo. Algunos de estos mecanismos son:

  • Normalización: consiste en transformar los atributos de una porción del dataset a una escala similar a partir de la identificación de valores mínimos y máximos de modelos lineales o de distribución de valores atípicos.
  • Discretización: consiste en distribuir un conjunto de valores en intervalos de igual amplitud o por cuartiles.
  • Numerización: consiste en convertir a una escala de valores numéricos valores categóricos con el fin de medir la frecuencia con la que aparecen.

El análisis de datos a partir de este tipo de técnicas de gestión, tradicionalmente parte de la utilización de herramientas de estadística, útiles para obtener medidas del conjunto de datos a partir de segmentaciones del mismo, así como para identificar correlaciones y/o distintos tipos de causalidad o tendencia que conlleven a la construcción de interpretaciones que comúnmente aspiran a producir modelos de predictibilidad.

El historiador, estadístico y sociólogo Alain Desrosieres (Desrosières, 2011) elaboró un minucioso estudio acerca de la historia del razonamiento estadístico, en el cual señala algunas de las cualidades principales de este dispositivo cognitivo que, como pocos, ha tenido un éxito y una legitimidad que en muchas ocasiones rayan en lo incuestionable. Desrosieres señala los elementos racionales, históricos y políticos que construyeron el pensamiento estadístico. A partir de su lectura es posible identificar y categorizar al menos tres dimensiones constitutivas de la estadística:

  • Dimensión epistemológico-política: Se refiere a entender que la estadística es el fruto de la unión entre el desarrollo del pensamiento probabilístico a partir del siglo XVIII y la configuración de los estados-nación en esa misma época. Esta unión le ha dado a la estadística una legitimidad tanto epistemológica como política, con la que ha sido capaz de producir un lenguaje que sirve de piso y sentido común para las sociedades y para los gobiernos, con mayor firmeza desde mediados del siglo XX.
  • Dimensión ontológica: Se refiere a la transformación en la naturaleza de las cosas que lleva a cabo la estadística, ocurrida en el momento en el que selecciona un fenómeno de la realidad social y una vez identificada una cualidad o conjunto de cualidades medibles del mismo, hace a un lado las cualidades no medibles. Sin embargo, una vez analizadas estadísticamente dichas cualidades, los resultados tienden a hablar tanto por lo medible como por lo no medible del fenómeno.
  • Dimensión semiótica-retórica: Se refiere a la cualidad sineqdóquica de la estadística, mediante la cual toma una parte (el promedio, la correlación, la tendencia), y la hace hablar por el todo. Se trata de un despliegue de significado del análisis producido mediante el cual la representación sustituye a lo representado.

Señalar estas cualidades no implica en modo alguno que se intente descalificar o poner en duda el valor de las aproximaciones cuantitativas al análisis de datos, sino que busca evidenciar áreas de oportunidad para la experimentación con distintas herramientas de manejo de datos que coloquen el foco del análisis en valores categóricos desde andamiajes cualitativos y mixtos.

Medir lo inconmensurable

A contrapelo de los supuestos elementales del pensamiento estadístico, la antropóloga Sally Engle Merry ha hecho una etnografía de los indicadores numéricos internacionales que registran abusos a los derechos humanos y ha señalado que estos parten de una imposibilidad general, a saber, la imposibilidad de medir lo inconmensurable (Merry, 2016). Es decir, la naturaleza de los abusos a los derechos humanos imposibilita de manera radical que el registro de la experiencia sea la medición de dicha experiencia, y mucho menos la sustitución de la experiencia. Esta incompatibilidad entre la condición de inconmensurabilidad de este tipo de experiencias y la validación mediante lo cuantificable de lo estadístico, da cuenta de posibilidades de exploración e interpretación del peso semiótico de registros de este tipo de experiencias desde regímenes analíticos no centrados en lo cuantitativo.

Luego entonces, los métodos cualitativos (la entrevista a profundidad, la etnografía, entre otras) suelen ser las aproximaciones más adecuadas para analizar críticamente este tipo de registros. Sin embargo, el acceso a amplios archivos digitales con testimonios de violaciones graves a los derechos humanos o con descripciones de estos hechos, permite la exploración de métodos computacionales y de tratamiento de datos tabulares alternativos para emprender un tipo de análisis centrado en los aspectos cualitativos de estos registros.

Una investigación crítica de registros digitales de este tipo no excluye la utilización de métodos cuantitativos de segmentación y análisis preliminar de ciertas porciones de los datos, pero sí supone utilizarlos no como fines sino como puntos intermedios condicionados por una reorientación constante hacia el análisis de valores categóricos desde anclajes conceptuales y metodológicos cualitativos y mixtos, desde los cuales contribuir a los estudios de memoria histórica y trauma social (Alexander, 2016) con la utilización de métodos computacionales.

El peso político de la datificación de la violencia en Colombia y en México

México y Colombia comparten características en sus formas de violencia y en los efectos sociales que estas han tenido en las últimas décadas. Si bien cada país ha atravesado por etapas y actores distintos, las catastróficas cifras de violaciones graves a los derechos humanos son un aspecto compartido. Según datos del INEGI (INEGI, 2025), en México entre 2006 y 2023 han sido asesinadas al menos 400 mil personas. En Colombia una cifra de alrededor de 450 mil personas asesinadas es la que se tiene documentada de 1985 a 2019, con más del 75% de víctimas registradas entre 1996 y 2010, de acuerdo con datos del informe final de la Comisión de la Verdad (Comisión de la Verdad de Colombia, 2022). México alcanzó en 2022 el registro oficial de 100 mil personas desaparecidas y en años recientes se ha señalado la necesidad de documentar víctimas de desplazamiento forzado y de reclutamiento forzado de jóvenes. En Colombia hay documentados 11 abusos a los derechos humanos, entre los que se encuentran los mencionados y otros más, cometidos desde 1958. En ambas naciones es posible encontrar formas similares de violencia sistemática en contra de la población civil, formas de gobernanza criminal en distintos territorios, así como formas de macro-criminalidad o patrones de comportamiento criminal de los grupos armados (Alfonso-Camelo & Chaparro Moreno, 2024). Este contexto en ambos países ha ido a la par del desarrollo de una paradójica condición de consolidación institucional y de fragilidad institucional, en la cual la violencia, los amplios márgenes de impunidad y la corrupción institucional no han sido excluyentes sino concurrentes y complementarios al desarrollo de ambos estados.

Sin embargo, entre las diferencias en el modo de abordar esta crisis de violaciones a los derechos humanos está el propio papel de los gobiernos. En el caso colombiano se ha hecho un reconocimiento oficial de estar en medio de un conflicto armado, mientras que en México ningún gobierno federal se ha atrevido a aceptar esta condición, sin la cual mecanismos oficiales de documentación, sistematización y diseño de políticas de desarme y pacificación puedan ser diseñadas e implementadas. Esta comparación nos lleva a ver las diferencias en el estado de la propia documentación del conflicto y de las víctimas en ambos países. Mientras en Colombia se tienen espacios oficiales dedicados al estudio y documentación del conflicto, como el del Centro Nacional de Memoria Histórica o el informe final de la Comisión de la Verdad, en México los registros de víctimas de delitos como la desaparición siguen estando en medio de un jaloneo institucional entre un registro nacional que en los últimos años ha tenido modificaciones sin consultar con autoridades, expertos y familias de las víctimas, y registros estatales que no necesariamente han sido confiables ni cuentan con metodologías de captura y seguimiento rigurosos ni homologados de los casos.

Los registros de violaciones graves a los derechos humanos en ambos países, provenientes tanto de fuentes oficiales como de ONGs, medios alternativos y comisiones de la verdad, están insertos en un circuito de disputa por la construcción de la verdad acerca del pasado y el presente de los conflictos, de los referentes y encuadres para la construcción de memoria histórica desde el trauma social y de las propias posibilidades de imaginar salidas pacíficas al conflicto a partir de la comprensión del mismo. De estas construcciones depende parte importante de la identidad nacional, la legitimidad institucional y las posibilidades de construcción de sociedades democráticas en cada país. Es decir, la disputa por el sentido de los registros de violaciones graves a los derechos humanos tiene un peso político definitorio del presente y el futuro de ambos países.

1

Un artículo resultado de una porción de este apartado ha sido publicado recientemente en la revista Acta Sociológica bajo el título: Datificación crítica de la violencia. Aportaciones a los estudios críticos de datos desde contextos Latinoamericanos. Disponible en: https://www.revistas.unam.mx/index.php/ras/article/view/90765

Planteamiento del problema y problema de investigación

Abrir las infraestructuras de la datificación

A continuación, se presenta una serie de huecos y desfases del conocimiento alrededor de los procesos de datificación de la realidad, a los cuales esta investigación puede contribuir con el abordaje crítico de registros digitales de violaciones graves a los derechos humanos. Cada párrafo se corresponde con los temas y áreas del conocimiento abordados en el estado del arte.

Los énfasis conceptuales hallados en los Estudios Críticos de Datos muestran que poco se ha explorado alrededor de procesos de datificación de violaciones graves a los derechos humanos en contextos latinoamericanos, ni acerca de las implicaciones políticas y sociales de la disputa por el sentido de estos procesos. Tampoco hay trabajos que aborden en particular los valores categóricos presentes en estos registros, es decir los testimonios o las descripciones de los hechos, antes bien, los análisis de estos archivos suelen enfocarse en métodos cuantitativos y poner el centro de atención en los valores numéricos para el análisis de los registros. Esto evidencia la necesidad de ampliar la discusión acerca de procesos de datificación de la violencia en contextos latinoamericanos desde anclajes conceptuales críticos y referentes metodológicos mixtos y cualitativos.

La revisión de la literatura alrededor de problematizaciones de mecanismos de procesamiento y visualización de datos desde miradas provenientes de las ciencias sociales y las humanidades muestra que hay una conversación abierta acerca de las exploraciones conceptuales y metodológicas que se pueden hacer desde investigaciones cualitativas que utilicen herramientas de procesamiento y visualización de datos concebidas desde marcos epistemológicos cuantitativos. La emergencia de referentes como los métodos digitales y la incursión de herramientas etnográficas para el análisis denso de conjuntos de datos suman a la conversación acerca de las posibilidades de construir abordajes cualitativos de registros de datos tabulares. Estas exploraciones invitan al diseño de visualizaciones que no pretendan seguir pautas de mímesis del significado numérico de los datos, sino que busquen interpretaciones abiertas, nuevas interrogantes y conocimiento parcial desde los datos, para una necesaria interrupción de las inercias que suelen reafirmar sesgos interpretativos en muchas ocasiones provenientes de marcos interpretativos numéricos. En consecuencia, el desarrollo de conceptualizaciones críticas de registros digitales de violaciones graves a los derechos humanos, así como el diseño e implementación de mecanismos de procesamiento y visualización de datos a partir de una mirada centrada en valores cualitativos, pueden contribuir a los afanes exploratorios y al desarrollo conceptual y metodológico abierto por esta conversación interdisciplinaria.

Los mecanismos de procesamiento de datos más utilizados están anclados a procedimientos estadísticos de gestión y "limpieza" de los datos, que buscan ordenar la información a partir de la identificación, segmentación y análisis de porciones representativas de una muestra o de un universo de datos. Estos procedimientos llevan a cabo afirmaciones analíticas que llegan a ser incuestionables debido a la legitimidad científica y política del razonamiento estadístico, cuya cualidad de transformación de cualquier fenómeno a objeto medible tiene implicaciones ontológicas de exclusión o reducción de la importancia de los aspectos no medibles del fenómeno y ha sido adoptada por default en la comunidad de análisis de datos. Esta misma inercia invisibiliza una capa semiótica-retórica del pensamiento estadístico que sostiene sus afirmaciones a partir de sustituir al todo (medible y no medible) por la parte medible. Estas cualidades no descalifican la utilidad ni la eficacia de dichos mecanismos de gestión y limpieza de datos, sino que ayudan a situar epistemológica y políticamente al razonamiento estadístico, en particular cuando se está frente a registros de experiencias como violaciones graves a los derechos humanos, cuya naturaleza es precisamente su condición de inconmensurabilidad. Situar los límites epistemológicos y políticos del tratamiento estadístico de datos con este tipo de registros abre la posibilidad de explorarlos sin mantener el foco de atención en los aspectos medibles de estos conjuntos de datos, o tomando la dimensión medible como un punto de acceso pero no como el objetivo del análisis.

México y Colombia comparten la condición de ser atravesados por conflictos que han dejado a ambos países en una crisis de violaciones graves a los derechos humanos en las últimas décadas. El peso político de la disputa por el significado público de los procesos de datificación de estas violencias es definitorio para el presente y el futuro de estas sociedades, por ello es pertinente contribuir a esta disputa desde el desarrollo de abordajes críticos de estos registros, que sumen a la construcción de memoria histórica desde el foco en los testimonios y narraciones de experiencias de víctimas y sobrevivientes, y no desde la cuantificación de sus experiencias.

Finalmente, desde sus aproximaciones a la etnografía de las infraestructuras, Susan Leigh Star puso en evidencia que la producción de conocimiento científico es posible a partir de conceptos que funcionan como el piso sobre el cual un aparato epistemológico opera. Estos conceptos funcionan como andamiajes y como puntos de contacto para mantener el flujo del conocimiento. A estos conceptos la autora los nombró "infraestructuras simbólicas" (Star, 2002). El acercamiento crítico a estas infraestructuras permite evidenciar las afirmaciones y las exclusiones que ejerce una disciplina o campo, también permite trabajar en la construcción de caminos alternativos que no necesariamente buscan ir en contra del conocimiento sostenido por estas infraestructuras y legitimado por su efectividad como herramientas de producción de conocimiento, sino producir nuevas preguntas y nuevas maneras de abordarlas fuera del alcance de las infraestructuras vigentes. Pensar en una propuesta de datificación crítica de la violencia implica abrir las infraestructuras simbólicas alrededor de la conceptualización, procesamiento, visualización y análisis de datos con registros de experiencias inconmensurables.

Problema de investigación

En un contexto de emergencia y consolidación de campos de estudio crítico de procesos de datificación de la realidad y de exploración y problematización de mecanismos de procesamiento y visualización de datos desde miradas provenientes de las ciencias sociales y las humanidades, los conjuntos de datos con registros de violaciones graves a los derechos humanos suelen ser procesados y visualizados desde perspectivas cuantitativas centradas en el análisis de valores cuantitativos dentro de dichos conjuntos de datos. Sin embargo, estos datos registran experiencias caracterizadas por su condición de inconmensurabilidad. Es posible llevar a cabo una conceptualización critica de estos registros que contemple dicha condición, y que a su vez lleve a diseñar e implementar mecanismos de procesamiento y visualización de datos consecuentes con planteamientos críticos alrededor de la datificación, cuyos mecanismos sean abordados desde un tipo de análisis centrado en los valores cualitativos presentes en estos conjuntos de datos.

Preguntas de investigación y objetivos

Pregunta general

  • V1. ¿Cuáles serían las características de una conceptualización crítica acerca de conjuntos de datos con registros de violaciones graves a los ddhh en Colombia y en México, que lleve al diseño e implementación de mecanismos de procesamiento y visualización de datos cuyos productos sean abordados desde un tipo de análisis centrado en los valores categóricos de dichos registros?

  • V2. ¿Cuáles serían las características de una conceptualización crítica acerca de conjuntos de datos con registros de violaciones graves a los ddhh en Colombia y en México, que lleve al diseño e implementación de mecanismos de procesamiento y visualización de datos abordables desde un tipo de análisis centrado en los valores categóricos de dichos registros?

Objetivo general

  • V1. Desarrollar una conceptualización crítica de un conjunto de registros digitales de violaciones graves a los derechos humanos en Colombia y en México, que permita diseñar e implementar mecanismos de procesamiento y visualización de datos, cuyos productos conduzcan a un análisis que no busque medir la experiencia capturada en estos registros sino producir interpretaciones abiertas centradas en el abordaje de valores categóricos dentro de estos conjuntos de datos.

  • V2. Desarrollar una conceptualización crítica de un conjunto de registros digitales de violaciones graves a los derechos humanos en Colombia y en México, que permita diseñar e implementar mecanismos de procesamiento y visualización de datos, cuyo análisis no busque medir la experiencia capturada en estos registros sino producir interpretaciones abiertas centradas en el abordaje de valores categóricos dentro de estos conjuntos de datos.

Objetivos específicos

  • Generar mecanismos de procesamiento de datos que no requieran de una infraestructura institucional ni de un saber especializado en programación para poder ser llevados a cabo.

  • Generar protocolos de catalogación, etiquetamiento y delimitación de los datos utilizados, mediante fichas de datos que sean elementos primordiales de los mecanismos de procesamiento crítico de los datos.

  • Problematizar y proponer elementos para un tratamiento colectivo de los datos, que parta del diálogo y el cuidado entre las comunidades datificadoras.

Referentes conceptuales. Andamiajes para una datificación crítica de la violencia

A partir de la revisión de la literatura, de la enunciación del problema y de la definición de la pregunta y de los objetivos de investigación, este apartado condensa ejes conceptuales provenientes de la semiótica, de los estudios de violencia y memoria, del estudio de experiencias traumáticas, de la archivística y de la estética forense, desde los cuales se abordarán teóricamente los procesos de datificación crítica de la violencia 1.

Dimensiones semióticas del dato que registra violencia

Peirce desarrolló una categorización del signo que no únicamente toma en cuenta los aspectos simbólicos o de significado y significante que utilizó Saussure para su definición. Para Peirce hay íconos, índices y símbolos (Peirce, 1992). Actualmente, los estudios acerca de la semiótica más allá de lo simbólico complejizan el panorama de lo que entendemos por significación en muchos aspectos de la realidad. Chudy y Müller (2024) parten de un sesgo claro: "la capa semiótica se suele confundir con la capa simbólica", lo cual permite abordar los modos en que, por ejemplo, los estudios de medios han hecho históricamente a un lado a los signos no simbólicos que la materialidad de los medios producen. Esta especie de ceguera semiótica ha considerado a estos signos no como tales sino como "ruido", como "señales" o como "problemas de ingenieros", lo cual ha tenido serias implicaciones para entender el papel de los medios como productores semióticos y no sólo como soportes y transmisores en el proceso de semiosis. El foco de atención en valores categóricos dentro de registros de violaciones a los derechos humanos (testimonios y narraciones de sobrevivientes, descripciones oficiales de los hechos) requiere de un acercamiento semiótico capaz de abordar signos no simbólicos presentes en este tipo de archivos, así como tomar a los mecanismos de procesamiento y visualización de datos como productores y no sólo como portadores de sentido.

Para entender como signos no necesariamente simbólicos a los datos que registran la violencia, los estudios acerca del trauma social y de la violencia en conflictos de gran envergadura han puesto de relieve la naturaleza "inconceptualizable" de este tipo de experiencias. María del Rosario Acosta se refiere a cómo el trauma provoca un impasse cognitivo que impide que el sujeto la asimile, por lo que, a nivel mental, el trauma "permanece desconocido... en nuestro lenguaje" y "no apunta a nada más que a la incapacidad de la mente de procesar el accidente como evento, como experiencia" (Acosta López, 2017, pág. 89). En esta misma línea, Shoshana Felman (2017), leyendo a Benjamin, recupera el modo en que los soldados que volvieron de la primera guerra mundial perdieron "la capacidad de simbolizar", es decir, de contar lo que les había ocurrido, lo cual llevó a estudiar de nuevas formas lo que entendemos por silencio, así como las relaciones entre historia, memoria y testimonio. Así, por ejemplo el silencio, signo clave en estos registros, desde la semiótica de Pierce sería un tipo de signo que no requiere de palabras para evocar un significado, pero no una ausencia de significado. Los signos simbólicos pueden colapsar, pero esto no significa que se dejen de producir signos ni que se deje de producir semiosis. María Victoria Uribe y Rodrigo Parrini (2020) hacen referencia a los modos en que los signos simbólicos naufragan cuando se está frente a acciones violentas y a los efectos de estas acciones en contextos como el colombiano y el mexicano. Estos autores hablan de cómo "violencia y significación no coinciden", de escenarios donde "si bien algo se encuentra, no necesariamente se puede nombrar", así como de "discursos fantasmas" y de "sombras". Estas evocaciones invitan a abordar los datos que registran la violencia a partir de un nivel de complejización semiótica desde el cual lo que entendemos por signos y lenguajes en los que se expresa dicha violencia avancen hacia formas de pensar e interpretar la semiosis fuera y más allá de los signos simbólicos.

Norman Fairclough ha indicado que la noción de discurso bien puede pensarse como "semiosis, sugiriendo que al análisis del discurso le conciernen varias 'modalidades semióticas', de las cuales el lenguaje (escrito) es una sola" (Fairclough, 2023). Desde la lingüística y desde los estudios del discurso se han desarrollado perspectivas multifacéticas del discurso para fortalecer esta postura. Gunther Krees ha desarrollado la noción de multimodalidad para referirse a los múltiples "espacios y recursos que entran en el significado -del discurso- de un modo u otro" (Kress et al., 2000). Los módulos son los escenarios, los lenguajes y los canales que despliegan sentido en un discurso. Cada uno de estos módulos (escritos, icónicos, espaciales, de proximidad, etc.) han de ser analizados como elementos que dan cuentan de manera "parcial" del sentido de un discurso, expresamente, "language can no longer be treated as providing a full account of meaning but is seen as only ever providing a partial account". Para Kress, la semiótica social es la teoría que busca analizar la multimodalidad del discurso mediante la identificación de los módulos, de la naturaleza y de las características semióticas de cada uno, así como de las relaciones de poder que rigen los principios de orden mediante los cuales una comunidad produce significados.

Dicho lo anterior, desde una mirada peirceana, cuando la violencia alcanza niveles de brutalidad incomprensible rebasa y desborda la inteligibilidad de los signos y lenguajes simbólicos disponibles. ¿Qué tipo de signos produce la violencia extrema? ¿El hecho de que no produzca un lenguaje racional-logocéntrico hace que lo que produzca sean "señales" o "ruidos" carentes de significado? No, las formas brutales de la violencia no han de ser concebidas como signos simbólicos sino como signos icónicos o indexicales producidos por humanos.

¿Qué despliega, si no es un signo simbólico, la violencia? Cuando se despliega en sus formas más brutales, la violencia se despliega a sí misma de un modo fático y autorreferencial. En esos casos, la violencia despliega poder como significado, no como logos. A este tipo de signos se refiere también Rossana Reguillo cuando dice, acerca de las acciones del narcotráfico en México, que "frente a estas violencias, el lenguaje naufraga, se agota en el mismo acto de tratar de producir una explicación, una razón" (Reguillo, 2011).

Silencio, escucha y experiencia traumática

La violencia traumática, nos dice María del Rosario Acosta, "está también dirigida hacia destruir y controlar los medios para su representación". Esto supone una crítica al hecho de que uno de los filtros de validación de los testimonios de este tipo de violencias para su integración a carpetas de investigación o incluso para su registro oficial, sea que éstos posean una estructura o una gramática organizada de manera "clara" y "entendible", pautas de reconstrucción de la experiencia que precisamente hace estallar la violencia. Por el contrario, señala Acosta, lo común es encontrarse con que estos testimonios están "expresados en sí en silencio" o expresan "no meramente palabras -y su fallo en nombrar adecuadamente las experiencias en cuestión... (sino) también profundos y elocuentes silencios" (Acosta López, 2023).

Para María del Rosario Acosta, la voz afectada por el trauma "es una capaz de producir y también de demandar sus propias gramáticas para poder hacer que algo resulte audible y comunicable". (Acosta López, 2023). La escucha de este tipo de experiencias no consiste únicamente en tener la disposición a escuchar el testimonio de las personas, sino en desarrollar la capacidad de transformar el marco interpretativo o las gramáticas de estas experiencias, pues para la autora, las gramáticas son esos "marcos de arreglo de nuestra percepción y las jerarquías que gobiernan nuestros sentidos".

Frente a este tipo de testimonios es que la autora invita a desarrollar "formas de escucha radical", o lo que llama "gramáticas de lo inaudito", entendido lo inaudito como aquello que aún no es escuchado y como aquello que resulta indignante una vez se hace escuchar. Estas gramáticas abren "a site for listening to what does not ‘make sense’ as meaningful within available and hegemonic frameworks of meaning" (Acosta López, 2023), al tiempo que cuestionan y amplían lo que consideramos como "audible" y significante no sólo en términos semánticos sino, podemos agregar, desde marcos y despliegues semióticos no simbólicos.

Para registrar con atención lo inconceptualizable de la experiencia traumática, podemos acudir al supuesto de la lingüística interactual de que "cuando la gente habla, es incapaz de decir de manera suficientemente explícita todo aquello a lo que se refiere" (Jaspers, 2023). Esta "incompletud" del habla ha permitido desarrollar nociones como la de "conocimiento extracomunicativo" para entender cómo es que a través del contexto es que quien habla y quien escucha establecen relaciones semióticas que hacen el intercambio de significados más eficiente, y al mismo tiempo han contribuido a evidenciar el peso que tiene lo no dicho en una conversación.

Archivo y memoria

Para Diana Taylor (2011) el archivo está conformado por todo el material tangible o “núcleo duradero de registros” relacionados con la violencia ejercida para borrar vidas y memorias de las víctimas; en tanto que el repertorio “almacena y recrea la memoria ‘encarnada’, en resumen, todos los actos que suelen considerarse de conocimiento o “en vivo”, efímero, no reproducible” (Taylor & Fuentes, 2011). Es en las posibilidades de conjugación entre lo tangible y lo no reproducible, entre lo articulable y lo inconceptualizable que los estudios del performance llevan a cabo ejercicios para evidenciar los intersticios en escenarios de relaciones de poder dominantes. ¿De qué preguntas tendría que partir un proceso de datificación que busque integrar lo “no reproducible” del repertorio performático señalado por Taylor? ¿Es posible transmitir la memoria traumática a través de los datos que registran la violencia? ¿Es posible construir un dato que tenga estos fines? ¿Cómo se representaría este dato? ¿Qué intersticios en las relaciones de poder sería posible evidenciar a través de los registros datificados de acontecimientos traumáticos? Podríamos pensar en un tipo de “dato anclado”, que a diferencia del dato crudo (raw data) (Kitchin & Lauriault, 2014) del que parte la datificación dominante, puede asumir como su lugar de enunciación el desafío a las asimetrías en el pronunciamiento sobre una realidad traumática proveniente de violaciones graves a los derechos humanos. Podemos pensar en un dato social o anclado que parta de nombrar lo real desde una versión invisibilizada o invalidada por las autoridades o por una porción de la opinión pública, y en mecanismos de procesamiento y visualización de datos que busquen hacer visibles posicionalidades enunciativas cotidianas y símbolos no simbólicos, usualmente abordados desde instrumentos metodológicos etnográficos y/o sociolingüísticos, e igualmente excluidos de las formas tradicionales de análisis de datos.

Por otro lado, desde la archivística los registros que se toman como neutrales u objetivos corren el riesgo de contribuir a una lectura que petrifique lo registrado o lo encasille como un pasado acabado. Ariella Azoulay señala una “actitud instrumental” en la fotografía como archivo, que opera cuando “iconizamos” la imagen, es decir, cuando la cosa o persona que aparecen en una fotografía sustituye al acto del registro que supone la propia fotografía, de modo que se suprime el acto mismo del registro como lugar y práctica de mediación de la realidad, y al hacerlo, se convierte al registro en transparencia, en neutralidad, en objetividad, esto es, cuando se dota al registro de una suerte de soberanía sobre lo real, mediante la cual llega a sustituir lo que registra. La autora nos recuerda entonces que “la fotografía no documenta un concepto o demarca un evento, sino que es más bien un documento, el producto de un evento común para varios participantes” (Azoulay, 2014). Dicho esto, podemos afirmar que al igual que una fotografía, el dato numérico tiende a ser instrumentalizado y su “acto de registro” suprimido cuando se piensa que éste abarca al sujeto cuya práctica está documentando. Para contrarrestar esta actitud instrumental, Azoulay propone llevar a cabo “protocolos iconoclastas” para “destruir” los íconos producidos por las imágenes y restituirles su cualidad de documentos, es decir para situarlos y delimitarlos en tanto registros llevados a cabo en circunstancias históricas y políticas específicas.

Kitchin y Lauriault (2014), desde los ECD, se concentran en los mecanismos que operan como una suerte de bucle o camino entre instituciones, discursos y prácticas sociales con los que los procesos de datificación de la realidad se van concatenando para reproducirse, volverse referentes de sí mismos y consolidar la lectura de la realidad que datifican. Estos "ensamblajes" producen “motores de descubrimiento”, los cuales operan como un engranaje entre el conteo de información que refuerza la legitimidad de la cuantificación como registro válido de la experiencia, la creación de normas y correlaciones “neutrales” a partir de esta cuantificación, la toma de acciones para “cientifizar” todo el procedimiento y la reafirmación de la jerarquía de los hallazgos y de los métodos de datificación en cada ensamblaje. Este modelo resulta útil para estudios que buscan comprender cómo se construyen y entrelazan sistemas de regulación y normalización de la realidad a partir de sus respectivos ensamblajes de datos, pero también es útil para imaginar posibilidades de ensamblajes que partan de una epistemología alternativa de los datos, es decir que no coloquen en el centro la mirada pragmática y falsamente objetiva de la datificación dominante como eje del discurso de verdad que buscan producir. En este sentido, cabe pensar en ensamblajes que no tengan como objetivo calcular o predecir comportamientos, sino evidenciar, por ejemplo, visiones de un aspecto de la realidad sobre el que otro tipo de ensamblajes de datos amplían o consolidan discursos de exclusión o de perpetuación de un tipo de violencia. Se trata de una posible intervención, o profanación, de los efectos de los ensamblajes de datos y de sus motores que cuestione los alcances del registro, problematice los límites de la cuantificación de la experiencia, evidencie sus exclusiones y des-neutralice el recorte de la realidad histórica y políticamente situado que supone todo proceso de datificación de la experiencia.

Estética forense

Forensic Architecture (FA) ha desarrollado un marco conceptual para pensar y abordar las relaciones entré estética y política en investigaciones interdisciplinarias construidas a partir de archivos de violaciones graves a los derechos humanos. La noción de estética forense propuesta por FA coloca ideas clave para tomar en cuenta en una perspectiva conceptual hacia una datificación crítica de la violencia.

Para FA la noción de estética no se puede reducir ni a lo bello ni a la percepción humana, sino que abarca la condición de "sensor" de cualquier cuerpo o material. Los elementos que componen una ciudad, por ejemplo los edificios, funcionan como sensores de impacto de agentes externos (Forensic Architecture, 2017). Vista desde esta lógica, una maqueta es una "deformación material" producto de los impactos registrados por una construcción que atestiguó un acontecimiento. Siguiendo este supuesto, los conjuntos de datos pueden ser concebidos como "sensores" que registran impactos cuya ruta también puede ser focalizada y trazada críticamente, y no sólo medida. Las visualizaciones de datos centradas en la exploración de aspectos cualitativos y en particular en segmentos narrativos y testimoniales de violaciones graves a los derechos humanos resultan, desde esta mirada, "deformaciones materiales" de estos impactos y pueden ser también susceptibles de ejercicios de búsqueda de "señales débiles", referidas a aquellos aspectos que en su condición de elemento en apariencia no central, evidencian "the threshold of visibility, pushing against the flood of obfuscating messages, of dominant narratives, fabricated noise, and attempts at denial" (Weizman, 2014). Las señales débiles en los datos podrían ser conjuntos de signos no simbólicos (como el silencio), enunciaciones cotidianas (menciones a familiares, lugares, momentos del día) en apariencia irrelevantes debido a su familiaridad, o cadenas sintácticas que lleven a identificar encuadres políticos del discurso de un tipo de actores.

Desde estas nociones es posible anclar una datificación crítica de la violencia que siempre está políticamente situada y que se ubica en contextos de relaciones de poder predominantemente asimétricas. Por ello, parte de las indagaciones que resulten de los mecanismos de procesamiento y visualización de datos desde esta aproximación pueden contribuir a la noción de "foro" descrita por FA, la cual radica en que la curaduría de ciertos contenidos o el montaje de este tipo de investigaciones pensado para espacios ajenos a los tribunales judiciales, tiene como objetivo ampliar los escenarios de discusión pública de la información y de las versiones con las que se cuenta de un acontecimiento. En este caso, el montaje de estos contenidos puede contribuir a colocar el foco de atención en un nuevo tipo de "señales débiles" halladas en los datos, relevantes para fines de construcción de memoria histórica. El foro así entendido remite a un espacio donde la audiencia de la investigación tiene valor no sólo como lectora sino como generadora de conversaciones cargadas políticamente para evidenciar y/o impugnar la asimetría en las relaciones de poder en las que estos acontecimientos han tenido lugar.

En conjunto, estos referentes conceptuales permitirán abordar los valores categóricos presentes en registros de violaciones graves a los derechos humanos, así como contribuir a una mirada crítica sobre dichos registros cuya apuesta no sea la de medir la experiencia capturada en ellos.

1

Un artículo resultado de una porción de este apartado está por ser publicado en la revista Signo y Pensamiento, bajo el título: Dimensiones semióticas y políticas del dato. Ruta conceptual y construcción de objetos para una datificación testimonial de la violencia.

Propuesta metodológica. Anclajes metodológicos para una datificación crítica de la violencia

En conexión con la pregunta de investigación, los elementos del marco conceptual y la revisión de la literatura, esta investigación estará basada en métodos mixtos, utilizará herramientas de lingüística de corpus (anclada a una perspectiva cuantitativa del análisis de contenido), métodos biográficos y análisis de la conversación, análisis de redes (anclado a una perspectiva cuantitativa de la ciencia de redes) y análisis crítico del discurso, para ampliar las prácticas de procesamiento, visualización y análisis de conjuntos de datos que contienen registros de violaciones graves a los derechos humanos 1. Si bien se han elegido recursos metodológicos provenientes de aproximaciones cualitativas y cuantitativas, en tanto el foco de análisis está en los valores categóricos de estos registros, la utilización de métodos cuantitativos contribuirá a segmentar y elaborar descripciones particulares del corpus, pero no será el elemento central en el abordaje de los archivos para este estudio. Asimismo, los instrumentos de descarga, procesamiento y visualización de datos han sido seleccionados y diseñados en conexión estrecha con los apartados previos de esta propuesta.

Lingüística de corpus y análisis crítico del discurso

La lingüística de corpus se refiere a una aproximación "al estudio del lenguaje que incluye recolectar grandes cantidades de lenguaje ocurrido de manera natural y la utilización de software especializado que manipula ese lenguaje para obtener información acerca de frecuencias, co-ocurrencias y significado” (Hunston, 2022). Este campo ha desarrollado un amplio repertorio de conceptos y fórmulas para medir frecuencias, identificar y comparar estructuras sintácticas, así como para categorizar usos y orientaciones semánticas en corpus que pueden contener desde algunos cientos hasta millones de palabras.

El desarrollo de herramientas desde la lingüística de corpus ha ido de la mano de preguntas y reflexiones alrededor de las mutaciones en la presentación del propio corpus de estudio en la medida en que tanto los soportes digitales como las herramientas para gestionarlos han desbordado la linealidad de la escritura tradicional. Al respecto, Mayaffre y Poudat (2020) se refieren a formas de lectura "reticulares", "tabulares" e "hipertextuales” mediante procesadores tabulares, hipervínculos de páginas web o incluso visualizaciones de tipo red. Desde está área se han desarrollado conceptos para identificar encuadres políticos en "plantillas" (Longhi, 2021) que identifican aspectos relevantes de un corpus y sirven de puentes entre el análisis de contenido y el análisis crítico del discurso.

El análisis crítico del discurso permite identificar y cuestionar hasta qué punto y en qué situaciones "las estructuras de dominancia están legitimadas por las ideologías de grupos poderosos" (Wodak & Meyer, 2003), así como los procesos de negociación y resistencia que se presentan por parte de distintos actores sociales frente a estas asimetrías en las relaciones de poder ejercidas y sostenidas desde el uso de distintos lenguajes.

Sociolingüística y análisis de la conversación

La sociolingüística y el análisis de la conversación han abordado los elementos no escritos y no verbales que también están cargados de significado en las interacciones cara a cara y en las conversaciones (Clayman & Teas Gill, 2023; Jaspers, 2023). Estos elementos habilitan canales semióticos que desbordan la semántica y la sintaxis. Ambas áreas han producido conceptos y métodos para abordar la semiosis más allá de las palabras.

El análisis de la conversación ha reparado en los "malentendidos" en las interacciones cara a cara, para aproximarse a "la relación entre comportamientos vocales y no vocales" (Clayman & Teas Gill, 2023). Estos malentendidos han sido analizados a la par de aspectos no vocales para construir categorías como "tokens de reconocimiento" y "comunicación por canales de apoyo", para señalar la presencia y el sentido de sonidos, silencios y gestos que no sólo acompañan sino que son en sí la enunciación en un turno de la conversación entre hablantes. Estos elementos semióticos no cumplen con una función interactual secundaria a la oral, sino con una función discursiva desde signos no simbólicos.

La sociolingüística interactual ha señalado que tanto el contexto como lo no dicho en interacciones entre las personas habilitan canales de "significados indexicales", que a su vez portan signos considerados como "pistas de contextualización", que "conducen" el hilo de la interpretación de las palabras (Jaspers, 2023). Con esto se han desarrollado métodos de transcripción de signos no simbólicos que incluyen las constantes modulaciones orales que las personas llevan a cabo en su habla cotidiana (silencios, interrupciones, alargamiento en la pronunciación de sílabas, etc.) (Du Bois et al., 1993). Estas herramientas permiten identificar y categorizar enunciaciones con estas características en los registros seleccionados.

Métodos biográficos y análisis de redes

Los métodos narrativos identifican eventos bisagra y epifanías (o turning points ) como aquellos que marcan "un antes y un después" en una narración y como "momentos críticos" en un relato (Mallimaci & Giménez Béliveau, 2006), así como la pregunta ¿por qué esto ocurre aquí?, como elementos preponderantes en los estudios narrativos. Estas nociones resultan útiles cuando se llevan a cabo indagaciones sintácticas y semánticas para identificar, categorizar y analizar extractos discursivos específicos.

El análisis de redes aborda elementos entendidos como lugares de conexión (nodos) a partir de las relaciones (aristas) que establecen con otras instancias. Para esta investigación, los entes relacionales serán las propias palabras y cadenas sintácticas que componen los testimonios y registros seleccionados. El procesamiento de datos diseñado e implementado para esta investigación permitirá generar archivos tabulares compatibles con software para la visualización y análisis de redes generadas a partir de estos archivos. El foco en las relaciones entre los nodos y no en sus atributos individuales permitirá observar la acumulación y la distribución de poder en una red de interacciones, así como analizar las cualidades y el peso de estas relaciones (Hanneman & Riddle, 2005). Las visualizaciones obtenidas también serán consideradas elementos con carga semiótica propia y no sólo portadores de la semántica de las palabras que las componen.

Descripción general. Selección y recolección del corpus

Los archivos consultados para esta investigación provendrán de comisiones de la verdad, ONG´s y medios de comunicación. La selección de estos archivos dependerá de su disponibilidad en versiones nativas de forma digital, de su accesibilidad pública y de que contengan material testimonial de víctimas y/o sobrevivientes de los conflictos en cada país o descripciones de hechos violentos. El archivo de casos colombianos está compuesto hasta ahora por un testimonio de Luz Marina Bernal (CHARLAS 914, 2024), madre de Leonardo, joven falsamente presentado por las fuerzas armadas colombianas como muerto en combate, por el Volumen testimonial del informe final de la Comisión de la verdad en Colombia (2022a), y por un conjunto de datos aún por determinar. El archivo de casos mexicanos está compuesto hasta ahora por la descripción de los hechos en la base de datos del proyecto Con Copia Oculta (DATACÍVICA & INTERSECTA, 2023) y por dos conjuntos de datos aún por determinar.

Herramientas de obtención y sistematización de datos

Los registros serán descargados del repositorio público al que cada uno pertenezca y procesados, segmentados y visualizados utilizando una o varias de las siguientes herramientas:

  • Whisper
  • Antconc
  • Google colab
  • Libre Office
  • Open Refine
  • Gephi
  • Tableau public

En conjunto, estos métodos y herramientas serán útiles para diseñar e implementar mecanismos de procesamiento y visualización de datos que lleven al tipo de análisis definido en la pregunta y los objetivos de esta propuesta, pues permiten sistematizar, segmentar y hacer exploraciones a modo para los distintos conjuntos de datos y registros que componen el corpus seleccionado; también corresponden con apuestas significativas a nivel doctoral y coinciden con una configuración de un campo novedoso de investigación.

1

Un artículo resultado de una porción de este apartado actualmente está en proceso de dictaminación en una revista de la Universidad Nacional de Colombia.

Índice temático

Resumen de la propuesta

Estado del arte. Aproximaciones críticas a la realidad datificada

  • Estudios Críticos de Datos
    • Énfasis conceptuales en los estudios críticos de datos
    • datificación dominante
  • Visualización y representación crítica de datos
    • Referentes interdisciplinarios: Graficacidades, Epistemología visual. Humanistic data research
    • Métodos digitales y encuadres etnográficos para el análisis de datos
  • Los default del tratamiento estadístico de los datos (disputar los indisputable)
    • Limpieza y normalización de datos
    • Cualidades del razonamiento estadístico
  • Medir lo inconmensurable
    • Registros de violaciones a los derechos humanos y los límites de lo numérico
    • Exploración metodológica para la construcción de memoria histórica
  • El peso político de la datificación de la violencia en Colombia y en México
    • Contextos de crisis de violaciones graves a los ddhh
      • Registros de la violencia
      • Comisiones de la verdad, ONG's, medios alternativos
  • La disputa por el sentido público de los registros de la violencia
    • la experiencia de víctimas y sobrevivientes de la violencia
    • el pasado y el presente de los conflictos
    • las posibilidades de construcción de memoria histórica desde el trauma social
    • identidad nacional, legitimidad institucional y sociedades democráticas

Planteamiento del problema

  • Abrir las infraestructuras de la datificación
    • datificación en contextos latinoamericanos
    • sumar a una conversación y experimentación interdisciplinaria
    • situar epistemológica y políticamente al razanamiento estadístico
    • abordar lo inconmensurable desde aproximaciones centradas en los valores categóricos de los registros
    • contribuir con abordajes críticos a la construcción de memoria histórica en contextos de crisis de violaciones graves a los derechos humanos
  • Problema de investigación
    • pregunta
    • objetivos

Referentes conceptuales. Andamiajes para una datificación crítica de la violencia

  • Dimensiones semióticas -no simbólicas- del dato que registra violencia
    • Semiótica no simbólica
    • El dato y sus registros más allá de lo simbólico
    • Semiótica multimodal
    • La violencia como signo
  • Silencio, escucha y experiencia traumática.
    • gramáticas de lo inaudito
    • escucha radical
    • testimonio, violencia y memoria
  • Archivo y memoria
    • Archivo y repertorio en los estudios de performance
    • Iconización del registro y mal de archivo
    • ensamblajes de datos y máquinas de profanación
  • Estética forense
    • Estética y percepción
    • Sensores de impacto y deformaciones materiales
    • Señales débiles, foro y montaje

Propuesta metodológica. Anclajes metodológicos para una datificación crítica de la violencia

  • Descripción general. Selección y recolección de corpora
    • métodos mixtos
  • Descripción de archivos
    • Colombia
    • México
  • Herramientas de obtención y sistematización de datos. Datificación de textos digitales
  • Lingüística de corpus, análisis de contenido y análisis crítico del discurso
  • Sociolingüística y análisis de la conversación
  • Métodos biográficos y análisis de redes

Diagrama del índice

indicediagrama

Consideraciones éticas y cómo abordarlas

Acceso a la información y normas institucionales

Los datos obtenidos mediante la API de YouTube se rigen por los términos de uso que establece la plataforma, en los cuales se señala la responsabilidad del usuario en tanto este "... maintain reasonable and appropriate administrative, organizational, technical and physical controls designed to ensure the privacy, security, and confidentiality of YouTube data" (YouTube API, s/f).

En cuanto a la información obtenida del informe final de la Comisión de la verdad de Colombia, esta investigación contempla que sea "acompañado del reconocimiento de la Comisión de la Verdad como fuente, citando la URL de dicho contenido y del autor original" (Comisión de la Verdad de Colombia, 2022c). La licencia de uso libre utilizada por la Comisión es la Creative Commons Atribución-No Comercial-Compartir Igual 4.0, la cual permite lo siguiente:

  • “Compartir — copiar y redistribuir el material en cualquier medio o formato
  • Adaptar — remezclar, transformar y construir a partir del material
  • Atribución — Usted debe dar crédito de manera adecuada, brindar un enlace a la licencia, e indicar si se han realizado cambios. Puede hacerlo en cualquier forma razonable, pero no de forma tal que sugiera que usted o su uso tienen el apoyo de la licenciante.
  • No Comercial — Usted no puede hacer uso del material con propósitos comerciales.
  • Compartir Igual — Si remezcla, transforma o crea a partir del material, debe distribuir su contribución bajo la la misma licencia del original.” (creative commons, s/f)

En cuanto a la base de datos del proyecto Con Copia Oculta, el sitio oficial 1 da cuenta del método de obtención y anonimización de datos personales de la documentación original para evitar formas de revictimización o perfilamiento de sujetos, y de las solicitudes de acceso a la información que acompañaron el cotejo de los datos obtenidos.

En el momento en el que los datasets generados y procesados para esta investigación estén en su estado final serán debidamente subidos al repositorio REDCap institucional de la Pontificia Universidad Javeriana 2.

Los datasets que complementen esta investigación seguirán las normas institucionales y los términos de uso correspondientes.

Posicionamiento ético y político

Esta investigación contempla una reflexión constante acerca de las implicaciones políticas de su análisis y de las afirmaciones que provengan de éste. La no revictimización, esto es, la no reafirmación del lugar de sufrimiento y de la falta de agencia de víctimas y sobrevivientes de los casos registrados en la documentación seleccionada es un punto de referencia constante. El lugar de enunciación de esta investigación busca, en cambio, la reivindicación de la memoria colectiva, de la experiencia de sobrevivientes y víctimas y de los lugares cotidianos, entendidos como espacios clave de subjetivación gravemente afectados por la violencia, pero nunca anulados.

Para esta investigación el lugar de la academia es uno histórica y políticamente situado, capaz de brindar elementos analíticos válidos que sirvan para evidenciar, desnaturalizar e impugnar las asimetrías y las formas de dominación en las relaciones de poder en los escenarios que aborda. Los resultados de esta investigación buscarán ser útiles para la conversación pública informada, como insumo académicamente riguroso para la investigación y para distintas instituciones públicas y privadas, y como fuente de recursos para un tipo de memoria histórica alimentada desde los testimonios de quienes han padecido y sobrevivido a la violencia.

Cronograma

  • Junio de 2025. Examen de candidatura.
  • Enero de 2026. Entrega de análisis de corpus de ambos países y profundización de la propuesta teórico-metodológica.
  • Junio de 2026. Estancia de investigación.
  • Diciembre de 2026. Entrega del primer borrador de tesis.
  • Junio 2027. Defensa de tesis.

Referencias

  • Acosta López, M. del R. (2023). Grammars of Listening: Or On the Difficulty of Rendering Trauma Audible. Royal Institute of Philosophy Supplement, 93, 153–170. https://doi.org/10.1017/S1358246123000048
  • Acosta López, M. del R. (2017). Hacia una gramática del silencio: Benjamin y Felman. En Los silencios de la guerra (C. de Gamboa & M. V. Uribe, Eds.; Primera edición). Editorial Universidad del Rosario.
  • Alexander, J. C. (2016). Trauma cultural, moralidad y solidaridad La construcción social del Holocausto y otros asesinatos en masa1. Revista Mexicana de Ciencias Políticas y Sociales, 61(228), 191–210. https://doi.org/10.1016/S0185-1918(16)30045-9
  • Alfonso-Camelo, H., & Chaparro Moreno, L. (2024). Patrones de violencia y de macrocriminalidad: Una categoría en disputa en la justicia transicional colombiana. Análisis Político, 108, 28–54.
  • Ardévol, E. (2017). Big data y descripción densa. Virtualis, 7.
  • Azoulay, A. (2014). Historia potencial y otros ensayos. CONACULTA.
  • Barreneche, C. (2019). Data Corruption: The Institutional Cultures of Data Collection and the Case of a Crime-Mapping System in Latin America. Canadian Journal of Communication, 44(3), 343–350. https://doi.org/10.22230/cjc.2019v44n3a3481
  • Barreneche, C., Lombana Bermúdez, A., & Ramos Martín, J. (2021). Datificación en contextos de corrupción: Imaginarios sociotécnicos y prácticas de resistencia frente a sistemas antipobreza en Colombia. Palabra Clave, 24(3), 1–39. https://doi.org/10.5294/pacla.2021.24.3.4
  • Boyd, D., & Crawford, K. (2012). CRITICAL QUESTIONS FOR BIG DATA: Provocations for a cultural, technological, and scholarly phenomenon. Information, Communication & Society, 15(5), 662–679. https://doi.org/10.1080/1369118X.2012.678878
  • Cairo, A. (2019). How Charts Lie. W. W. Norton & Company, Incorporated.
  • CHARLAS 914. (2024). Luz Marina Bernal: Madre de Soacha que se convirtió en memoria de los Falsos Positivos [Tercer Canal]. https://www.youtube.com/watch?v=mObDZzNpHSA
  • Chudý, T., & Müller, R. (2024). Intermediality, Semiotics, and Media Theory. En J. Bruhn, A. L.-V. Azcárate, & M. De Paiva Vieira (Eds.), The Palgrave Handbook of Intermediality (pp. 253–284). Springer International Publishing. https://doi.org/10.1007/978-3-031-28322-2_18
  • Clayman, S. E., & Teas Gill, V. (2023). Conversation analysis. In The Routledge handbook of discourse analysis (M. Handford & J. P. Gee, Eds.; Second edition). Routledge, Taylor & Francis Group. https://doi.org/10.4324/9781003035244
  • Comisión de la Verdad de Colombia. (2022a). Cuando los pájaros no cantaban. Historias del conflicto armado en Colombia. Volumen testimonial.
  • Comisión de la Verdad de Colombia. (2022b). Hasta la guerra tiene límites: Violaciones de los derechos humanos, infracciones al derecho internacional humanitario y responsabilidades colectivas (Primera edición). Comisión de la Verdad.
  • Comisión de la Verdad de Colombia. (2022c). Legado. Comisión de la verdad. https://www.comisiondelaverdad.co/terminos-y-condiciones-para-el-acceso-y-uso-de-los-contenidos-de-la-plataforma-digital-del-informe
  • creative commons. (s/f). Deed—Atribución/Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional—Creative Commons. Recuperado el 25 de abril de 2025, de https://creativecommons.org/licenses/by-nc-sa/4.0/deed.es
  • Dalton, C. M., & Stallmann, T. (2018). Counter‐mapping data science. Canadian Geographies / Géographies Canadiennes, 62(1), 93–101. https://doi.org/10.1111/cag.12398
  • DATACÍVICA, & INTERSECTA. (2023). Con Copia Oculta. La guerra que cuenta la SEDENA [Dataset]. https://concopiaoculta.org/la-bitacora-de-la-guerra/base-de-datos
  • Desrosières, A. (2011). The politics of large numbers: A history of statistical reasoning (C. Naish, Trad.; Digital repr. 2011). Harvard University Press.
  • Drucker, J. (2020). Visualization and interpretation: Humanistic approaches to display. The MIT Press. -Du Bois, J., Schuetze-Coburn, S., Cumming, S., & Paolino, D. (1993). Outline of Discourse Transcription. In Talking data: Transcription and coding in discourse research (J. A. Edwards & M. D. Lampert, Eds.). Lawrence Erlbaum Associates.
  • Ettlinger, N. (2018). Algorithmic affordances for productive resistance. Big Data & Society, 5(1), 205395171877139. https://doi.org/10.1177/2053951718771399
  • Fairclough, N. (2023). Critical discourse analysis, in The Routledge handbook of discourse analysis (M. Handford & J. P. Gee, Eds.; Second edition). Routledge.
  • Felman, S. (2017). El silencio de Benjamin. En Los silencios de la guerra (C. de Gamboa & M. V. Uribe, Eds.; Primera edición). Editorial Universidad del Rosario.
  • Forensic Architecture (with Universidad Nacional Autónoma de México & Museu d’Art Contemporani de Barcelona). (2017). Forensic Architecture: Hacia una estética investigativa (C. Plasencia, E. Álvarez Romero, & F. Barenblit, Eds.; Primera edición). MACBA, Museu d’Art Contemporani de Barcelona.
  • Gray, J., Gerlitz, C., & Bounegru, L. (2018). Data infrastructure literacy. Big Data & Society, 5(2), 205395171878631. https://doi.org/10.1177/2053951718786316
  • Hanneman, R., & Riddle, M. (2005). Introduction to social network methods.
  • Hepp, A., Jarke, J., & Kramp, L. (2022). “New Perspectives in Critical Data Studies: The Ambivalences of Data Power. Palgrave Macmillan.
  • Hunston, S. (2022). Corpora in Applied Linguistics (2a ed.). Cambridge University Press. https://doi.org/10.1017/9781108616218
  • INEGI. (2025). Defunciones por homicidios. https://www.inegi.org.mx/sistemas/olap/proyectos/bd/continuas/mortalidad/defuncioneshom.asp?s=est
  • Jaspers, J. (2023). Interactional sociolinguistics and discourse analysis. In The Routledge handbook of discourse analysis (M. Handford & J. P. Gee, Eds.; Second edition). Routledge.
  • Kitchin, R. (2022). The data revolution: A critical analysis of big data, open data & data infrastructures (Second edition). Sage Publications.
  • Kitchin, R., & Lauriault, T. P. (2014). Towards critical data studies: Charting and unpacking data assemblages and their work. The Programmable City Working Paper 2.
  • Kress, G., Leite-García, R., & van Leeuwen, T. (2000). Semiótica discursiva. En El discurso como estructura y proceso (T. A. van Dijk, Ed.). Gedisa Editorial.
  • Longhi, J. (2021). Mapping information and identifying disinformation based on digital humanities methods: From accuracy to plasticity. Digital Scholarship in the Humanities, 36(4), 980–998. https://doi.org/10.1093/llc/fqab005
  • Mallimaci, F., & Giménez Béliveau, V. (2006). Historia de vida y métodos biográficos. Estrategias de investigación cualitativa (I. Vasilachis de Gialdino, Ed.; 1. ed). Gedisa Ed.
  • Masson, E. (2017). “Humanistic Data Research” en The datafied society: Studying culture through data. (M. T. Schäfer & K. Van Es, Eds.). Amsterdam University Press.
  • Mayaffre, D., & Poudat, C. (2020). “Quantitative approaches to political discourse: Corpus linguistics and text statistics” in Speaking of Europe. Approaches to complexity in European political discourse (K. Flottum, Ed.). John Benjamins Publishing Company.
  • Mejias, U. A., & Couldry, N. (2019). Datafication. Internet Policy Review, 8(4). https://doi.org/10.14763/2019.4.1428
  • Merry, S. E. (2016). The seductions of quantification: Measuring human rights, gender violence, and sex trafficking. The University of Chicago Press.
  • Milan, S., & Treré, E. (2019). Big Data from the South(s): Beyond Data Universalism. Television & New Media, 20(4), 319–335. https://doi.org/10.1177/1527476419837739
  • Peirce, C. S. (1992). The essential Peirce: Selected philosophical writings. Indiana University Press.
  • Ramos-Martín, J. (2022). Capitalismo informacional desde el Sur. Fetichismo de la información y materialidades de la colonialidad de los datos. Revista Latinoamericana Estudios de la Paz y el Conflicto, 3(6), 58–68. https://doi.org/10.5377/rlpc.v3i6.14051
  • Reguillo, R. (2011). La narcomáquina y el trabajo de la violencia: Apuntes para su decodificación. Hemispheric Institute, Dossier. https://hemisphericinstitute.org/es/emisferica-82/reguillo5.html
  • Ricaurte, P. (2019). Data Epistemologies, The Coloniality of Power, and Resistance. Television & New Media, 20(4), 350–365. https://doi.org/10.1177/1527476419831640
  • Rieder, B. (2015). YouTube Data Tools (Versión 1.42) [Software]. https://ytdt.digitalmethods.net
  • Rodríguez Cano, C. A. (2022). Hypermethods. Repertories of social research in digital environments (PRIMERA EDICIÓN). UNIVERSIDAD AUTÓNOMA METROPOLITANA. https://doi.org/10.24275/9786072824812
  • Rogers, R. (2017). “Foundations of Digital Methods. Query Design” en The datafied society: Studying culture through data. (M. T. Schäfer & K. Van Es, Eds.). Amsterdam University Press.
  • Rogers, R. (2023). Métodos digitales. ITESO.
  • Rouvroy, A., & Berns, T. (2018). Gubernamentalidad algorítmica y perspectivas de emancipación: ¿lo dispar como condición de individuación mediante la relación? http://repositorio.flacsoandes.edu.ec/handle/10469/15424
  • Selwyn, N. (2020). Re-imagining ‘Learning Analytics’ … a case for starting again? The Internet and Higher Education, 46, 100745. https://doi.org/10.1016/j.iheduc.2020.100745
  • Star, S. L. (2002). Infrastructure and ethnographic practice: Working on the fringes. 14.
  • Taylor, D., & Fuentes, M. (Eds.). (2011). Estudios avanzados de performance. Fondo de Cultura Económica. https://www.icmujeres.gob.mx/wp-content/uploads/2020/05/Performance_Butler.pdf
  • Thatcher, J., O’Sullivan, D., & Mahmoudi, D. (2016). Data colonialism through accumulation by dispossession: New metaphors for daily data. Environment and Planning D: Society and Space, 34(6), 990–1006. https://doi.org/10.1177/0263775816633195
  • Uribe, M. V., & Parrini, R. (2020). Introducción. Montajes y fantasmas. En La violencia y su sombra. Aproximaciones desde Colombia y México. Universidad del Rosario y Universidad Autónoma Metropolitana.
  • Weizman, E. (2014). Introduction: Forensis. In Forensis: The architecture of public truth (Forensic Architecture (Project), A. Franke, & Haus der Kulturen der Welt, Eds.). Sternberg Press.
  • Wodak, R., & Meyer, M. (2003). Métodos de análisis crítico del discurso (1. Aufl). Gedisa.
  • Yeung, K. (2018). Algorithmic regulation: A critical interrogation. Regulation & Governance, 12(4), 505–523. https://doi.org/10.1111/rego.12158
  • YouTube API. (s/f). YouTube API Services Terms of Service. Google for Developers. Recuperado el 25 de abril de 2025, de https://developers.google.com/youtube/terms/api-services-terms-of-service

Condiciones y puentes para una datificación alternativa

Víctor Hugo Ábrego1

Resumen

Este ensayo aborda las condiciones y posibilidades para el desarrollo de formas de datificación alternativas ancladas al paradigma cualitativo. Desde ese horizonte se articulan aproximaciones y apropiaciones de herramientas de manejo de datos. La emergencia de campos como los estudios críticos de datos y las humanidades digitales invitan a sumar a otros campos y disciplinas a arrojar luz sobre sesgos y puntos ciegos de la captura digital de lo real a partir de su conocimiento acumulado desde lo analógico. Se menciona como uno de los principales riesgos de esta experimentación la generación de dispositivos retóricos visuales que convenzan por fascinación y que sustituyan la argumentación y la interpretación conceptualmente rigurosa en las ciencias sociales. Aparecen referentes de lugares e investigaciones en los cuales estos cruces han sido exitosos. Finalmente, la exploración crítica de este tipo de puentes y apropiaciones se suma a la exploración política de tecnodiversidades.

Palabras clave

datificación, metodología, ciencias sociales, humanidades, cosmotécnica

Abstract

This essay addresses the conditions and possibilities for developing alternative forms of datafication anchored in the qualitative paradigm. From this perspective, it articulates approaches to and appropriations of data management tools. The emergence of fields such as critical data studies and digital humanities invites other fields and disciplines to contribute to shedding light on biases and blind spots in the digital capture of reality, drawing on their accumulated knowledge from the analog register. One of the main risks of this experimentation is mentioned as the generation of visual rhetorical devices that convince through fascination and replace argumentation and conceptually rigorous interpretation in the social sciences. References are presented to places and research where these intersections have been successful. Finally, the critical exploration of these kinds of bridges and appropriations contributes to the political exploration of technodiversities.

Keywords

datafication, methodology, social sciences, humanities, cosmotechnics

1

Profesor del Departamento de Estudios Socioculturales del ITESO. Candidato a doctor en Comunicación, lenguajes e información por la Pontificia Universidad Javeriana

Introducción. Condiciones generales

Las principales herramientas de manejo de datos provienen de marcos epistemológicos cuantitativos. Esta condición ha abierto el debate por las posibilidades de obtención de resultados para investigaciones cualitativas a partir del uso de herramientas y métodos con un diseño y un marco de posibilidades de segmentación y generación de resultados centrados en el procesamiento de valores numéricos (Masson, 2017). Este debate es una invitación al diálogo interdisciplinar y al desarrollo metodológico de investigaciones que desde las ciencias sociales y las humanidades busquen abordar la realidad a partir de aproximaciones a conjuntos de datos.

Aunado a esto, la datificación de la realidad en el imaginario colectivo ha sido secuestrada por empresas y gobiernos, que desde una visión de vigilancia y control, utilitarista y pragmática, no escatiman en exceder sus propias capacidades de abstracción y se empeñan en anunciar una supuesta habilidad de predecir lo que ocurrirá con toda precisión a partir del análisis cuantitativo de registros digitales masivos de la realidad. Este exceso, que José van Dijck ha llamado "dataísmo" (van Dijck, 2014), es el referente incubado para la mayoría de las personas cuando se habla de posibilidades de datificación de la realidad, por ello es pertinente el desarrollo de rutas alternativas para la descarga u obtención, la gestión, la visualización y el análisis de datos desde enfoques cualitativos. Estas rutas alternativas deben agregar la conceptualización de los datos como elemento constitutivo de la datificación, para desnaturalizarlos y evidenciar su condición de registro y no de sustituto de la experiencia, así como para problematizar sus capas epistemológicas y los ineludibles sesgos y efectos políticos de trabajar con datos.

En las últimas décadas la investigación social ha abordado aspectos diversos de lo sociodigital, entre los que destacan las plataformas, las lógicas de aceleración de la realidad, los algoritmos y por supuesto los procesos de datificación. Estas condiciones se han convertido en "moduladores" de los procesos de subjetivación, las relaciones sociales y las formas de construcción del conocimiento (Reguillo, 2023), y también han traído la emergencia de campos como los Estudios críticos de datos y las Humanidades digitales. Los primeros acumulan una batería importante de preguntas y conceptos para problematizar las condiciones en que los datos que registran la vida social son producidos, las disputas e implicaciones políticas de su gestión y las consecuencias que han tenido en el modo de ejercer la toma de decisiones en todos los niveles de la vida social (Kitchin, 2022; Kitchin & Lauriault, 2014); las segundas se han convertido en un campo de experimentación que acumula herramientas para la gestión y exploración de grandes volúmenes de información desde miradas cualitativas, al tiempo que han abonado a problematizar y desarrollar metodologías que van más allá de la apropiación técnica de herramientas de gestión y visualización de datos (Cairo, 2019; Drucker, 2020). A la par de esto, desde distintas disciplinas y campos de las ciencias sociales y las humanidades, como la filosofía, la comunicación, la antropología, la sociología, etc., se discuten y amplían anclajes conceptuales y metodológicos para abordar y problematizar las condiciones de la era digital.

Bajo este panorama, ¿cuáles son las cualidades de las rutas que desde las ciencias sociales y humanidades se han emprendido para la apropiación de métodos y herramientas de manejo de datos provenientes de las ciencias exactas? ¿Cuáles son algunas prospectivas en el corto y mediano plazo para el sostenimiento y avance de estos cruces? ¿Cómo se puede agregar una capa simbólica alternativa a la cuantificación, la vigilancia y el control, como parte constitutiva del desarrollo de conocimiento a partir de estos cruces? Este ensayo busca abrir un diálogo alrededor de estas preguntas, para profundizar en las necesidades y precauciones que supone la generación de estos cruces, urgentes para el desarrollo de aproximaciones metodológicas críticas, que vayan a la par del desarrollo conceptual, alrededor de la cultura digital.

Exploración de rutas y cimientos de una datificación alternativa

La historia para quienes desde las ciencias sociales y las humanidades han intentado crear puentes hacia la apropiación de herramientas de gestión, visualización y análisis de datos es cada vez más conocida. Después de una conferencia, taller, serie de lecturas o por simple curiosidad, se gana el entusiasmo suficiente para aventurarse en el desarrollo de habilidades para integrar un kit de herramientas que permitan aportar a la investigación crítica con datos. Y así inicia el desfile: Open Refine, Libre office, Excel, Power BI, Flourish, Tableau, R, Python, RAWGraphs, Google Colab, Jupyter, Pandas, Matplotlib, entre muchas herramientas disponibles en tutoriales, cursos de analítica de datos, estadística para ciencias sociales, programación para humanistas, periodismo de datos, etc. La variedad de herramientas comienza a ser descifrada y categorizada. Se identifican programas de gestión, programas de visualización, programas que segmentan, calculan y visualizan, paqueterías de procesamiento y postprocesamiento de datos. Hay quienes inician este camino cuando entran a un proyecto interdisciplinario o son ellos mismos quienes convocan a integrantes de distintas facultades o centros de investigación para iniciar uno. Esta ruta suele ir acompañada de preguntas complejas elaboradas por los colegas de ingenierías, física o matemáticas, que llegan a sembrar inseguridad y a desincentivar a los humanistas y cientistas sociales, pues no sólo ponen en duda la utilidad de las herramientas, sino la propia pertinencia del intento de construir estos cruces: ¿Para qué necesitas la herramienta?, ¿ya tienes claro si necesitas R o Python?, ¿no será mejor hacerlo usando SQL?, ¿tus datos son estructurados o no estructurados?, ¿ya has probado con un cuaderno en Jupyter o no lo quieres correr en local?

Para las colegas provenientes de las ciencias exactas, la investigación consiste en resolver problemas, en entregar productos acabados. Para las ciencias sociales y las humanidades, en cambio, es común que el objetivo de un proyecto no sea resolver problemas, sino problematizar hallazgos, afinar las preguntas acerca de un fenómeno social y llegar a conclusiones parciales. Este es uno de los primeros cortocircuitos epistemológicos para construir el cruce entre perspectivas que se requiere para construir los puentes a los que nos referimos. Después de este tipo de experiencias es recurrente que los encuentros entre colegas cuantitativos y cualitativos se conviertan en terreno hostil para ambas partes y no en pocas ocasiones lo que sigue es el desdén o la aceptación tácita de que el fin del proyecto consistirá en la presentación de hallazgos que poco contribuirán a una auténtica cooperación interdisciplinar como la que se imaginaba al inicio.

Otro puente es uno que pocos han logrado cruzar viniendo de las ciencias sociales. El de convertirse en programadores senior y en desarrolladores de herramientas propias, adecuadas a proyectos focalizados en datos y ancladas a perspectivas de corte cualitativo. Estos perfiles híbridos son considerados una rareza aún y tienen un alto valor en los departamentos de ciencias sociales y humanidades, pero también en empresas y gobiernos, cada vez más conscientes de la necesidad de una mirada creativa y crítica para el análisis de datos. Estas personas corren el riesgo de ser menos tomadas en cuenta entre colegas cuantitativos, debido al exceso de consideraciones y preguntas que recorren el diseño y la implementación de sus investigaciones.

A pesar de estos y otros obstáculos, en los últimos años han emergido programas, materias y laboratorios en universidades, que contribuyen a los esfuerzos puestos sobre el abordaje de lo digital desde disciplinas tradicionales y campos emergentes como las ya mencionadas humanidades digitales y estudios críticos de datos. Estas y otras iniciativas no deben separar el desarrollo conceptual proveniente de lo analógico de sus discusiones, por el contrario, deben partir del supuesto de que el conocimiento acumulado en esas áreas permite precisamente poner en evidencia puntos ciegos del análisis de registros masivos y complejizar con capas analógicas y socioculturales el recorte de la realidad que viene de lo digital. Las disciplinas tradicionales de las ciencias sociales y las humanidades así como campos como los estudios de performance, comunicación, archivística, entre otros, a partir de temas y documentos provenientes de los estudios de memoria, violencia o movimientos sociales, por mencionar algunos, están en condiciones de avanzar en el diálogo y la integración de herramientas provenientes de áreas como la lingüística de corpus, el análisis de redes y los métodos digitales, para fomentar abiertamente una discusión inter y transdisciplinar capaz de producir un tipo de investigación social que no agote la construcción de estos puentes metodológicos en la apropiación técnica y la utilización "sin errores" de métodos y herramientas de gestión y visualización de datos provenientes de las ciencias exactas.

Los campos mencionados tienen la capacidad de sopesar las implicaciones epistemológicas del abordaje de tipos específicos de registros y de sus limitaciones constitutivas, así como los efectos políticos, de visibilización e invisibilización de ciertos aspectos y versiones de la realidad, que tienen los sesgos metodológicos en casos concretos. En conjunto, estas áreas del conocimiento pueden producir incidencia en el desarrollo alternativo de la propia concepción de la datificación de la realidad como condición contemporánea, dominada en el contexto actual por el mercantilismo empresarial, la vigilancia gubernamental y el pragmatismo ingenieril.

En Latinoamérica hay algunos ejemplos donde los cruces aquí señalados ocurren. Se encuentran sobre todo en espacios de trabajo dentro de universidades y en medios alternativos. Estos lugares se han convertido en semilleros de pensamiento crítico ejercido a través del análisis de datos. Anclados a preguntas cualitativas para abordar problemas sociales, estos espacios han crecido gracias a la participación activa de programadores que han desarrollado herramientas de descarga, gestión y visualización de datos, así como colaborado en fases cuantitativas del análisis de datos que no son el fin último de los proyectos, sino un insumo para profundizar en un aspecto datificado de la realidad social. Espacios como LABIC[^1] en Brasil, Plano Negativo[^2] en Colombia o Signa_Lab[^3] en México han desarrollado proyectos donde este cruce interdisciplinario ha sido fructífero. Medios independientes y ONG´s en defensa de los derechos humanos, como InternetLab[^4] en Brasil, Linterna Verde[^5] en Colombia, Data Cívica[^6] o Quinto Elemento Lab[^7] en México, entre otros, cuentan con informes e investigaciones fundamentados en aproximaciones críticas al trabajo con datos. También se encuentran grupalidades como Tierra Común[^8], donde académicos y activistas abordan procesos de descolonización de los datos desde posicionamientos situados en el sur global, y más allá de Latinoamérica están el Critical Data Studies Research Group creado por estudiantes de la universidad de Groningen, que ha organizado un par de temporadas a distancia y ha convocado a interlocutores de distintos países para pensar cultura digital y datificación, y la Data Power Conference[^9], encuentro internacional en el que se han desarrollado conversaciones fundamentales para los Estudios críticos de datos desde el 2015.

Desafíos epistemológicos y apuestas políticas para la producción de conocimiento

La construcción de puentes para el desarrollo de métodos digitales críticos debe mantener una vigilancia epistemológica constante. Para Bernhard Rieder y Theo Röhle, el despliegue técnico proveniente de la capacidad de manejar inmensas cantidades de información y el despliegue estético proveniente en particular de la generación de visualizaciones en forma de red o en forma de mosaicos con cientos o miles de palabras o imágenes, en ocasiones corren el riesgo de convertirse en resultados en sí mismos, que además reclaman cierta incuestionabilidad, aspecto que precisamente el pensamiento crítico ha puesto en duda en el pensamiento cuantitativo en general, en lugar de ser utilizados como insumos para fortalecer el análisis crítico. Sobre esto, agregan los autores, "While a textual argument can easily be converted into its negation (anyone can quickly formulate a counter-argument) a visual or quantitative argument is not as easily reversed (one would need access to the instrument and its specifications)" (Rieder & Röhle, 2012. p. 74). Así, el uso de estas herramientas puede producir un convencimiento por fascinación y consolidar una suerte de entusiasmo acrítico desde las ciencias sociales que, en escenarios pragmáticos o colmados de exigencias institucionales, lleve a sustituir la argumentación realizada con hallazgos bien sustentados entretejidos con una interpretación conceptual rigurosa, por laxos dispositivos retóricos gráficos que no aceptan preguntas.

Por otro lado, la integración de la "objetividad numérica" en la investigación social provista por el cálculo computacional puede aparentar una necesidad de resolver problemas y de llegar a un resultado preciso, medible y replicable también en las ciencias sociales y las humanidades. Uno de los mejores ejemplos de esta inercia es la amplia aceptación de estudios de análisis de sentimiento en las investigaciones de datos masivos ancladas a preguntas cualitativas. Este tipo de estudios traducen escalas de valores positivos y negativos al análisis de registros categóricos en los datasets, esto es, al análisis de palabras dentro de un corpus de texto, para identificar emociones positivas y negativas, y así calcular la intensidad de cada indicador. Este enfoque ha traído herramientas para el análisis de contenido y está produciendo aportaciones relevantes, entre otros, a campos como los estudios del discurso y la comunicación política. Se trata de actualizaciones a la investigación social cuantitativa, preexistente al acceso a cantidades masivas de datos y herramientas para abordarlos llegadas con la era digital. No pretendo poner en duda ni relativizar estas aportaciones, sino mencionar estos desarrollos para delinear de mejor manera el horizonte cualitativo de los puentes aquí abordados. Mi pregunta no es si el horizonte de estos cruces debe ser que las investigaciones sociales ganen precisión cuantitativa, está claro que eso está ocurriendo y con resultados más que positivos, sino ¿qué otra cosa es posible hacer además de aprender a usar las herramientas desde el marco epistemológico en el que fueron diseñadas? y ¿qué otras rutas de producción de conocimiento pueden emerger de la experimentación metodológica en las condiciones actuales?

Puesto así, parte de las precauciones epistemológicas en el desarrollo de los puentes que proponemos consiste en identificar y actualizar aspectos de la producción de pensamiento crítico que necesitan sostenerse en la aproximación a la realidad a partir de registros digitales. La generación de preguntas, la producción de conocimiento parcial, la entrega de hallazgos que problematicen el panorama de lo analizado y que no lo "resuelvan", son un conjunto de características de la mirada cualitativa que es necesario sostener en las aproximaciones metodológicas con datos como anclaje epistemológico y como apuesta política de la producción de conocimiento. Desde las humanidades digitales esta cualidad ha sido colocada como exigencia. Para Johanna Drucker, la generación de visualizaciones de datos que no emulen a nivel gráfico los valores cuantitativos presentes en las bases de datos, sino que lleven a exploraciones que produzcan "nuevos significados" (Drucker, 2020) tiene como uno de sus objetivos la producción de "conocimiento parcial", de preguntas y no sólo de certezas acerca de lo que investiga. Esta acumulación de procesos como productos de investigación permite sostener el análisis de una realidad social contingente sin apelar a una mirada inocente que piense en la carencia de cálculo y estrategia, aspectos inherentes a toda mirada socioculturalmente situada, sino a contrapelo de una concepción de la realidad como algo que debe ser sistemáticamente predicho, ¿para beneficio de quién? En consecuencia, se distingue como parte de los horizontes que aquí buscamos, el valor de no buscar la solución pragmática de problemas a partir de la integración de la precisión numérica que ofrecen las herramientas de manejo de datos, sino la construcción de nuevas formas de problematizar la contingente realidad.

Algunos referentes de este tipo de exploraciones podemos encontrarlos en investigaciones como la de Sayde Mobayed, quien ha problematizado la cuantificación del feminicidio en diversas fuentes en México y ha trabajado en una "ontología política del dato" que lo concibe como registro soportado por infraestructuras simbólicas y materiales que lo moldean y lo despliegan como algo "múltiple" y no como un hecho particular (Mobayed Vega, 2025. p. 295). En esta misma ruta, el feminismo de datos se ha empeñado en problematizar, situar y repensar las categorías con las que se registran y comparten los datos como forma de intervención directa en el procesamiento y análisis crítico de los mismos (D'Ignazio & Klein, 2020). Diego Arredondo ha desarrollado cuadernos de procesamiento de datos textuales con Python, para crear visualizaciones interactivas de los patrones semánticos en las preocupaciones ciudadanas en Barcelona recogidas en la plataforma Decidim (Arredondo, 2025). Por su parte, desde una mezcla entre estudios de violencia y memoria y a partir de la utilización de herramientas de sociolingüística, lingüística de corpus y análisis de redes, Ábrego ha trabajado en un tipo de datificación crítica de la violencia que transcribe, grafica y analiza los silencios en testimonios de violencia traumática (Ábrego, 2026). Mientras, Gray y otros han abierto una agenda alrededor de posibles literacidades de infraestructuras de datos, desde las cuales se invita a "not only inventively repurposing data but also problematising data, gathering alternative data or not gathering data at all" (Gray et al., 2018. p. 3). Estas aproximaciones, insertas en general en los estudios críticos de datos, son apuestas para intervenir y complejizar los procesos de datificación a partir de la condensación política de los registros, la generación de categorías sin pasar por el filtro de la supuesta objetividad del registro y la exploración de formas de visualización y análisis de datos desde marcos estrictamente cualitativos.

Galería

Decidim Barcelona: Diego Arredondo

Plano Negativo:

Conclusión. Prospectivas y apuesta cosmotécnica

Mi intención no ha sido alimentar la estéril pugna entre lo cuantitativo y lo cualitativo. Ese encuadre únicamente fortalece el atrincheramiento y ahuyenta la experimentación, sino contribuir al pensar a la datificación de la realidad como algo abierto. Así, como parte del desarrollo conceptual y metodológico alternativo de los procesos de datificación de la realidad, los datos no pueden ser concebidos únicamente como registros que permiten cuantificar la experiencia que capturan, sino como insumos para problematizarla y analizarla desde preguntas con fines cualitativos y herramientas apropiadas y diseñadas para estos fines, sin que esto relativice ni descalifique el desarrollo continuo y necesario de enfoques cuantitativos. En el contexto latinoamericano, este desarrollo metodológico debe ir a la par del desarrollo conceptual pujante alrededor de la cultura digital. A las sólidas aproximaciones teóricas al colonialismo de datos, a la economía de plataformas, al tecnoceno, al big data desde el sur, al capitalismo informacional, entre otros, se deben agregar rutas de exploración y apropiación crítica de herramientas de manejo de datos capaces dimensionar y materializar el peso político de los sesgos metodológicos y las implicaciones epistemológicas que tienen los datos.

En medio de la crisis de sentido de pertinencia social de las habilidades construidas en las universidades y de los espacios educativos en general, no debe perderse de vista la necesidad de crear perfiles híbridos que, como ya decían desde el 2012 Danah Boyd y Kate Crawford, se sientan "equally comfortable with algorithms and data analysis as well as with social analysis and theory" (Boyd & Crawford, 2012. p. 23). Para Latinoamérica, a las deficiencias infraestructurales y los pendientes en temas de acceso a tecnologías, brecha educativa, regulación y gobernanza de datos, etc., se suma la tarea de trabajar en la apropiación crítica de herramientas de manejo de datos ancladas a la investigación social cualitativa, y en la medida de lo posible contribuir al desarrollo de herramientas propias de gestión, visualización y análisis de datos. La ruta hacia una datificación alternativa orientada hacia la construcción de conocimiento parcial y nuevas formas de problematizar la realidad contingente, así como la confianza de que concentrarse en lo cualitativo no significa perder de vista lo masivo de los registros, configuran un horizonte epistemológico que bien vale la pena seguir explorando.

Algunas herramientas de generación de código con inteligencia artificial también se han sumado al desarrollo de este tipo de aproximaciones en la medida en que ofrecen la posibilidad de crear instrumentos de procesamiento y visualización de datos ad hoc, si se cuenta con una alfabetización básica relacionada con la programación. Para algunos, este tipo de usos de la IA "... isn't just about writing code faster --- it's about being able to attempt things that would have been completely out of reach before" (Kim, 2025). Entre el escándalo aceleracionista y el determinismo tecnológico que gira alrededor de esta tecnología, este se trata de un camino que cada vez más personas y espacios están abriendo, sobre el cual sin duda hay que poner atención en el corto y mediano plazo.

Por último, Yuk Hui ha desarrollado el concepto de cosmotécnica para referirse a la identificación de la dimensión simbólica de la técnica y de la dimensión técnica de lo simbólico en cada cultura (Hui, 2020). Este principio permite hacer una exploración profunda en la relación que distintas civilizaciones han construido entre técnica, entorno y sujeto. La cosmotécnica occidental, señala el autor, es una en la que el sujeto domina al entorno a través de la utilización de la técnica. Para Hui, la apuesta política desde la exploración de tecnodiversidades consiste no sólo en buscar registros de cosmotécnicas que no sigan la pauta de dominación que sigue la occidental, sino en pensar en el diseño de cosmotécnicas alternativas. En este sentido, el desarrollo metodológico a partir de los cruces entre marcos teóricos y epistemológicos cualitativos con herramientas concebidas desde marcos epistemológicos cuantitativos supone en cierto sentido el desarrollo de anclajes civilizatorios de una cosmotécnica alternativa, que nos recuerde que "la tecnología funciona como una reticularidad transversal en lugar de «ser» una mera instrumentalización del mundo sin reflexividad" (Peirone, 2025), desde la cual se sostenga la mirada sobre las implicaciones políticas de las relaciones entre sujeto, técnica y entorno, sobre las implicaciones epistemológicas de los sesgos de nuestras herramientas y que sea consciente de la dimensión simbólica, o cosmogónica siguiendo a Hui, que se imprime tanto en el diseño como en el uso de la tecnología.

Referencias

[Ábrego, V. H. (2026). Insurgencia semiótica del silencio en testimonios de violencia. Forum. Revista Departamento de Ciencia Política, 29. Recuperado https://doi.org/10.15446/frdcp.n29.119157]

Arredondo, D. (2025). Cosmograph. Decidim Barcelona [Software]. https://run.cosmograph.app/public/32e1288d-ccbc-46cc-8e00-203c84364b06

[Boyd, D., & Crawford, K. (2012). CRITICAL QUESTIONS FOR BIG DATA: Provocations for a cultural, technological, and scholarly phenomenon. Information, Communication & Society, 15(5), 662--679. https://doi.org/10.1080/1369118X.2012.678878]

[Cairo, A. (2019). How Charts Lie. W. W. Norton & Company, Incorporated.]

[D'Ignazio, C., & Klein, L. F. (2020). Data Feminism. The MIT Press.]

[Drucker, J. (2020). Blind Spot: Information Visualization and Art History. En The Routledge Companion to Digital Humanities and Art History. Routledge.]

[Gray, J., Gerlitz, C., & Bounegru, L. (2018). Data infrastructure literacy. Big Data & Society, 5(2), 205395171878631. https://doi.org/10.1177/2053951718786316]

[Hui, Y. (2020). Fragmentar el futuro. Ensayos sobre tecnodiversidad. Caja Negra.]

[Kim, G. (2025). How I Broke My 20-Year SPSS Habit To Vibe Code Something in a Python Colab Notebook. IT Revolution. https://itrevolution.com/articles/how-i-broke-my-20-year-spss-habit-to-vibe-code-something-in-a-python-colab-notebook/#:~:text=Last%20month%2C%20Dr.,language%20I ve%20barely%20used.]

[Kitchin, R. (2022). The data revolution: A critical analysis of big data, open data & data infrastructures (Second edition). Sage Publications.]

[Kitchin, R., & Lauriault, T. P. (2014). Towards critical data studies: Charting and unpacking data assemblages and their work. The Programmable City Working Paper 2.

[Masson, E. (2017). "Humanistic Data Research" en The datafied society: Studying culture through data. (M. T. Schäfer & K. Van Es, Eds.). Amsterdam University Press.]

[Mobayed Vega, S. (2025). Feminicide: Unravelling the State's Data Infrastructures. Critical Sociology, 51(6), 1289--1311. https://doi.org/10.1177/08969205241262416]

[Peirone, F. (2025). Tecnología política. [Supernova]. https://revistasupernova.com/nota/tecnologia-politica]

[Reguillo, R. (2023). Ensayos sobre el abismo: Políticas de la mirada, violencia, tecnopolítica. Encartes, 6(11). https://doi.org/10.29340/en.v6n11.317]

[Rieder, B., & Röhle, T. (2012). "Digital Methods: Five Challenges". In Understanding Digital Humanities (D. Berry, Ed.; 1st ed. 2012). Palgrave Macmillan UK. https://doi.org/10.1057/9780230371934]

[van Dijck, J. (2014). Datafication, dataism and dataveillance: Big Data between scientific paradigm and ideology. Surveillance & Society, 12(2).]