Título y resumen de propuesta

DATIFICACIÓN CRÍTICA DE LA VIOLENCIA. CONCEPTUALIZACIÓN, PROCESAMIENTO, VISUALIZACIÓN Y ANÁLISIS DE DATOS CON REGISTROS DE VIOLACIONES GRAVES A LOS DERECHOS HUMANOS EN COLOMBIA Y EN MÉXICO

Víctor Hugo Ábrego Molina

Los procesos contemporáneos de datificación de la realidad están siendo abordados desde los estudios críticos de datos, las humanidades digitales, los estudios de visualidades y otras áreas del conocimiento, para señalar las limitaciones, sesgos políticos, epistemológicos y culturales de los marcos dominantes en los que ocurren estos procesos. Esta propuesta condensa dichos abordajes para conceptualizar críticamente registros digitales de violaciones graves a los derechos humanos en Colombia y en México, y tiene como objetivo el diseño e implementación de mecanismos de procesamiento y visualización de datos cuyo análisis no busca medir la experiencia capturada en estos registros sino producir interpretaciones abiertas centradas en el abordaje de valores categóricos en estos conjuntos de datos. A partir de conceptos de los estudios de memoria, trauma y violencia, de la semiótica, la archivística y la estética forense emerge una datificación crítica de la violencia, basada en una metodología mixta que utiliza herramientas de lingüística de corpus, análisis de redes, métodos biográficos, sociolingüística y análisis crítico del discurso.

redmimama

Estado del arte

Aproximaciones críticas a la realidad datificada

La consulta de literatura alrededor de procesos de datificación de la realidad ha arrojado la siguiente categorización de énfasis, exploraciones y sesgos en diversos campos y áreas del conocimiento, así como evidencia de la incidencia cultural, epistemológica y política de dichos procesos en contextos determinados1.

Estudios Críticos de Datos

Los Estudios Críticos de Datos (ECD) son un campo interdisciplinario emergente alrededor de la problematización de los procesos de datificación de la realidad. ¿Cómo se producen y cómo se adquieren los datos? ¿De quiénes son los intereses alrededor de la inteligencia que producen los datos? ¿Cuáles son las implicaciones políticas y las consecuencias culturales y sociales alrededor del uso de los datos? Son algunas de las preguntas que condensan los intereses de este campo (Boyd & Crawford, 2012; Kitchin, 2022; Kitchin & Lauriault, 2014). Los énfasis conceptuales en este campo abarcan:

  • La vigilancia y el control social ejercidos desde la sistematización y la generación de inteligencia con datos (Mejias & Couldry, 2019; Thatcher et al., 2016; Yeung, 2018).
  • La predictibilidad de lo posible mediante formas de gubernamentalidad algorítmica (Rouvroy & Berns, 2018).
  • Las formas de datificación de la realidad como métodos actuales de extractivismo y fetichismo informacional contemporáneo (Milan & Treré, 2019; Ramos-Martín, 2022; Ricaurte, 2019).
  • Las tensiones entre estructura y agentes en forma de "ambivalencias" o tensiones y disputas alrededor de los datos (Hepp et al., 2022).
  • La observación y el análisis de las infraestructuras materiales y simbólicas de los datos y de los usos de estos por parte de gobiernos y ciudadanías (Barreneche, 2019; Barreneche et al., 2021).
  • Y un conjunto en particular que apunta no sólo al desarrollo conceptual sino también al de distintas formas de apropiación crítica de la datificación. Desde aquí se habla, por ejemplo, de literacidades de infraestructuras de datos (Gray et al., 2018), reimaginación de la analítica de datos (Selwyn, 2020), formas de contra-mapeo (Dalton & Stallmann, 2018), asequibilidades algorítmicas (Ettlinger, 2018), entre otras posibilidades que incentivan al desarrollo metodológico con datos.

Así, desde este campo emerge lo que podemos nombrar como datificación dominante, caracterizada por una ontología numérica, que remite a una cualidad mediante la cual el dato es capaz de aportar al conocimiento únicamente en tanto “mide” algo, una racionalidad predictiva, que más allá de controlar la ingente cantidad de información a la que tiene acceso y produce la datificación, busca controlar “lo por venir” en lo social a partir de registros digitales de la experiencia, un tipo de gubernamentalidad de vigilancia y control, que remite a un vicio institucional que amplía las posibilidades de perfilamiento de usuarios de tecnologías digitales con intenciones de producir a los sujetos como sospechosos o como consumidores, una ética comercial, que remite a una utilidad de los datos cifrada en las posibilidades de generar rendimiento económico, y una epistemología universalizante, que remite a un reforzamiento autorreferencial de la jerarquía ejercida por la lectura estrictamente numérica de la realidad a través de datos, por encima de otras posibilidades de producir conocimiento mediante el énfasis, por ejemplo, en valores categóricos en los mismos datos.

Visualización y representación crítica de datos

Por otro lado, hay una conversación a nivel interdisciplinar abierta alrededor de la problematización y la exploración de mecanismos de procesamiento y visualización de datos desde investigaciones provenientes de las ciencias sociales y las humanidades. Algunos referentes al respecto han apuntado que las herramientas más usadas de procesamiento y visualización de datos están construidas y concebidas desde marcos epistemológicos (y escópicos) de corte cuantitativo, que producen y condicionan el tipo de resultados que se pueden obtener con ellas, lo cual nos deja frente al cuestionamiento acerca de cuáles son las posibilidades de obtener resultados con fines cualitativos (y críticos) con el uso de estas herramientas (Masson, 2017). En esa misma línea, Johanna Drucker ha desarrollado una serie de principios para concebir una producción de conocimiento desde la visualización de datos que no parta ni tenga como objetivo la representación gráfica de significados pre-existentes en los datos. Para la autora, hay un tipo de conocimiento visual que no sólo es capaz de "reproducir" sino de "producir" significados. A este conocimiento le llama "Graphesis" y se distingue de la "Mathesis", que es el tipo de conocimiento visual que sí tiene como objetivo leer en las visualizaciones "la precisión" con la que éstas "representan" el significado preexistente en los datos, usualmente numéricos (Drucker, 2020). Drucker invita a pensar a las visualizaciones de datos como argumentaciones retóricas desplegadas en escenarios gráficos, cuyo objetivo es tener efectos de verdad en tanto flujo discursivo y no simple conjunto de información que acompaña una idea. A este respecto, Alberto Cairo ha señalado que usualmente los mecanismos de procesamiento y visualización de datos se dan por sentados desde la mirada cuantitativa e invisibilizan, o justifican por simple funcionalidad, las transformaciones y los sesgos epistemológicos y políticos que sus convenciones siguen y consolidan. Sin embargo, esta jerarquía de la lectura estrictamente numérica de los datos, fácilmente refuerza creencias y tiende a aumentar los sesgos de confirmación en quien los lee (Cairo, 2019).

Otro referente alrededor del abordaje crítico de datos es el de los métodos digitales, encargados de lo "nativamente digital" (Rogers, 2023), y desde donde se han desarrollado distintas herramientas de descarga y extracción de datos de plataformas digitales y motores de búsqueda (Rieder, 2015; Rogers, 2017), con la intención de analizar estos datos al menos desde dos dimensiones, a saber, desde los "datos sociales", referidos a las tendencias o temas sociales visibles en estos espacios, y desde los "datos semánticos", referidos a las conversaciones que componen dichas tendencias, presentes en distintos tipos de mensajes producidos por todo tipo de actores en estos escenarios. De corte mixto, los métodos digitales tienen un particular interés en la interpretación crítica de los valores cualitativos, es decir en los textos presentes en los conjuntos de datos a los que acceden.

Finalmente, distintos autores han abogado por la inclusión de herramientas y miradas etnográficas para el análisis de datos. Al respecto, Elisenda Ardévol ha identificado las coincidencias entre la ciencia de datos y los enfoques hermenéuticos, señalando que ambos están interesados en "hallar patrones para la investigación" que puedan ser tomados como insumos susceptibles de ser interpretados. Para la autora "modelizar el comportamiento humano" no es suficiente para llevar a cabo una interpretación de aspectos culturales a partir de patrones, sino que "sólo una descripción densa puede revelar el significado cultural, si tiene alguno, de estas conexiones" (Ardévol, 2017). A este respecto, César Rodríguez Cano (Rodríguez Cano, 2022) se ha pronunciado por evidenciar que "aunque sean inmensos, los datos se pueden interpretar cualitativamente", siempre y cuando se mantenga una vigilancia epistemológica y una actitud crítica permanentes frente a los datos, los métodos y los marcos interpretativos de los que se parta para trabajar con datos masivos.

Los default del tratamiento estadístico de los datos (disputar lo indisputable)

Los mecanismos de gestión y limpieza de datos desde la llamada ciencia de datos tienen como finalidad homogeneizar la información, ya sea para alimentar algún modelo de análisis a partir de los patrones numéricos identificados en los datasets o ya sea para presentar informes (con visualizaciones integradas) que integren las cualidades medibles de los valores que componen un archivo. Algunos de estos mecanismos son:

  • Normalización: consiste en transformar los atributos de una porción del dataset a una escala similar a partir de la identificación de valores mínimos y máximos de modelos lineales o de distribución de valores atípicos.
  • Discretización: consiste en distribuir un conjunto de valores en intervalos de igual amplitud o por cuartiles.
  • Numerización: consiste en convertir a una escala de valores numéricos valores categóricos con el fin de medir la frecuencia con la que aparecen.

El análisis de datos a partir de este tipo de técnicas de gestión, tradicionalmente parte de la utilización de herramientas de estadística, útiles para obtener medidas del conjunto de datos a partir de segmentaciones del mismo, así como para identificar correlaciones y/o distintos tipos de causalidad o tendencia que conlleven a la construcción de interpretaciones que comúnmente aspiran a producir modelos de predictibilidad.

El historiador, estadístico y sociólogo Alain Desrosieres (Desrosières, 2011) elaboró un minucioso estudio acerca de la historia del razonamiento estadístico, en el cual señala algunas de las cualidades principales de este dispositivo cognitivo que, como pocos, ha tenido un éxito y una legitimidad que en muchas ocasiones rayan en lo incuestionable. Desrosieres señala los elementos racionales, históricos y políticos que construyeron el pensamiento estadístico. A partir de su lectura es posible identificar y categorizar al menos tres dimensiones constitutivas de la estadística:

  • Dimensión epistemológico-política: Se refiere a entender que la estadística es el fruto de la unión entre el desarrollo del pensamiento probabilístico a partir del siglo XVIII y la configuración de los estados-nación en esa misma época. Esta unión le ha dado a la estadística una legitimidad tanto epistemológica como política, con la que ha sido capaz de producir un lenguaje que sirve de piso y sentido común para las sociedades y para los gobiernos, con mayor firmeza desde mediados del siglo XX.
  • Dimensión ontológica: Se refiere a la transformación en la naturaleza de las cosas que lleva a cabo la estadística, ocurrida en el momento en el que selecciona un fenómeno de la realidad social y una vez identificada una cualidad o conjunto de cualidades medibles del mismo, hace a un lado las cualidades no medibles. Sin embargo, una vez analizadas estadísticamente dichas cualidades, los resultados tienden a hablar tanto por lo medible como por lo no medible del fenómeno.
  • Dimensión semiótica-retórica: Se refiere a la cualidad sineqdóquica de la estadística, mediante la cual toma una parte (el promedio, la correlación, la tendencia), y la hace hablar por el todo. Se trata de un despliegue de significado del análisis producido mediante el cual la representación sustituye a lo representado.

Señalar estas cualidades no implica en modo alguno que se intente descalificar o poner en duda el valor de las aproximaciones cuantitativas al análisis de datos, sino que busca evidenciar áreas de oportunidad para la experimentación con distintas herramientas de manejo de datos que coloquen el foco del análisis en valores categóricos desde andamiajes cualitativos y mixtos.

Medir lo inconmensurable

A contrapelo de los supuestos elementales del pensamiento estadístico, la antropóloga Sally Engle Merry ha hecho una etnografía de los indicadores numéricos internacionales que registran abusos a los derechos humanos y ha señalado que estos parten de una imposibilidad general, a saber, la imposibilidad de medir lo inconmensurable (Merry, 2016). Es decir, la naturaleza de los abusos a los derechos humanos imposibilita de manera radical que el registro de la experiencia sea la medición de dicha experiencia, y mucho menos la sustitución de la experiencia. Esta incompatibilidad entre la condición de inconmensurabilidad de este tipo de experiencias y la validación mediante lo cuantificable de lo estadístico, da cuenta de posibilidades de exploración e interpretación del peso semiótico de registros de este tipo de experiencias desde regímenes analíticos no centrados en lo cuantitativo.

Luego entonces, los métodos cualitativos (la entrevista a profundidad, la etnografía, entre otras) suelen ser las aproximaciones más adecuadas para analizar críticamente este tipo de registros. Sin embargo, el acceso a amplios archivos digitales con testimonios de violaciones graves a los derechos humanos o con descripciones de estos hechos, permite la exploración de métodos computacionales y de tratamiento de datos tabulares alternativos para emprender un tipo de análisis centrado en los aspectos cualitativos de estos registros.

Una investigación crítica de registros digitales de este tipo no excluye la utilización de métodos cuantitativos de segmentación y análisis preliminar de ciertas porciones de los datos, pero sí supone utilizarlos no como fines sino como puntos intermedios condicionados por una reorientación constante hacia el análisis de valores categóricos desde anclajes conceptuales y metodológicos cualitativos y mixtos, desde los cuales contribuir a los estudios de memoria histórica y trauma social (Alexander, 2016) con la utilización de métodos computacionales.

El peso político de la datificación de la violencia en Colombia y en México

México y Colombia comparten características en sus formas de violencia y en los efectos sociales que estas han tenido en las últimas décadas. Si bien cada país ha atravesado por etapas y actores distintos, las catastróficas cifras de violaciones graves a los derechos humanos son un aspecto compartido. Según datos del INEGI (INEGI, 2025), en México entre 2006 y 2023 han sido asesinadas al menos 400 mil personas. En Colombia una cifra de alrededor de 450 mil personas asesinadas es la que se tiene documentada de 1985 a 2019, con más del 75% de víctimas registradas entre 1996 y 2010, de acuerdo con datos del informe final de la Comisión de la Verdad (Comisión de la Verdad de Colombia, 2022). México alcanzó en 2022 el registro oficial de 100 mil personas desaparecidas y en años recientes se ha señalado la necesidad de documentar víctimas de desplazamiento forzado y de reclutamiento forzado de jóvenes. En Colombia hay documentados 11 abusos a los derechos humanos, entre los que se encuentran los mencionados y otros más, cometidos desde 1958. En ambas naciones es posible encontrar formas similares de violencia sistemática en contra de la población civil, formas de gobernanza criminal en distintos territorios, así como formas de macro-criminalidad o patrones de comportamiento criminal de los grupos armados (Alfonso-Camelo & Chaparro Moreno, 2024). Este contexto en ambos países ha ido a la par del desarrollo de una paradójica condición de consolidación institucional y de fragilidad institucional, en la cual la violencia, los amplios márgenes de impunidad y la corrupción institucional no han sido excluyentes sino concurrentes y complementarios al desarrollo de ambos estados.

Sin embargo, entre las diferencias en el modo de abordar esta crisis de violaciones a los derechos humanos está el propio papel de los gobiernos. En el caso colombiano se ha hecho un reconocimiento oficial de estar en medio de un conflicto armado, mientras que en México ningún gobierno federal se ha atrevido a aceptar esta condición, sin la cual mecanismos oficiales de documentación, sistematización y diseño de políticas de desarme y pacificación puedan ser diseñadas e implementadas. Esta comparación nos lleva a ver las diferencias en el estado de la propia documentación del conflicto y de las víctimas en ambos países. Mientras en Colombia se tienen espacios oficiales dedicados al estudio y documentación del conflicto, como el del Centro Nacional de Memoria Histórica o el informe final de la Comisión de la Verdad, en México los registros de víctimas de delitos como la desaparición siguen estando en medio de un jaloneo institucional entre un registro nacional que en los últimos años ha tenido modificaciones sin consultar con autoridades, expertos y familias de las víctimas, y registros estatales que no necesariamente han sido confiables ni cuentan con metodologías de captura y seguimiento rigurosos ni homologados de los casos.

Los registros de violaciones graves a los derechos humanos en ambos países, provenientes tanto de fuentes oficiales como de ONGs, medios alternativos y comisiones de la verdad, están insertos en un circuito de disputa por la construcción de la verdad acerca del pasado y el presente de los conflictos, de los referentes y encuadres para la construcción de memoria histórica desde el trauma social y de las propias posibilidades de imaginar salidas pacíficas al conflicto a partir de la comprensión del mismo. De estas construcciones depende parte importante de la identidad nacional, la legitimidad institucional y las posibilidades de construcción de sociedades democráticas en cada país. Es decir, la disputa por el sentido de los registros de violaciones graves a los derechos humanos tiene un peso político definitorio del presente y el futuro de ambos países.

1

Un artículo resultado de una porción de este apartado ha sido publicado recientemente en la revista Acta Sociológica bajo el título: Datificación crítica de la violencia. Aportaciones a los estudios críticos de datos desde contextos Latinoamericanos. Disponible en: https://www.revistas.unam.mx/index.php/ras/article/view/90765

Planteamiento del problema y problema de investigación

Abrir las infraestructuras de la datificación

A continuación, se presenta una serie de huecos y desfases del conocimiento alrededor de los procesos de datificación de la realidad, a los cuales esta investigación puede contribuir con el abordaje crítico de registros digitales de violaciones graves a los derechos humanos. Cada párrafo se corresponde con los temas y áreas del conocimiento abordados en el estado del arte.

Los énfasis conceptuales hallados en los Estudios Críticos de Datos muestran que poco se ha explorado alrededor de procesos de datificación de violaciones graves a los derechos humanos en contextos latinoamericanos, ni acerca de las implicaciones políticas y sociales de la disputa por el sentido de estos procesos. Tampoco hay trabajos que aborden en particular los valores categóricos presentes en estos registros, es decir los testimonios o las descripciones de los hechos, antes bien, los análisis de estos archivos suelen enfocarse en métodos cuantitativos y poner el centro de atención en los valores numéricos para el análisis de los registros. Esto evidencia la necesidad de ampliar la discusión acerca de procesos de datificación de la violencia en contextos latinoamericanos desde anclajes conceptuales críticos y referentes metodológicos mixtos y cualitativos.

La revisión de la literatura alrededor de problematizaciones de mecanismos de procesamiento y visualización de datos desde miradas provenientes de las ciencias sociales y las humanidades muestra que hay una conversación abierta acerca de las exploraciones conceptuales y metodológicas que se pueden hacer desde investigaciones cualitativas que utilicen herramientas de procesamiento y visualización de datos concebidas desde marcos epistemológicos cuantitativos. La emergencia de referentes como los métodos digitales y la incursión de herramientas etnográficas para el análisis denso de conjuntos de datos suman a la conversación acerca de las posibilidades de construir abordajes cualitativos de registros de datos tabulares. Estas exploraciones invitan al diseño de visualizaciones que no pretendan seguir pautas de mímesis del significado numérico de los datos, sino que busquen interpretaciones abiertas, nuevas interrogantes y conocimiento parcial desde los datos, para una necesaria interrupción de las inercias que suelen reafirmar sesgos interpretativos en muchas ocasiones provenientes de marcos interpretativos numéricos. En consecuencia, el desarrollo de conceptualizaciones críticas de registros digitales de violaciones graves a los derechos humanos, así como el diseño e implementación de mecanismos de procesamiento y visualización de datos a partir de una mirada centrada en valores cualitativos, pueden contribuir a los afanes exploratorios y al desarrollo conceptual y metodológico abierto por esta conversación interdisciplinaria.

Los mecanismos de procesamiento de datos más utilizados están anclados a procedimientos estadísticos de gestión y "limpieza" de los datos, que buscan ordenar la información a partir de la identificación, segmentación y análisis de porciones representativas de una muestra o de un universo de datos. Estos procedimientos llevan a cabo afirmaciones analíticas que llegan a ser incuestionables debido a la legitimidad científica y política del razonamiento estadístico, cuya cualidad de transformación de cualquier fenómeno a objeto medible tiene implicaciones ontológicas de exclusión o reducción de la importancia de los aspectos no medibles del fenómeno y ha sido adoptada por default en la comunidad de análisis de datos. Esta misma inercia invisibiliza una capa semiótica-retórica del pensamiento estadístico que sostiene sus afirmaciones a partir de sustituir al todo (medible y no medible) por la parte medible. Estas cualidades no descalifican la utilidad ni la eficacia de dichos mecanismos de gestión y limpieza de datos, sino que ayudan a situar epistemológica y políticamente al razonamiento estadístico, en particular cuando se está frente a registros de experiencias como violaciones graves a los derechos humanos, cuya naturaleza es precisamente su condición de inconmensurabilidad. Situar los límites epistemológicos y políticos del tratamiento estadístico de datos con este tipo de registros abre la posibilidad de explorarlos sin mantener el foco de atención en los aspectos medibles de estos conjuntos de datos, o tomando la dimensión medible como un punto de acceso pero no como el objetivo del análisis.

México y Colombia comparten la condición de ser atravesados por conflictos que han dejado a ambos países en una crisis de violaciones graves a los derechos humanos en las últimas décadas. El peso político de la disputa por el significado público de los procesos de datificación de estas violencias es definitorio para el presente y el futuro de estas sociedades, por ello es pertinente contribuir a esta disputa desde el desarrollo de abordajes críticos de estos registros, que sumen a la construcción de memoria histórica desde el foco en los testimonios y narraciones de experiencias de víctimas y sobrevivientes, y no desde la cuantificación de sus experiencias.

Finalmente, desde sus aproximaciones a la etnografía de las infraestructuras, Susan Leigh Star puso en evidencia que la producción de conocimiento científico es posible a partir de conceptos que funcionan como el piso sobre el cual un aparato epistemológico opera. Estos conceptos funcionan como andamiajes y como puntos de contacto para mantener el flujo del conocimiento. A estos conceptos la autora los nombró "infraestructuras simbólicas" (Star, 2002). El acercamiento crítico a estas infraestructuras permite evidenciar las afirmaciones y las exclusiones que ejerce una disciplina o campo, también permite trabajar en la construcción de caminos alternativos que no necesariamente buscan ir en contra del conocimiento sostenido por estas infraestructuras y legitimado por su efectividad como herramientas de producción de conocimiento, sino producir nuevas preguntas y nuevas maneras de abordarlas fuera del alcance de las infraestructuras vigentes. Pensar en una propuesta de datificación crítica de la violencia implica abrir las infraestructuras simbólicas alrededor de la conceptualización, procesamiento, visualización y análisis de datos con registros de experiencias inconmensurables.

Problema de investigación

En un contexto de emergencia y consolidación de campos de estudio crítico de procesos de datificación de la realidad y de exploración y problematización de mecanismos de procesamiento y visualización de datos desde miradas provenientes de las ciencias sociales y las humanidades, los conjuntos de datos con registros de violaciones graves a los derechos humanos suelen ser procesados y visualizados desde perspectivas cuantitativas centradas en el análisis de valores cuantitativos dentro de dichos conjuntos de datos. Sin embargo, estos datos registran experiencias caracterizadas por su condición de inconmensurabilidad. Es posible llevar a cabo una conceptualización critica de estos registros que contemple dicha condición, y que a su vez lleve a diseñar e implementar mecanismos de procesamiento y visualización de datos consecuentes con planteamientos críticos alrededor de la datificación, cuyos mecanismos sean abordados desde un tipo de análisis centrado en los valores cualitativos presentes en estos conjuntos de datos.

Preguntas de investigación y objetivos

Pregunta general

  • V1. ¿Cuáles serían las características de una conceptualización crítica acerca de conjuntos de datos con registros de violaciones graves a los ddhh en Colombia y en México, que lleve al diseño e implementación de mecanismos de procesamiento y visualización de datos cuyos productos sean abordados desde un tipo de análisis centrado en los valores categóricos de dichos registros?

  • V2. ¿Cuáles serían las características de una conceptualización crítica acerca de conjuntos de datos con registros de violaciones graves a los ddhh en Colombia y en México, que lleve al diseño e implementación de mecanismos de procesamiento y visualización de datos abordables desde un tipo de análisis centrado en los valores categóricos de dichos registros?

Objetivo general

  • V1. Desarrollar una conceptualización crítica de un conjunto de registros digitales de violaciones graves a los derechos humanos en Colombia y en México, que permita diseñar e implementar mecanismos de procesamiento y visualización de datos, cuyos productos conduzcan a un análisis que no busque medir la experiencia capturada en estos registros sino producir interpretaciones abiertas centradas en el abordaje de valores categóricos dentro de estos conjuntos de datos.

  • V2. Desarrollar una conceptualización crítica de un conjunto de registros digitales de violaciones graves a los derechos humanos en Colombia y en México, que permita diseñar e implementar mecanismos de procesamiento y visualización de datos, cuyo análisis no busque medir la experiencia capturada en estos registros sino producir interpretaciones abiertas centradas en el abordaje de valores categóricos dentro de estos conjuntos de datos.

Objetivos específicos

  • Generar mecanismos de procesamiento de datos que no requieran de una infraestructura institucional ni de un saber especializado en programación para poder ser llevados a cabo.

  • Generar protocolos de catalogación, etiquetamiento y delimitación de los datos utilizados, mediante fichas de datos que sean elementos primordiales de los mecanismos de procesamiento crítico de los datos.

  • Problematizar y proponer elementos para un tratamiento colectivo de los datos, que parta del diálogo y el cuidado entre las comunidades datificadoras.

Referentes conceptuales. Andamiajes para una datificación crítica de la violencia

A partir de la revisión de la literatura, de la enunciación del problema y de la definición de la pregunta y de los objetivos de investigación, este apartado condensa ejes conceptuales provenientes de la semiótica, de los estudios de violencia y memoria, del estudio de experiencias traumáticas, de la archivística y de la estética forense, desde los cuales se abordarán teóricamente los procesos de datificación crítica de la violencia 1.

Dimensiones semióticas del dato que registra violencia

Peirce desarrolló una categorización del signo que no únicamente toma en cuenta los aspectos simbólicos o de significado y significante que utilizó Saussure para su definición. Para Peirce hay íconos, índices y símbolos (Peirce, 1992). Actualmente, los estudios acerca de la semiótica más allá de lo simbólico complejizan el panorama de lo que entendemos por significación en muchos aspectos de la realidad. Chudy y Müller (2024) parten de un sesgo claro: "la capa semiótica se suele confundir con la capa simbólica", lo cual permite abordar los modos en que, por ejemplo, los estudios de medios han hecho históricamente a un lado a los signos no simbólicos que la materialidad de los medios producen. Esta especie de ceguera semiótica ha considerado a estos signos no como tales sino como "ruido", como "señales" o como "problemas de ingenieros", lo cual ha tenido serias implicaciones para entender el papel de los medios como productores semióticos y no sólo como soportes y transmisores en el proceso de semiosis. El foco de atención en valores categóricos dentro de registros de violaciones a los derechos humanos (testimonios y narraciones de sobrevivientes, descripciones oficiales de los hechos) requiere de un acercamiento semiótico capaz de abordar signos no simbólicos presentes en este tipo de archivos, así como tomar a los mecanismos de procesamiento y visualización de datos como productores y no sólo como portadores de sentido.

Para entender como signos no necesariamente simbólicos a los datos que registran la violencia, los estudios acerca del trauma social y de la violencia en conflictos de gran envergadura han puesto de relieve la naturaleza "inconceptualizable" de este tipo de experiencias. María del Rosario Acosta se refiere a cómo el trauma provoca un impasse cognitivo que impide que el sujeto la asimile, por lo que, a nivel mental, el trauma "permanece desconocido... en nuestro lenguaje" y "no apunta a nada más que a la incapacidad de la mente de procesar el accidente como evento, como experiencia" (Acosta López, 2017, pág. 89). En esta misma línea, Shoshana Felman (2017), leyendo a Benjamin, recupera el modo en que los soldados que volvieron de la primera guerra mundial perdieron "la capacidad de simbolizar", es decir, de contar lo que les había ocurrido, lo cual llevó a estudiar de nuevas formas lo que entendemos por silencio, así como las relaciones entre historia, memoria y testimonio. Así, por ejemplo el silencio, signo clave en estos registros, desde la semiótica de Pierce sería un tipo de signo que no requiere de palabras para evocar un significado, pero no una ausencia de significado. Los signos simbólicos pueden colapsar, pero esto no significa que se dejen de producir signos ni que se deje de producir semiosis. María Victoria Uribe y Rodrigo Parrini (2020) hacen referencia a los modos en que los signos simbólicos naufragan cuando se está frente a acciones violentas y a los efectos de estas acciones en contextos como el colombiano y el mexicano. Estos autores hablan de cómo "violencia y significación no coinciden", de escenarios donde "si bien algo se encuentra, no necesariamente se puede nombrar", así como de "discursos fantasmas" y de "sombras". Estas evocaciones invitan a abordar los datos que registran la violencia a partir de un nivel de complejización semiótica desde el cual lo que entendemos por signos y lenguajes en los que se expresa dicha violencia avancen hacia formas de pensar e interpretar la semiosis fuera y más allá de los signos simbólicos.

Norman Fairclough ha indicado que la noción de discurso bien puede pensarse como "semiosis, sugiriendo que al análisis del discurso le conciernen varias 'modalidades semióticas', de las cuales el lenguaje (escrito) es una sola" (Fairclough, 2023). Desde la lingüística y desde los estudios del discurso se han desarrollado perspectivas multifacéticas del discurso para fortalecer esta postura. Gunther Krees ha desarrollado la noción de multimodalidad para referirse a los múltiples "espacios y recursos que entran en el significado -del discurso- de un modo u otro" (Kress et al., 2000). Los módulos son los escenarios, los lenguajes y los canales que despliegan sentido en un discurso. Cada uno de estos módulos (escritos, icónicos, espaciales, de proximidad, etc.) han de ser analizados como elementos que dan cuentan de manera "parcial" del sentido de un discurso, expresamente, "language can no longer be treated as providing a full account of meaning but is seen as only ever providing a partial account". Para Kress, la semiótica social es la teoría que busca analizar la multimodalidad del discurso mediante la identificación de los módulos, de la naturaleza y de las características semióticas de cada uno, así como de las relaciones de poder que rigen los principios de orden mediante los cuales una comunidad produce significados.

Dicho lo anterior, desde una mirada peirceana, cuando la violencia alcanza niveles de brutalidad incomprensible rebasa y desborda la inteligibilidad de los signos y lenguajes simbólicos disponibles. ¿Qué tipo de signos produce la violencia extrema? ¿El hecho de que no produzca un lenguaje racional-logocéntrico hace que lo que produzca sean "señales" o "ruidos" carentes de significado? No, las formas brutales de la violencia no han de ser concebidas como signos simbólicos sino como signos icónicos o indexicales producidos por humanos.

¿Qué despliega, si no es un signo simbólico, la violencia? Cuando se despliega en sus formas más brutales, la violencia se despliega a sí misma de un modo fático y autorreferencial. En esos casos, la violencia despliega poder como significado, no como logos. A este tipo de signos se refiere también Rossana Reguillo cuando dice, acerca de las acciones del narcotráfico en México, que "frente a estas violencias, el lenguaje naufraga, se agota en el mismo acto de tratar de producir una explicación, una razón" (Reguillo, 2011).

Silencio, escucha y experiencia traumática

La violencia traumática, nos dice María del Rosario Acosta, "está también dirigida hacia destruir y controlar los medios para su representación". Esto supone una crítica al hecho de que uno de los filtros de validación de los testimonios de este tipo de violencias para su integración a carpetas de investigación o incluso para su registro oficial, sea que éstos posean una estructura o una gramática organizada de manera "clara" y "entendible", pautas de reconstrucción de la experiencia que precisamente hace estallar la violencia. Por el contrario, señala Acosta, lo común es encontrarse con que estos testimonios están "expresados en sí en silencio" o expresan "no meramente palabras -y su fallo en nombrar adecuadamente las experiencias en cuestión... (sino) también profundos y elocuentes silencios" (Acosta López, 2023).

Para María del Rosario Acosta, la voz afectada por el trauma "es una capaz de producir y también de demandar sus propias gramáticas para poder hacer que algo resulte audible y comunicable". (Acosta López, 2023). La escucha de este tipo de experiencias no consiste únicamente en tener la disposición a escuchar el testimonio de las personas, sino en desarrollar la capacidad de transformar el marco interpretativo o las gramáticas de estas experiencias, pues para la autora, las gramáticas son esos "marcos de arreglo de nuestra percepción y las jerarquías que gobiernan nuestros sentidos".

Frente a este tipo de testimonios es que la autora invita a desarrollar "formas de escucha radical", o lo que llama "gramáticas de lo inaudito", entendido lo inaudito como aquello que aún no es escuchado y como aquello que resulta indignante una vez se hace escuchar. Estas gramáticas abren "a site for listening to what does not ‘make sense’ as meaningful within available and hegemonic frameworks of meaning" (Acosta López, 2023), al tiempo que cuestionan y amplían lo que consideramos como "audible" y significante no sólo en términos semánticos sino, podemos agregar, desde marcos y despliegues semióticos no simbólicos.

Para registrar con atención lo inconceptualizable de la experiencia traumática, podemos acudir al supuesto de la lingüística interactual de que "cuando la gente habla, es incapaz de decir de manera suficientemente explícita todo aquello a lo que se refiere" (Jaspers, 2023). Esta "incompletud" del habla ha permitido desarrollar nociones como la de "conocimiento extracomunicativo" para entender cómo es que a través del contexto es que quien habla y quien escucha establecen relaciones semióticas que hacen el intercambio de significados más eficiente, y al mismo tiempo han contribuido a evidenciar el peso que tiene lo no dicho en una conversación.

Archivo y memoria

Para Diana Taylor (2011) el archivo está conformado por todo el material tangible o “núcleo duradero de registros” relacionados con la violencia ejercida para borrar vidas y memorias de las víctimas; en tanto que el repertorio “almacena y recrea la memoria ‘encarnada’, en resumen, todos los actos que suelen considerarse de conocimiento o “en vivo”, efímero, no reproducible” (Taylor & Fuentes, 2011). Es en las posibilidades de conjugación entre lo tangible y lo no reproducible, entre lo articulable y lo inconceptualizable que los estudios del performance llevan a cabo ejercicios para evidenciar los intersticios en escenarios de relaciones de poder dominantes. ¿De qué preguntas tendría que partir un proceso de datificación que busque integrar lo “no reproducible” del repertorio performático señalado por Taylor? ¿Es posible transmitir la memoria traumática a través de los datos que registran la violencia? ¿Es posible construir un dato que tenga estos fines? ¿Cómo se representaría este dato? ¿Qué intersticios en las relaciones de poder sería posible evidenciar a través de los registros datificados de acontecimientos traumáticos? Podríamos pensar en un tipo de “dato anclado”, que a diferencia del dato crudo (raw data) (Kitchin & Lauriault, 2014) del que parte la datificación dominante, puede asumir como su lugar de enunciación el desafío a las asimetrías en el pronunciamiento sobre una realidad traumática proveniente de violaciones graves a los derechos humanos. Podemos pensar en un dato social o anclado que parta de nombrar lo real desde una versión invisibilizada o invalidada por las autoridades o por una porción de la opinión pública, y en mecanismos de procesamiento y visualización de datos que busquen hacer visibles posicionalidades enunciativas cotidianas y símbolos no simbólicos, usualmente abordados desde instrumentos metodológicos etnográficos y/o sociolingüísticos, e igualmente excluidos de las formas tradicionales de análisis de datos.

Por otro lado, desde la archivística los registros que se toman como neutrales u objetivos corren el riesgo de contribuir a una lectura que petrifique lo registrado o lo encasille como un pasado acabado. Ariella Azoulay señala una “actitud instrumental” en la fotografía como archivo, que opera cuando “iconizamos” la imagen, es decir, cuando la cosa o persona que aparecen en una fotografía sustituye al acto del registro que supone la propia fotografía, de modo que se suprime el acto mismo del registro como lugar y práctica de mediación de la realidad, y al hacerlo, se convierte al registro en transparencia, en neutralidad, en objetividad, esto es, cuando se dota al registro de una suerte de soberanía sobre lo real, mediante la cual llega a sustituir lo que registra. La autora nos recuerda entonces que “la fotografía no documenta un concepto o demarca un evento, sino que es más bien un documento, el producto de un evento común para varios participantes” (Azoulay, 2014). Dicho esto, podemos afirmar que al igual que una fotografía, el dato numérico tiende a ser instrumentalizado y su “acto de registro” suprimido cuando se piensa que éste abarca al sujeto cuya práctica está documentando. Para contrarrestar esta actitud instrumental, Azoulay propone llevar a cabo “protocolos iconoclastas” para “destruir” los íconos producidos por las imágenes y restituirles su cualidad de documentos, es decir para situarlos y delimitarlos en tanto registros llevados a cabo en circunstancias históricas y políticas específicas.

Kitchin y Lauriault (2014), desde los ECD, se concentran en los mecanismos que operan como una suerte de bucle o camino entre instituciones, discursos y prácticas sociales con los que los procesos de datificación de la realidad se van concatenando para reproducirse, volverse referentes de sí mismos y consolidar la lectura de la realidad que datifican. Estos "ensamblajes" producen “motores de descubrimiento”, los cuales operan como un engranaje entre el conteo de información que refuerza la legitimidad de la cuantificación como registro válido de la experiencia, la creación de normas y correlaciones “neutrales” a partir de esta cuantificación, la toma de acciones para “cientifizar” todo el procedimiento y la reafirmación de la jerarquía de los hallazgos y de los métodos de datificación en cada ensamblaje. Este modelo resulta útil para estudios que buscan comprender cómo se construyen y entrelazan sistemas de regulación y normalización de la realidad a partir de sus respectivos ensamblajes de datos, pero también es útil para imaginar posibilidades de ensamblajes que partan de una epistemología alternativa de los datos, es decir que no coloquen en el centro la mirada pragmática y falsamente objetiva de la datificación dominante como eje del discurso de verdad que buscan producir. En este sentido, cabe pensar en ensamblajes que no tengan como objetivo calcular o predecir comportamientos, sino evidenciar, por ejemplo, visiones de un aspecto de la realidad sobre el que otro tipo de ensamblajes de datos amplían o consolidan discursos de exclusión o de perpetuación de un tipo de violencia. Se trata de una posible intervención, o profanación, de los efectos de los ensamblajes de datos y de sus motores que cuestione los alcances del registro, problematice los límites de la cuantificación de la experiencia, evidencie sus exclusiones y des-neutralice el recorte de la realidad histórica y políticamente situado que supone todo proceso de datificación de la experiencia.

Estética forense

Forensic Architecture (FA) ha desarrollado un marco conceptual para pensar y abordar las relaciones entré estética y política en investigaciones interdisciplinarias construidas a partir de archivos de violaciones graves a los derechos humanos. La noción de estética forense propuesta por FA coloca ideas clave para tomar en cuenta en una perspectiva conceptual hacia una datificación crítica de la violencia.

Para FA la noción de estética no se puede reducir ni a lo bello ni a la percepción humana, sino que abarca la condición de "sensor" de cualquier cuerpo o material. Los elementos que componen una ciudad, por ejemplo los edificios, funcionan como sensores de impacto de agentes externos (Forensic Architecture, 2017). Vista desde esta lógica, una maqueta es una "deformación material" producto de los impactos registrados por una construcción que atestiguó un acontecimiento. Siguiendo este supuesto, los conjuntos de datos pueden ser concebidos como "sensores" que registran impactos cuya ruta también puede ser focalizada y trazada críticamente, y no sólo medida. Las visualizaciones de datos centradas en la exploración de aspectos cualitativos y en particular en segmentos narrativos y testimoniales de violaciones graves a los derechos humanos resultan, desde esta mirada, "deformaciones materiales" de estos impactos y pueden ser también susceptibles de ejercicios de búsqueda de "señales débiles", referidas a aquellos aspectos que en su condición de elemento en apariencia no central, evidencian "the threshold of visibility, pushing against the flood of obfuscating messages, of dominant narratives, fabricated noise, and attempts at denial" (Weizman, 2014). Las señales débiles en los datos podrían ser conjuntos de signos no simbólicos (como el silencio), enunciaciones cotidianas (menciones a familiares, lugares, momentos del día) en apariencia irrelevantes debido a su familiaridad, o cadenas sintácticas que lleven a identificar encuadres políticos del discurso de un tipo de actores.

Desde estas nociones es posible anclar una datificación crítica de la violencia que siempre está políticamente situada y que se ubica en contextos de relaciones de poder predominantemente asimétricas. Por ello, parte de las indagaciones que resulten de los mecanismos de procesamiento y visualización de datos desde esta aproximación pueden contribuir a la noción de "foro" descrita por FA, la cual radica en que la curaduría de ciertos contenidos o el montaje de este tipo de investigaciones pensado para espacios ajenos a los tribunales judiciales, tiene como objetivo ampliar los escenarios de discusión pública de la información y de las versiones con las que se cuenta de un acontecimiento. En este caso, el montaje de estos contenidos puede contribuir a colocar el foco de atención en un nuevo tipo de "señales débiles" halladas en los datos, relevantes para fines de construcción de memoria histórica. El foro así entendido remite a un espacio donde la audiencia de la investigación tiene valor no sólo como lectora sino como generadora de conversaciones cargadas políticamente para evidenciar y/o impugnar la asimetría en las relaciones de poder en las que estos acontecimientos han tenido lugar.

En conjunto, estos referentes conceptuales permitirán abordar los valores categóricos presentes en registros de violaciones graves a los derechos humanos, así como contribuir a una mirada crítica sobre dichos registros cuya apuesta no sea la de medir la experiencia capturada en ellos.

1

Un artículo resultado de una porción de este apartado está por ser publicado en la revista Signo y Pensamiento, bajo el título: Dimensiones semióticas y políticas del dato. Ruta conceptual y construcción de objetos para una datificación testimonial de la violencia.

Propuesta metodológica. Anclajes metodológicos para una datificación crítica de la violencia

En conexión con la pregunta de investigación, los elementos del marco conceptual y la revisión de la literatura, esta investigación estará basada en métodos mixtos, utilizará herramientas de lingüística de corpus (anclada a una perspectiva cuantitativa del análisis de contenido), métodos biográficos y análisis de la conversación, análisis de redes (anclado a una perspectiva cuantitativa de la ciencia de redes) y análisis crítico del discurso, para ampliar las prácticas de procesamiento, visualización y análisis de conjuntos de datos que contienen registros de violaciones graves a los derechos humanos 1. Si bien se han elegido recursos metodológicos provenientes de aproximaciones cualitativas y cuantitativas, en tanto el foco de análisis está en los valores categóricos de estos registros, la utilización de métodos cuantitativos contribuirá a segmentar y elaborar descripciones particulares del corpus, pero no será el elemento central en el abordaje de los archivos para este estudio. Asimismo, los instrumentos de descarga, procesamiento y visualización de datos han sido seleccionados y diseñados en conexión estrecha con los apartados previos de esta propuesta.

Lingüística de corpus y análisis crítico del discurso

La lingüística de corpus se refiere a una aproximación "al estudio del lenguaje que incluye recolectar grandes cantidades de lenguaje ocurrido de manera natural y la utilización de software especializado que manipula ese lenguaje para obtener información acerca de frecuencias, co-ocurrencias y significado” (Hunston, 2022). Este campo ha desarrollado un amplio repertorio de conceptos y fórmulas para medir frecuencias, identificar y comparar estructuras sintácticas, así como para categorizar usos y orientaciones semánticas en corpus que pueden contener desde algunos cientos hasta millones de palabras.

El desarrollo de herramientas desde la lingüística de corpus ha ido de la mano de preguntas y reflexiones alrededor de las mutaciones en la presentación del propio corpus de estudio en la medida en que tanto los soportes digitales como las herramientas para gestionarlos han desbordado la linealidad de la escritura tradicional. Al respecto, Mayaffre y Poudat (2020) se refieren a formas de lectura "reticulares", "tabulares" e "hipertextuales” mediante procesadores tabulares, hipervínculos de páginas web o incluso visualizaciones de tipo red. Desde está área se han desarrollado conceptos para identificar encuadres políticos en "plantillas" (Longhi, 2021) que identifican aspectos relevantes de un corpus y sirven de puentes entre el análisis de contenido y el análisis crítico del discurso.

El análisis crítico del discurso permite identificar y cuestionar hasta qué punto y en qué situaciones "las estructuras de dominancia están legitimadas por las ideologías de grupos poderosos" (Wodak & Meyer, 2003), así como los procesos de negociación y resistencia que se presentan por parte de distintos actores sociales frente a estas asimetrías en las relaciones de poder ejercidas y sostenidas desde el uso de distintos lenguajes.

Sociolingüística y análisis de la conversación

La sociolingüística y el análisis de la conversación han abordado los elementos no escritos y no verbales que también están cargados de significado en las interacciones cara a cara y en las conversaciones (Clayman & Teas Gill, 2023; Jaspers, 2023). Estos elementos habilitan canales semióticos que desbordan la semántica y la sintaxis. Ambas áreas han producido conceptos y métodos para abordar la semiosis más allá de las palabras.

El análisis de la conversación ha reparado en los "malentendidos" en las interacciones cara a cara, para aproximarse a "la relación entre comportamientos vocales y no vocales" (Clayman & Teas Gill, 2023). Estos malentendidos han sido analizados a la par de aspectos no vocales para construir categorías como "tokens de reconocimiento" y "comunicación por canales de apoyo", para señalar la presencia y el sentido de sonidos, silencios y gestos que no sólo acompañan sino que son en sí la enunciación en un turno de la conversación entre hablantes. Estos elementos semióticos no cumplen con una función interactual secundaria a la oral, sino con una función discursiva desde signos no simbólicos.

La sociolingüística interactual ha señalado que tanto el contexto como lo no dicho en interacciones entre las personas habilitan canales de "significados indexicales", que a su vez portan signos considerados como "pistas de contextualización", que "conducen" el hilo de la interpretación de las palabras (Jaspers, 2023). Con esto se han desarrollado métodos de transcripción de signos no simbólicos que incluyen las constantes modulaciones orales que las personas llevan a cabo en su habla cotidiana (silencios, interrupciones, alargamiento en la pronunciación de sílabas, etc.) (Du Bois et al., 1993). Estas herramientas permiten identificar y categorizar enunciaciones con estas características en los registros seleccionados.

Métodos biográficos y análisis de redes

Los métodos narrativos identifican eventos bisagra y epifanías (o turning points ) como aquellos que marcan "un antes y un después" en una narración y como "momentos críticos" en un relato (Mallimaci & Giménez Béliveau, 2006), así como la pregunta ¿por qué esto ocurre aquí?, como elementos preponderantes en los estudios narrativos. Estas nociones resultan útiles cuando se llevan a cabo indagaciones sintácticas y semánticas para identificar, categorizar y analizar extractos discursivos específicos.

El análisis de redes aborda elementos entendidos como lugares de conexión (nodos) a partir de las relaciones (aristas) que establecen con otras instancias. Para esta investigación, los entes relacionales serán las propias palabras y cadenas sintácticas que componen los testimonios y registros seleccionados. El procesamiento de datos diseñado e implementado para esta investigación permitirá generar archivos tabulares compatibles con software para la visualización y análisis de redes generadas a partir de estos archivos. El foco en las relaciones entre los nodos y no en sus atributos individuales permitirá observar la acumulación y la distribución de poder en una red de interacciones, así como analizar las cualidades y el peso de estas relaciones (Hanneman & Riddle, 2005). Las visualizaciones obtenidas también serán consideradas elementos con carga semiótica propia y no sólo portadores de la semántica de las palabras que las componen.

Descripción general. Selección y recolección del corpus

Los archivos consultados para esta investigación provendrán de comisiones de la verdad, ONG´s y medios de comunicación. La selección de estos archivos dependerá de su disponibilidad en versiones nativas de forma digital, de su accesibilidad pública y de que contengan material testimonial de víctimas y/o sobrevivientes de los conflictos en cada país o descripciones de hechos violentos. El archivo de casos colombianos está compuesto hasta ahora por un testimonio de Luz Marina Bernal (CHARLAS 914, 2024), madre de Leonardo, joven falsamente presentado por las fuerzas armadas colombianas como muerto en combate, por el Volumen testimonial del informe final de la Comisión de la verdad en Colombia (2022a), y por un conjunto de datos aún por determinar. El archivo de casos mexicanos está compuesto hasta ahora por la descripción de los hechos en la base de datos del proyecto Con Copia Oculta (DATACÍVICA & INTERSECTA, 2023) y por dos conjuntos de datos aún por determinar.

Herramientas de obtención y sistematización de datos

Los registros serán descargados del repositorio público al que cada uno pertenezca y procesados, segmentados y visualizados utilizando una o varias de las siguientes herramientas:

  • Whisper
  • Antconc
  • Google colab
  • Libre Office
  • Open Refine
  • Gephi
  • Tableau public

En conjunto, estos métodos y herramientas serán útiles para diseñar e implementar mecanismos de procesamiento y visualización de datos que lleven al tipo de análisis definido en la pregunta y los objetivos de esta propuesta, pues permiten sistematizar, segmentar y hacer exploraciones a modo para los distintos conjuntos de datos y registros que componen el corpus seleccionado; también corresponden con apuestas significativas a nivel doctoral y coinciden con una configuración de un campo novedoso de investigación.

1

Un artículo resultado de una porción de este apartado actualmente está en proceso de dictaminación en una revista de la Universidad Nacional de Colombia.

Índice temático

Resumen de la propuesta

Estado del arte. Aproximaciones críticas a la realidad datificada

  • Estudios Críticos de Datos
    • Énfasis conceptuales en los estudios críticos de datos
    • datificación dominante
  • Visualización y representación crítica de datos
    • Referentes interdisciplinarios: Graficacidades, Epistemología visual. Humanistic data research
    • Métodos digitales y encuadres etnográficos para el análisis de datos
  • Los default del tratamiento estadístico de los datos (disputar los indisputable)
    • Limpieza y normalización de datos
    • Cualidades del razonamiento estadístico
  • Medir lo inconmensurable
    • Registros de violaciones a los derechos humanos y los límites de lo numérico
    • Exploración metodológica para la construcción de memoria histórica
  • El peso político de la datificación de la violencia en Colombia y en México
    • Contextos de crisis de violaciones graves a los ddhh
      • Registros de la violencia
      • Comisiones de la verdad, ONG's, medios alternativos
  • La disputa por el sentido público de los registros de la violencia
    • la experiencia de víctimas y sobrevivientes de la violencia
    • el pasado y el presente de los conflictos
    • las posibilidades de construcción de memoria histórica desde el trauma social
    • identidad nacional, legitimidad institucional y sociedades democráticas

Planteamiento del problema

  • Abrir las infraestructuras de la datificación
    • datificación en contextos latinoamericanos
    • sumar a una conversación y experimentación interdisciplinaria
    • situar epistemológica y políticamente al razanamiento estadístico
    • abordar lo inconmensurable desde aproximaciones centradas en los valores categóricos de los registros
    • contribuir con abordajes críticos a la construcción de memoria histórica en contextos de crisis de violaciones graves a los derechos humanos
  • Problema de investigación
    • pregunta
    • objetivos

Referentes conceptuales. Andamiajes para una datificación crítica de la violencia

  • Dimensiones semióticas -no simbólicas- del dato que registra violencia
    • Semiótica no simbólica
    • El dato y sus registros más allá de lo simbólico
    • Semiótica multimodal
    • La violencia como signo
  • Silencio, escucha y experiencia traumática.
    • gramáticas de lo inaudito
    • escucha radical
    • testimonio, violencia y memoria
  • Archivo y memoria
    • Archivo y repertorio en los estudios de performance
    • Iconización del registro y mal de archivo
    • ensamblajes de datos y máquinas de profanación
  • Estética forense
    • Estética y percepción
    • Sensores de impacto y deformaciones materiales
    • Señales débiles, foro y montaje

Propuesta metodológica. Anclajes metodológicos para una datificación crítica de la violencia

  • Descripción general. Selección y recolección de corpora
    • métodos mixtos
  • Descripción de archivos
    • Colombia
    • México
  • Herramientas de obtención y sistematización de datos. Datificación de textos digitales
  • Lingüística de corpus, análisis de contenido y análisis crítico del discurso
  • Sociolingüística y análisis de la conversación
  • Métodos biográficos y análisis de redes

Diagrama del índice

indicediagrama

Consideraciones éticas y cómo abordarlas

Acceso a la información y normas institucionales

Los datos obtenidos mediante la API de YouTube se rigen por los términos de uso que establece la plataforma, en los cuales se señala la responsabilidad del usuario en tanto este "... maintain reasonable and appropriate administrative, organizational, technical and physical controls designed to ensure the privacy, security, and confidentiality of YouTube data" (YouTube API, s/f).

En cuanto a la información obtenida del informe final de la Comisión de la verdad de Colombia, esta investigación contempla que sea "acompañado del reconocimiento de la Comisión de la Verdad como fuente, citando la URL de dicho contenido y del autor original" (Comisión de la Verdad de Colombia, 2022c). La licencia de uso libre utilizada por la Comisión es la Creative Commons Atribución-No Comercial-Compartir Igual 4.0, la cual permite lo siguiente:

  • “Compartir — copiar y redistribuir el material en cualquier medio o formato
  • Adaptar — remezclar, transformar y construir a partir del material
  • Atribución — Usted debe dar crédito de manera adecuada, brindar un enlace a la licencia, e indicar si se han realizado cambios. Puede hacerlo en cualquier forma razonable, pero no de forma tal que sugiera que usted o su uso tienen el apoyo de la licenciante.
  • No Comercial — Usted no puede hacer uso del material con propósitos comerciales.
  • Compartir Igual — Si remezcla, transforma o crea a partir del material, debe distribuir su contribución bajo la la misma licencia del original.” (creative commons, s/f)

En cuanto a la base de datos del proyecto Con Copia Oculta, el sitio oficial 1 da cuenta del método de obtención y anonimización de datos personales de la documentación original para evitar formas de revictimización o perfilamiento de sujetos, y de las solicitudes de acceso a la información que acompañaron el cotejo de los datos obtenidos.

En el momento en el que los datasets generados y procesados para esta investigación estén en su estado final serán debidamente subidos al repositorio REDCap institucional de la Pontificia Universidad Javeriana 2.

Los datasets que complementen esta investigación seguirán las normas institucionales y los términos de uso correspondientes.

Posicionamiento ético y político

Esta investigación contempla una reflexión constante acerca de las implicaciones políticas de su análisis y de las afirmaciones que provengan de éste. La no revictimización, esto es, la no reafirmación del lugar de sufrimiento y de la falta de agencia de víctimas y sobrevivientes de los casos registrados en la documentación seleccionada es un punto de referencia constante. El lugar de enunciación de esta investigación busca, en cambio, la reivindicación de la memoria colectiva, de la experiencia de sobrevivientes y víctimas y de los lugares cotidianos, entendidos como espacios clave de subjetivación gravemente afectados por la violencia, pero nunca anulados.

Para esta investigación el lugar de la academia es uno histórica y políticamente situado, capaz de brindar elementos analíticos válidos que sirvan para evidenciar, desnaturalizar e impugnar las asimetrías y las formas de dominación en las relaciones de poder en los escenarios que aborda. Los resultados de esta investigación buscarán ser útiles para la conversación pública informada, como insumo académicamente riguroso para la investigación y para distintas instituciones públicas y privadas, y como fuente de recursos para un tipo de memoria histórica alimentada desde los testimonios de quienes han padecido y sobrevivido a la violencia.

Cronograma

  • Junio de 2025. Examen de candidatura.
  • Enero de 2026. Entrega de análisis de corpus de ambos países y profundización de la propuesta teórico-metodológica.
  • Junio de 2026. Estancia de investigación.
  • Diciembre de 2026. Entrega del primer borrador de tesis.
  • Junio 2027. Defensa de tesis.

Referencias

  • Acosta López, M. del R. (2023). Grammars of Listening: Or On the Difficulty of Rendering Trauma Audible. Royal Institute of Philosophy Supplement, 93, 153–170. https://doi.org/10.1017/S1358246123000048
  • Acosta López, M. del R. (2017). Hacia una gramática del silencio: Benjamin y Felman. En Los silencios de la guerra (C. de Gamboa & M. V. Uribe, Eds.; Primera edición). Editorial Universidad del Rosario.
  • Alexander, J. C. (2016). Trauma cultural, moralidad y solidaridad La construcción social del Holocausto y otros asesinatos en masa1. Revista Mexicana de Ciencias Políticas y Sociales, 61(228), 191–210. https://doi.org/10.1016/S0185-1918(16)30045-9
  • Alfonso-Camelo, H., & Chaparro Moreno, L. (2024). Patrones de violencia y de macrocriminalidad: Una categoría en disputa en la justicia transicional colombiana. Análisis Político, 108, 28–54.
  • Ardévol, E. (2017). Big data y descripción densa. Virtualis, 7.
  • Azoulay, A. (2014). Historia potencial y otros ensayos. CONACULTA.
  • Barreneche, C. (2019). Data Corruption: The Institutional Cultures of Data Collection and the Case of a Crime-Mapping System in Latin America. Canadian Journal of Communication, 44(3), 343–350. https://doi.org/10.22230/cjc.2019v44n3a3481
  • Barreneche, C., Lombana Bermúdez, A., & Ramos Martín, J. (2021). Datificación en contextos de corrupción: Imaginarios sociotécnicos y prácticas de resistencia frente a sistemas antipobreza en Colombia. Palabra Clave, 24(3), 1–39. https://doi.org/10.5294/pacla.2021.24.3.4
  • Boyd, D., & Crawford, K. (2012). CRITICAL QUESTIONS FOR BIG DATA: Provocations for a cultural, technological, and scholarly phenomenon. Information, Communication & Society, 15(5), 662–679. https://doi.org/10.1080/1369118X.2012.678878
  • Cairo, A. (2019). How Charts Lie. W. W. Norton & Company, Incorporated.
  • CHARLAS 914. (2024). Luz Marina Bernal: Madre de Soacha que se convirtió en memoria de los Falsos Positivos [Tercer Canal]. https://www.youtube.com/watch?v=mObDZzNpHSA
  • Chudý, T., & Müller, R. (2024). Intermediality, Semiotics, and Media Theory. En J. Bruhn, A. L.-V. Azcárate, & M. De Paiva Vieira (Eds.), The Palgrave Handbook of Intermediality (pp. 253–284). Springer International Publishing. https://doi.org/10.1007/978-3-031-28322-2_18
  • Clayman, S. E., & Teas Gill, V. (2023). Conversation analysis. In The Routledge handbook of discourse analysis (M. Handford & J. P. Gee, Eds.; Second edition). Routledge, Taylor & Francis Group. https://doi.org/10.4324/9781003035244
  • Comisión de la Verdad de Colombia. (2022a). Cuando los pájaros no cantaban. Historias del conflicto armado en Colombia. Volumen testimonial.
  • Comisión de la Verdad de Colombia. (2022b). Hasta la guerra tiene límites: Violaciones de los derechos humanos, infracciones al derecho internacional humanitario y responsabilidades colectivas (Primera edición). Comisión de la Verdad.
  • Comisión de la Verdad de Colombia. (2022c). Legado. Comisión de la verdad. https://www.comisiondelaverdad.co/terminos-y-condiciones-para-el-acceso-y-uso-de-los-contenidos-de-la-plataforma-digital-del-informe
  • creative commons. (s/f). Deed—Atribución/Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional—Creative Commons. Recuperado el 25 de abril de 2025, de https://creativecommons.org/licenses/by-nc-sa/4.0/deed.es
  • Dalton, C. M., & Stallmann, T. (2018). Counter‐mapping data science. Canadian Geographies / Géographies Canadiennes, 62(1), 93–101. https://doi.org/10.1111/cag.12398
  • DATACÍVICA, & INTERSECTA. (2023). Con Copia Oculta. La guerra que cuenta la SEDENA [Dataset]. https://concopiaoculta.org/la-bitacora-de-la-guerra/base-de-datos
  • Desrosières, A. (2011). The politics of large numbers: A history of statistical reasoning (C. Naish, Trad.; Digital repr. 2011). Harvard University Press.
  • Drucker, J. (2020). Visualization and interpretation: Humanistic approaches to display. The MIT Press. -Du Bois, J., Schuetze-Coburn, S., Cumming, S., & Paolino, D. (1993). Outline of Discourse Transcription. In Talking data: Transcription and coding in discourse research (J. A. Edwards & M. D. Lampert, Eds.). Lawrence Erlbaum Associates.
  • Ettlinger, N. (2018). Algorithmic affordances for productive resistance. Big Data & Society, 5(1), 205395171877139. https://doi.org/10.1177/2053951718771399
  • Fairclough, N. (2023). Critical discourse analysis, in The Routledge handbook of discourse analysis (M. Handford & J. P. Gee, Eds.; Second edition). Routledge.
  • Felman, S. (2017). El silencio de Benjamin. En Los silencios de la guerra (C. de Gamboa & M. V. Uribe, Eds.; Primera edición). Editorial Universidad del Rosario.
  • Forensic Architecture (with Universidad Nacional Autónoma de México & Museu d’Art Contemporani de Barcelona). (2017). Forensic Architecture: Hacia una estética investigativa (C. Plasencia, E. Álvarez Romero, & F. Barenblit, Eds.; Primera edición). MACBA, Museu d’Art Contemporani de Barcelona.
  • Gray, J., Gerlitz, C., & Bounegru, L. (2018). Data infrastructure literacy. Big Data & Society, 5(2), 205395171878631. https://doi.org/10.1177/2053951718786316
  • Hanneman, R., & Riddle, M. (2005). Introduction to social network methods.
  • Hepp, A., Jarke, J., & Kramp, L. (2022). “New Perspectives in Critical Data Studies: The Ambivalences of Data Power. Palgrave Macmillan.
  • Hunston, S. (2022). Corpora in Applied Linguistics (2a ed.). Cambridge University Press. https://doi.org/10.1017/9781108616218
  • INEGI. (2025). Defunciones por homicidios. https://www.inegi.org.mx/sistemas/olap/proyectos/bd/continuas/mortalidad/defuncioneshom.asp?s=est
  • Jaspers, J. (2023). Interactional sociolinguistics and discourse analysis. In The Routledge handbook of discourse analysis (M. Handford & J. P. Gee, Eds.; Second edition). Routledge.
  • Kitchin, R. (2022). The data revolution: A critical analysis of big data, open data & data infrastructures (Second edition). Sage Publications.
  • Kitchin, R., & Lauriault, T. P. (2014). Towards critical data studies: Charting and unpacking data assemblages and their work. The Programmable City Working Paper 2.
  • Kress, G., Leite-García, R., & van Leeuwen, T. (2000). Semiótica discursiva. En El discurso como estructura y proceso (T. A. van Dijk, Ed.). Gedisa Editorial.
  • Longhi, J. (2021). Mapping information and identifying disinformation based on digital humanities methods: From accuracy to plasticity. Digital Scholarship in the Humanities, 36(4), 980–998. https://doi.org/10.1093/llc/fqab005
  • Mallimaci, F., & Giménez Béliveau, V. (2006). Historia de vida y métodos biográficos. Estrategias de investigación cualitativa (I. Vasilachis de Gialdino, Ed.; 1. ed). Gedisa Ed.
  • Masson, E. (2017). “Humanistic Data Research” en The datafied society: Studying culture through data. (M. T. Schäfer & K. Van Es, Eds.). Amsterdam University Press.
  • Mayaffre, D., & Poudat, C. (2020). “Quantitative approaches to political discourse: Corpus linguistics and text statistics” in Speaking of Europe. Approaches to complexity in European political discourse (K. Flottum, Ed.). John Benjamins Publishing Company.
  • Mejias, U. A., & Couldry, N. (2019). Datafication. Internet Policy Review, 8(4). https://doi.org/10.14763/2019.4.1428
  • Merry, S. E. (2016). The seductions of quantification: Measuring human rights, gender violence, and sex trafficking. The University of Chicago Press.
  • Milan, S., & Treré, E. (2019). Big Data from the South(s): Beyond Data Universalism. Television & New Media, 20(4), 319–335. https://doi.org/10.1177/1527476419837739
  • Peirce, C. S. (1992). The essential Peirce: Selected philosophical writings. Indiana University Press.
  • Ramos-Martín, J. (2022). Capitalismo informacional desde el Sur. Fetichismo de la información y materialidades de la colonialidad de los datos. Revista Latinoamericana Estudios de la Paz y el Conflicto, 3(6), 58–68. https://doi.org/10.5377/rlpc.v3i6.14051
  • Reguillo, R. (2011). La narcomáquina y el trabajo de la violencia: Apuntes para su decodificación. Hemispheric Institute, Dossier. https://hemisphericinstitute.org/es/emisferica-82/reguillo5.html
  • Ricaurte, P. (2019). Data Epistemologies, The Coloniality of Power, and Resistance. Television & New Media, 20(4), 350–365. https://doi.org/10.1177/1527476419831640
  • Rieder, B. (2015). YouTube Data Tools (Versión 1.42) [Software]. https://ytdt.digitalmethods.net
  • Rodríguez Cano, C. A. (2022). Hypermethods. Repertories of social research in digital environments (PRIMERA EDICIÓN). UNIVERSIDAD AUTÓNOMA METROPOLITANA. https://doi.org/10.24275/9786072824812
  • Rogers, R. (2017). “Foundations of Digital Methods. Query Design” en The datafied society: Studying culture through data. (M. T. Schäfer & K. Van Es, Eds.). Amsterdam University Press.
  • Rogers, R. (2023). Métodos digitales. ITESO.
  • Rouvroy, A., & Berns, T. (2018). Gubernamentalidad algorítmica y perspectivas de emancipación: ¿lo dispar como condición de individuación mediante la relación? http://repositorio.flacsoandes.edu.ec/handle/10469/15424
  • Selwyn, N. (2020). Re-imagining ‘Learning Analytics’ … a case for starting again? The Internet and Higher Education, 46, 100745. https://doi.org/10.1016/j.iheduc.2020.100745
  • Star, S. L. (2002). Infrastructure and ethnographic practice: Working on the fringes. 14.
  • Taylor, D., & Fuentes, M. (Eds.). (2011). Estudios avanzados de performance. Fondo de Cultura Económica. https://www.icmujeres.gob.mx/wp-content/uploads/2020/05/Performance_Butler.pdf
  • Thatcher, J., O’Sullivan, D., & Mahmoudi, D. (2016). Data colonialism through accumulation by dispossession: New metaphors for daily data. Environment and Planning D: Society and Space, 34(6), 990–1006. https://doi.org/10.1177/0263775816633195
  • Uribe, M. V., & Parrini, R. (2020). Introducción. Montajes y fantasmas. En La violencia y su sombra. Aproximaciones desde Colombia y México. Universidad del Rosario y Universidad Autónoma Metropolitana.
  • Weizman, E. (2014). Introduction: Forensis. In Forensis: The architecture of public truth (Forensic Architecture (Project), A. Franke, & Haus der Kulturen der Welt, Eds.). Sternberg Press.
  • Wodak, R., & Meyer, M. (2003). Métodos de análisis crítico del discurso (1. Aufl). Gedisa.
  • Yeung, K. (2018). Algorithmic regulation: A critical interrogation. Regulation & Governance, 12(4), 505–523. https://doi.org/10.1111/rego.12158
  • YouTube API. (s/f). YouTube API Services Terms of Service. Google for Developers. Recuperado el 25 de abril de 2025, de https://developers.google.com/youtube/terms/api-services-terms-of-service