Propuesta metodológica. Anclajes metodológicos para una datificación crítica de la violencia

En conexión con la pregunta de investigación, los elementos del marco conceptual y la revisión de la literatura, esta investigación estará basada en métodos mixtos, utilizará herramientas de lingüística de corpus (anclada a una perspectiva cuantitativa del análisis de contenido), métodos biográficos y análisis de la conversación, análisis de redes (anclado a una perspectiva cuantitativa de la ciencia de redes) y análisis crítico del discurso, para ampliar las prácticas de procesamiento, visualización y análisis de conjuntos de datos que contienen registros de violaciones graves a los derechos humanos ¹. Si bien se han elegido recursos metodológicos provenientes de aproximaciones cualitativas y cuantitativas, en tanto el foco de análisis está en los valores categóricos de estos registros, la utilización de métodos cuantitativos contribuirá a segmentar y elaborar descripciones particulares del corpus, pero no será el elemento central en el abordaje de los archivos para este estudio. Asimismo, los instrumentos de descarga, procesamiento y visualización de datos han sido seleccionados y diseñados en conexión estrecha con los apartados previos de esta propuesta.

Lingüística de corpus y análisis crítico del discurso

La lingüística de corpus se refiere a una aproximación "al estudio del lenguaje que incluye recolectar grandes cantidades de lenguaje ocurrido de manera natural y la utilización de software especializado que manipula ese lenguaje para obtener información acerca de frecuencias, co-ocurrencias y significado” (Hunston, 2022). Este campo ha desarrollado un amplio repertorio de conceptos y fórmulas para medir frecuencias, identificar y comparar estructuras sintácticas, así como para categorizar usos y orientaciones semánticas en corpus que pueden contener desde algunos cientos hasta millones de palabras.

El desarrollo de herramientas desde la lingüística de corpus ha ido de la mano de preguntas y reflexiones alrededor de las mutaciones en la presentación del propio corpus de estudio en la medida en que tanto los soportes digitales como las herramientas para gestionarlos han desbordado la linealidad de la escritura tradicional. Al respecto, Mayaffre y Poudat (2020) se refieren a formas de lectura "reticulares", "tabulares" e "hipertextuales” mediante procesadores tabulares, hipervínculos de páginas web o incluso visualizaciones de tipo red. Desde está área se han desarrollado conceptos para identificar encuadres políticos en "plantillas" (Longhi, 2021) que identifican aspectos relevantes de un corpus y sirven de puentes entre el análisis de contenido y el análisis crítico del discurso.

El análisis crítico del discurso permite identificar y cuestionar hasta qué punto y en qué situaciones "las estructuras de dominancia están legitimadas por las ideologías de grupos poderosos" (Wodak & Meyer, 2003), así como los procesos de negociación y resistencia que se presentan por parte de distintos actores sociales frente a estas asimetrías en las relaciones de poder ejercidas y sostenidas desde el uso de distintos lenguajes.

Sociolingüística y análisis de la conversación

La sociolingüística y el análisis de la conversación han abordado los elementos no escritos y no verbales que también están cargados de significado en las interacciones cara a cara y en las conversaciones (Clayman & Teas Gill, 2023; Jaspers, 2023). Estos elementos habilitan canales semióticos que desbordan la semántica y la sintaxis. Ambas áreas han producido conceptos y métodos para abordar la semiosis más allá de las palabras.

El análisis de la conversación ha reparado en los "malentendidos" en las interacciones cara a cara, para aproximarse a "la relación entre comportamientos vocales y no vocales" (Clayman & Teas Gill, 2023). Estos malentendidos han sido analizados a la par de aspectos no vocales para construir categorías como "tokens de reconocimiento" y "comunicación por canales de apoyo", para señalar la presencia y el sentido de sonidos, silencios y gestos que no sólo acompañan sino que son en sí la enunciación en un turno de la conversación entre hablantes. Estos elementos semióticos no cumplen con una función interactual secundaria a la oral, sino con una función discursiva desde signos no simbólicos.

La sociolingüística interactual ha señalado que tanto el contexto como lo no dicho en interacciones entre las personas habilitan canales de "significados indexicales", que a su vez portan signos considerados como "pistas de contextualización", que "conducen" el hilo de la interpretación de las palabras (Jaspers, 2023). Con esto se han desarrollado métodos de transcripción de signos no simbólicos que incluyen las constantes modulaciones orales que las personas llevan a cabo en su habla cotidiana (silencios, interrupciones, alargamiento en la pronunciación de sílabas, etc.) (Du Bois et al., 1993). Estas herramientas permiten identificar y categorizar enunciaciones con estas características en los registros seleccionados.

Métodos biográficos y análisis de redes

Los métodos narrativos identifican eventos bisagra y epifanías (o turning points ) como aquellos que marcan "un antes y un después" en una narración y como "momentos críticos" en un relato (Mallimaci & Giménez Béliveau, 2006), así como la pregunta ¿por qué esto ocurre aquí?, como elementos preponderantes en los estudios narrativos. Estas nociones resultan útiles cuando se llevan a cabo indagaciones sintácticas y semánticas para identificar, categorizar y analizar extractos discursivos específicos.

El análisis de redes aborda elementos entendidos como lugares de conexión (nodos) a partir de las relaciones (aristas) que establecen con otras instancias. Para esta investigación, los entes relacionales serán las propias palabras y cadenas sintácticas que componen los testimonios y registros seleccionados. El procesamiento de datos diseñado e implementado para esta investigación permitirá generar archivos tabulares compatibles con software para la visualización y análisis de redes generadas a partir de estos archivos. El foco en las relaciones entre los nodos y no en sus atributos individuales permitirá observar la acumulación y la distribución de poder en una red de interacciones, así como analizar las cualidades y el peso de estas relaciones (Hanneman & Riddle, 2005). Las visualizaciones obtenidas también serán consideradas elementos con carga semiótica propia y no sólo portadores de la semántica de las palabras que las componen.

Descripción general. Selección y recolección del corpus

Los archivos consultados para esta investigación provendrán de comisiones de la verdad, ONG´s y medios de comunicación. La selección de estos archivos dependerá de su disponibilidad en versiones nativas de forma digital, de su accesibilidad pública y de que contengan material testimonial de víctimas y/o sobrevivientes de los conflictos en cada país o descripciones de hechos violentos. El archivo de casos colombianos está compuesto hasta ahora por un testimonio de Luz Marina Bernal (CHARLAS 914, 2024), madre de Leonardo, joven falsamente presentado por las fuerzas armadas colombianas como muerto en combate, por el Volumen testimonial del informe final de la Comisión de la verdad en Colombia (2022a), y por un conjunto de datos aún por determinar. El archivo de casos mexicanos está compuesto hasta ahora por la descripción de los hechos en la base de datos del proyecto Con Copia Oculta (DATACÍVICA & INTERSECTA, 2023) y por dos conjuntos de datos aún por determinar.

Herramientas de obtención y sistematización de datos

Los registros serán descargados del repositorio público al que cada uno pertenezca y procesados, segmentados y visualizados utilizando una o varias de las siguientes herramientas:

Whisper
Antconc
Google colab
Libre Office
Open Refine
Gephi
Tableau public

En conjunto, estos métodos y herramientas serán útiles para diseñar e implementar mecanismos de procesamiento y visualización de datos que lleven al tipo de análisis definido en la pregunta y los objetivos de esta propuesta, pues permiten sistematizar, segmentar y hacer exploraciones a modo para los distintos conjuntos de datos y registros que componen el corpus seleccionado; también corresponden con apuestas significativas a nivel doctoral y coinciden con una configuración de un campo novedoso de investigación.