Graph Mind: de fragmentos a conocimiento
Analizamos "The Official CIA Manual of Trickery and Deception". Como toda buena historia de espías, no solo leemos lo obvio: descubrimos la red de conocimiento detrás del texto.
The “Official CIA Manual of Trickery and Deception” es un documento desclasificado décadas después de haber sido escrito. Incluye instrucciones detalladas para distraer, engañar, pasar desapercibido y desaparecer. Técnicas diseñadas para agentes en plena operación.
En este experimento buscamos descifrar las relaciones a lo largo del documento. Para eso lo procesamos, fragmentamos, extraemos entidades y acciones, agrupamos por temas y construimos un grafo semántico: una red que conecta fragmentos según lo que dicen, no según el orden en que aparecen.
No buscamos solo leerlo, sino descifrar la estructura detrás de este manual. Una forma de explorar el documento como si fuera una arquitectura, no una historia.
Este post documenta la primera etapa, conocida como cognitive mapping, que forma parte de un proyecto más grande que iré desvelando en los próximos posts.
Operación semántica
Para intervenir el manual, seguimos una secuencia técnica que permite pasar del PDF original a una red estructurada de relaciones. El proceso tiene tres fases principales:
Procesamiento del documento
Usamos una combinación de reconocimiento óptico de caracteres (OCR) y modelos visuales de lenguaje (VLM) para extraer el texto, incluso en páginas escaneadas, subrayadas o con diagramas. Esto nos permite convertir el PDF en una versión estructurada, lista para ser procesada por modelos de lenguaje.Fragmentación y anotación
Una vez que tenemos las páginas procesadas, dividimos el contenido en fragmentos informativos. Para eso, agrupamos las secciones según su similitud semántica. A cada fragmento le generamos un resumen y extraemos entidades, acciones y temas mediante modelos de lenguaje y técnicas de aprendizaje automático. El resultado: bloques mínimos de información, anotados automáticamente.Construcción del grafo
Con esas unidades generamos un grafo dirigido. Cada nodo representa una entidad o una acción extraída, y las conexiones reflejan relaciones semánticas inferidas: por ejemplo, una acción que vincula dos entidades, o conceptos que coexisten dentro de un mismo fragmento. Un caso concreto: el nodo Manual (entidad) se conecta con Deception Technique (entidad) a través de la acción describes. Ese patrón —entidad–acción–entidad— es la base sobre la que se construye toda la red.
Geometría táctica
Una vez construido el grafo, pasamos de la fase de extracción a la de observación. Ya no trabajamos con fragmentos, sino con nodos y conexiones: entidades, acciones y relaciones distribuidas en una red que expone la estructura interna del documento.
Aplicamos métricas de análisis de red para identificar patrones: nodos con mayor número de conexiones (grado), nodos puente entre distintas secciones (intermediación), o agrupamientos densos que forman comunidades temáticas. Estas mediciones nos permiten detectar zonas de concentración, recorridos posibles y puntos de control dentro del grafo.
No buscamos interpretar el contenido del manual, sino analizar su arquitectura informativa. Qué elementos son centrales, qué relaciones se repiten y cómo se organiza el conocimiento táctico cuando se abstrae de su forma textual.
¿Quién ocupa el centro de la operación?
Encontramos que ciertos nodos, entidades o conceptos, concentran un mayor número de conexiones. Es decir, aparecen repetidamente asociados a otras entidades o acciones.
La CIA es, como era de esperarse, el nodo con mayor grado de conexión (degree), lo que refleja su rol dominante en el manual, no solo como autor o institución, sino como punto de anclaje temático. Le siguen nodos como woman, John Mulholland (el autor del manual), performer, container y Houdini. Estos no son solo nombres o figuras: representan roles funcionales dentro del sistema de engaño que el texto propone.
La métrica de intermediación (betweenness) nos da otra lectura: mide qué nodos actúan como puentes entre distintas partes de la red. La CIA vuelve a aparecer como nodo clave, pero se suman otros menos obvios: KGB, container, pencil, MKULTRA, Spycraft. Entidades que, sin tener tantas conexiones directas, conectan zonas temáticas distintas del grafo.
Este doble análisis nos permite distinguir entre nodos populares (por frecuencia) y nodos estratégicos (por posición estructural). Algunos objetos, como pill, paper o pencil, funcionan como conectores entre técnicas o contextos distintos, revelando su papel operativo más allá de su mención superficial.
Visión satelital
Con el grafo construido, podemos alejarnos del detalle y observar el paisaje general. La red no es uniforme: hay núcleos densamente conectados, regiones periféricas y agrupamientos que responden a afinidades temáticas.
Cada nodo está etiquetado con un tópico detectado automáticamente. El color indica a qué tema pertenece: desde Covert Communication Methods hasta Magic Trick Principles. Estos tópicos no fueron definidos a mano, sino inferidos a partir de la similitud semántica entre fragmentos, lo que da lugar a una taxonomía emergente, no predefinida.
En el siguiente video se muestra cómo se organiza el contenido del manual a escala estructural. Cada nodo corresponde a una entidad o acción extraída, y cada color a un grupo temático estimado automáticamente. Lo que se observa no es una animación decorativa, sino una representación funcional del grafo semántico.
Durante el recorrido se destacan zonas con mayor densidad de conexiones: tópicos centrales como técnicas de espionaje, manipulación de objetos o principios de magia, junto con regiones periféricas que contienen fragmentos más específicos o aislados.
Filtrar por tópico permite observar cómo se distribuyen los temas, cómo se conectan entre sí y qué entidades funcionan como ejes estructurales.
La visualización permite explorar el manual no como una secuencia lineal, sino como un sistema relacional. Un mapa de relaciones construido a partir de fragmentos.
Conclusiones
En esta primera etapa construimos una representación estructurada del manual. Lo fragmentamos, identificamos entidades y acciones, agrupamos por temas y conectamos los fragmentos en un grafo semántico. Después analizamos la topología de este grafo para entender su arquitectura: qué conceptos ocupan posiciones centrales, qué relaciones se repiten y qué patrones emergen a gran escala.
El resultado no es una lectura del contenido, sino una forma de reorganizarlo. Un mapa relacional que permite recorrer el manual desde su estructura interna, no desde su narrativa original.
En la siguiente fase usaremos este grafo como base para un sistema que no solo recupera información, sino que también genera respuestas a partir de ella. La idea es que esta red sirva como interfaz entre el conocimiento estructurado y un modelo de lenguaje, permitiendo recorrer el contenido, hacer preguntas y obtener respuestas que se apoyan en los fragmentos originales.
Clave parcial 1/3: (38.8977° N, 77.0365° W)
Una coordenada no dice mucho por sí sola. Pero toda red empieza con un primer punto.