Bilal Abu-Salih et al (2020)
Rodrigo Molina Ávila
Grafos de Conocimiento - MDS 7205
Presentación sobre Knowledge Graphs - Framework de Embeddings Basado en Credibilidad
Arquitectura completa del sistema para construcción de Knowledge Graphs basados en credibilidad
Identificar las fuentes de datos utilizadas como insumo para el sistema de construcción del grafo de conocimiento.
Datos sociales y discusión política
Conocimiento estructurado y referencial
Contexto y análisis periodístico
Estos recursos alimentan el módulo de Domain Knowledge Acquisition & Pre-processing
El estudio se enfoca en analizar contenido político publicado en Twitter.
API User_timeline
para recolectar publicaciones y metadatos públicos
Eliminación de datos erróneos, redundantes, sin sentido o irrelevantes
Uso de la API lookup
para reemplazar handles por nombres reales
Identificación de usuarios políticamente relevantes mediante menciones y patrones de publicación
Garantizar que el contenido que alimenta el grafo sea semánticamente relevante, confiable y libre de ruido
Representación de entidades del mundo real (obtenidas desde Twitter) en una estructura formal y comprensible por máquinas.
Ontología extendida y adaptada al contexto político australiano
Agrega sinónimos y conceptos semánticamente relacionados
Ej: "politician" → "politico"
Permite interlinking de entidades usando owl:sameAs
Clasificación temática y análisis de sentimiento
Ej: "law, govt and politics" → "presidential elections"
El sistema estructura semánticamente, valida lógicamente y enriquece entidades con conocimiento vinculado de múltiples fuentes
Filtrado de contenido no fidedigno antes de incorporar datos al grafo de conocimiento
Mecanismo que mide credibilidad por dominio temático utilizando características:
Aplicado sobre dataset con usuarios legítimos y spammers
Genera rankings de confianza específicos por dominio
Joanne Ryan (diputada)
Alto índice de credibilidad política
@hamjuku
Bajo índice de credibilidad
Resultados muestran capacidad para distinguir perfiles confiables de usuarios anómalos
Transformación de datos sociales heterogéneos (JSON, CSV, tablas) en modelo RDF
Permite declarar reglas genéricas para convertir estructuras arbitrarias en grafos RDF
Este proceso asegura la uniformización sintáctica y semántica de los datos
Vinculan entidades extraídas a conceptos de ontologías de dominio
Relaciones de equivalencia semántica (owl:sameAs
)
Consolidación de una representación densa, confiable y contextual del conocimiento político
Entidades y relaciones en espacios vectoriales de baja dimensión
Predicción de enlaces, clustering y resolución de entidades
Sustitución de representaciones simbólicas por estructuras matemáticas
Métricas utilizadas para evaluar modelos en experimento de link prediction
Mean Reciprocal Rank
Mean Rank
Precisión en top N
Métrica combinada
Estas métricas permiten validar la efectividad semántica y relacional de los embeddings en la estructura inferida del grafo político
Accuracy
Precision
Recall
F1-Score
Identificó correctamente el 51.4% de hechos verdaderos
Clasificó correctamente el 23% de hechos falsos
Performance robusta al capturar relaciones asimétricas mediante correlación circular
Las propiedades algebraicas de cada modelo inciden directamente en su capacidad para capturar patrones relacionales complejos del grafo político
Resultados de accuracy, precision, recall y f1-score para cada modelo de embeddings. ConvE destaca como el modelo con mejor desempeño general en la tarea de predicción de hechos políticos plausibles dentro del KG.
k=100
KMeans seleccionado por su mayor coherencia semántica en la agrupación de entidades políticas
Evaluación subjetiva de coherencia semántica entre embeddings
Visualización tridimensional de embeddings mediante PCA, mostrando relaciones semánticas entre entidades políticas en el espacio vectorial.
El marco propuesto introduce una arquitectura robusta para la generación de Knowledge Graph Embeddings (KGE) dominiales, anclada en criterios de credibilidad social.
Esta aproximación busca resolver las limitaciones inherentes a los KGs extraídos desde entornos digitales abiertos mediante:
El framework permite construir representaciones de conocimiento político confiables y semánticamente enriquecidas desde fuentes sociales heterogéneas.
Incorporar modelos más expresivos y adaptativos
Profundizar en polarización, posicionamiento ideológico y estilos retóricos
Integrar dimensión temporal en modelización de credibilidad dinámica
Potenciar sentiment analysis en inferencia de entidades y relaciones
Este marco sienta las bases para la construcción de KGs específicos de dominio que integren credibilidad como base epistémica para la incorporación de conocimiento social. Al formalizar entidades, relaciones y usuarios verificados mediante ontologías extendidas y análisis semántico, se fortalece la trazabilidad, reutilización y robustez de los grafos construidos. El resultado es una arquitectura orientada a aplicaciones de análisis político, descubrimiento de conocimiento y evaluación dinámica de fuentes en contextos altamente volátiles como las redes sociales.