1/10
Logo Magister Ciencia de Datos

Grafos de conocimiento de la construcción del conocimiento

Fabrizzio Pezzolla - Rodrigo Molina

Grafos de Conocimiento MDS7205

Presiona ↓ para comenzar
2/10

Introducción

Extensión del proyecto Fondecyt: 11241304

Estudio enfocado en comprender las desigualdades académicas.

Análisis de desigualdades

  • Género
  • Clase social
  • Epistémica
  • Estructural

Importancia crítica

Identificar y abordar estas desigualdades es esencial para construir un sistema académico más equitativo.

ODS 5: Igualdad de Género
3/10

Datos 1 - Origen de Datos

Base de datos Fuente Método de obtención Número (N)
Becarios Portal de Transparencia Descarga directa 3,143
Secundaria Mineduc Webscraping (Selenium) 2,497
Pregrado Contratación de personal + CNA Compilación manual 3,084
Calidad Posgrado Ranking Shanghái Webscraping (JS) 2,112
Calidad Posgrado Ranking QS Exportación CSV 3,077
Perfil Autor Scopus ElSevier API (author_retrieval) 2,712
Perfil Autor Scopus ElSevier API (abstract_retrieval) 16,769
4/10

Implementación de grafo

Esquema Neo4j

Esquema del Grafo

Nodos

  • Becarios: becarios.csv + scopus_author_search.csv
  • Ed. Sec.: secundaria.csv
  • Postgrado: postgrado.csv
  • Rank: qs_rank.csv + shanghai_rank.csv
  • Publication: scopus_author_search.csv

Relaciones

  • ENROLLED_IN: maestra_pregrado_link.csv
  • ENROLLED_IN: maestra_posgrado_link.csv
  • ENROLLED_IN: maestra_secundaria_link.csv
  • HAS_RANK: qs_posgrado_link.csv + shanghai_posgrado_link.csv
  • AUTHORED: scopusid_authorid.csv
5/10

Objetivos del Proyecto

Objetivo General

Explorar relaciones de datos multifuente relacionados a un individuo de interés, en este caso becarios que obtuvieron Becas Chile y Conicyt.

Objetivos Específicos

  • 1

    Identificar la efectividad de la implementación del grafo

  • 2

    Acceder a una interfaz operativa para la exploración de datos

6/10

Metodología

En función de conseguir la exploración de los datos, identificaremos preliminarmente la integridad de datos de nodos en el software Neo4J mediante análisis de grafos de conocimiento.

Metodología Cuantitativa

  • Método: Descriptivo
  • Método: Exploratorio
7/10

Resultados - Efectividad de la Implementación

Consulta

MATCH (b:Becario)-[:ENROLLED_IN]->(prog)
RETURN labels(prog)[0] AS level,
    count(DISTINCT b) AS num
ORDER BY num DESC;

Consulta

MATCH (p:Publication)
RETURN p.anio AS year,
    count(*) AS pubs
ORDER BY year;
8/10

Visualizaciones de Resultados

Visualización Becarios-Relaciones
/* Explore all relationships */ MATCH (b:Becario)-[:ENROLLED_IN]->()
WITH b           // pick one that has school
OPTIONAL MATCH (b)-[r]->(n)
RETURN b,r,n;
Visualización Becarios-Postgrados
/* Scholars with postgrad */ MATCH (b:Becario)-[:ENROLLED_IN]->(:Postgrado)
RETURN b LIMIT 100;
Visualización Completa
/* Detailed scholar */ MATCH (b:Becario)-[:ENROLLED_IN]->(:Postgrado),
    (b)-[:AUTHORED]->(:Publication)
WITH b LIMIT 1
OPTIONAL MATCH (b)-[e]->(pg:Postgrado)-[hr]->(r:Rank)
OPTIONAL MATCH (b)-[a]->(pub:Publication)
RETURN b, e, pg, hr, r, a, pub;
9/10

Conclusiones

Los grafos de conocimiento nos permiten observar desde una perspectiva diferente los datos, permitiendo una exploración más rica y efectiva de la información en múltiples dimensiones.

El abordaje de desigualdades en la academia se beneficia de un análisis integral que considera relaciones transversales entre múltiples fuentes de datos.

La implementación en Neo4J proporcionó una interfaz operativa efectiva para explorar las relaciones complejas entre entidades académicas distintas.

Esta metodología representa un paso significativo para la comprensión sistemática de desigualdades estructurales en sistemas académicos complejos.

Contribución significativa al ODS 5: Igualdad de Género
10/10
Logo Magister Ciencia de Datos

¡Gracias!

Fabrizzio Pezzolla - Rodrigo Molina
Magíster en Ciencia de Datos - MDS7205