Resumen
Esta investigación presenta el desarrollo de un modelo predictivo para estimar el éxito
profesional de egresados de Ingeniería de Sistemas e Informática de la Universidad
Nacional del Santa (UNS). Se recopilaron datos académicos (promedio de notas, ciclos
cursados), socioeconómicos (dependencia económica, convivencia familiar) y laborales
(tipo de contrato, certificaciones, relación con la carrera). Tras la limpieza y codificación
de variables, se aplicaron técnicas de oversampling para balancear clases minoritarias y
se entrenaron algoritmos de aprendizaje automático (Random Forest, XGBoost y
MLPClassifier).
Los resultados evidenciaron que Random Forest y XGBoost alcanzaron precisión y macro
F1-score del 100% en los conjuntos de validación y prueba, resultado que, si bien podría
reflejar sobreajuste dada la muestra reducida (n=96), superó ampliamente el umbral del
80% inicialmente propuesto. Además, la importancia de variables subraya que factores
como los estudios de posgrado y las certificaciones pesan más que la nota promedio en la
predicción del éxito. Estos hallazgos confirman la hipótesis de que la conjunción de datos
académicos y socioeconómicos permite anticipar el nivel de éxito, ofreciendo a la UNS
una herramienta de diagnóstico y acción para fortalecer la inserción laboral y la formación
continua de sus estudiantes.