Predicción del rendimiento académico mediante algoritmos de machine learning en la Institución Educativa N° 00804 - Moyobamba

Loading...
Thumbnail Image

Date

2024-11-28

Journal Title

Journal ISSN

Volume Title

Publisher

Universidad Nacional de San Martín. Fondo Editorial

Abstract

Predicción del rendimiento académico mediante algoritmos de machine learning en la Institución Educativa N° 00804 - Moyobamba. La investigación Aplicar algoritmos de machine learning para predecir el rendimiento académico en la Institución Educativa N° 00804 - Moyobamba. El estudio fue de tipo aplicado, nivel descriptivo - predictivo y diseño metodológico no experimental. La población compuesta por 1524 estudiantes, la muestra fue dada por conveniencia con total de 1182 estudiantes. La técnica fue el análisis documental y el instrumento la ficha de datos. Mediante procedimientos de ETL se consolidó un dataset robusto, estableciendo factores como "Sexo", "Situación de matrícula", "Comportamiento", "Lengua materna", "Segunda lengua", “Escolaridad de la madre”, "Educación cívica", "Ciencias sociales", "Educación para el trabajo", "Educación física", "Comunicación", "Arte", "Inglés", "Matemáticas", "C.T.A" y "Educación religiosa" el cual son influyentes dentro del rendimiento académico. Seguidamente se analizaron 7 algoritmos, siendo: J48, Random Forest, Vecinos Mas Cercanos, Función Logística, Perceptrón Multicapa, Maquina de Soporte de Vectores y Naive Bayes desempeñándose con mayor efectividad el algoritmo SVM. Se construyó un modelo capaz de predecir en un 97.6% el rendimiento académico, además esto fue corroborado con la prueba estadística Chi-cuadrado de Pearson con valor de 1175.697 (p=0.000), pudiendo aceptar la hipótesis alterna de la investigación.
Prediction of academic performance using machine learning algorithms at Institución Educativa N° 00804 - Moyobamba. The research applied machine learning algorithms to predict academic performance at Educational Institution No. 00804 - Moyobamba. The study was of an applied nature, with a descriptive-predictive level and a non-experimental methodological design. The population consisted of 1524 students, with a convenience sample totaling 1182 students. The technique used was documentary analysis, and the instrument employed was a data sheet. Through ETL procedures, a robust dataset was consolidated, establishing factors such as "Sex", "Enrollment status", "Behavior", "Native language", "Second language", "Mother's education level", "Civic education", "Social sciences", "Vocational education", "Physical education", "Communication", "Art", "English", "Mathematics", "Science, Technology, and Environment (C.T.A)", and "Religious education" as influential factors in academic performance. Subsequently, 7 algorithms were analyzed, namely: J48, Random Forest, k-Nearest Neighbors, Logistic Regression, Multilayer Perceptron, Support Vector Machine, and Naive Bayes, with the SVM algorithm performing most effectively. A model capable of predicting academic performance with 97.6% accuracy was constructed, and this was further validated by the Pearson chi-square statistical test with a value of 1175.697 (p=0.000), allowing for the acceptance of the research's alternative hypothesis.

Description

Keywords

Predicción, Rendimiento académico, Algoritmos, Machine learning

Citation

Garcia-Casaverde, J. P. (2024). Predicción del rendimiento académico mediante algoritmos de machine learning en la Institución Educativa N° 00804 - Moyobamba. Tesis para optar el grado de Maestro en Ciencias con mención en Tecnología de la Información. Facultad de Ingeniería de Sistemas e Informática, Universidad Nacional de San Martín, Tarapoto, Perú.