Machine learning: Uma aplicação para a prevenção da Evasão Escolar

Autores

DOI:

https://doi.org/10.33448/rsd-v14i6.49029

Palavras-chave:

Retenção, Evasão, Aprendizado de máquina, Naive bayes, Regressão logística.

Resumo

A retenção de estudantes em disciplinas de matemática perpetua-se como uma preocupação preeminente nas instituições educacionais, constituindo um desafio multifacetado, pois influencia diretamente a eficácia do processo pedagógico e, consequentemente, incita à evasão escolar. O objetivo do presente estudo é apresentar uma aplicação de aprendizagem de máquina na prevenção de evasão escolar. No escopo desta pesquisa, o intento consiste em discernir as probabilidades associadas à aprovação ou reprovação de alunos matriculados em disciplinas de matemática no primeiro semestre letivo, com base em registros históricos de desempenho acadêmico no Instituto Federal do Ceará (IFCE), campus de Fortaleza. A esse propósito, foi aplicado algoritmos de Aprendizagem de Máquina para indicar a probabilidade de um aluno ser aprovado ou reprovado em matemática no primeiro semestre letivo, gerando relatórios que auxiliem a tomada de decisão por parte das coordenações dos cursos em que essa matéria é lecionada. Serão utilizados os algoritmos Regressão Logística e Naive Bayes. Para isso, serão utilizadas bibliotecas disponíveis para a linguagem Python, a saber, Scikit-learn. O resultado esperado é de que os algoritmos de Aprendizagem de Máquina forneçam percepções na tomada de ações pedagógicas e gerenciais acadêmicas preventivas que visem à redução dos índices de reprovação e, consequentemente, a evasão escolar.

Downloads

Os dados de download ainda não estão disponíveis.

Referências

Akamine, C. T. & Yamamoto, R. K. (2009). Estudo dirigido: estatística descritiva. (3ed). Editora Érica.

Batista, A.S. (2015). Regressão Logística: Uma introdução ao modelo estatístico - Exemplo de aplicação ao Revolving Credit. Vida Economica Editorial. Recuperado de https://books.google.com.br/books?id=EtAsCgAAQBAJ.

Brasil. (2018). Lei nº 13.709, de 14 de agosto de 2018. Dispõe sobre a proteção de dados pessoais e altera a Lei nº 12.965, de 23 de abril de 2014 (Marco Civil da Internet).Brasília, DF: Presidência da República. Recuperado de: http://www.planalto.gov.br/ccivil_03/_ato2015-2018/2018/lei/L13709.htm.

Bussab, Wilton de O.; Morettin, Pedro A. (2010). Estatística básica. In: Estatística básica. p. xvi, 540-xvi, 540.

Burkov, A. (2019). The Hundred-Page Machine Learning Book. Ed. Andriy Burkov. ISBN-13: ‎ 978-1999579500.

Chawla, N., Bowyer, K., Hall, L., & Kegelmeyer, W. (2002). SMOTE: Synthetic Minority Over-sampling Technique. Journal of Artificial Intelligence Research (JAIR), 16, 321-357. https://doi.org/10.1613/jair.953

Costa, N. ., Nascimento, M. ., Nascimento, A. C. ., Azevedo, C. ., & Suela, M. . (2024). Classificadores Híbridos Baseados no Naive Bayes Avaliados em Diferentes Níveis de Dependência Entre Variáveis. Enciclopedia Biosfera, 21(47), 47-61. https://conhecer.org.br/ojs/index.php/biosfera/article/view/5749

Creswell, J. W. (2014). Research design: Qualitative, quantitative, and mixed methods approaches. (4th ed.). Sage Publications.

Faceli, K., Lorena, A. C., Gama, J., & Carvalho, A. C. P. de L. F. de. (2011). Inteligência artificial: uma abordagem de aprendizado de máquina. Rio de Janeiro: LTC.

Felizardo, L. F., Gualberto, D. R., & Carrano, D. P. (2024). Redes neurais artificiais em ambientes educacionais: business intelligence aplicado à pedagogia. Caderno Pedagógico, 21(6), e5210. https://doi.org/10.54033/cadpedv21n6-258

Fernández, A., García, S., Herrera, F., Chawla N. V. (2018). SMOTE for Learning from Imbalanced Data: Progress and Challenges, Marking the 15-year Anniversary. Journal of Artificial Intelligence Research, 61, 863-905.

Galdino, M. V. (2018). Modelos probabilísticos e não probabilísticos de classificação binária para pacientes com ou sem demência como auxílio na prática clínica em geriatria [Tese de Doutorado, Universidade Estadual Paulista]. Repositório UNESP.

Géron, A. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. O'Reilly Media.

Gil, A. C. (2017). Como elaborar projetos de pesquisa. (6ed). Editora Atlas.

Hair, Joseph F. et al. (2009). Análise multivariada de dados. Bookman editora.

He, H., & Garcia, E. A. (2009). Learning from imbalanced data. IEEE Transactions on Knowledge and Data Engineering, 21(9), 1263-1284. https://doi.org/10.1109/TKDE.2008.239

Hosmer, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied Logistic Regression (3rd ed.). Wiley.

Janiesch, C., Zschech, P., & Heinrich, K. (2021). Machine learning and deep learning. Electronic Markets, 31, 685–695.

https://doi.org/10.1007/s12525-021-00475-2.

Mckinney, Wes. Python para análise de dados: Tratamento de dados com Pandas, NumPy e IPython. Novatec Editora, 2018.

Melgaço da Silva, L., & Ciasca, M. (2021). história da educação profissional no Brasil: do período colonial ao Governo Michel Temer (1500-2018). Educação Profissional E Tecnológica Em Revista, 5(1), 73-101. https://doi.org/10.36524/profept.v5i1.677

Mendoza Lira, Michelle, Quiroz Muñoz, Javiera, Muñoz Pérez, Daniela, Contreras Pérez, Camila, & Ballesta Acevedo, Emilio. (2023). Conceituações de evasão e retenção escolar segundo uma escola primária no Chile. Cadernos de Pesquisa Educacional , 14 (2), e206. Epub 1 de dezembro de 2023. https://doi.org/10.18861/cied.2023.14.2.3368.

Montgomery, D. C., & Runger, G. C. (2010). Applied Statistics and Probability for Engineers. John Wiley & Sons.

Moore, D. S., McCabe, G. P., & Craig, B. A. (2014). Introduction to the Practice of Statistics (8th ed.). W.H. Freeman and Company.

Morettin, Pedro A.; Singer, Julio M. (2021). Estatıstica e Ciência de Dados. Texto Preliminar, IME-USP.

Müller, A. C. & Guido, S. (2017). Introduction of machine leaning with phyton. Published by O’Reilly Media, Inc.

https://www.nrigroupindia.com/e-book/Introduction%20to%20Machine%20Learning%20with%20Python%20(%20PDFDrive.com%20)-min.pdf.

Pedregosa, F. et al. (2011). Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research, 12, 2825-2830, 2011. https://jmlr.csail.mit.edu/papers/v12/pedregosa11a.html.

Pereira A. S. et al. (2018). Metodologia da pesquisa científica. [free e-book]. Editora da UAB/NTE/UFSM.

Sabry, F. (2023). Naive Bayes Classifier: Fundamentals and Applications [Série Artificial Intelligence]. One Billion Knowledgeable.

Scikit-Learn. (2024). Sklearn.feature_selection.SelectKBest. https://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.SelectKBest.html.

Scikit-Learn. (2024). Scikit-learn: Machine Learning in Python. https://scikit-learn.org/stable/.

Shitsuka et al. (2014). Matemática fundamental para a tecnologia. Editora Érica.

Tanimu, Jesse Jeremiah et al. A machine learning method for classification of cervical cancer. Electronics, 11(3), 463, 2022.

Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.

Van Rossum, G., & Drake, F. L. (2009). Python 3 Reference Manual. Scotts Valley, CA: CreateSpace.

Yin, R. K. (2018). Case study research and applications: Design and methods. (6th ed.). Sage Publications.

Downloads

Publicado

2025-06-17

Edição

Seção

Ensino e Ciências Educacionais

Como Citar

Machine learning: Uma aplicação para a prevenção da Evasão Escolar. Research, Society and Development, [S. l.], v. 14, n. 6, p. e6214649029, 2025. DOI: 10.33448/rsd-v14i6.49029. Disponível em: https://ojs34.rsdjournal.org/index.php/rsd/article/view/49029. Acesso em: 28 jun. 2025.