Home - PadawanXXVI/projeto_ams GitHub Wiki

🧠 Projeto de Classificação Binária – Predição de Evasão Escolar

Bem-vindo à documentação oficial do projeto de classificação binária de risco de evasão escolar, desenvolvido como parte da disciplina de Aprendizado de Máquina Supervisionado do curso de Tecnologia em Ciência de Dados – Faculdade de Tecnologia e Inovação Senac DF, sob orientação do Prof. Dr. Jairo Simão Santana Melo.


🎯 Objetivo Geral

Desenvolver um modelo supervisionado, baseado em dados reais do ambiente educacional, capaz de prever o risco de evasão escolar a partir da performance e comportamento de estudantes registrados em uma plataforma LMS.

O projeto segue rigorosamente a metodologia CRISP-DM, cobrindo todas as suas fases — do entendimento do negócio até a implantação do modelo final (.pickle).


👥 Autores

  • Anderson de Matos Guimarães
  • Renan Ost

📂 Estrutura da Wiki

Navegue pelos tópicos abaixo para acompanhar detalhadamente o desenvolvimento deste projeto:

🔸 Metodologia CRISP-DM

🧰 Infraestrutura e Execução

📌 Extras


📈 Tecnologias utilizadas

  • Python 3.11
  • pandas, numpy, scikit-learn, matplotlib
  • Algoritmos: RandomForest, SVM, LogisticRegression, Naive Bayes, Gradient Boosting, MLP (rede neural)
  • Ambiente virtual com venv
  • Versionamento com Git + GitHub
  • Modelo final salvo com pickle

📘 Dataset

Students' Academic Performance Dataset (Kaggle)

  • Fonte: Universidade da Jordânia / Kalboard LMS (xAPI)
  • Total de registros: 480 alunos
  • Atributos: demográficos, acadêmicos, comportamentais e participação dos pais
  • Classe original: Class (L, M, H)
  • Transformação para binário: L → 1 (risco de evasão); M/H → 0

🔗 Link para o Dataset no Kaggle


📄 Referências bibliográficas

Amrieh, E. A., Hamtini, T., & Aljarah, I. (2016). Mining Educational Data to Predict Student’s academic Performance using Ensemble Methods. International Journal of Database Theory and Application, 9(8), 119-136.

Amrieh, E. A., Hamtini, T., & Aljarah, I. (2015). Preprocessing and analyzing educational data set using X-API for improving student's performance. IEEE AEECT.


🧭 Como contribuir

Este é um projeto acadêmico de avaliação final. No entanto, colaborações, comentários ou sugestões serão bem-vindas via Issues ou Pull Requests no repositório oficial.