Home - PadawanXXVI/projeto_ams GitHub Wiki
🧠 Projeto de Classificação Binária – Predição de Evasão Escolar
Bem-vindo à documentação oficial do projeto de classificação binária de risco de evasão escolar, desenvolvido como parte da disciplina de Aprendizado de Máquina Supervisionado do curso de Tecnologia em Ciência de Dados – Faculdade de Tecnologia e Inovação Senac DF, sob orientação do Prof. Dr. Jairo Simão Santana Melo.
🎯 Objetivo Geral
Desenvolver um modelo supervisionado, baseado em dados reais do ambiente educacional, capaz de prever o risco de evasão escolar a partir da performance e comportamento de estudantes registrados em uma plataforma LMS.
O projeto segue rigorosamente a metodologia CRISP-DM, cobrindo todas as suas fases — do entendimento do negócio até a implantação do modelo final (.pickle
).
👥 Autores
- Anderson de Matos Guimarães
- Renan Ost
📂 Estrutura da Wiki
Navegue pelos tópicos abaixo para acompanhar detalhadamente o desenvolvimento deste projeto:
🔸 Metodologia CRISP-DM
- Fase 1 – Entendimento do Negócio
- Fase 2 – Entendimento dos Dados
- Fase 3 – Preparação dos Dados
- Fase 4 – Modelagem dos Algoritmos
- Fase 5 – Avaliação do Modelo
- Fase 6 – Implantação e Persistência
🧰 Infraestrutura e Execução
📌 Extras
📈 Tecnologias utilizadas
- Python 3.11
- pandas, numpy, scikit-learn, matplotlib
- Algoritmos: RandomForest, SVM, LogisticRegression, Naive Bayes, Gradient Boosting, MLP (rede neural)
- Ambiente virtual com
venv
- Versionamento com Git + GitHub
- Modelo final salvo com
pickle
📘 Dataset
Students' Academic Performance Dataset (Kaggle)
- Fonte: Universidade da Jordânia / Kalboard LMS (xAPI)
- Total de registros: 480 alunos
- Atributos: demográficos, acadêmicos, comportamentais e participação dos pais
- Classe original:
Class
(L, M, H) - Transformação para binário:
L
→ 1 (risco de evasão);M
/H
→ 0
🔗 Link para o Dataset no Kaggle
📄 Referências bibliográficas
Amrieh, E. A., Hamtini, T., & Aljarah, I. (2016). Mining Educational Data to Predict Student’s academic Performance using Ensemble Methods. International Journal of Database Theory and Application, 9(8), 119-136.
Amrieh, E. A., Hamtini, T., & Aljarah, I. (2015). Preprocessing and analyzing educational data set using X-API for improving student's performance. IEEE AEECT.
🧭 Como contribuir
Este é um projeto acadêmico de avaliação final. No entanto, colaborações, comentários ou sugestões serão bem-vindas via Issues ou Pull Requests no repositório oficial.