Fase 1 Entendimento do Negocio - PadawanXXVI/projeto_ams GitHub Wiki
📌 Fase 1 – Entendimento do Negócio
Nesta primeira fase da metodologia CRISP-DM, buscamos compreender profundamente o objetivo do projeto, a realidade educacional envolvida e a importância da evasão escolar como um desafio para instituições de ensino.
🎯 Objetivo do projeto
O objetivo central é construir um modelo preditivo que identifique alunos com alto risco de evasão escolar, utilizando como proxy de evasão a categoria de desempenho “Low” (baixo desempenho), presente na coluna Class
do dataset.
Essa escolha está alinhada com estudos educacionais que relacionam baixo desempenho com aumento da probabilidade de evasão.
🧩 Justificativa da escolha do problema
A evasão escolar é um dos principais desafios enfrentados por sistemas de ensino no Brasil e no mundo. Detectar padrões de comportamento e desempenho que antecedem a evasão pode:
- Melhorar a alocação de recursos pedagógicos
- Aumentar a eficácia de intervenções preventivas
- Reduzir o impacto social e institucional da desistência escolar
🧪 Formulação do problema como aprendizado de máquina
O problema foi modelado como uma tarefa de classificação supervisionada binária, em que o modelo recebe dados de entrada (atributos de comportamento, desempenho e contexto do estudante) e retorna um rótulo binário:
- 1 → Alto risco de evasão (
Class = 'L'
) - 0 → Baixo ou nenhum risco (
Class = 'M'
ou'H'
)
🔍 Definição dos critérios de sucesso
- Técnico: gerar um modelo com acurácia satisfatória e capaz de generalizar para novos dados
- Negócio (educacional): identificar corretamente os estudantes em risco, com menor taxa de falsos negativos
- Científico: utilizar abordagens metodológicas compatíveis com boas práticas em Ciência de Dados
✅ Entregas previstas desta fase
- Definição clara do objetivo e do problema de negócio
- Transformação do problema em uma tarefa de classificação binária
- Escolha da variável-alvo (
Class
) e do critério de risco (L = 1
)