Resultados SVC - Segmentation-Fault-Machine-Learning/Knowledge GitHub Wiki
Objetivo
Nesta página serão listadas os resultados obtidos através das melhorias executadas no algoritmo de SVC, com kernel
rbf, trocando os parâmetros gamma, C, probability e shrinking, para os 3 plots escolhidos previamente:
- largura flagelo x largura corpo
- largura flagelo x comprimento flagelo
- volume flagelo x volume corpo
Introdução
Os 4 parâmetros escolhidos para se realizar as alterações foram:
- gamma, sendo este o coeficiente do kernel, usado pelos kernels 'rbf', 'poly' e 'sigmoid', variando de 0.01 até 1, sendo o valor default = 1/n_features.
- C, sendo C o valor de penalidade do erro, variando de 0.01 até 1, sendo o default = 1.
- probability, permite ou não estimativas de probabilidade, default = false.
- shrinking, permite ou não usar a heurística de encolhimento, default = true.
Em todos os 3 gráficos, foi aplicada a mesma lógica para a identificação dos valores ótimos, sendo esta lógica ilustrada pelos passos abaixo listados:
- variação de gamma, começando em 0.01 até 1, definindo o valor ótimo para usar nos outros modelos
- variação de C, começando em 0.01 até 1, definindo valor ótimo para usar nos outros modelos
- variação de probability, sendo o valor primeiramente default, e depois true, observando se houve variação
- variação de shrinking, sendo o valor primeiramente default, e depois false, observando
Após realizar as alterações previamente citadas, analisa-se qual o score de cada modelo dada as features previamente definidas.
Resultados Gerais
Features | Gamma(ótimo) | C(ótimo) | Score |
---|---|---|---|
largura flagelo x largura corpo | gamma >= 0.4 | C >= 0.5 | 0.97777 |
largura flagelo x comprimento flagelo | gamma >= 0.1 | C = 0.05 | 0.95555 |
volume flagelo x volume corpo | gamma = 0.01 | C >= 0.3 | 0.93333 |
Obs: Não foi retratado na matriz acima os parâmetros probability e shrinking pois nenhum deles, valor default ou não, apresentou alterações no score dos modelos.
Resultados Individuais
largura flagelo x comprimento flagelo
Mais detalhes sobre este modelo aqui
Gráfico de variação do parâmetro gamma
E a partir deste gráfico, podemos concluir que qualquer gamma, para gamma > 0.05, resulta no mesmo score, portanto, usaremos gamma = 1 nos próximos modelos.
Gráfico de variação do parâmetro C
E a partir deste gráfico, podemos concluir que o valor ótimo de C = 0.05, e este será o valor usado nos próximos modelos.
Gráfico de variação do parâmetro probability
A partir deste gráfico, concluímos que o atributo probability, sendo true ou false, não interfere no score do modelo.
Gráfico de variação do parâmetro shrinking
A partir deste gráfico, concluímos que o atributo shrinking, sendo true ou false, não interfere no score do modelo.
Resultado
Como resultado, fazendo todas as otimizações esperadas, obtivemos como score: 0.95555
volume flagelo x volume corpo
Mais detalhes sobre este modelo aqui
Gráfico de variação do parâmetro gamma
E a partir deste gráfico, podemos concluir que o valor ótimo para gamma é gamma = 0.01, e este valor será usados nos próximos modelos.
Gráfico de variação do parâmetro C
E a partir deste gráfico, podemos concluir que qualquer C, sendo C > 0.3, resulta no score ótimo, então, daqui em diante, usaremos C = 1 para os próximos modelos
Gráfico de variação do parâmetro probability
A partir deste gráfico, concluímos que o atributo probability, sendo true ou false, não interfere no score do modelo.
Gráfico de variação do parâmetro shrinking
A partir deste gráfico, concluímos que o atributo shrinking, sendo true ou false, não interfere no score do modelo.
Resultado
Como resultado, fazendo todas as otimizações esperadas, obtivemos como score: 0.93333
largura flagelo x largura corpo
Mais detalhes sobre este modelo aqui
Gráfico de variação do parâmetro gamma
E a partir deste gráfico podemos concluir que qualquer gamma, sendo gamma >= 0.4, leva ao score ótimo. Portanto, daqui em diante usaremos gamma = 1.
Gráfico de variação do parâmetro C
E a partir deste gráfico podemos concluir que qualquer C, sendo C >= 0.5, leva ao score ótimo. Portanto, daqui em diante usaremos C = 1.
Gráfico de variação do parâmetro probability
A partir deste gráfico, concluímos que o atributo probability, sendo true ou false, não interfere no score do modelo.
Gráfico de variação do parâmetro shrinking
A partir deste gráfico, concluímos que o atributo shrinking, sendo true ou false, não interfere no score do modelo.
Resultado
Como resultado, fazendo todas as otimizações esperadas, obtivemos como score: 0.97777