Resultados SVC - Segmentation-Fault-Machine-Learning/Knowledge GitHub Wiki

Objetivo

Nesta página serão listadas os resultados obtidos através das melhorias executadas no algoritmo de SVC, com kernel
rbf, trocando os parâmetros gamma, C, probability e shrinking, para os 3 plots escolhidos previamente:

  • largura flagelo x largura corpo
  • largura flagelo x comprimento flagelo
  • volume flagelo x volume corpo

Introdução

Os 4 parâmetros escolhidos para se realizar as alterações foram:

  • gamma, sendo este o coeficiente do kernel, usado pelos kernels 'rbf', 'poly' e 'sigmoid', variando de 0.01 até 1, sendo o valor default = 1/n_features.
  • C, sendo C o valor de penalidade do erro, variando de 0.01 até 1, sendo o default = 1.
  • probability, permite ou não estimativas de probabilidade, default = false.
  • shrinking, permite ou não usar a heurística de encolhimento, default = true.

Em todos os 3 gráficos, foi aplicada a mesma lógica para a identificação dos valores ótimos, sendo esta lógica ilustrada pelos passos abaixo listados:

  • variação de gamma, começando em 0.01 até 1, definindo o valor ótimo para usar nos outros modelos
  • variação de C, começando em 0.01 até 1, definindo valor ótimo para usar nos outros modelos
  • variação de probability, sendo o valor primeiramente default, e depois true, observando se houve variação
  • variação de shrinking, sendo o valor primeiramente default, e depois false, observando

Após realizar as alterações previamente citadas, analisa-se qual o score de cada modelo dada as features previamente definidas.

Resultados Gerais

Features Gamma(ótimo) C(ótimo) Score
largura flagelo x largura corpo gamma >= 0.4 C >= 0.5 0.97777
largura flagelo x comprimento flagelo gamma >= 0.1 C = 0.05 0.95555
volume flagelo x volume corpo gamma = 0.01 C >= 0.3 0.93333

Obs: Não foi retratado na matriz acima os parâmetros probability e shrinking pois nenhum deles, valor default ou não, apresentou alterações no score dos modelos.

Resultados Individuais

largura flagelo x comprimento flagelo

Mais detalhes sobre este modelo aqui

Gráfico de variação do parâmetro gamma

gamma variation

E a partir deste gráfico, podemos concluir que qualquer gamma, para gamma > 0.05, resulta no mesmo score, portanto, usaremos gamma = 1 nos próximos modelos.

Gráfico de variação do parâmetro C

c variation

E a partir deste gráfico, podemos concluir que o valor ótimo de C = 0.05, e este será o valor usado nos próximos modelos.

Gráfico de variação do parâmetro probability

probability variation A partir deste gráfico, concluímos que o atributo probability, sendo true ou false, não interfere no score do modelo.

Gráfico de variação do parâmetro shrinking

shrinking variation A partir deste gráfico, concluímos que o atributo shrinking, sendo true ou false, não interfere no score do modelo.

Resultado

Como resultado, fazendo todas as otimizações esperadas, obtivemos como score: 0.95555 comprimento flagelo x largura flagelo

volume flagelo x volume corpo

Mais detalhes sobre este modelo aqui

Gráfico de variação do parâmetro gamma

gamma variation E a partir deste gráfico, podemos concluir que o valor ótimo para gamma é gamma = 0.01, e este valor será usados nos próximos modelos.

Gráfico de variação do parâmetro C

C variation E a partir deste gráfico, podemos concluir que qualquer C, sendo C > 0.3, resulta no score ótimo, então, daqui em diante, usaremos C = 1 para os próximos modelos

Gráfico de variação do parâmetro probability

probability variation A partir deste gráfico, concluímos que o atributo probability, sendo true ou false, não interfere no score do modelo.

Gráfico de variação do parâmetro shrinking

shrinking variation A partir deste gráfico, concluímos que o atributo shrinking, sendo true ou false, não interfere no score do modelo.

Resultado

Como resultado, fazendo todas as otimizações esperadas, obtivemos como score: 0.93333 volume corpo x volume flagelo

largura flagelo x largura corpo

Mais detalhes sobre este modelo aqui

Gráfico de variação do parâmetro gamma

gamma variation E a partir deste gráfico podemos concluir que qualquer gamma, sendo gamma >= 0.4, leva ao score ótimo. Portanto, daqui em diante usaremos gamma = 1.

Gráfico de variação do parâmetro C

C variation E a partir deste gráfico podemos concluir que qualquer C, sendo C >= 0.5, leva ao score ótimo. Portanto, daqui em diante usaremos C = 1.

Gráfico de variação do parâmetro probability

probability variation A partir deste gráfico, concluímos que o atributo probability, sendo true ou false, não interfere no score do modelo.

Gráfico de variação do parâmetro shrinking

shrinking variation A partir deste gráfico, concluímos que o atributo shrinking, sendo true ou false, não interfere no score do modelo.

Resultado

Como resultado, fazendo todas as otimizações esperadas, obtivemos como score: 0.97777

largura corpo x largura flagelo