Etapas de aprendizagem do algoritmo SVM
A etapa de aprendizado do Support Vector Machine (SVM) é crucial para definir o hiperplano que otimiza a separação das classes de dados. O objetivo é encontrar um hiperplano que maximize a margem entre os vetores de suporte, que são os pontos mais próximos do hiperplano e desempenham um papel fundamental na construção da fronteira de decisão.
Técnicas de Criação do Hiperplano
Existem duas técnicas proeminentes para criar o hiperplano de separação:
Convex Hulls (Envoltória Convexa)
Na abordagem de Convex Hulls, cria-se uma envoltória convexa que abrange os vetores de suporte de cada classe. A menor distância entre essas envoltórias é determinada, e o hiperplano é traçado ao longo da mediatriz dessa distância, garantindo uma margem máxima entre as classes.
Produto Escalar (Dot Product)
O método do Produto Escalar é amplamente empregado na prática. Ele envolve a multiplicação das matrizes das classes para traçar retas parciais que são, então, utilizadas para definir o hiperplano com a maior margem entre essas retas.
A fórmula do Produto Escalar é dada por:
Considerações sobre Erros e Custos
A compreensão dos conceitos de erros e custos é essencial para analisar o funcionamento do SVM.
Observando a imagem acima, podemos identificar registros classificados incorretamente. O SVM se esforça para minimizar esses erros (expressos como distância
Nessa fórmula:
é o vetor de pesos associados aos atributos. representa o termo de penalização por classificações incorretas. elevado: Busca-se uma separação exata das classes, com tolerância mínima para erros. reduzido: Permite-se uma margem maior, priorizando a generalização sobre a precisão absoluta.