Análise dos resultados

Na análise dos resultados de modelos de aprendizado de máquina, várias métricas são utilizadas para avaliar o desempenho do modelo e calcular a distribuição dos resultados, a fim de compreender a consistência do algoritmo. As principais métricas consideradas são: média, desvio padrão, mínima, máxima e coeficiente de variação.

Seguindo as etapas de avaliação vistas anteriormente temos:

Pré-processamento

Para o presente estudo, considerou-se um conjunto de dados normalizado, proporcionando uma base padronizada para a avaliação dos algoritmos.

Modelagem e Inferência

Resultados após o treinamento de diversos algoritmos de aprendizagem de máquina:

ArvoreRandom forestKNNLogisticaSVMRede neural
00.98700.98500.98150.94750.98450.9975
10.98400.98300.98000.94650.98400.9985
20.99050.98450.97950.94700.98650.9970
30.98750.98000.97800.94600.98500.9965
40.98850.98300.98200.94650.98500.9975
50.98900.98700.97800.94650.98450.9975
60.98800.98500.98050.94700.98600.9970
70.98750.98600.98000.94800.98500.9970
80.98700.98250.97950.94650.98400.9955
90.98750.98450.98200.94650.98450.9970
100.98650.98500.97950.94750.98400.9975
110.99000.98150.98250.94800.98450.9970
120.98850.98350.98250.94750.98550.9980
130.98700.98600.97800.94750.98550.9975
140.98400.98450.98100.94850.98300.9960
150.98600.98000.97900.94750.98650.9980
160.98550.98400.98100.94600.98600.9965
170.99050.98450.98000.94700.98650.9970
180.98750.98550.98050.94650.98500.9970
190.98700.98400.97950.94650.98450.9975
200.98500.98350.98200.94650.98400.9975
210.98650.98050.98250.94700.98500.9975
220.98900.98200.97800.94550.98650.9965
230.98700.99000.98100.94650.98750.9965
240.98650.98050.97950.94700.98700.9975
250.98800.98450.97900.94700.98200.9975
260.98800.98350.97700.94750.98400.9970
270.98600.98150.97850.94650.98650.9970
280.98600.98500.97900.94800.98350.9970
290.98800.98400.98050.94650.98650.9965

Pós-processamento

Ao aplicar a função describe ao DataFrame com os resultados, é possível analisar as métricas calculadas:

ArvoreRandom forestKNNLogisticaSVMRede neural
count30.00000030.00000030.00000030.00000030.00000030.000000
mean0.9873000.9838000.9800500.9469500.9850830.997117
std0.0016220.0021760.0015330.0006870.0012800.000611
min0.9840000.9800000.9770000.9455000.9820000.995500
25%0.9865000.9826250.9790000.9465000.9841250.997000
50%0.9872500.9840000.9800000.9470000.9850000.997000
75%0.9880000.9850000.9810000.9475000.9863750.997500
max0.9905000.9900000.9825000.9485000.9875000.998500

Apresentação de Resultados

Com base nas métricas calculadas, pode-se concluir que o modelo de rede neural apresentou o melhor desempenho. Isso é evidenciado pelo menor desvio padrão, indicando menor margem de erro nas classificações. Além disso, a média das classificações da rede neural é a mais alta, indicando maior precisão em relação aos outros modelos.

Implantação do Modelo e Geração de Valor

Esses resultados podem ser usados para selecionar o modelo mais apropriado para a aplicação em questão e para direcionar a otimização futura do modelo visando a obtenção de um desempenho ainda melhor.