Função “predict”
A função GaussianNB.predict()
faz parte do módulo sklearn.naive_bayes
do scikit-learn e é usada para fazer previsões de classe em novos dados usando um modelo de classificação Naive Bayes Gaussiano previamente ajustado.
Sintaxe
y_pred = model.predict(X_new)
Parâmetros:
X_new
: Array-like ou matriz esparsa de formato (n_samples, n_features) que representa os novos dados de entrada para os quais queremos fazer as previsões.
Retorno:
y_pred
: Array de formato (n_samples,) contendo as previsões de classe para os dados de entrada fornecidos.
Exemplo:
from sklearn.naive_bayes import GaussianNB
import numpy as np
# Dados de treinamento
X_train = np.array([[1.0, 2.0], [2.0, 3.0], [3.0, 4.0], [4.0, 5.0]])
y_train = np.array([0, 1, 0, 1])
# Dados de teste
X_test = np.array([[1.5, 3.5], [3.5, 6.0]])
# Criando e ajustando o modelo Naive Bayes Gaussiano
model = GaussianNB()
model.fit(X_train, y_train)
# Fazendo previsões nos dados de teste
y_pred = model.predict(X_test)
print(y_pred) # Saída: [0 1]
No exemplo acima, criamos um modelo Naive Bayes Gaussiano e o ajustamos aos dados de treinamento X_train
e y_train
. Em seguida, usamos o modelo ajustado para fazer previsões nas novas amostras X_test
. A função predict()
retorna um array contendo as previsões de classe para as amostras de teste fornecidas.
Conclusão
O algoritmo Naive Bayes Gaussiano calcula as probabilidades de classificação para cada classe com base nas estimativas das médias e desvios padrão das distribuições normais ajustadas aos dados de treinamento. Em seguida, ele atribui a classe com a maior probabilidade como a previsão para cada amostra de teste.
Vale ressaltar que a implementação do algoritmo Naive Bayes Gaussiano no Python não disponibiliza a visualização da tabela de probabilidade, entretanto a linguagem R, por exemplo, têm suporte para isso.