Função “fit”
A função GaussianNB.fit()
faz parte do módulo sklearn.naive_bayes
do scikit-learn e é usada para ajustar um modelo de classificação Naive Bayes Gaussiano aos dados de treinamento. O algoritmo Naive Bayes Gaussiano é apropriado para dados contínuos e assume que as características seguem uma distribuição normal (distribuição gaussiana).
Sintaxe
model.fit(X_train, y_train)
Parâmetros:
-
X_train
: Array-like ou matriz esparsa de formato (n_samples, n_features) que representa as características de treinamento. -
y_train
: Array-like de formato (n_samples,) que representa os rótulos de classe de treinamento.
Exemplo
from sklearn.naive_bayes import GaussianNB
import numpy as np
# Dados de treinamento
X_train = np.array([[1.0, 2.0], [2.0, 3.0], [3.0, 4.0], [4.0, 5.0]])
y_train = np.array([0, 1, 0, 1])
# Criando e ajustando o modelo Naive Bayes Gaussiano
model = GaussianNB()
model.fit(X_train, y_train)
Saída:
Nenhum valor de saída é retornado explicitamente. O método fit()
ajusta o modelo aos dados de treinamento para que ele esteja pronto para fazer previsões.
Conclusão
Durante o processo de ajuste, o modelo estima as médias e os desvios padrão das distribuições normais para cada classe e cada atributo dos dados de treinamento. Essas estimativas são usadas posteriormente para calcular as probabilidades de classificação no momento da previsão. Após o ajuste, o modelo está pronto para ser usado para fazer previsões em novos dados não vistos.