Função “fit”

A função GaussianNB.fit() faz parte do módulo sklearn.naive_bayes do scikit-learn e é usada para ajustar um modelo de classificação Naive Bayes Gaussiano aos dados de treinamento. O algoritmo Naive Bayes Gaussiano é apropriado para dados contínuos e assume que as características seguem uma distribuição normal (distribuição gaussiana).

Sintaxe

model.fit(X_train, y_train)

Parâmetros:

  • X_train: Array-like ou matriz esparsa de formato (n_samples, n_features) que representa as características de treinamento.

  • y_train: Array-like de formato (n_samples,) que representa os rótulos de classe de treinamento.

Exemplo

from sklearn.naive_bayes import GaussianNB
import numpy as np
 
# Dados de treinamento
X_train = np.array([[1.0, 2.0], [2.0, 3.0], [3.0, 4.0], [4.0, 5.0]])
y_train = np.array([0, 1, 0, 1])
 
# Criando e ajustando o modelo Naive Bayes Gaussiano
model = GaussianNB()
model.fit(X_train, y_train)

Saída:

Nenhum valor de saída é retornado explicitamente. O método fit() ajusta o modelo aos dados de treinamento para que ele esteja pronto para fazer previsões.

Conclusão

Durante o processo de ajuste, o modelo estima as médias e os desvios padrão das distribuições normais para cada classe e cada atributo dos dados de treinamento. Essas estimativas são usadas posteriormente para calcular as probabilidades de classificação no momento da previsão. Após o ajuste, o modelo está pronto para ser usado para fazer previsões em novos dados não vistos.