Função histplot

A função histplot() é uma função para criar um histograma, que é uma representação gráfica da distribuição de frequência de uma variável numérica.

Sintaxe:

seaborn.histplot(data, x=None, bins='auto', kde=False, color=None)

Parâmetros principais:

  • data: Obrigatório. O DataFrame ou conjunto de dados que contém a variável numérica a ser plotada no histograma.

  • x: Opcional. Especifica a variável numérica a ser plotada no eixo x. Se não fornecido, o histograma será plotado com base em data.

  • bins: Opcional. Especifica a quantidade de bins (intervalos) a serem usados no histograma. Pode ser um número inteiro, uma sequência de valores representando os limites dos bins ou a string ‘auto’, que usa uma heurística para determinar automaticamente os bins.

  • kde: Opcional. Se True, adiciona uma estimativa da função de densidade do kernel ao histograma, produzindo um gráfico de densidade.

  • color: Opcional. Especifica a cor do histograma.

Exemplo:

import seaborn as sns
import matplotlib.pyplot as plt
 
# Criando um DataFrame de exemplo
base_credit = pd.read_csv("./assets/credit_data.csv")
 
# Plotando o histograma para a coluna "loan"
sns.histplot(x = base_credit["loan"]);

Saída:

A função histplot() é muito útil para visualizar a distribuição de dados numéricos e identificar padrões, outliers e tendências nos dados. Ela é amplamente utilizada em análise exploratória de dados e na compreensão da distribuição dos dados em um conjunto de dados. A opção kde=True pode ser útil para sobrepor uma estimativa de densidade suavizada ao histograma, o que pode fornecer insights adicionais sobre a distribuição dos dados.