Diagramas de dispersão e correlação 1


Variável resposta e explicativa

Considerando a notação de uma função , as variáveis explicativas são chamadas de variáveis independente e pode ser representado por . Já as variáveis resposta são denominados de variáveis dependente,sendo a . Além disso, as variáveis explicativas também são chamados de grau de liberdade, pois são independentes, logo podem assumir qualquer valor dentro dos valores possíveis do conjunto de dados.

Gráfico de dispersão

Um gráfico de dispersão serve para apresentar a relação entre duas variáveis quantitativas onde no eixo x representa a variável explicativa, já no eixo y a variável resposta.

Existem vários formatos de curvas que descrevem a dispersão de um conjunto de valores, tais como:

  • Linear
  • Curvilínea
  • Senoide

Coeficiente de correlação

O coeficiente de correlação linear mede a força e a direção da relação linear entre duas variáveis, geralmente denotadas como “x” e “y”. Este coeficiente varia entre -1 e 1, onde:

  • indica uma correlação positiva perfeita: À medida que “x” aumenta, “y” aumenta linearmente.

  • indica uma correlação negativa perfeita: À medida que “x” aumenta, “y” diminui linearmente.

  • indica nenhuma correlação linear: Não há relação linear entre “x” e “y”.

O cálculo de é feito da seguinte forma:

  1. Calcule as médias de “x” () e de “y” () a partir dos dados disponíveis.

  2. Calcule os desvios de “x” e “y” em relação às suas respectivas médias:

    Para cada par de pontos :

    • Desvio de “x”: .
    • Desvio de “y”: .
  3. Calcule o produto dos desvios de “x” e “y” para cada par de pontos e encontre a média desses produtos:

    • Produto dos desvios: .

    A média dos produtos dos desvios é representada como .

  4. Calcule os desvios padrão de “x” () e de “y” () a partir dos dados disponíveis.

  5. Calcule o coeficiente de correlação linear usando a fórmula:

O valor de obtido indica a força e a direção da relação linear entre “x” e “y”. Se for próximo de 1 ou -1, há uma forte correlação linear positiva ou negativa, respectivamente. Se for próximo de 0, não há uma relação linear clara entre as variáveis.

Em resumo, o coeficiente de correlação linear é uma medida estatística importante para quantificar a relação linear entre duas variáveis e é essencial para o cálculo da reta de regressão de mínimos quadrados.

Referências