Matriz de Design (Design Matrix):
Na regressão linear, é comum representar os dados de entrada (variáveis independentes) em uma matriz chamada “matriz de design” (design matrix). Nessa matriz, cada linha corresponde a uma observação (amostra) e cada coluna corresponde a uma variável independente. Isso permite que a equação da regressão linear seja escrita de forma mais compacta na forma matricial:
Onde:
- é o vetor das variáveis dependentes.
- é a matriz de design que contém as variáveis independentes.
- é o vetor de coeficientes (incluindo o intercepto e os coeficientes para as variáveis independentes).
- é o vetor de erros aleatórios.
Por exemplo ao calcular a matriz de design em uma regressão linear simples, ela seguir feita da seguinte forma:
Já para no caso de uma regressão linear múltipla, o cálculo da matriz de design seria:
A matriz de design facilita o ajuste de parâmetros, pois permite que você reescreva a equação da regressão linear de forma mais eficiente usando álgebra linear. O objetivo é encontrar os valores de que minimizam a soma dos quadrados dos erros, como mencionado anteriormente.