Regressão Linear - Segmentation-Fault-Machine-Learning/Knowledge GitHub Wiki
Introdução
Regressão Linear é o tipo mais básico de regressão e o que é usado com mais frequência para análise de predição, um modelo estatístico que examina a relação linear entre duas variáveis (regressão linear simples) ou mais (regressão linear múltipla), sendo essas duas variáveis: uma variável dependente e variáveis independentes. O relacionamento linear basicamente significa que quando uma (ou mais) variáveis independentes aumenta (ou diminui), a variável dependente aumenta (ou diminui) também.
O objetivo principal desta regressão é analisar algumas perguntas, como:
O modelo que usa as predições é responsável pela variabilidade nas mudanças na variável dependente? Quais variáveis em particular são predições significativos da variável dependente e de que maneira eles influenciam está variável? Qual é a equação de regressão que mostra como o conjunto de variáveis preditas que pode ser usado para prever o resultado?
A forma mais simples da equação com uma variável dependente e uma independente é definida pela fórmula y = c + b * x + ε; onde y é índice dependente estimado, c é constante, b é coeficientes de regressão, x é a variável independente e o ε descreve o componente aleatório da relação linear entre x e y.
Regressão Linear Simples
A Regressão Linear Simples, a forma mais simples de uma análise de regressão, usa uma variável dependente e uma variável independente. Neste modelo simples, uma linha reta aproxima a relação entre a variável dependente e a variável independente e nos permite resumir e estudar relações entre duas variáveis contínuas (quantitativas) x e y, que conseguimos através da fórmula mostrada na introdução (y = c + b * x + ε):
-
Uma variável, chamada x, é considerada como a variável preditora, explicativa ou independente
-
A outra variável, chamada y, é considerada como o resultado ou variável dependente.
Regressão Linear Múltipla
A Regressão Linear Múltipla é a forma mais comum de análise de regressão linear. Como análise preditiva, a regressão linear múltipla é usada para explicar a relação entre uma variável dependente contínua de duas ou mais variáveis independentes. As variáveis independentes podem ser contínuas ou categóricas.