Regressão Linear Simples

Para a disciplina de Fundamentos de Estatística por Ronan Soares

Revisão

Dados Brutos
A totalidade dos dados estudados.
Exemplo: o resultado do censo de todas as pessoas de uma cidade.
Variável
Uma característica das observações.
Exemplo: a altura dessas pessoas.

Relacionando Variáveis

Requisitos

  • Variáveis \(x\) e \(y\)
  • Varias observações...
  • Reta: \(x = y\)
x y

Relacionando Variáveis

Mas e agora?

x y

De todas as retas: \(bx + a = y\) qual escolher?

Regressão Linear

Temos
Vários dados correlacionados: \[\{(x_1, y_1), (x_2, y_2), \cdots, (x_n, y_n)\}\]
Queremos
Encontrar uma reta \(bx + a = y\) que relacione esses dados.
Problema
Dificilmente uma reta passa por todos os pontos sem erro...

Regressão Linear

Escolher \(a\) e \(b\) de modo que o erro seja mínimo?

\[b x_1 + a \neq y_1\]

\(e_1 = y_1 - b x_1 - a\)

\[\textnormal{minimizar} \sum_{i = 1}^n e_i\]

Erro negativo anula positivo...

Regressão Linear

Escolher \(a\) e \(b\) de modo que a soma os quadrados dos erros sejam mínimos?

\[\textnormal{minimizar} \sum_{i = 1}^n e_i^2\]

Cálculos

Soma dos erros

\[\sum_{i = 1}^n (y_i - b x_i - a)^2\]

Usando cálculo diferencial descobrimos \(a\) e \(b\):

\[\begin{align*} a &= \bar{y} - b \bar{x}\\ b &= \frac{\sum_{i = 1}^n (x_i - \bar{x})(y_i - \bar{y})}{\sum_{i = 1}^n (x_i - \bar{x})^2} \end{align*}\]

Exemplo

Dados \((x,y)\):

  • (-40, -20)
  • (-20, -20)
  • (10, 15)
  • (30, 25)
  • (40, 40)
x y

Exemplo

Dados \((x,y)\):

  • (-40, -20)
  • (-20, -20)
  • (10, 15)
  • (30, 25)
  • (40, 40)

\[\bar{x} = \frac{-40-20+10+30+40}{5} = 4\]

\[\bar{y} = \frac{-20-20+15+25+40}{5} = 8\]

\[\begin{align*} a &= \bar{y} - b \bar{x}\\ b &= \frac{\sum_{i = 1}^n (x_i - \bar{x})(y_i - \bar{y})}{\sum_{i = 1}^n (x_i - \bar{x})^2} \end{align*}\]

Exemplo

Dados \((x,y)\):

  • (-40, -20)
  • (-20, -20)
  • (10, 15)
  • (30, 25)
  • (40, 40)

\(\bar{x} = 4 \qquad \bar{y} = 8\)

\[\begin{align*} a &= 8 - 4b\\ b &=\frac{\sum_{i = 1}^n (x_i - 4)(y_i - 8)}{\sum_{i = 1}^n (x_i - 4)^2} \end{align*}\]

Exemplo

Dados \((x,y)\):

  • (-40, -20)
  • (-20, -20)
  • (10, 15)
  • (30, 25)
  • (40, 40)

\[\begin{align*} a &= \frac{550}{113}\\ b &= \frac{177}{226} \end{align*}\]

Exemplo

\(a = \frac{550}{113} \qquad b = \frac{177}{226}\)

Equação final:

\[\begin{align*} y&= bx + a\\ &\downarrow\\ y &= \frac{177}{226}x + \frac{550}{113} \end{align*}\]

x y

Conclusão