A maior rede de estudos do Brasil

Grátis
11 pág.
MÓDULO 4 - ALUNO

Pré-visualização | Página 1 de 3

ESTATÍSTICA INDUTIVA Regressão e Correlação MÓDULO 4 
 
1 Prof. DSc. Eng. Braitner Lobato – Notas de Aula 02/2013 
 
1. Análise de regressão 
2. Análise de regressão linear 
3. Método dos mínimos quadrados 
4. Correlação 
5. Classificação da correlação 
6. Coeficiente de determinação 
 
1. ANÁLISE DE REGRESSÃO 
 
No cotidiano, muitos experimentos envolvem a medição de uma variável dependente y, que pode ser 
dependente de uma ou mais variáveis independentes, x1, x2, ... , xk. A análise de regressão provê uma 
abordagem estatística para relacionar os dados obtidos a partir de experimentos onde duas ou mais 
quantidades relacionadas são medidas. 
Qual a relação entre a quantidade de combustível e a quilometragem rodada para um determinado 
modelo de carro? Qual a relação entre a renda per capita e o número de homicídios? De que forma a 
resistência mecânica de uma viga de concreto armado se relaciona com a quantidade de carbono do aço 
usado? De que maneira a durabilidade de um equipamento eletrônico se comporta em relação à 
temperatura de funcionamento do seu microchip? 
Nesses exemplos, as variáveis independentes seriam a quantidade de combustível, a renda per capita, a 
quantidade de carbono do aço utilizada e a temperatura de funcionamento do microchip. Elas são 
chamadas de independentes ou regressores, porque são valores de entrada, a partir dos quais se deseja 
obter uma resposta. Já a quilometragem rodada, o número de homicídios, a resistência mecânica da viga 
de concreto armado e a durabilidade do equipamento eletrônico são chamados de variáveis dependentes 
ou respostas, uma vez que elas dependem diretamente da respectiva variável dependente. 
A análise de regressão visa encontrar a melhor relação entre a resposta, variável dependente, Y; e o 
regressor, variável independente, x. Essa relação não é determinística, ou seja, não é exata, logo o mesmo 
valor de x nem sempre fornece o mesmo valor de Y pois nessa relação há componentes aleatórias, 
probabilísticas. A força e a forma em que essa relação se dá podem ser quantificadas por métodos 
apropriados, que serão estudados a seguir, de forma a permitir a previsão de valores da resposta, Y, a 
partir de um dado valor para o regressor, x. 
Como visto anteriormente, a análise de regressão refere-se à relação entre variáveis. No caso da 
relação entre apenas uma variável independente e uma dependente, denomina-se análise de regressão 
simples, Eq. (1). No caso em que há mais de uma variável independente a ser analisada como fator de 
influência na resposta da variável dependente, chama-se de análise de regressão múltipla, Eq. (2). 
Todavia, há também relações na forma de uma função potencial. Dessa forma temos a função de Cobb-
Douglas, Eq. (3); a função exponencial, Eq. (4); e a função logística, Eq. (5). 
 
Y x    
 (1) 
 
1 1 1 2 2 ... k kY x x x       
 (2) 
 
Y x

 (3) 
 
x
Y 
 (4) 
 
xY e



 (5) 
 
 
 
 
 
 
 
ESTATÍSTICA INDUTIVA Regressão e Correlação MÓDULO 4 
 
2 Prof. DSc. Eng. Braitner Lobato – Notas de Aula 02/2013 
 
2. ANÁLISE DE REGRESSÃO LINEAR 
 
No caso de uma única variável independente, a relação pode ser descrita linearmente pelo modelo 
estatístico descrito pela Eq. (1). De forma que 

 e 

são os coeficientes de regressão e

corresponde ao 
erro aleatório que evita que o modelo seja apenas uma equação determinística, conforme a Fig. 1. 
 
1
2
3
4
x
Y


 
Figura 1. Diagrama de dispersão para uma relação linear. 
 
3. MÉTODO DOS MÍNIMOS QUADRADOS 
 
O método mais adotado para ajustar um conjunto de pontos é o Método de Mínimos Quadrados. Este 
método consiste em adotar como estimativa dos parâmetros os valores que minimizem a soma dos 
quadrados dos desvios. Suas principais características são: (i) a soma dos desvios verticais dos pontos em 
relação à reta é zero e (ii) a soma dos quadrados desses desvios é mínima. 
 
A soma mínima dos quadrados dos resíduos é comumente chamada de soma dos quadrados dos erros 
em torno da reta de regressão e pode ser expressa pela Eq. (2), onde a e b são estimadores para 

 e 

. 
 
 
22
1 1
n n
i i ii i
SQE e y a bx
 
    
 (2) 
 
A partir das derivadas de SQE com relação à a e b é possível estimar os coeficientes de regressão 
através das Equações (3) e (4). 
 
  
 
  
 
1 1 11
22
2
1
1 1
n n nn
i i i ii i ii ii
n
n n
ii i ii i
b
n x y x yx x y y
x x n x x
  

 

 

 
  
  
 (3) 
 
1 1
n n
i ii i
y b x
a y bx
n
 

  
  (4) 
 
 
 
 
 
 
 
 
 
 
 
 
ESTATÍSTICA INDUTIVA Regressão e Correlação MÓDULO 4 
 
3 Prof. DSc. Eng. Braitner Lobato – Notas de Aula 02/2013 
 
Exemplo 01. Francisvaldo, empreendedor sagaz, decidiu investigar a relação entre a autonomia de carga 
de um aparelho eletrônico portátil, em horas, e a quantidade de baterias AA utilizadas. O conjunto de 
dados abaixo foi extraído de um experimento aleatório com o propósito de avaliar a relação linear entre a 
variável dependente y, autonomia de carga; e uma variável independente x, quantidade de baterias. Utilize 
o método dos mínimos quadrados para determinar os coeficientes da equação matemática que descreve o 
fenômeno. 
 
x 0 1 2 3 
y 2 5 8 11 
 
 
a) Esboce o diagrama de dispersão dos dados extraídos do experimento aleatório citado. 
 
0
2
4
6
8
10
12
0 1 2 3 4
 
b) Ajuste um modelo de regressão linear simples entre x e y determinando as estimativas do intercepto e 
da inclinação. 
 
 
iX x
 
iY y
 
i iXY x y
 
2 2
iX x
 
2 2
iY y
 
0 2 0 0 4 
1 5 5 1 25 
2 8 16 4 64 
3 11 33 9 121 
X 
6 
Y 
26 
XY 
54 
2X 
14 
2Y 
214 
 
n = 4 
 
 
  
 
2
2
X Y
XY
b
X
X
n
n

 

 



 
 
 
Y b X
a
n

 
  
 
 
Y 
 
 
ESTATÍSTICA INDUTIVA Regressão e Correlação MÓDULO 4 
 
4 Prof. DSc. Eng. Braitner Lobato – Notas de Aula 02/2013 
 
4. CORRELAÇÃO 
 
A correlação é o parâmetro estatístico que mede o grau de relação entre as variáveis. No caso da 
correlação simples entre duas variáveis, o mesmo é denominado de coeficiente de correlação de Pearson, 
rxy, e pode ser determinado matematicamente através das Eqs. (5), (6) e (7). 
 
 
 covariância x,y
desvio padrão (x).desvio padrão (y)
xy
xy
xx yy
r
S
S S
 
 (5) 
 
   
2 2
2 2
1
1 1
xyr
X Y
XY
n n
X Y
X Y
n n n n

 
 
 
   
    
   
   
 

 
 
 (6) 
 
 
   
2 2
22
xyr
X Y
XY
n
X Y
Y
n n
X


   
    
   
  
 

 

 (7) 
 
5. CLASSIFICAÇÃO DA CORRELAÇÃO 
 
 
Negativa
forte
Negativa
fraca
Negativa
moderada
Positiva
fraca
Positiva
forte
Positiva
moderada
-1 +1
-0,5 +0,50
 
 
Figura 2. Classificação do coeficiente de correlação de Pearson 
 
0
5
10
15
20
25
30
0 1 2 3 4 5 6
 
0
5
10
15
20
25
30
0 1 2 3 4 5 6
 
Figura 3. Correlação linear positiva e perfeita: 
1r 
 
Figura 4. Correlação linear negativa e perfeita: 
1r  
 
 
ESTATÍSTICA INDUTIVA Regressão

Crie agora seu perfil grátis para visualizar sem restrições.