Buscar

Estatística Aplicada - Capítulo 5: Regressão

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 24 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 24 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 24 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Professor: Hudson T. da Silva – Estatística Aplicada 1 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Professor: Hudson T. da Silva – Estatística Aplicada 2 
OBJETIVO: 
 
Mede o grau de relacionamento entre as variáveis através da apreciação de correlação simples 
e predizer o valor da variável dependente “Y” dado que seja conhecido o valor da variável 
independente “X” por meio da análise de regressão linear simples. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Professor: Hudson T. da Silva – Estatística Aplicada 3 
5. INTRODUÇÃO A ANÁLISE DE CORRELAÇÃO 
 
5.1 Diagrama de Dispersão 
É um gráfico que permite a identificação do possível relacionamento entre variáveis 
consideradas numa análise. 
O diagrama de dispersão consiste basicamente, num “aglomerado” de pontos, distribuídos 
sobre um plano estabelecido por um par de eixos ortogonais: “X” e “Y” cada eixo 
corresponde ao conjunto e valores das variáveis, cuja análise pretende-se realizar. Os pontos 
são a interseções dos valores das variáveis “X” e “Y”, tomadas a partir de seus eixos 
correspondentes. 
Ao fazer um diagrama de dispersão, deve-se ter muito cuidado para não extrair conclusões 
erradas, o diagrama mostra, somente, o relacionamento entre duas variáveis, através da forma 
como se distribuem os pontos. A utilização apenas, do diagrama de dispersão não é suficiente 
para provar que uma variável é causa da outra, ou seja, não prova relação de causalidade. 
Exemplo 1: Dado o quadro abaixo construa o diagrama de dispersão. 
 
X (investimento em 
1.000 reais) 
2 3 4 5 6 7 8 9 10 
Y (Aumento de Vendas 
em 1.000 reais) 
5,2 7,3 8,9 11,0 13,5 15,7 17.2 19.1 21 
 
Para construção do gráfico devemos considerar para cada ponto o seu respectivo par 
ordenado. 
 
 
 
 
 
 
 
 
 
Professor: Hudson T. da Silva – Estatística Aplicada 4 
FIGURA 1: Diagrama de dispersão entre as variáveis investimento e vendas. 
 
 
5.1.2 Coeficiente de Correlação de Pearson 
Um dos aspectos mais importantes ao se estudar variáveis bidimensionais é o de procurar 
dimensionar o quanto elas apresentam-se correlacionadas. Uma das medidas utilizadas é o 
coeficiente de Correlação linear, denotado por “r” ou “r (X,Y)”, que calcula a partir de n pares 
de observações de “X” e de “Y”, o grau de relação linear existente entre as duas variáveis. 
O coeficiente de correlação linear “r” permite que se determine o grau e o sinal da correlação 
entre as variáveis “X” e “Y”, esse coeficiente é uma mediada adimensional do 
relacionamento entre as variáveis (X e Y). 
O coeficiente de correlação linear é dado como a razão entre a covariância e a raiz quadrada 
do produto das variações de X e de Y, simbolicamente: 
 











































YYXX
YYXX
r
.
.
 eq. (1) 
 
Dividindo-se, em (1) o numerador e o denominador por n (n° de observações) podemos 
escrever: 
 
X 0 
4 
8 
12 
16 
20 
24 
0 1 2 3 4 5 6 7 8 9 10 11 
A
u
m
e
n
to
 d
e
 V
e
n
d
a
 (
e
m
 1
.0
0
0
 r
e
a
is
) 
Investimento(em 1.000 reais) 
Y 
Professor: Hudson T. da Silva – Estatística Aplicada 5 
YX SS
YXCov
r
.
),(

 eq. (2) 
Onde: 
n
YYXX
YXCov
 













__
.
),( 
n
XX
S X
 







2
_
 e 
n
YY
SY
 







2
_
 n = n° de observações 
Outra simbologia bastante utilizada é: 
 
YYXX
XY
SS
S
r
.

, eq. (3) 
 
onde: 
  



n
YX
XYS XY
.   
n
Y
YSYY
2
2 
 



n
X
XS XX
2
2 
 
O coeficiente de Correlação Linear é uma medida cujo valor se situa no intervalo 
compreendido pelos valores –1 e +1, ou seja, -1  r  1. A seguir mostraremos os possíveis 
valores de “r” e sua interpretação. 
 
i) 0,7  r  1 - Correlação Forte - Positiva. 
Interpretação: Os valores da variável “Y” crescem com o aumento dos valores da variável 
“X”; há pouca dispersão entre os pontos do diagrama (FIGURA 16). 
 
 
 
Professor: Hudson T. da Silva – Estatística Aplicada 6 
FIGURA 2: Correlação Forte - Positiva 
 
ii) 0,3  r < 0,7 – Correlação Fraca – Positiva 
Interpretação: Os valores de “X” crescem, “Y” também cresce; os pontos do diagrama estão 
mais dispersos (FIGURA 17). 
 
FIGURA 3: Correlação Fraca - Positiva 
 
iii) -0,3 < r < 0,3 - Sem Correlação 
Interpretação: “Y” assumirá qualquer valor, independente do valor da variável “X”; não é 
possível encontrar algum padrão de correlação entre as variáveis (FIGURA 18). 
 
FIGURA 4: Sem Correlação 
X 
x 
X 
Professor: Hudson T. da Silva – Estatística Aplicada 7 
iv) -0,7 < r ≤ -0,3 – Correlação Fraca – Negativa 
Interpretação: Quando os valores de “X” crescem, “Y” decresce; os pontos estão dispersos 
(FIGURA 19). 
 
FIGURA 5: Correlação Fraca - Negativa 
 
 
v) -1  r  -0,7 – Correlação Forte - Negativa 
Interpretação: O valor de “X” cresce, e “Y” decresce; há pouca dispersão entre os pontos 
(FIGURA 20). 
 
FIGURA 6: Correlação Forte - Negativa 
 
 
 
 
 
 
 
x 
X 
Professor: Hudson T. da Silva – Estatística Aplicada 8 
Exemplo 2: A tabela a seguir representa os custos totais de produção de certas quantidades de 
determinado artigo, em cinco observações independentes. Pede-se o coeficiente de pearson e 
interprete o seu resultado. 
 
 
 
 
 
 
 
Para solucionar o problema devemos fazer o uso da equação do “r”. (equação 3) 
1º passo: vamos construir um quadro para obtermos o somatório das parcelas. 
).,,,( 22   YXeYXYX
 
 X Y X
2
 Y
2
 X*Y 
 10 50 100 2500 500 
 15 120 225 14400 1800 
 23 145 529 21025 3335 
 30 200 900 40000 6000 
 37 245 1369 60025 9065 
Somatório 115 760 3.123 137.950 20.700 
 
2º passo: Aplicar as equações: 
  
220.3
5
760115
700.20
.




n
YX
XYSXY
 
   
478
5
115
123.3
22
2 

n
X
XSXX
 
   
430.22
5
760
950.137
22
2 

n
Y
YSYY
 
983.0
430.22478
220.3
.



YYXX
XY
SS
S
r
 
Interpretação: como o valor de r estar dentro do intervalo 0,7  r  1, logo terá uma 
correlação forte positiva. 
 
Quantidade (X) 
em Toneladas 
Custos Totais (Y) 
em U.M 
10 50 
15 120 
23 145 
30 200 
37 245 
PARCELAS 
Professor: Hudson T. da Silva – Estatística Aplicada 9 
5.2 ANÁLISE DE REGRESSÃO 
5.2.1 Introdução 
De uma maneira bastante resumida, podemos dizer que o objetivo da regressão é, no caso em 
que há duas ou mais variáveis envolvidas, estudaro efeito que algumas variáveis exercem nas 
outras, este estudo consistiria na construção e análise de uma relação funcional entre as 
variáveis (ELIAN, 1988). 
Em casos que dispomos de variáveis auxiliares, poderíamos querer estudar o peso em função 
da altura e do sexo, ou ambas. Neste ponto, é importante identificarmos dois tipos de 
variáveis: independentes e dependente. As variáveis independentes são aquelas nas quais 
não temos um particular interesse. Essas variáveis serviram para tentar explicar a 
variabilidade de uma outra variável, a dependente, cujo comportamento desejamos estudar e 
que é a variável de interesse no problema. 
A análise de regressão consistirá, em um método de análise entre a variável independente (X) 
ou as variáveis independentes X1, X2, ..., Xk e a variável dependente (Y). E têm como um dos 
objetivos estabelecer uma possível relação funcional (Matemática), entre elas e, se a relação 
for boa, usar para fazer previsões. 
5.2.2 Modelo de Regressão Linear Simples 
Observando o diagrama de dispersão podemos ter uma idéia do tipo de relação entre as 
variáveis. A natureza da relação pode tomar várias formas, desde uma simples relação linear 
até uma complicada função Matemática. 
Considerando a regressão de “Y” sobre “X”, é de grande interesse obter, a partir dos dados, a 
equação da reta quem represente uma estimativa da verdadeira linha de regressão e sirva, não 
só para descrever a relação entre “X” e “Y”, mas para prever o valor de “Y” quando “X” for 
dado. O modelo de regressão linear simples pode ser interpretado como: 
 
 
 
 
Professor: Hudson T. da Silva – Estatística Aplicada 10 
iii XY   . , eq. (4) 
onde: 
 é o intercepto da reta com o eixo y; 
 é a inclinação da reta e 
i é o erro aleatório de “Y” para observação i. 
Assim, a inclinação  representa a mudança esperada de “Y” por unidade de “X”, isto é, 
representa a mudança de “Y” (tanto positivo quando negativo) para uma particular unidade de 
“X”. Por outro lado,  representa o valor de “Y” quando X = 0, enquanto i representa uma 
variável aleatória que descreve o erro de “Y” para cada observação i. 
A equação de “Y” sobre “X”, onde  e  são os verdadeiros parâmetros, da população, como 
 e  são desconhecidos, obteremos a partir de uma amostra de n pares (Xi, Yi) as estimativas 
dos parâmetros do modelo adotado, que designaremos por “a” e “b”, dessa forma a equação 
abaixo é uma estimativa da verdadeira reta de regressão: 
iî XbaY .
 eq. (5) 
Onde: 
iY
 é o valor da previsão de “Y” para uma observação de “Xi”. 
Xi é o valor de X para cada observação i. 
a
é o estimador de . 
b
é o estimador de  
Portanto para determinar a reta estimada, é necessário obter estimativas dos seus parâmetros 
a
 e 
b
. Diversos métodos têm sido sugeridos para calcular essas estimativas. Segundo o 
método dos mínimos quadrados, o mais utilizado, determinam-se os parâmetros de forma que 
a soma dos quadrados dos desvios seja mínima (MURTEIRA, 1983). 
 
 








n
i
n
i
iii YY
1 1
2
2
= mínimo eq. (6) 
Substituindo-se 
iY
 pela expressão dada em (5), tem-se: 
  ),(.
2
baQXbaY ii 
 
função de 
a
 e 
b
, cujas as condições que minimizam são: 
Professor: Hudson T. da Silva – Estatística Aplicada 11 
 
0


a
Q
 
0


b
Q
 
ou seja: 
  


0..2 ii XbaY
a
Q
 
  


0...2 iii XbaYX
b
Q
 
Efetuando-se a derivação, obtém-se o sistema: 
 
  ii YXbna ..
 eq. (7) 
 
   iiii YXXbXa ...
2
 eq. (8) 
Resolvendo o sistema, ou seja, encontramos os valores de 
a
 e 
b
. 
Primeiro dividiremos todos os termos da equação (7) por n; assim: 
n
Xb
n
na
n
Y ii 

.. 
Lembrando que _
Y
n
Yi

 e _
X
n
X i

 vem: 
__
.XbYa  eq. (9) 
 
Substituindo a equação (9) na equação (8), resolvendo teremos o valor de b: 
 
n
X
X
n
YX
YX
b
i
i
ii
ii
2
2
.
.



 


 ou 
XX
XY
S
S
b 
 eq. (10) 
 
 
 
 
 
 
 
 
 
Professor: Hudson T. da Silva – Estatística Aplicada 12 
Exemplo 3: A tabela a seguir representa os custos totais de produção de certas quantidades de 
determinado artigo, em cinco observações independentes. Pede-se para ajustar uma reta aos 
dados. 
 
 
 
 
 
 
 
Solução: 
Para resolver o problema devemos utilizar a equação (5) iî XbaY . , senda assim, 
devemos encontrar os valores de “a” através da equação (9) __ .XbYa  e de “b” através da 
equação (10) 
XX
XY
S
S
b 
 e depois substituir os valores na equação (5). 
1º passo: vamos construir um quadro para obtermos o somatório das parcelas. 
).,,,( 22   YXeYXYX
 
 X Y X
2
 Y
2
 X*Y 
 10 50 100 2500 500 
 15 120 225 14400 1800 
 23 145 529 21025 3335 
 30 200 900 40000 6000 
 37 245 1369 60025 9065 
Somatório 115 760 3.123 137.950 20.700 
 
2º Passo: Calcular o valor de “b” 
  
220.3
5
760115
700.20
.




n
YX
XYSXY
 
   
478
5
115
123.3
22
2 

n
X
XSXX
 
736401674,6
478
220.3

XX
XY
S
S
b
 
 
Quantidade (X) 
em Toneladas 
Custos Totais (Y) 
em U.M 
10 50 
15 120 
23 145 
30 200 
37 245 
PARCELAS 
Professor: Hudson T. da Silva – Estatística Aplicada 13 
3º Passo: Calcular o valor de “a” 
É necessário que calcule as médias de “X” e “Y” 
152
5
760


n
Y
Y
i
 
23
5
115
_


n
X
X
i
 
Substituir os valores das médias de “b” na equação (9) 
  937238,223736401674,6152.
__
 XbYa
 
Substituindo os valores de “a” e “b” na equação (5)
iî XbaY .
 teremos: 
iî XY 

736,6937,2 solução do problema 
 
 
5.2.3 Testes de Hipótese 
Veremos nesta seção os testes mais utilizados para verificar a existência de regressão. 
 
5.2.3.1 Testes Para a Existência de Regressão 
Conhecida as distribuições dos estimadores, devem-se considerar os seguintes passos visando 
aplicar os testes de hipótese (ELIAN, 1988). 
 
a) Teste T 
 
1º Passo: As Hipóteses: 
Dados que 
iii XY   .
, deve-se testar as hipóteses: 
H0: = 0 (não há regressão) 
H1:  0 (há regressão) 
 
2° Passo: Fixação do nível de significância () e escolha da variável do teste, geralmente usa-
se  = 5% ou  = 10%. 
 
 
Professor: Hudson T. da Silva – Estatística Aplicada 14 
3º Passo: Definir a Região Crítica da Aceitação da Hipótese H0 
Conhecidos os níveis de significância “” e os graus de liberdade, determina-se tais regiões: 
 
 
 RC /2 RA /2 RC 
 
 - t/2 (tabelado) + t/2 (tabelado) 
RA = Região de Aceitação e RC = Região Crítica 
 
4º Passo: Calcular o valor de 
calt
 
Temos que 
XXS
b
Z



 tem distribuição Normal Padrão. Como não conhecemos o 
verdadeiro valor de 2 , deve-se estimá-lo através de S2; daí: 
t calculado dado por: 
XX
calS
S
b
t 
, 
onde: 
XX
XY
S
S
b 
 e 
2
.2



n
SbS
S XYYY 
5º Passo: Conclusão: 
Se -t/2 < tcal < t/2 aceita-se H0, e concluí-se com risco “” que não há regressão. 
Se | tcal | > t/2, rejeita-se H0, e conclui-se que existe regressão. 
 
Exemplo 4: Vamos considerar os dados da aplicação acima para testar a existência de 
regressão utilizando o teste t. 
1º Passo: Hipóteses: 
H0: = 0 (não há regressão) 
H1:  0 (há regressão) 
 
2° Passo: Fixação do nível de significância () = 5% e escolher a variável t com 3 graus de 
liberdade (g.l.) pois n= 5 e g.l. = n – 2. 
Professor: Hudson T. da Silva – Estatística Aplicada 15 
3º Passo: Região Crítica da Aceitação da Hipótese H0 
 
 
 RC /2 RA /2 RC 
 
 - 3,1825 + 3,1825 
RA = Região de Aceitação e RC = Região Crítica 
 
Para encontrar o valor de Ttabelado devemos utilizar a tabela de distribuição t Student, para 
localizar o valor devemos verificar o valor de alfa na coluna ( = 0,05) e o valor do grau de 
liberdade na linha (n – 2), onde g.l = 5-2 = 3 o cruzamento da linha com a coluna será o valor 
de Ttabelado. 
Após consultar o valor na tabela teremos: Ttab.(5%, 3) = 3,1825 
 
Distribuição t de Student 
Graus de 
liberdade 
(GL) 
Área (α) 
0,50 0,25 0,10 0,05 0,025 0,01 0,005 
1 1,00000 2,4142 6,3138 12,706 25,542 63,657 127,32 
2 0,81650 1,6036 2,9200 4,3127 6,2053 9,9248 14,089 
3 0,76489 1,4226 2,3534 3,1825 4,1765 5,8409 7,4533 
4 0,74070 1,3444 2,1318 2,7764 3,4954 4,6041 5,5976 
5 0,72669 1,3009 2,0150 2,5706 3,1634 4,0321 4,7733 
6 0,71756 1,2733 1,9432 2,4469 2,9687 3,7074 4,3168 
... ... ... ... ... ... ... ... 
 
 
 
 
 
 
Professor: Hudson T. da Silva – Estatística Aplicada 16 
4º Passo: Calculo da variável tcal 
t calculado dado por: 
XX
cal
S
S
b
t 
, 
onde: 
736401674,6
478
220.3

XX
XY
S
S
b
 
 
2622032,246
3
)220.3736401674,6(430.22
2
.2 





n
SbS
S XYYY
 
692743,152622032,246 S
 
Então: 
385,9
478
692743,15
736401674,6

XX
cal
S
S
b
t
 
 
385,9calt 
 
5º Passo: Conclusão: 
Se | tcal | > t/2, rejeita-se H0, e conclui-se que existe regressão. 
Como | 9,385| > 3,1825, rejeita-se Ho e concluímos com risco de  = 5% que existe 
regressão. 
 
b) Teste ANOVA ou F 
A existência de regressão pode, ainda, ser verificada através do teste de análise de Variância 
(ANOVA), que considera o comportamento das variações totais, explicada e residuais. Este 
teste é compactado pelo QUADRO 01 (FONSECA, MARTINS e TOLEDO,1991). 
 
QUADRO 01: ANOVA 
Fonte de Variação Soma dos Quadrados (SQ) G.L Q. Médios (QM) Fcal 
Devido à regressão VE = b.SXY 1 QME =b.SXY/1 
Fcal =b.Sxy/S
2 
Resíduo VR = SYY – b.SXY n – 2 
S
2
 = VR/n-2 
Total VT = SYY n – 1 
Professor: Hudson T. da Silva – Estatística Aplicada 17 
Onde: 
i) As hipóteses a serem testadas, são: 
H0: = 0 (não há regressão) 
H1:  0 (há regressão) 
 
ii) Fixação do nível de significância () e escolha da variável do teste, geralmente usa-se  = 
5% ou  = 10%. 
 
iii) Fcal =
2/
1/.
2
2
2
2 

 nVR
VE
S
Sb
n
XY

 é uma variável aleatória com distribuição F de Snedecor 
com 1 grau de liberdade (G.L) no numerador e n-2 graus de liberdade no denominador. 
 
iv) Região Crítica e Região de Aceitação (sob H0) 
 
 
 
 Ftab (1,n-2, ), 
onde: : nível de significância 
RA = Região de Aceitação 
RC = Região Crítica 
 
v) Conclusão 
Se Fcal > F(1,n-2, ), Rejeita-se H0 e conclui-se que existe regressão 
Se Fcal < F(1,n-2, ), Aceita-se H0 e conclui-se que não há regressão 
 
Exemplo 5: Vamos considerar os dados da aplicação acima para testar a existência de 
regressão utilizando o teste F. 
1º Passo: Hipóteses: 
H0: = 0 (não há regressão) H1:  0 (há regressão) 
RA 
RC 
Professor: Hudson T. da Silva – Estatística Aplicada 18 
2° Passo: Fixação do nível de significância () = 5% e escolher a variável Ftabelado com 1 
grau de liberdade no numerador e 3 (n – 2) graus de liberdade no denominador. 
 
3° Passo: Região Crítica e Região de Aceitação (sob H0) 
 
 
 Ftabelado = 10,128 
Para determinar o valor de Ftabelado devemos utilizar a tabela da distribuição F para alfa igual a 
5%. Como o Ftabelado(1, 3) para alfa igual a 0,05, o numerador é igual a 1 (coluna) e o 
denominador é igual a 3 (linha) devemos localizar este valores na tabela e o cruzamento da 
coluna com a linha será o valor do Ftabelado 
Usaremos apenas uma parte da tabela para mostrar o valor de Ftab. Para alfa igual a 5% 
Distribuição F de Snedecor 
 
 
 
O valor de Ftabelado(1,3) = 10,128 
 
 
Denominado
r 
V2 
Numerador (V1) 
1 2 3 
... 
1 161.4 199.5 215.7 ... 
2 18.513 19.000 19.164 ... 
3 10.128 9.552 9.277 ... 
4 7.709 6.944 6.591 ... 
5 6.608 5.786 5.409 ... 
6 5.987 5.143 4.757 ... 
7 5.591 4.737 4.347 ... 
8 5.318 4.459 4.066 ... 
9 5.117 4.256 3.863 ... 
10 4.965 4.103 3.708 ... 
... ... ... ... ... 
Professor: Hudson T. da Silva – Estatística Aplicada 19 
4° Passo: Construir a tabela abaixo para determinar o valor de Fcalculado. 
Fonte de Variação Soma dos Quadrados (SQ) G.L Q. Médios (QM) Fcal 
Devido à regressão VE = 21.691,21339 1 21.691,21339 
Fcal =88,0817
 
Resíduo VR = 738,78661 3 
S
2
 = 246,2622033 
Total VT = 22.430 4 
 
VE = b.SXY = VE = 6,736401674 • 3.220 = 21.691,21339 
VT = SYY = VT = 22.430 
VR = SYY – b.SXY = 22.430 – 21.691,21339 = 738,78661 
QME = VE 
S
2
 = VR/n-2 = 738,78661/3 = 246,2622033 
Fcal = 21.691,21339/246,262203 = 88,0817 
 
5º Passo: Conclusão: 
Se Fcal > F(1,n-2, ), Rejeita-se H0 e conclui-se que existe regressão 
Como Fcal > Ftab, rejeita-se Ho e concluímos com risco de  = 5% que existe regressão. 
 
5.2.4 Coeficiente de Determinação ou Explicação (R
2
) 
Outra maneira de termos uma indicação de que o modelo adotado se ajusta aos dados é 
através do coeficiente de determinação ou de explicação, definido por: 
YY
XX
S
Sb
VT
VE
R
.22  
Variação: 0  R2  1 
Este coeficiente indica o quanto à variação explicada pela regressão representada da variação 
total. 
No caso de R
2
 = 1, todos os pontos se situam sobre a reta de regressão, o ajuste é perfeito. As 
variações de Y são 100% explicadas pelas variações de X, não havendo desvios em torno da 
função estimada (FONSECA, MARTINS, TOLEDO,1991). 
Se R
2
 = 0, as variações de Y são totalmente aleatórias, a variável X não trará nenhuma 
informação sobre a variação Y. 
Professor: Hudson T. da Silva – Estatística Aplicada 20 
Exemplo 6: Considere os dados da aplicação acima e determine o valor de R
2 
 e interprete o 
resultado. 
967,0
430.22
21339,691.212 
VT
VE
R
, este resultado indica que o nosso modelo explica 96,7% da 
variação total deY. 
 
OOBBSSEERRVVAAÇÇÕÕEESS:: 
─ Geralmente quando o valor de R2 é superior ou igual a 90% o modelo é considerado bom 
para se fazer previsão. 
 
─ Existem outros procedimentos para verificar a ser o modelo é considerado ideal ou não, 
porém não será visto nesta unidade. 
 
− No exemplo dado acima com 5 observações apenas é utilizado para efeito didático, na 
prática devemos tomar se possível 30 observações no mínimo. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Professor: Hudson T. da Silva – Estatística Aplicada 21 
 
REFERÊNCIAS: 
ANDERSON, D.R.; SWEENEY, D.J.; WILLIAMS, T.A. Estatística aplicada à 
Administração e Economia. São Paulo: Pioneira, 2002. 
BRUNI, A.L. Estatística Aplicada à Gestão Empresarial. São Paulo: Atlas, 2007. 
CRESPO, A.A. Estatística Fácil. 14º ed. São Paulo: Saraiva, 1996. 
ELIAN, S. N. Análise de Regressão. São Paulo: IME – USP, 1998. 
FONSECA, J.S.; MARTINS, G. A.; TOLEDO, Geraldo Luciano. Estatística Aplicada. 2.ed. 
São Paulo: Atlas; 1991. 
LAPPONI, J.C. Estatística usando Excel. São Paulo: Lapponi; 2000. 
MARTINS, G.A. Estatística Geral e Aplicada. São Paulo: Atlas, 2001. 
MURTEIRA, B.J.F. & BLACK, G.H.J. Estatística Descritiva. Lisboa: Mc Graw – Hill, 
1983. 
SILVA, E.M.; GONÇALVES, V.; MUROLO, A.C.; SILVA, E.M. Estatística para os 
cursos de: Economia, Administração e Ciências Contábeis. 2º ed. V. 1. São Paulo: Atlas, 
1996. 
____________. Estatística para os cursos de: Economia, Administração e Ciências 
Contábeis. 2º ed. V. 2. São Paulo: Atlas, 1997. 
 
 
 
 
 
 
 
 
 
 
Professor: Hudson T. da Silva – Estatística Aplicada 22 
ANEXOS 
Tabela: Valores para distribuição t 
gl 
Nível de Significância (α) 
0,500 0,250 0,100 0,050 0,025 0,010 0,005 0,001 
1 1,0000 2,4142 6,3137 12,706 25,452 63,656 127,32 636,58 
2 0,8165 1,6036 2,9200 4,3027 6,2054 9,9250 14,09 31,60 
3 0,7649 1,4226 2,3534 3,1824 4,1765 5,8408 7,4532 12,924 
4 0,7407 1,3444 2,1318 2,7765 3,4954 4,6041 5,5975 8,6101 
5 0,7267 1,3009 2,0150 2,5706 3,1634 4,0321 4,7733 6,8685 
6 0,7176 1,2733 1,9432 2,4469 2,9687 3,7074 4,3168 5,9587 
7 0,7111 1,2543 1,8946 2,3646 2,8412 3,4995 4,0294 5,4081 
8 0,7064 1,2403 1,8595 2,3060 2,7515 3,3554 3,8325 5,0414 
9 0,7027 1,2297 1,8331 2,2622 2,6850 3,2498 3,6896 4,7809 
10 0,6998 1,2213 1,8125 2,2281 2,6338 3,1693 3,5814 4,5868 
11 0,6974 1,2145 1,7959 2,2010 2,5931 3,1058 3,4966 4,4369 
12 0,6955 1,2089 1,7823 2,1788 2,5600 3,0545 3,4284 4,3178 
13 0,6938 1,2041 1,7709 2,1604 2,5326 3,0123 3,3725 4,2209 
14 0,6924 1,2001 1,7613 2,1448 2,5096 2,9768 3,3257 4,1403 
15 0,6912 1,1967 1,7531 2,1315 2,4899 2,9467 3,2860 4,0728 
16 0,6901 1,1937 1,7459 2,1199 2,4729 2,9208 3,2520 4,0149 
17 0,6892 1,1910 1,7396 2,1098 2,4581 2,8982 3,2224 3,9651 
18 0,6884 1,1887 1,7341 2,1009 2,4450 2,8784 3,1966 3,9217 
19 0,6876 1,1866 1,7291 2,0930 2,4334 2,8609 3,1737 3,8833 
20 0,6870 1,1848 1,7247 2,0860 2,4231 2,8453 3,1534 3,8496 
21 0,6864 1,1831 1,7207 2,0796 2,4138 2,8314 3,1352 3,8193 
22 0,6858 1,1815 1,7171 2,0739 2,4055 2,8188 3,1188 3,7922 
23 0,6853 1,1802 1,7139 2,0687 2,3979 2,8073 3,1040 3,7676 
24 0,6848 1,1789 1,7109 2,0639 2,3910 2,7970 3,0905 3,7454 
Professor: Hudson T. da Silva – Estatística Aplicada 23 
25 0,6844 1,1777 1,7081 2,0595 2,3846 2,7874 3,0782 3,7251 
26 0,6840 1,1766 1,7056 2,0555 2,3788 2,7787 3,0669 3,7067 
27 0,6837 1,1756 1,7033 2,0518 2,3734 2,7707 3,0565 3,6895 
28 0,6834 1,1747 1,7011 2,0484 2,3685 2,7633 3,0470 3,6739 
29 0,6830 1,1739 1,6991 2,0452 2,3638 2,7564 3,0380 3,6595 
30 0,6828 1,1731 1,6973 2,0423 2,3596 2,7500 3,0298 3,6460 
31 0,6825 1,1723 1,6955 2,0395 2,3556 2,7440 3,0221 3,6335 
32 0,6822 1,1716 1,6939 2,0369 2,3518 2,7385 3,0149 3,6218 
33 0,6820 1,1710 1,6924 2,0345 2,3483 2,7333 3,0082 3,6109 
34 0,6818 1,1703 1,6909 2,0322 2,3451 2,7284 3,0020 3,6007 
35 0,6816 1,1698 1,6896 2,0301 2,3420 2,7238 2,9961 3,5911 
36 0,6814 1,1692 1,6883 2,0281 2,3391 2,7195 2,9905 3,5821 
37 0,6812 1,1687 1,6871 2,0262 2,3363 2,7154 2,9853 3,5737 
38 0,6810 1,1682 1,6860 2,0244 2,3337 2,7116 2,9803 3,5657 
39 0,6808 1,1677 1,6849 2,0227 2,3313 2,7079 2,9756 3,5581 
40 0,6807 1,1673 1,6839 2,0211 2,3289 2,7045 2,9712 3,5510 
41 0,6805 1,1669 1,6829 2,0195 2,3267 2,7012 2,9670 3,5443 
42 0,6804 1,1665 1,6820 2,0181 2,3246 2,6981 2,9630 3,5377 
43 0,6802 1,1661 1,6811 2,0167 2,3226 2,6951 2,9592 3,5316 
44 0,6801 1,1657 1,6802 2,0154 2,3207 2,6923 2,9555 3,5258 
45 0,6800 1,1654 1,6794 2,0141 2,3189 2,6896 2,9521 3,5203 
46 0,6799 1,1651 1,6787 2,0129 2,3172 2,6870 2,9488 3,5149 
47 0,6797 1,1647 1,6779 2,0117 2,3155 2,6846 2,9456 3,5099 
48 0,6796 1,1644 1,6772 2,0106 2,3139 2,6822 2,9426 3,5050 
49 0,6795 1,1642 1,6766 2,0096 2,3124 2,6800 2,9397 3,5005 
50 0,6794 1,1639 1,6759 2,0086 2,3109 2,6778 2,9370 3,4960 
 
 
 
 
 
 
Professor: Hudson T. da Silva – Estatística Aplicada 24 
 
Fonte: FONSECA, J.S.; MARTINS, G. A.; TOLEDO, Geraldo Luciano. Estatística Aplicada. 2.ed. São Paulo: 
Atlas; p. 264; 1991.

Outros materiais

Outros materiais