Buscar

Introdução à Correlação e Regressão

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 9 páginas

Prévia do material em texto

•s :v
iff ill
® • \ mig
• V:- S' :
ats* ®#i
-i S'
VÍ1a mm:ir§ s a e
8$d* 0|8AJ9)U|
m MMi-s-f ti mm 11•g-; •8 - li?
®Sslit*B "S B ST 8IS miife/s9dl 0|QAI31U|
a: .-allll.» .- a l'if;|-r ' '
” lllSlfl
iiSliliSl
i mmillê:ll
1JT 5 3
sods nj®Aia»u|
I í.
Correlação e Regressão 411
I 10-1 Visão Geral
É Este capítulo introduz métodos para se fazerem inferências sobrea correlação (ou relação) entre
B duas variáveis e para a descrição dessa relação através de uma equação que possa ser usada para
U se prever o valor de uma variável dado o valor da outra. Consideramos dados amostrais que vêmj§ mpares- A Seção94 usou também dados emparelhados, mas o objetivo era fundamentalmente
fe:diferente. As inferências na Seção 94 tratavam da média das diferenças entre pares de valores,
gif/jjias este capítulo tem por objetivo as inferências sobre a relação entre duas variáveis.
A Seção 10-2 introduz a relação entre duas variáveis. A Seção 10-3 introduz a análise de
J regressão, que nos permite descrever a relação através de uma equação. Na Seção 10-4, ana-
I lisamos diferenças entre valores previstos e valores reais observados. As Seções 10-2 a 104
fc; envolvem relações entre duas variáveis, mas a Seção 10-5 introduz a regressão múltipla paraI; relações entre três ou mais variáveis. Finalmente, na Seção 10-6 descrevemos alguns métodos
|básicos para o desenvolvimento de um modelo matemático que possa ser usado para a descri-
i çao da relação entre duas variáveis. Embora a Seção 10-3se limite a relações lineares, aSeção
|j 10-6 introduz algumas relações não lineares comuns.
10-2 Correlação
i Conceito-chave Esta seção introduz o coeficiente de correlação linear r, que é uma me-
|dida numérica da força da relação entre duas variáveis que representam dados quantitativos.
í Usando dados amostrais emparelhados (algumas vezes chamados dados bivariados), encon-
11 tramos o valor de r (usualmente, com auxílio de tecnologia) e a seguir, usamos esse valor para
§í concluir que há (ou não) uma relação entre as duas variáveis. Nesta seção, consideraremos
li apenas relações lineares, o que significa que, quando se constroem seus gráficos, os pontos se
|aproximam do padrão de uma reta. Como os programas de computador ou calculadoras são
normalmente usados para o cálculo de r, é importante nos concentrarmos nos conceitos nesta
gj seção, sem nos envolvermos demais com os cálculos aritméticos.
Parte 1: Conceitos Básicos de Correlação
Começamos com a definição básica de correlação, um termo comumente usado no contexto
de uma relação entre duas variáveis.
Definição
Existe uma correlação entre duas variáveis quando uma delas está relacionada com a
outra de alguma maneira.
I A Tabela 10-1, por exemplo, consiste em dados aos pares sobre as durações e intervalos de
f tempo entre erupções do géiser Old Faithful. (O “intervalo após” uma erupção é o tempo até
feã próxima erupção.) Determinaremos se há uma correlação entre a variável x (duração) e a
jgrvariável y (intervalo após).
Exploração dos Dados
lentes de trabalharmos com os métodos computacionais mais formais desta seção, devemos pri-
|meiro explorar o conjunto de dados para ver o que podemos aprender. Em geral, podemos ver
|fma relação entre duas variáveis construindo um diagrama de dispersão. Ao examinarmos tal
[4iagrama, devemós estudar o padrão global dos pontos grafados.Se houver um padrão, devemos
|óbservar sua direção. Uma direção para crina sugere que, quando uma variável cresce, a outra
|ktnbém cresce. Uma direção para baixo sugere que, quando uma variável cresce, a outra decresce.
í;Dcvernos procurar outliers, quésão pontos que se localizam muito afastados dos demais.
Ev A Figura lO-2,mostra diagramas de dispersão com diferentes características. Os gráficos na Fi-
ÈfPra10-2(áJ,(b) é (c) mostram um padrão de valores crescentes dey que correspondem a valores
lÿrefcentes dex À medida que vamos de (a) para (c), o padrão dos pontos se aproxima mais de
lÿnia reta;sugerindo que a relação entre x e y se toma mais forte. Os diagramas de dispersão em
ss?
412 Capítulo Dez
10-2(d), (e) e (f) mostram padrões nos quais os valores dey decrescem à medida que os valores de
x crescem. Novamente, indo de (d) a (f), a relação se toma mais forte. Em contraste com os seis
primeiros gráficos, odiagrama de dispersão na Figura 10-2(g) não mostra qualquer padrão, suge.
rindo que não há qualquer correlação (ou relação) entre x ey. Finalmente, o diagrama na FiSura
10-2(h) mostra um padrão muito distinto, sugerindo uma relação entrexe y, que não é o padrão
de uma reta. (As Figuras 10-2(a) a (g) são do ActiveStats, e a Figura 10-2(h) é do Minitab.)
Coeficiente de Correlação Linear
Como o exame visual de diagramas de dispersão é altamente subjetivo, necessitamos de
didas mais precisas e objetivas. Usamos o coeficiente de correlação linear r, que é útil para
detectar padrões lineares.
Hi Definição
I"** O coeficiente de correlação linear r mede a intensidade da relação linear entre os valo-
£2 res quantitativos emparelhados xey em uma amostra. Seu valor é calculado usando-se a3 Fórmula 10-1, incluída no próximo quadro. [O coeficientede correlação linear é, algumas
es, chamado de coeficiente de correlação do produto de momentos de Pearson, em
homenagem a Karl Pearson (1857-1936), que o desenvolveu originalmente.]
vez
1
í
Como o coeficiente de correlação linear r é calculado com o uso de dados amostrais, ele é
uma estatística amostrai usada para medir a intensidade da correlação linear entre x e y. Se
tivéssemos todos os pares de valores populacionais xey, o resultado da Fórmula 10-1 seria
parâmetro populacional, representado por p (letra grega rô). O quadro seguinte inclui os
requisitos, a notação e a Fórmula 10-1.
um
b b
•;
5«I
(c) Correlação positiva perfeita:
r-1
(b) Correlação pos
r= 0,991
(d) Correlação negativa:
r = -0,702
sitiva:(a) Correlação po
r = 0,851
I ActivStàts I
v.
•vá;
H 18-
ie-
14-;; • • ;
(f) Correfação negativa perfeita:
r = -1
12-(e) Correlação negativa:
r = -0,965 10-
8-
6-
2-
y o-
2.0To" Is
(h) Relação não-linear: r = -0,087
rrelação: r = O(g) Nenhui
FIGURA 10-2 Diagramas de Dispersão À
r
Correlação e Regressão 413
Requisitos
pada qualquer coleção de dados amostrais emparelhados, o coeficiente de correlação linear
r pode sempre ser calculado, mas os seguintes requisitos devem ser satisfeitos ao se testarem
hipóteses ou ao se fazerem outras inferências sobre r.
1. A amostra de dados emparelhados (x, y) é uma amostra aleatória de dados quantitativos
independentes. (É importante que os dados amostrais não tenham sido coletados com o
uso de método não apropriado, por exemplo, amostra de resposta voluntária.)
2. O exame visual do diagrama de dispersão deve confirmar que os pontos se aproximam do
padrão de uma reta.
3, Quaisquer outliers devem ser removidos caso se saibaquesão erros.Os efeitos dequaisquer
outros outliers devem ser considerados pelo cálculo de r com e sem o outlier incluído.
Mota: Os requisitos 2 e 3 acima são tentativas simplificadas de se verificar este requisito
formal:
Os pares dados (x, y) devem ter uma distribuição normal bivariada. (As distribuições
normais são discutidas no Capítulo 6, mas esta suposição requer, basicamente, que para um
valor fixo de x os valores correspondentes de y tenham uma distribuição que tem a forma de
; sino e, para qualquer valor fixo de y, os valores correspondentes de x tenham uma distribui-
; ção que tem a forma de sino.) Essa suposição é, em geral, difícil de ser verificada, de modo
que, por agora, usaremos os requisitos 2 e 3 como listados acima.
m
£§8gjíassa
Leitura da Mão
Algumas pessoas acreditam que
o comprimento da linha da vida
de sua mão possa ser usado para
prever a longevidade. Em uma
carta publicada no Journal of the
American Medical Association,
os autores M. E. Wilson eL. E.
Mather refutam essa crença com o
estudo de cadáveres. Registraram-
se as idades na morte juntamente
com os comprimentos das linhas
da vida. Os autores concluíram que
não há correlação significante entre
a idade na ocasião do falecimento
Notação para o Coeficiente de Correlação Linear
n representa o número de pares de dados presentes.
: I representa a soma dos itens indicados.
' Ix denota a soma de todos os valores de x.
’ Ix2 indica que cada valor de x deve ser elevado ao quadrado e, então, somados esses qua¬
drados.
(Ix)2 indica que os valores de x devem ser somados e o total, então, elevado ao quadrado. É
extremamente importante evitar-se confusão entre Ix2e (Er)2.
í
e o comprimento da linha da vida.
Ixy indica que cada valor de x deve ser multiplicado por seu valor correspondente de y. , - Quiromancia perdida, mãos para
baixo.Depois de obtidos todos esses produtos, calcule sua soma.
representa o coeficiente de correlação linear para uma amostra.
p letra grega rõ, usada para representar o coeficiente de correlação linear para umapo¬
pulação.
r
Essa fórmula simplificada
facilita os cálculos manuais.
O formato da fórmula torna
fácil seu uso em uma planilha
ou programa de computador.
Yeja outras fórmulas
equivalentes dadas mais
adiante nesta seção e veja
também os fundamentos
para o cálculo de r.
n&xy) -r (£x)(Xy)
Vndx2) - (Xx)2 Vndy2) - (2y)2Fórmula 10-1
s.
: Interpretação der com o Uso daTabelaA-6:Seo valor absoluto do valor calculadpde rex-
: ceder o valor naTabelaA-6, conclua que há uma correlação linearsignificativa. Caso contrário,
não há evidência suficiente para apoiar a conclusão de uma correlação linear significativa.
Interpretação de r com o Uso de Software: Se o valor P calculado for merior ou igual ao
r nível designificância, conclua que há uma correlação linear. Caso contrário, não há evidência
j: suficiente para apoiar a conclusão de uma correlação linear.
Arredondamento do Coeficiente de Correlação Linear
Arredonde o coeficiente de correlação linear r para três casas decimais (de modo que seu va¬
lor possa ser comparado diretamente com os valores críticos da Tabela A-6). Ao se calcular
®anualmente r e outras estatísticas neste capítulo, o arredondamento no meio dos cálculos em
m
114 Capítulo Dez
ETSTi
9
8-
7-
6-
5-
ji
4-
í
> 3
1 2 3 4 5 6
X
geral ocasiona erros substanciais; portanto, tente usar a memória de sua calculadora para ar¬
mazenar resultados intermediários e arredonde apenas no final.
/- EXEMPLO Calculando rUsando a amostra aleatória simples de dados apresentada
na margem, ache o valor do coeficiente de correlação linear r.
3 13 5x
5 8 6 4
SOLUÇÃO
REQUISITOS 6/ Os dados são uma amostra aleatória simples. O diagrama de dispersão
acima, gerado pelo SPSS, mostra um padrão dos pontos que se parece com uma reta. Não
há outliers. Os requisitos são satisfeitos e podemos passar ao cálculo do coeficiente de cor¬
relação linear r. t/
Para os dados amostrais emparelhados apresentados, n = 4, pois há quatro pares de dados.
Os outros componentes exigidos pela Fórmula 10-1 são encontrados a partir de cálculos na
Tabela 10-2. Note que esse formato vertical toma os cálculos mais fáceis.
Usando os valores calculados e a Fórmula 10-1, podemos agora calcular r como segue:
n(Scy) ~ (S»)(Xy)
VníXx2) — (Xx)2 Vn(2>2) - (Xy)2
4(61) - (12)(23)
V4(44) - (12)2 V4Í141) - (23)2
-32 = -0,956V32V35
Tabela 10-2 Determinação das Estatísticas Usadas para se Calcular r
y2X2Y xyx
3 255 15 9
8 641 8 1
363 186 9
165 4 20 25
Total 14112 23 61 44
t TT t t
sy2Zx Zxy Ix2
ai
Correlação e Regressão 415
|: gsses cálculos se tomam um pouco complicados com grandes conjuntos de dados, de modo Avaliações de Professores
|que é ótimo que o coeficiente de correlação linear possa ser encontrado automaticamente por se Correlac
§ muitas calculadoras e programas de computador. Veja “Usando a Tecnologia” no final desta
°m
1[_ seção para comentários sobre STATDISK, Minitab, Excel e a calculadora TI-83/84 Plus. Conceitos
As avaliações de estudantes de
faculdade são frequentemente
usadas para medir a eficácia do
ensino. Muitos estudos revelam
uma correlação com as notas mais
altas de estudantes associadas a
avaliações mais altas da faculdade.
Um estudo na Universidade de
Duke envolveu avaliações de
estudantes coletadas antes e depois
de serem atribuídas as notas finais.
O estudo mostrou que “a expectativa
da nota ou a nota recebida causavam
uma mudança na maneira como os
alunos percebiam seus professores
e a qualidade do ensino”. Notou-
se que, com as avaliações dos|j|. Quando não há, realmente, uma correlação linear entre x e y, a Tabela A-6 lista valores que estudantes, “cresciam os incentivos|§ são “críticos” neste sentido: Eles separam valores usuais de r daqueles que são não-usuais, para a faculdade manipull Por exemplo, a Tabela A-6 mostra que, com n = 4 pares de dados amostrais, os valores críti- políticas de notas para melhorar
If:cos são 0,950 (para a= 0,05) e 0,999 (para a = 0,01). Os valores críticos e o papel de a são SUas avaliações”. Concluiu-se\ § descritos nos Capítulos 7 e 8. Eis como interpretar aqueles números: Com 4 pares de dados e qUe “a consequência final de tais
£ li nenhuma correlação linear entre x e y, há uma chance de 5% de que o valor absoluto do coefi- manipulações é a degradação da
3 jfp.ciente de correlação linear calculado r exceda 0,950. Com n = 4 e nenhuma correlação linear, qualidade da educação nos Estados11' há uma chance de 1% de que Iri exceda 0,999. Dado r =-0,956 calculado no exemplo anterior, Unidos”. (Veja “Teacher Course
: Interpretação do Coeficiente de Correlação Linear
If precisamos interpretar um valor calculado de r, tal como o valor de -0,956 encontrado nopsexemplo precedente. Dada a maneira como a Fórmula 10-1 é construída, o valor de r deve
% sempre estar entre -1e +1, inclusive. Se r estiver muito próximo de 0, concluímos que não háH correlação linear significativa entre xey. mas se r estiver próximo de -1ou de +1 concluímos
Sí que há uma relação linear significativa entre xey. Interpretações de “próximo de” 0, ou 1, ou
|_1 são vagas, de modo que usamos o seguinte critério de decisão bem específico:
Usando a Tabela A-6:Se o valor absoluto do valor calculado de r excede o valor
na Tabela A-6, concluímos que há uma correlação linear. Caso contrário, não
há evidência suficiente para apoiar a conclusão de uma correlação linear.
Usando Software: Se o valor P calculado é menor do que ou igual ao nível de
significância, concluímos que há uma correlação linear. Caso contrário, não
há evidência suficiente para apoiar a conclusão de uma correlação linear.
m
i
HH se usarmos um nível de significância de 0,05 concluiremos que há uma correlação linear entre Evaluations and Student Grades:Ip x.e y (porque |—0,9561 excede o valor crítico de 0,950). No entanto, se usarmos um nível de An Academic Tango”, de Valen1§ significância de 0,01, não concluiremos que haja uma correlação linear (porque |-0,956| não Johnson, Chance, Vol.15, N°. 3.)lit excede o valor crítico de 0,999).
:
í ESm EXEMPLO Old Faithful Usando osdados emparelhados de duração e inter¬valo após erupção da Tabela 10-1, ache o valor do coeficiente de correlação linearr. Consulte então a TabelaA-6 para determinar se há ou não uma correlação linear
entre os tempos de duração eos intervalos após erupções. Na Tabela A-6, use o valor crítico
de a = 0,05. (Com a = 0,05, concluímos que há uma correlação linear significativa apenas
se a amostra for improvável no seguinte sentido: Se não há qualquer correlação linear entre
as duas variáveis, tal valor de r ocorre 5% das vezes ou menos.)
-•
r
SOLUÇÃO
REQUISITOS Os dados são de erupções selecionadas aleatoriamente. O diagrama de
dispersão da Figura 10-l(a) mostra um padrão de pontos que se parece com o padrão de uma
reta. Não parecehaver outliers. Os requisitos são satisfeitos e podemos passar ao cálculo
de r e determinar se há ou não uma correlação linear entre tempos de duração e intervalos
após erupções, e/
Usando o mesmo procedimento ilustrado no exemplo precedente, ou usando tecnologia,
podemos ver que os oito pares de dados tempo de duração/intervalo de tempo após erupção
na Tabela 10-1 resultam em r = 0,926. Eis a apresentação do Minitab:
:
5
i
Pearson correlation of Duração and Intervalo Após = 0.926
P-Value = 0.001i
\
Consultando a Tabela A-6, localizamos a linha para a qual n = 8 (porque há 8 pares de da¬
dos). Essa linha contém os valores críticos de 0,707 (para a= 0,05) e 0,834 (para a= 0,01).
1
Usando o valor crítico de a-0,05, vemos que há menos de 5% dechance de que, sem quaj
quer correlação linear, o valor absoluto calculado de r exceda 0,707. Como r = 0,926 seuvalor absoluto excede 0,707, de modo que concluímos que há uma correlação linear èntreo tempo de duração e o intervalo de tempo após erupção.
Já observamos que a Fórmula 10-1 requer que o valor calculado de r fique sempre entre-]
e +1, inclusive. Listamos essa juntamente com outras importantes propriedades.
Propriedades do Coeficiente de Correlação Linear r
1. O valor de r está sempre entre -1e +1, inclusive. Isto é,
-1 <r< +1
2. O valor de r não muda se todos os valores de qualquer das variáveisforem convertidos
para uma escala diferente.
3. O valor de r rião é afçtàdo pela escolha de x ou y. Troque todos os Valores dex pelos va¬
lores rcspectivos de y e vicè-versã, e o valor de r não mudará.
4. rmede a intensidade de uma relação linear. Ele não é planejado para medir intensidade
de uma relação que não seja linear.
Interpretação de r: Variação Explicada
Se concluímos que há uma correlação linear entre xey, podemos encontrar uma equação li¬
near que expresse y em termos de x, e essa equação pode ser usada para prever valores de_y
para valores dados dex Na Seção 10-3, descreveremos um procedimento para se encontrarem
tais equações e mostraremos como prever valores de y para valores dados de x. Mas um valor
previsto de y não será necessariamente o resultado exato, porque, além de x, há outros fatores
que afetam y, tais como variação aleatória e outras características não incluídas no estudo. Na
Seção 10-4 apresentaremos o fundamento e mais detalhes sobre este importante princípio:
O valor de r2 é a proporção da variação em y que é explicada pela relação li¬
near entre x ey.
SBEXEMPLO Old Faithful Usando os dados dos tempos de duração/interva¬lo após erupções da Tabela 10-1, vimos que o coeficiente de correlação linear ér = 0,926. Que proporção da variação dos tempos dos intervalos após erupções
pode ser explicada pela variação nos tempos de duração?
SOLUÇÃO Com r = 0,926, obtemos r2 = 0,857.
INTERPRETAÇÃO Concluímos que 0,857 (cu cerca de 86%) da variação nos tempos
dos intervalos após empções podem ser explicados pela relação linear entre os tempos de
duração e os tempos dos intervalos após empções. Isso implica que 14% da variação nos
tempos dos intervalos após empções não podem ser explicados pelos tempos de duração.
Erros Comuns Envolvendo Correlação
Identificamos agora três das fontes mais comuns de erros feitos na interpretação de resultados
que envolvem correlação:
1. Um erro comum é concluir que a correlação implica causalidade. Usando os dados
amostrais da Tabela 10-1, podemos concluir que há uma correlação entre os tempos de
duração e os tempos dos intervalos após erupções, mas não podemos concluir que tempos
mais longos de duração causem tempos maiores de intervalos após empções. Os tempos
dos intervalos após empções podem ser afetados por alguma variável oculta. (Uma va¬
riável oculta é uma variável que afeta as variáveis em estudo, mas que não está incluída
&
nele.) Por exemplo, a temperatura externa do ar pode afetar a duração de uma erupção
e o intervalo de tempo após uma erupção.A temperatura externa do ar seria, então, uma
variável oculta.
2. Outro erro surge de dados que se baseiam em médias. As médias suprimem a variação
individual e podem aumentar o coeficiente de correlação. Um estudo produziu um coe¬
ficiente de correlação linear de 0,4 para dados emparelhados que relacionavam renda e
educação entre indivíduos, mas o coeficiente de correlação linear se tomou 0,7 quando
m foram usadas médias regionais.
i:.. 3. Um terceiro erro envolve a propriedade de linearidade. Pode existir uma relação entre
|p xey mesmo quando não há correlação linear. Os dados retratados na Figura 10-2(h) re¬
sultam em um valor de r = -0,087, que é uma indicação de nenhuma correlação linear
entre as duas variáveis. No entanto, podemos facilmente ver pelafigura que há um padrão
pi que reflete uma forte relação não-linear. (A Figura 10-2(h) é um diagrama de dispersão
que retrata a relação entre a distância acima do chão e o tempo passado para um objeto
lançado para cima.)
1
I
-ÿ
lt Parte 2: Teste de Hipótese Formal
(Requer Conhecimento do Capítulo 8)
I Apresentamos dois métodos (resumidos no boxe a seguir e na Figura 10-3) para seusar um teste
|de hipótese formal para determinar se há ou não uma relação linear significativa entre duas va¬
li fiáveis. Alguns professores preferem o Método 1 porque ele reforça os conceitos introduzidos
jj| em capítulos anteriores. Outros preferem o Método 2 porque envolve cálculos mais fáceis. O
%Método 1 usa a distribuição t de Student com uma estatística de teste que tem a forma t = r/sn
|i em que sr representa o valor do desvio padrão amostrai dos valores de r. A estatística de teste
V dada no quadro (para o Método 1) reflete o fato de que o desvio padrão dos valores de r pode
pser expresso como V(1- r-)l (n - 2).p A Figura 10-3 mostra que o critério de decisão é rejeitar a hipótese nula p = 0 se o valor
absoluto da estatística de teste exceder os valores críticos; a rejeição de p-0 significa que há
evidência suficiente para apoiar a afirmativa de uma correlação linear entre as duas variáveis.
Jg:Se o valor absoluto da estatística de teste não exceder os valores críticos, então deixamos de
5* rejeitar p = 0; isto é, não há evidência suficiente para se concluir que haja uma correlação li-
near entre as duas variáveis.
I
Teste de Hipótese para Correlação (Veja a Figura 10-3.)
H0: p = 0 (Não há correlação linear.)
I H,: p*0 correlação linear.)
!
\\
-
fy Método 1; A Estatística de Teste É t
; fc Estatística de teste: t =
n- 2is I Valores críticos: Use a Tabela A-3 com n-2 graus de liberdade
:i Valor P: Use a Tabela A-3 com n-2 graus de liberdade.
5 5 Conclusão: Se líl > valor crítico da Tabela A-3, rejeite H0 e conclua que há uma correlação
linear. Se líl < valor crítico, deixe de rejeitar H0\ não há evidência suficiente para se concluir
que haja uma correlação linear.ii-;1: Método 2: A Estatística de Teste É r
l
lf-_ Estatística de teste: r
|í; Valores críticos: Consulte a Tabela A-6.
(| Conclusão: Se Irl > valor crítico da Tabela A-6, rejeite H0 e conclua que há uma correlação
i t- linear. Se Irl < valor crítico, deixe de rejeitar H0\ não há evidência suficiente para se concluir
que haja uma correlação linear.
m

Outros materiais

Outros materiais