Baixe o app para aproveitar ainda mais
Prévia do material em texto
19/03/2015 1 Aula 4 Teste de Significância para as Correlações de Spearman e Pearson Prof. Cesar Alexandre de Souza Material desenvolvido pela Profa. Adriana Backx Noronha Viana EAD0655 – Técnicas Estatística de Projeção Agenda – Aula 4 • Resolução – Situação Problema 6: Teste de Significância para Correlação de Spearman • Teste de Significância para Correlação de Pearson • Exercícios • Atividade 4 19/03/2015 2 • Situação Problema 6 – Desejamos testar se existe ou não correlação entre o número de clientes (Y) e os anos de experiência de agentes de seguros (X). Foram sorteados cinco agentes e observamos as duas variáveis em cada agente, cujos resultados foram: – Agentes A B C D E – Anos 2 4 5 6 8 – Clientes 48 56 64 60 72 – Teste a hipótese de não haver correlação entre número de clientes e anos de experiência. Utilize nível de significância de 10% (=0,10). Teste de significância – Correlação FONTE: http://www.inf.ufsc.br/~ogliari/ Situação Problema 6 Agentes Anos Exp. Clientes Classificação anos Classificação Clientes Diferença D^2 A 2 48 1 1 0 0 B 4 56 2 2 0 0 C 5 64 3 4 -1 1 D 6 60 4 3 1 1 E 8 72 5 5 0 0 soma 2 n 5 Coeficiente de correlação de Spearman 0,900 9,01,01 120 12 1 55 26 1 3 sr 19/03/2015 3 Valores Críticos do Coeficiente de Correlação por postos H0: = 0 (as variáveis X e Y são não correlacionadas) = 0 R. Como rs >= valor crítico, Podemos rejeitar a hipótese de que não há correlação, a um nível de significância de 10% Teste de Significância – Correlação • Coeficiente de correlação populacional é um parâmetro ou característica da população, em geral representado pela letra grega e desconhecido. • Teste de Significância – Dada uma amostra aleatória simples (x1, y1), (x2, y2), ..., (xn, yn) do par de variáveis aleatórias (X, Y), o coeficiente r pode ser considerado uma estimativa do verdadeiro e desconhecido coeficiente (intervalo de confiança) – Dada uma amostra aleatória simples (x1, y1), (x2, y2), ..., (xn, yn) do par de variáveis aleatórias (X, Y), verificar se o coeficiente r pode ser considerado como evidência suficiente de que o coeficiente é diferente de zero 19/03/2015 4 Teste de Significância – Correlação • Passos em um teste de hipótese: – Definir as Hipóteses H0 e Halternativa – Definir Estatística do teste (a partir da distribuição amostral da estatística em estudo) – Identificar a região crítica para rejeição da hipótese H0 (rs ≥ rcrit ou rs ≤ -rcrit ) – Levantar o resultado da amostra – Conclusão (se rejeita ou não a hipótese nula e qual o significado disso) Teste de significância Correlação de Pearson • H0: = 0 (as variáveis X e Y são não correlacionadas) • HA: 0 (as variáveis X e Y são correlacionadas) (pode também ser unilateral) é o coeficiente de correlação da população (desconhecido) r é o coeficiente de correlação da amostra r é uma variável aleatória, logo, tem uma distribuição amostral r )(rE Por exemplo, n= 20 e r=0,6741 0,6741 0,5001 0,7111 0,6049 0,6344 0,5341 0,2341 19/03/2015 5 Teste de significância Correlação de Pearson • H0: = 0 (as variáveis X e Y são não correlacionadas) • HA: 0 (as variáveis X e Y são correlacionadas) (pode também ser unilateral) é o coeficiente de correlação da população (suposto = 0) )(rE Por exemplo, r=0,0123 0,0123 -0,0231 0,1111 -0,0604 -0,098 0,0341 0,6741 = 0 Para estimar a quão improvável seria o valor 0,6741, precisamos conhecer a distribuição amostral de r Teste de significância Correlação de Pearson • A estatística r pearson não tem distribuição normal • Assumindo distribuição normal dos dados, para uma população em que = 0, a estatística de teste tobs tem distribuição t-student com n-2 graus de liberdade • O tobs deve ser comparado com o tcrítico obtido na tabela de t- student com n-2 graus de liberdade 21 2 r n rtobs 19/03/2015 6 Tabela de t-student William Gosset (“Student”) 1908 ... Finalizando nosso exemplo 21 2 r n rtobs 26741,01 220 6741,0 872,3 5456,0 18 6741,0 c 19/03/2015 7 Exercício – Situação Problema 7 Retorno no último ano (x) Retorno neste ano (y) 11,9 15,4 19,5 26,7 11,2 18,2 14,1 16,7 14,2 13,2 5,2 16,4 20,7 21,1 11,3 12 -1,1 12,1 3,9 7,4 12,9 11,5 12,4 23 12,5 12,7 2,7 15,1 8,8 18,7 7,2 9,9 5,9 18,9 A tabela ao lado apresenta retornos de diversos portfolios financeiros em dois anos consecutivos a) Faça um diagrama de dispersão dos dados e indique se ele sugere ou não a correlação b) Calcule a correlação de Pearson para os dados apresentados c) Indique se a correlação é significativa ao nível de 5% e ao nível de 1%. Exercício – Situação Problema 7 19/03/2015 8 Situação Problema 8 Nome da companhia 1 ano 3 anos 5 anos 10 anos Beazer Homes USA 50,3 26,1 50,1 28,9 Centex 23,4 33,3 40,8 28,6 D. R. Horton 41,4 42,4 52,9 35,8 Hovnanian Ent 13,8 67 73,1 33,8 KB Home 46,1 38,8 35,3 24,9 Lennar 19,4 39,3 50,9 36 M. D. C Holdings 48,7 41,6 53,2 39,7 NVR 65,1 55,7 74,4 63,9 Pulte Homes 36,8 42,4 42,1 27,9 Ryland Group 30,5 46,9 59 33,3 Standard Pacific 33 39,5 44,2 27,8 Toll Brothers 72,6 46,2 49,1 29,9 Atividade 4 • A tabela da situação 8 apresenta retornos anuais médios de diversas companhias de construção, considerando diferentes prazos a)Elabore a matriz de correlações entre os retornos de diferentes prazos b)Indique quais correlações são significativas ao nível de 10%, ao nível de 5% e ao nível de 1%. c) Entregue seu trabalho individualmente pelo STOA, até quinta-feira, 26/03, às 23h55m
Compartilhar