Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Medidas de Relacionamento entre Variáveis Introdução Até agora, consideramos sempre a existência de uma única variável de interesse. Entretanto, importantes problemas em Estatística envolvem duas ou mais variáveis quantitativas. Nosso objetivo é apresentar algumas das chamadas MEDIDAS DE RELACIONAMENTO, consideradas importantes no campo da aplicabilidade prática do nosso dia a dia. Tais medidas servem para: (a) Avaliar a possibilidade de associação (linear) entre duas ou mais variáveis quantitativas; (b) Caracterizar a natureza da associação (linear) . Motivação para o estudo ALUNO ALTURA (cm) (X) PESO (kg) (Y) 1 174 73 2 161 66 3 170 64 4 180 94 5 182 79 6 164 72 7 156 62 8 168 64 9 176 90 10 175 81 Exemplo: Avaliação de altura (cm) e peso (kg) de 10 alunos de uma faculdade Motivação para o estudo Exemplo: Avaliação de altura (cm) e peso (kg) de 10 alunos de uma faculdade 40 50 60 70 80 90 100 150 155 160 165 170 175 180 185 Altura, em cm Pe so , e m k g Covariância É uma medida do grau de associação e da forma de relacionamento (linear) entre duas variáveis quantitativas contínuas. 1 ).().( ),(ˆˆ 11 1 ,, n n YX YX YXvoCS n i i n i in i ii YXYX 1 )()( ),(ˆˆ 1,, n YYXX YXvoCS i n i i YXYX Conjunto de Dados Amostra Medidas de Relacionamento Covariância n n YX YX YXCov n i i n i in i ii YX ).().( ),( 11 1 , n YX YXCov Yi n i Xi YX )()( ),( 1, Conjunto de Dados População Medidas de Relacionamento 2 Covariância Algumas considerações importantes relacionadas a Covariância: Pode assumir qualquer valor entre - a +; Valores positivos: X e Y ou X e Y ; Valores negativos: X e Y ou X e Y . Indica o sentido de variação entre duas variáveis quaisquer; Medidas de Relacionamento ALUNO ALTURA (X) PESO (Y) PRODUTO (X.Y) 1 174 73 12702 2 161 66 10626 3 170 64 10880 4 180 94 16920 5 182 79 14378 6 164 72 11808 7 156 62 9672 8 168 64 10752 9 176 90 15840 10 175 81 14175 1706 745 127753 Exemplo de Cálculo da Covariância 9 127097127753 110 10 )745.1706( 127753 1 ).().( ˆ 11 1 ,, n n YX YX S n i i n i in i ii YXYX kgcmS YXYX .89,72ˆ ,, Medidas de Relacionamento Coeficiente de Correlação Momento-Produto de Pearson (ou Coeficiente de Correlação Linear) YX XY YX SS S r . , Conjunto de Dados Amostra => YX XY YX . , População => Também é uma medida do grau de associação e da forma de relacionamento (linear) entre duas variáveis quantitativas contínuas, com a vantagem de permitir “classificação” do grau de associação. Medidas de Relacionamento Coeficiente de Correlação (Linear) Algumas considerações importantes relacionadas ao Coeficiente de Correlação: Pode assumir qualquer valor entre -1 a +1; Valores positivos: X e Y ou X e Y ; Valores negativos: X e Y ou X e Y . 0 1 -1 -0,5 0,5 Baixa correlação entre X e Y Medidas de Relacionamento Coeficiente de Correlação (Linear) Algumas considerações importantes relacionadas ao Coeficiente de Correlação. -0,7 0,7 0 1 -1 -0,5 0,5 Baixa correlação entre X e Y Correlação média entre X e Y Alta correlação Alta correlação Medidas de Relacionamento ALUNO ALTURA(X) QUADRADO ALTURA PESO QUADRADO PESO PRODUTO 1 174 30276 73 5329 12702 2 161 25921 66 4356 10626 3 170 28900 64 4096 10880 4 180 32400 94 8836 16920 5 182 33124 79 6241 14378 6 164 26896 72 5184 11808 7 156 24336 62 3844 9672 8 168 28224 64 4096 10752 9 176 30976 90 8100 15840 10 175 30625 81 6561 14175 1706 291678 745 56643 127753 Exemplo do Cálculo do Coeficiente de Correlação Medidas de Relacionamento 3 Exemplo de Cálculo do Coeficiente de Correlação YX YX SS YXvoC r . ),(ˆ , 2 2 2 1 1 2 22 49,70 110 10 )1706( 291678 1 )( ˆ cm n n X X S n i in i i XX 2 2 2 1 1 2 22 72,126 110 10 )745( 56643 1 )( ˆ kg n n Y Y S n i in i i YY kgcmYXvoCSσ YXYX .89,72),(ˆˆ ,, Já calculamos: Precisaremos das Variâncias de X e Y: Medidas de Relacionamento Cálculo do Coeficiente de Correlação YX XY YX SS S r . , 222 49,70ˆ cmSσ XX 222 72,126ˆ kgSσ YY kgcmYXvoCSσ YXYX .89,72),(ˆˆ ,, Já calculamos: cmSσ XX 40,849,70ˆ kgSσ YY 26,1172,126ˆ 77,0771,0 26,11.40,8 89,72 . , YX XY YX SS S r Medidas de Relacionamento Motivação para o estudo Exemplo: Avaliação de altura (cm) e peso (kg) de 10 alunos de uma faculdade 40 50 60 70 80 90 100 150 155 160 165 170 175 180 185 Altura, em cm Pe so , e m k g Coeficientes de Regressão (Linear) Permite estabelecer uma função de associação entre duas variáveis: uma dependente (Y) e outra independente (X) por meio de modelo do tipo: iebXaY ieXY 10 ou Desejamos obter os Coeficientes de Regressão (a e b ou 0 e 1) com mínimo erro possível, ou seja: ei ter média 0 e variância 2e : ),0(~ 2 ei Ne Medidas de Relacionamento Coeficientes de Regressão (Linear) Amostra de n pares de valores (x1,y1),(x2,y2),....(xn,yn) podemos estabelecer um regressão através do modelo: iii ebxay Pressupomos que: a. A relação entre as variáveis X e Y é linear; b. Os valores da variável X não são sujeitos a erros (são fixos); c. A média dos erros é nula, isto é, E( )=0; d. A variância do erro é constante, variância residual, Var( )= 2; e. Os erros tem distribuição normal, isto é, ; f. É nula a correlação entre os erros, para qualquer i≠j. ),0(~ 2 ei Ne ie ie 0),( ji eecorr Medidas de Relacionamento Coeficientes de Regressão (Linear) O MMQ consiste em “obter estimativas de a e b que minimizam a soma do quadrado dos erros” n i ii bxaySQE 1 2 Derivamos parcialmente SQE em relação aos parâmetros a e b: Igualamos as derivadas a zero e calculamos os estimadores de e , que satisfazem o Sistema de Equações Normais: )2( )2( 1 1 i n i ii n i ii xbxay b SQE bxay a SQE n i n i i n i iii n i i n i i xbxayx xbany 1 1 2 1 11 ˆˆ ˆˆ aˆ bˆ 4 Coeficientes de Regressão (Linear) Para isso utilizamos o Método dos Mínimos Quadrados (M.M.Q.), que minimiza as Somas de Quadrados dos Erros, por meio dos seguintes estimadores: XbYa XY 10 Intercepto => ou 2 ),(ˆ XS YXvoC b 21 ),(ˆ XS YXvoC Coef. de Regressão => ou Medidas de Relacionamento ALUNO ALTURA(X) QUADRADO ALTURA PESO QUADRADO PESO PRODUTO 1 174 30276 73 5329 12702 2 161 25921 66 4356 10626 3 170 28900 644096 10880 4 180 32400 94 8836 16920 5 182 33124 79 6241 14378 6 164 26896 72 5184 11808 7 156 24336 62 3844 9672 8 168 28224 64 4096 10752 9 176 30976 90 8100 15840 10 175 30625 81 6561 14175 1706 291678 745 56643 127753 Exemplo do Cálculo dos Coeficientes de Regressão Medidas de Relacionamento kgcmYXvoCS YXYX .89,72),(ˆˆ ,, 2 2 2 1 1 2 22 49,70 110 10 )1706( 291678 1 )( ˆ cm n n X X S n i in i i XX Já calculamos: 49,70 89,72),(ˆ 21 XS YXvoC cmkg /034,11 6,170.034,15,7410 XY 90,1010 Medidas de Relacionamento 40 50 60 70 80 90 100 150 155 160 165 170 175 180 185 Altura, em cm Pe so , e m kg cmkg /034,11 90,1010 XY 034,190,101ˆ Medidas de Relacionamento Coeficiente de Determinação Permite avaliar a porcentagem de observações que estão próxima ou mesmo sob uma função de regressão ajustada. 100.)( 2 , 2 YXrR No nosso exemplo, 77,0771,0, YXr 100.)77,0( 22 R %29,59 2 R Medidas de Relacionamento 40 50 60 70 80 90 100 150 155 160 165 170 175 180 185 Altura, em cm Pe so , e m kg XY 034,190,101ˆ %29,59 2 R Medidas de Relacionamento 5 Os dados abaixo são referentes aos teores de conservantes (em mg/100 ml do produto) e vida útil de prateleira (em dias) para uma amostra de 09 marcas de iogurtes, encontrados nos principais Hipermercados da grande São Paulo Marca Teor de Conservante (X) Vida Útil de Prateleira (Y) Produto Quadrado (X) Quadrado (Y) 1 174 73 12.702 30.276 5.329 2 161 66 10.626 25.921 4.356 3 170 64 10.880 28.900 4.096 4 180 94 16.920 32.400 8.836 5 182 79 14.378 33.124 6.241 6 164 72 11.808 26.896 5.184 7 156 62 9.672 24.336 3.844 8 168 64 10.752 28.224 4.096 9 178 90 16.020 31.684 8.100 1533 664 113.758 261.761 50.082 A obtenção das estimativas de Covariância, do Coeficiente de Correlação Linear entre as variáveis, bem como as particulares interpretações para cada uma das estimativas. Se necessário, estime também os Coeficientes de Regressão (a e by.x) e o Coeficiente de Determinação associado. Exercício 0,00 10,00 20,00 30,00 40,00 50,00 60,00 70,00 80,00 90,00 100,00 156,00 161,00 164,00 168,00 170,00 174,00 178,00 180,00 182,00 V id a Ú ti l d e P ra te le ir a , e m d ia s Teores de Conversantes, em mg/100 ml VUP(Obs.) VUP(Est.) Y = -100,9842 + 1,0260.X r2xy = 61,61% Marca Conserv(X) VUP(Obs.) VUP(Est.) 7 156,00 62,00 59,07 2,93 2 161,00 66,00 64,20 1,80 6 164,00 72,00 67,28 4,72 8 168,00 64,00 71,38 -7,38 3 170,00 64,00 73,44 -9,44 1 174,00 73,00 77,54 -4,54 9 178,00 90,00 81,64 8,36 4 180,00 94,00 83,70 10,30 5 182,00 79,00 85,75 -6,75 eˆ
Compartilhar