Baixe o app para aproveitar ainda mais
Prévia do material em texto
14/11/2022 1 ASSOCIAÇÃO DE VARIÁVEIS QUANTITATIVAS CORRELAÇÃO LINEAR (r) SIMPLES A associação é a clara associação de uma variável em relação a outra. Podem ser definidas como: variáveis DEPENDENTE e INDEPENDENTE; Variação de uma variável (INDEPENDENTE) causa ou exerce uma variação na outra (DEPENDENTE) CORRELAÇÃO LINEAR (r) SIMPLES COEFICIENTE (rxy) DE CORRELAÇÃO LINEAR Pode variar de -1 a 1 –1 0 1 Se r está próximo de 1, há uma forte correlação positiva. Se r está próximo a –1, há uma forte correlação negativa. Se r está próximo de 0, não há correlação linear. COEFICIENTE (rxy) DE CORRELAÇÃO LINEAR Observe que o coeficiente de correlação mede as variações dos dados da amostra y com relação aos valores projetados da reta, sempre na direção de y. 1.17 1.32 1.49 1.51 1.61 1.76 1.8 1.00 1.10 1.20 1.30 1.40 1.50 1.60 1.70 1.80 1.90 8 10 12 14 16 18 20 altura Linear (altura) COEFICIENTE (rxy) DE CORRELAÇÃO LINEAR Pode-se calcular para verificar se a variação de uma das variáveis acompanha proporcional ou inversamente a outra; Será que existe uma dependência da nota no final do semestre com o número de aulas assistidas? Mas como medir o grau de correlação? Através do COEFICIENTE DE CORRELAÇÃO LINEAR )().( ),( YVarXVar YXCov r xy = 1 2 3 4 5 6 14/11/2022 2 COEFICIENTE (rxy) DE CORRELAÇÃO LINEAR Covariância 1 )).(( ),( 1 − −− = = n YYXX YXCov n i ii 1 )( 1 2 2 − − = = n XX n i i x 1 )( 1 2 2 − − = = n YY n i i y COEFICIENTE (rxy) DE CORRELAÇÃO LINEAR Exemplo: Notas Finais. Verificar se existe alguma relação entre as notas finais e o número de faltas. Valor limite (tab.) para coeficiente com 7-2 (GL) = 5 GL; a α=5%, é de 0,75. x y 8 78 2 92 5 90 12 58 15 43 9 74 6 81 Faltas Nota final 95 90 85 80 75 70 65 60 55 45 40 50 0 2 4 6 8 10 12 14 16 N o ta f in a l X Faltas COEFICIENTE (rxy) DE CORRELAÇÃO LINEAR com base no número de obs. COEFICIENTE DE DETERMINAÇÃO O objetivo da análise de regressão é construir e avaliar modelos matemáticos que descrevam a relação ou dependência existente entre variáveis quantitativas; Geralmente uma em função da(s) outra(s); 8.34 8.59 9.26 9.50 y = 0.1123x + 8.2209 R² = 0.9655 8.20 8.40 8.60 8.80 9.00 9.20 9.40 9.60 9.80 0 2 4 6 8 10 12 14 resp (y) COEFICIENTE DE DETERMINAÇÃO LINEAR (r2 OU R2) Mostra quanto da variação de Y (variável resposta DEPENDENTE) é explicada pela variação de X (variável INDEPENDENTE). Dado em %; Calculado por: 222 )( xy rrR == 9929,0= xy r %5,9898585,0)9929,0()( 22 === xy r 58,0= xy r %4,333364,0)58,0()( 22 === xy r COEFICIENTE DE DETERMINAÇÃO LINEAR (r2 OU R2) Varia de 0 a 1; Sempre positivo; 222 )( xy rrR == 0 0,5 1 X explica tudo da variação de Y X não explica nada da variação de Y 7 9 10 11 12 13 14/11/2022 3 ANÁLISE DE REGRESSÃO LINEAR Regressão – Termo empregado para descrever a influência de uma ou mais variáveis independentes (x, preditoras, prognosticadoras) sobre uma ou mais variáveis dependentes (y, resultado, consequência). ANÁLISE DE REGRESSÃO LINEAR No modelo de Regressão Linear Simples usa-se apenas uma variável progsnosticadora; Logo assume-se que a relação para a variável de resultado seja significativamente linear ou não; ANÁLISE DE REGRESSÃO LINEAR Equação de Regressão; Em que: yi = observação na unidade experimental; b0 = intercepto; b1 = coeficiente de regressão associado à x1, x2, x3,..; e1 = erro associado a cada observação. ii exbby ++= 110 REGRESSÃO LINEAR SIMPLES A equação algébrica que nos possibilita predizer um valor para Y, conhecido um valor para X é dada por: 01 10 ˆ ˆ bXbY ou XbbY += += REGRESSÃO LINEAR SIMPLES Como se calcula b1: E o b0: ( ) 2 1 1 2 1 1 22 1 1 1 )( )).(( )( . 2 XX YYXX X XY XnX YXnXY b i n i ii n i n X n i n YX n i n i n i − −− = − − = − − = = = = = = = XbYXbY n b i n i n i o .. 1 1 1 1 1 −= −= == REGRESSÃO LINEAR SIMPLES Como se calcula b1: E o b0: 𝑏1 = 𝑛 ∗ ȭ𝑖=1 𝑛 𝑋𝑌 − σ𝑋σ𝑌 𝑛 ∗ ȭ𝑖=1 𝑛 𝑋2 − σ𝑋 2 = ȭ𝑖=1 𝑛 (𝑋𝑖 − ሜ𝑋). (𝑌𝑖 − ሜ𝑌) ȭ𝑖=1 𝑛 (𝑋𝑖 − ሜ𝑋)2 XbYXbY n b i n i n i o .. 1 1 1 1 1 −= −= == 14 15 16 17 18 19 14/11/2022 4 REGRESSÃO LINEAR SIMPLES b1 REGRESSÃO LINEAR SIMPLES Dados de aumento no volume de chuva vs altura do milho avaliado em 90 dias de cultivo: Nível (x) mm resp (y) cm 20 44 40 92 80 116 140 156 REGRESSÃO LINEAR SIMPLES 44 92 116 156 Alt. = b0 + b1*X Alt.(cm) = 42,67 + 0,8476(Chuva) 0 20 40 60 80 100 120 140 160 180 0 20 40 60 80 100 120 140 160 Alt. (cm) VAMOS CALCULAR...... 01 10 ˆ ˆ bXbY ou XbbY += += ( ) 2 1 1 2 1 1 22 1 1 1 )( )).(( )( . 2 XX YYXX X XY XnX YXnXY b i n i ii n i n X n i n YX n i n i n i − −− = − − = − − = = = = = = = 𝑏1 = { 20∗44 + 40∗92 +⋯+(140∗156)}−{4∗70∗102} (202+402+⋯+1402)−{4∗ 702 } = 35680 −28560 28000−19600 𝑏1 = 7120 8400 = 0,8476 VAMOS CALCULAR...... 𝑏1 = 7120 8400 = 0,8476 XbYXbY n b i n i n i o .. 1 1 1 1 1 −= −= == 𝑏𝑜 = ሜ𝑌 − 𝑏1. ሜ𝑋 = 102 − 0,8476 ∗ 70 = 102 − 59,332 𝑏𝑜 = 42,668 𝐴𝑙𝑡𝑢𝑟𝑎 𝑑𝑎 𝑝𝑙𝑎𝑛𝑡𝑎 = 42,668+ 0,8476 ∗ 𝑋 Em que X, corresponde ao volume pluviométrico. 𝑌 = 𝑏0 + 𝑏1𝑋 REGRESSÃO LINEAR SIMPLES 44 92 116 156 Alt. = b0 + b1*X Alt. = 42,67 + 0,8476(Chuva) 0 20 40 60 80 100 120 140 160 180 0 20 40 60 80 100 120 140 160 Alt. (cm) 20 21 22 23 24 25 14/11/2022 5 EXEMPLOS... CONSIDERANDO OS DESEMPENHO (KG) DE BOVINOS E AS RESPECTIVAS IDADES. CALCULE UMA EQUAÇÃO DE REGRESSÃO PARA CADA SÉRIE DE PESOS. Idade (dias) Peso ao desmama Idade (dias) Peso ao ano Idade (dias) Peso ao abate 229 190 427 250 671 550 250 240 458 290 824 660 247 210 366 245 732 595 275 254 336 200 763 612 256 260 427 270 702 548 204 199 336 202 732 555 210 220 305 190 793 603 198 192 458 270 763 570 214 197 366 225 824 608 COEFICIENTE DE DETERMINAÇÃO Observe que o coeficiente de correlação mede as variações dos dados da amostra y com relação aos valores projetados da reta, sempre na direção de y. COEFICIENTE DE DETERMINAÇÃO O coeficiente de correlação é mais indicado para medir a força da relação linear entre as variáveis, e o coeficiente de determinação é mais apropriado para medir a explicação da reta de regressão. Dessa maneira, para apreciar o ajuste de uma reta é melhor utilizar o coeficiente de determinação que mede o sucesso da regressão em explicar y; O coeficiente de correlação também pode ser calculado a partir do coeficiente de determinação. Entretanto, como o coeficiente de determinação é sempre positivo, o sinal de r será o mesmo que o sinal do coeficiente b da reta de regressão. REGRESSÃO LINEAR SIMPLES – LIMITAÇÕES 1- Um valor de Y não poderá ser legitimamente estimado, se o valor de X estiver fora do intervalo de valores que serviam de base para a equação de regressão; REGRESSÃO LINEAR SIMPLES – LIMITAÇÕES 2 – Um coeficiente de correlação significante não indica, necessariamente, causação, mas pode indicar, isto sim, uma ligação comum a outros eventos; 3 – Uma correlação significante não é necessariamente uma correlação importante. Dada uma grande amostra, uma correlação de, digamos, R = +0,10 pode ser significantemente diferente de 0 a α= 0,05. ANÁLISE DE REGRESSÃO LINEAR Na análise de regressão a variação total é dividida em duas partes: 1. Uma devido a regressão (Quadrado médio da Regressão), e: 2. Outra devida ao acaso (Quadrado médio do Resíduo); Logo precisa-se verificar se a variação (devido a regressão) é SIGNIFICATIVA ou NÃO. ANOVA –análise de variância. 26 27 28 29 30 31 14/11/2022 6 ANÁLISE DE REGRESSÃO LINEAR Anova da Análise de Regressão. Fonte de variação GL SQ QM Valor de F Devido a Regressão p SQRegr SQRegr/GLRegr QMRegr/QMRes Resíduo n-p-1 SQTotal-SQRegr SQRes/GLRes - Total n-1 SQTotal - ANÁLISE DE REGRESSÃO LINEAR Somas de Quadadros. SQtotal n y ySQ n i in i iTotal 2 1 1 2 −= = = ANÁLISE DE REGRESSÃO LINEAR Somas de Quadadros. SQRegressão; n y ySQ n i in i igressão 2 1 1 2 Re ˆ ˆ −= = = i xbby 10 ˆ += Logo... ANÁLISE DE REGRESSÃO LINEAR SQRegressão, pode ser dada por: −= = yxnyxbSQ n i iigressão .. 1 1Re = = − − = n i n i ii xnx yxnyx b 1 22 1 1 ).( .. ANÁLISE DE REGRESSÃO LINEAR Vamos imaginar um exemplo: Em experimento que avalia o número de mastigadas que o animal faz, conforme a porcentagem de fibra do alimento; Mastigadas 5 10 15 25 30 Fibra (%) 20 25 35 46 54 Para acelerar o processo Calcule: Soma de x2=7.282, x=180 e y=85; média de x e y; soma do produto x*y=3.645; ANÁLISE DE REGRESSÃO LINEAR Vamos imaginar um exemplo: Em experimento que avalia a altura da planta de milho em função da precipitação pluviométrica; Precipitação (mm) x 10 30 50 70 90 Altura em (m) y 0,20 0,80 1,30 1,60 1,56 Para acelerar o processo Calcule: Soma de x2, x e y; média de x e y; soma do produto x*y; 32 33 34 35 36 37 14/11/2022 7 ANÁLISE DE REGRESSÃO LINEAR Cálculo das SQ’s; SQtotal?; SQRegressão?; F5% probabilidade, e ??; F1% probabilidade ??. ANÁLISE DE REGRESSÃO LINEAR Resultado da Anova. Fonte de variação GL SQ QM Valor de F Devido a Regressão 1 1,23904 1,23904 22,91 Resíduo 3 0,16224 0,05408 Total 4 1,40128 - TABELA F5% ANÁLISE DE REGRESSÃO LINEAR Exemplo: Em experimento avaliando a resposta imunológica em milhares de células somáticas. Princípio ativo (mL) x 0,3 0,6 0,8 0,9 1,1 1,4 1,7 C.S. (mil) y 2100 1220 825 425 280 190 120 Para acelerar o processo Calcule: Soma de x2, x e y; média de x e y; soma do produto x*y; Encontre os níveis nos pontos de 0,3 até 1,7 de 0,1 em 0,1mL. REGRESSÃO E CORRELAÇÃO LINEAR SIMPLES Qdo avalia-se várias respostas simultaneamente em mesmo animal Altura cernelha; Perímetro torácico; Circunferência escrotal; Largura da garupa; Peso ao desmame, etc.; Ao reunir diversas amostras, percebe-se que existe uma certa relação entre elas. Exemplo: animais mais altos, geralmente mais pesados; Animais com maiores perímetros toráxicos tem maior largura da garupa, etc.; 38 39 40 41 42
Compartilhar