Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prof. Msc. Pedro Gusmão Engenheiro de Pesca Universidade Federal do Paraná Setor Palotina CP 003 – Bioestatística Aplicada a Medicina Veterinária Correlação e Regressão Linear Simples Necessidade de avaliar várias respostas simultaneamente no mesmo animal Altura animal; Peso da carcaça; Circunferência escrotal; Largura da garupa; Peso ao desmame, etc.; Ao reunir dados oriundos de amostras, percebe-se que existe uma certa relação entre eles. Exemplo: animais mais altos, geralmente mais pesados; Animais com maiores perímetros toráxicos tem maior largura da garupa, etc.; Variáveis e Correlação Correlação Linear (r) Simples A associação é a clara dependência de uma variável em relação a outra. Podem ser definidas como variáveis: DEPENDENTE e INDEPENDENTE; Variação de uma variável (INDEPENDENTE) causa ou exerce uma variação na outra (DEPENDENTE) Correlação Linear (r) Simples Coeficiente (rxy) de Correlação Linear Pode variar de -1 a 1 –1 0 1 Se r está próximo de 1, há uma forte correlação positiva. Se r está próximo a –1, há uma forte correlação negativa. Se r está próximo de 0, não há correlação linear. Coeficiente (rxy) de Correlação Linear Observe que o coeficiente de correlação mede as variações dos dados da amostra y com relação aos valores projetados da reta, sempre na direção de y. altura Idade Coeficiente (rxy) de Correlação Linear Observe que o coeficiente de correlação mede as variações dos dados da amostra y com relação aos valores projetados da reta, sempre na direção de y. 1,00 1,10 1,20 1,30 1,40 1,50 1,60 1,70 1,80 1,90 8 10 12 14 16 18 20 A lt u r a Idade altura Coeficiente (rxy) de Correlação Linear Pode-se calcular para verificar se a variação de uma das variáveis acompanha proporcional ou inversamente a outra; Será que existe uma dependência da nota no final do semestre com o número de aulas assistidas? Mas como medir o grau de correlação? )().( ),( YVarXVar YXCov r xy Coeficiente de Correlação Coeficiente (rxy) de Correlação Linear Covariância 1 )).(( ),( 1 n YYXX YXCov n i ii 1 )( 1 2 2 n XX s n i i x 1 )( 1 2 2 n YY s n i i y )().( ),( YVarXVar YXCov r xy Coeficiente de correlação Rxy Coeficiente (rxy) de Correlação Linear Exercício 1: Em um experimento instalado para avaliar a correlação entre a resposta de meio-irmãos, filhos de um mesmo reprodutor, colocados em um confinamento e outro a nível de campo. Valor limite (tab.) para n = 12 α=5%, é de 0,58 Confinados (X) Campo (Y) 73 64 71 62 72 66 64 55 65 59 66 65 70 65 71 69 68 64 70 65 67 63 66 62 Coeficiente (rxy) de Correlação Linear com base no número de obs. Coeficiente (rxy) de Correlação Linear Exercicio 2: Notas Finais. Verificar se existe alguma relação entre as notas finais e o número de faltas. Valor limite (tab.) para n = 7 e α=5%, é de 0,75. x y 8 78 2 92 5 90 12 58 15 43 9 74 6 81 Faltas Notas 95 90 85 80 75 70 65 60 55 45 40 50 0 2 4 6 8 10 12 14 16 N o ta f in a l Faltas Coeficiente de determinação Linear (r2 ou r2) Mostra quanto da variação de Y (variável resposta DEPENDENTE) é explicada pela variação de X (variável INDEPENDENTE). Dado em % e Calculado por: 222 )( xy rrR 9929,0 xy r %5,9898585,0)9929,0()( 22 xy r 58,0 xy r %4,333364,0)58,0()( 22 xy r Coeficiente de determinação Linear (r2 ou r2) Varia de 0 a 1; Sempre positivo; 222 )( xy rrR 0 0,5 1 X explica tudo da variação de Y X não explica nada da variação de Y Regressão Linear Simples O objetivo da análise de regressão é construir e avaliar modelos matemáticos que descrevam a relação ou dependência existente entre variáveis quantitativas; Regressão Linear Simples A equação algébrica que nos possibilita predizer um valor para Y, conhecendo um valor para X : bX aYˆ ou XbbYˆ 10 Regressão Linear Simples Como se calcula b1: E o b0: 2 1 1 1 )( )).(( XX YYXX b i n i ii n i XbYbo .1 XbbYˆ 10 Regressão Linear Simples y = 0.1123x + 8.2209 R² = 0.9655 8,20 8,40 8,60 8,80 9,00 9,20 9,40 9,60 9,80 0 5 10 15 G a n h o d e P e s o - g Carboidrato – g/100g Resposta (y) resp (y) Linear (resp (y)) 1 4 8 12 Regressão Linear Simples Dados Exemplo Anterior: CHO (x) Ganho de Peso (y) 1 8,34 4 8,59 8 9,26 12 9,50 6% ??? Regressão Linear Simples Limitações 1- Na análise de regressão, um valor de Y não poderá ser legitimamente estimado, se o valor de X estiver fora do intervalo de valores que serviam de base para a equação de regressão; 2 – Se a predição de Y envolve um resultado que ainda não ocorreu, os dados históricos que serviram de base para a equação de regressão podem não ser relevantes para futuros eventos. Regressão Linear Simples Limitação 1 y = 0.1123x + 8.2209 R² = 0.9655 8,20 8,40 8,60 8,80 9,00 9,20 9,40 9,60 9,80 0 5 10 15 G a n h o d e P e s o - g Carboidrato – g/100g Resposta (y) resp (y) Linear (resp (y)) 1 4 8 12 Limites de x para estimativa de Y Regressão Linear Simples Limitações 3 – Um coeficiente de correlação significante não indica, necessariamente, relação de causa efeito, mas pode indicar, isto sim, uma ligação comum a outros eventos; 4 – Uma correlação significante não é necessariamente uma correlação importante. Análise de Regressão Linear Regressão – Termo empregado para descrever a influência de uma ou mais variáveis independentes (x, preditoras, prognosticadoras) sobre uma ou mais variáveis dependentes (y, resultado, consequência). Análise de Regressão Linear No modelo de Regressão Linear Simples usa-se apenas uma variável prognosticadora (x); Logo assume-se que a relação para a variável de resultado seja significativamente linear ou não; Análise de Regressão Linear Lembrando a equação de Regressão; Em que: yi = observação na unidade experimental; b0 = intercepto; b1 = coeficiente de regressão associado à x1, x2, x3,..; e1 = erro associado a cada observação. ii exbby 110 Análise de Regressão Linear Na análise de regressão a variação total é dividida em duas partes: 1. Uma devido a regressão (Quadrado médio da Regressão), e: 2. Outra devida ao acaso (Quadrado médio do Resíduo); Logo precisa-se verificar se a variação (devido a regressão) é significativa ou não. ANOVA – Análise de Variância. Análise de Regressão Linear Anova da Análise de Regressão. Fonte de variação GL SQ QM Valor de F Devido a Regressão p SQRegr SQRegr/GLRegrQMRegr/QMRes Resíduo n-p-1 SQTotal-SQRegr SQRes/GLRes - Total n-1 SQTotal - Análise de Regressão Linear Somas de Quadrados. SQtotal n i i YY 1 2)( Análise de Regressão Linear Somas de Quadrados. SQRegressão Logo... n i i YY 1 2)ˆ( Análise de Regressão Linear Vamos imaginar um exemplo: Em experimento que avalia a altura da planta de milho em função da precipitação pluviométrica; Precipitação (mm) x 10 30 50 70 90 Altura em (m) y 0.20 0.80 1.30 1.60 1.56 Análise de Regressão Linear Anova da Análise de Regressão. Fonte de variação GL SQ QM Valor de F Devido a Regressão 1 SQRegr SQRegr/GLRegr QMRegr/QMRes Resíduo n-2 SQTotal-SQRegr SQRes/GLRes - Total n-1 SQTotal - Análise de Regressão Linear Cálculo das SQ’s; SQtotal?; SQRegressão?; F 5% Probabilidade, é ??; Análise de Regressão Linear Resultado da Anova. F calc. > F Tab. = significativo a 5 % Rejeição da Hipótese nula Fonte de variação GL SQ QM Valor de F Devido a Regressão 1 1.5810 1.5810 30.40 Resíduo 3 0.1560 0.0520 Total 4 1.7370 - Tabela F5% Revisando - Coeficiente de determinação O coeficiente de determinação r2, também denominado r-quadrado, é sempre um número positivo dentro do intervalo (0-1) Deve ser interpretado como a proporção da variação total da variável dependente y, que é explicada pela variação da variável independente x. Observe que o coeficiente de correlação (r) mede as variações dos dados da amostra y com relação aos valores projetados da reta, sempre na direção de y. Exercício 3 - Análise de Regressão Linear Exemplo: Experimento avaliando a resposta imunológica em milhares de células somáticas. Princípio ativo (mL) x 0,3 0,6 0,8 0,9 1,1 1,4 1,7 C.S. (mil) y 2100 1220 825 425 280 190 120 Encontre os níveis nos pontos de 0.3 até 1.7, após estimar o modelo. Execute ANOVA
Compartilhar