Baixe o app para aproveitar ainda mais
Prévia do material em texto
ASSOCIAÇÃO DE VARIÁVEIS QUANTITATIVAS: CORRELAÇÃO E REGRESSÃO LINEAR Gabrimar Araújo Martins ASSOCIAÇÃO DE VARIÁVEIS QUANTITATIVAS: CORRELAÇÃO E REGRESSÃO LINEAR CORRELAÇÃO É o estudo de pares de observações medidas em um mesmo animal, com o objetivo de determinar o grau de associação entre variáveis, sendo que a variação de uma delas acompanha a da outra sem no entanto haver dependência entre elas. CORRELAÇÃO JUSTIFICATIVA Quando se deseja saber se a variação em uma determinada variável acompanha proporcionalmente ou inversamente a variação na outra. PREMISSAS ‡ Devem ser colhidos pares de observações em um mesmo animal; ‡ Não deve haver nenhuma razão biológica que aponte dependência entre as variáveis e estas devem ser aleatórias ‡ O intervalo de variação é entre menos um (-1) e um (1); ‡ Quando a correlação entre duas variáveis (X e Y) é igual a 1, implica em valores idênticos, quando igual a -1, a ordem de um deles é inversa, quando igual a zero, não há nenhum grau de associação entre elas. CORRELAÇÃO TIPOS DE ASSOCIAÇÕES INDEPENDENTES Medidas morfométricas em animais; Relação cálcio e fósforo em dietas ; Resultado de prova de desempenho em confinamento e a pasto; Associação entre características produtivas e reprodutivas; Entre características de produção e tipo. CORRELAÇÃO CÁLCULO DA CORRELAÇÃO Considerando a associação entre duas características X e Y, a correlação existente entre elas é dada pela fórmula: Avaliada com n-2 graus de liberdade correspondente à perda de 2 graus de liberdade pela estimativa das médias de X e de Y, conhecido como correlação de Pearson. CORRELAÇÃO CÁLCULO DA CORRELAÇÃO Reprodutor Novilhos Confinados(X) Campo(Y) 1 73 64 1 71 62 1 72 66 2 64 55 2 65 59 2 66 65 2 70 65 3 71 69 3 68 64 3 70 65 3 67 63 3 66 62 Exemplo 1: Para os dados de ganho de peso acima, calcular a correlação entre o desempenho no confinamento e a campo. Sampaio, (2002) SIGNIFICÂNCIA DA CORRELAÇÃO • TABELAS DE VALORES CRÍTICOS DO COEFICIENTE DE CORRELAÇÃO (r - segundo os graus de liberdade do estudo (n-2) e probabilidade do erro tipo I (P<0,05)). Do exemplo anterior cujo r=0,688 ou 68,8%; O coeficiente foi avaliado com 12-2 = 10 G. L. Na tabela de valores críticos do coeficiente de correlação para 10 G.L. e P<0,05, o valor limite é 0,58 ou 58,0%. Portanto a correlação é significativa e abona a prova de confinamento. SIGNIFICÂNCIA DA CORRELAÇÃO INTERVALO DE CONFIANÇA DA CORRELAÇÃO PREMISSAS A área que teoricamente define os limites do coeficiente de correlação corresponde a 95%; Quando a correlação está sendo avaliada entre os valores -0,70 e 0,70 a dispersão amostral atua entre os limites -1,0 e 1,0, apresentando uma distribuição aproximadamente normal; Quando r está próximos desses limites -0,93 e 0,93 a distribuição passa a ser assimétrica, afetando o cálculo para definir o intervalo de confiança; Neste caso Fisher (1921) propôs transformação matemática para tornar esse tipo de distribuição, aproximadamente normal. SIGNIFICÂNCIA DA CORRELAÇÃO INTERVALO DE CONFIANÇA DA CORRELAÇÃO (r) Valor de Z torna uma distribuição assimétrica em aproximadamente normal Desvio padrão de z SIGNIFICÂNCIA DA CORRELAÇÃO INTERVALO DE CONFIANÇA DA CORRELAÇÃO Desvio padrão de z Do exemplo anterior, r=0,688 e n=12, em termos de z teremos (FISHER, 1921) = = = Para z (95%): z ± 1,96s (1,96 desvios para mais ou para menos em relação a z); isso corresponde a valores de z entre 0,191 e 1,497. 0,844 ± 1,96 x 0,333 = 0,844 ± 0,65 = entre 0,191 e 1,497 SIGNIFICÂNCIA DA CORRELAÇÃO INTERVALO DE CONFIANÇA DA CORRELAÇÃO Substituindo os valores do intervalo z = 0,191 e z = 1,497, em; = = r= 0,191 e r= 0,904 Então o intervalo de confiança para r=0,688 será de 0,187 a 0,904; correlação entre 0,19 e 0,90, tornando a correlação significativa. Encontraremos valores para a correlação entre; REGRESSÃO CONCEITO Consiste em uma função que associa quantitativamente pares de observações de determinadas características, estimando a magnitude da mudança em uma delas por mudança unitária na outra. JUSTIFICATIVA Quando existem fatores quantitativos com mais de dois níveis (grau de liberdade para fatores >1); Deseja-se conhecer a relação matemática entre a variável dependente e os níveis dos fatores (variável independente); = = REGRESSÃO JUSTIFICATIVA Deseja-se definir o coeficiente de regressão que mede a variação experimentada na variável dependente para cada unidade da variável independente; A partir da determinação dos coeficientes de regressão, deseja-se conhecer a função (linear, quadrática, cúbica ou de ordem superior) de associação entre as variáveis. PREMISSA A regressão de uma variável dependente Y em função de uma ou mais variáveis independentes X, postula que X assuma valores fixos (desvios padrões desprezíveis); = = REGRESSÃO FUNÇÃO LINEAR Ŷ = a + bX Em que; Ŷ = é a variável dependente de X a = ao coeficiente de regressão linear correspondente teoricamente ao valor de Y quando X é igual a zero. b = coeficiente de regressão que pondera a variável independente X Exemplo para interpretação dos parâmetros da regressão: Ŷ = 2,7 – 0,1 X ; X = níveis de fibra em uma determinada ração (X = 7 e 13%); Ŷ = peso de coelhos ao abate alimentados com rações contendo níveis de fibra X = = REGRESSÃO EQUAÇÃO LINEAR Ŷ = 2,7 – 0,1 X ; a = 2,7 representa o coeficiente linear para o nível zero de fibra, correspondente ao peso igual a 2,7 kg; como biologicamente nível zero de fibra na ração não é aplicável, o valor de a=2,7, representa o ponto de interseção que a reta apresenta em relação ao eixo dos Y. b = -0,1 significa que para cada 1% de fibra na ração o desempenho do animal cai 0,1 kg no peso final Valores maiores de b, correspondem a maior inclinação da reta em relação ao eixo dos X, denotando maior influência de X sobre Y. O modelo pode estimar o teor de fibra na ração para Y = 0 (nenhum desempenho); 0 = 2,7 – 0,1 X logo; X = 27% de fibra. = = REGRESSÃO ESTIMATIVA DO COEFICIENTE DE REGRESSÃO = Repetição Lotação (animal/há) 0,5 1,0 1,5 2,0 1 10,5 12,6 8,1 6,5 2 9,4 7,9 6,7 5,8 3 11,0 10,4 - 4,3 4 8,3 9,3 7,3 7,0 5 15,0 7,2 7,0 3,9 6 12,7 8,9 6,1 4,6 Total 66,9 56,3 35,2 3,1 Sampaio, 2002 REGRESSÃO ESTIMATIVA DO COEFICIENTE DE REGRESSÃO = Ŷ = 13,1667 – 3,9415X REGRESSÃO AVALIAÇÃO DO MODELO Foram testados 4 tratamentos (taxas de lotação) Dos três graus de liberdade para tratamentos, um representa o efeito linear e os outros dois serão atribuídos à falta de ajuste (quadrático e cúbico). As fontes de variação serão; o modelo linear, a falta de ajuste, a variância do erro e total. REGRESSÃO AVALIAÇÃO DO MODELO SOMA DE QUADRADO DO MODELO SQregressão= SQregressão= SQregressão(1 GL) = 115,5030 SQtotal = 1751,41-(190,5)²/23 = 173,5730 (22 GL) SQlotação = A falta de ajusto ou desvio da linearidade, com 2 GL, corresponde: SQlotação – SQregressão = 115,9227 - 115,5030 = 0,4197 REGRESSÃO AVALIAÇÃO DO MODELO QUADRO DA ANÁLISE DE VARIÂNCIA Coeficiente de determinação (R²) R² = SQregressão/SQtotal = 115,5030/173,5730 = 65,5% R² = 65,5% representa razoável capacidade de previsão (variação do R², 0 a 100%) e o CV da resposta foi igual a 21%; R² Elevado: Alta adequação do modelo, estimativa confiável associada a desvios pequenos; R² Baixo: Inadequação do modelo ou instabilidade da variável medida associada a altos valores docoeficiente de variação (CV). *Significativo (p<0,05) n.s. (não significativo) FV GL SQ QM F Total 22 173,5730 Regressão 1 115,5030 115,5030 38,07* Falta de ajuste 2 0,4197 0,2098 n.s. Erro 19 57,6503 3,0342 REGRESSÃO AVALIAÇÃO DO MODELO • SIGNIFICÂNCIA DO COEFICIENTE DE REGRESSÃO O que se testa à luz do erro experimental é se a variação de magnitude b por unidade de X produz variação significativa em Y • TESTES ESTATÍSTICOS USADOS PARA TESTAR O COEFICIENTE DE REGRESSÃO Teste t de Student Teste F de Fischer REGRESSÃO AVALIAÇÃO DO MODELO • Teste t de Student: Compara a fonte testada com seu próprio desvio padrão. • Coeficiente de regressão b = -3,9415 • Desvio padrão da regressão REGRESSÃO AVALIAÇÃO DO MODELO O valor de “t” tabelado com 19Gl do erro = 2,093 O intervalo é: -2,093 a 2,093 “t” calculado esta fora deste intervalo e portanto : b é significativo. Intervalo de confiança de b é: -3,9415±1,3370 ou -5,2785 a -2,6045 REGRESSÃO AVALIAÇÃO DO MODELO TESTE F (FISCHER, 1924) Regressão: F=QMregressão/Qmerro = F= 115,5030/3,0342 =38,07 F tabelado com 1 e 19 GL = 4,38 Falta de ajuste: F=0,2098/3,0342 < 1 (n.s) não precisa comparar REGRESSÃO AVALIAÇÃO DO MODELO TESTE F (FISCHER, 1924) • A regressão foi significativa (F calculado maior que F tabelado) • A falta de ajuste não foi significativa (F calculado < 1). OBRIGADO
Compartilhar