Baixe o app para aproveitar ainda mais
Prévia do material em texto
LABORATÓRIO DE ESTATÍSTICA (CORRELAÇÃO LINEAR DE PEARSON E REGRESSÃO LINEAR SIMPLES) Discente: Clarita Silveira Reis Uma amostra aleatória de n = 9 extratos de pólen apícola foram coletados. As variáveis analisadas foram a quantidade de fenóis total(mg GAE.g-1) e a capacidade antioxidante DPPH (mg/mL) (EC50). O investigador deseja investigar a correlação amostral entre as duas variáveis quantitativas, bem como estabelecer uma relação funcional entre a capacidade antioxidante e a quantidade de fenóis totais. Obs. Os dados foram públicos no artigo (ChemicalCompositionandBiologicalActivitiesof Mono- andHeterofloral Bee PollenofDifferentGeographicalOrigins). Os dados obtidos estão contidos no nos Quadros 1 e 2 a seguir. Quadro 1. Quantidade de fenóis (mg GAE. g-1) – (variável x) 54.96 55.38 55.21 50.67 49.75 51.76 44.79 45.04 44.71 72.77 72.69 75.94 75.63 75.38 75.80 61.26 61.93 61.51 56.72 56.81 56.72 62.10 61.93 62.18 33.03 33.78 34.37 Quadro 2. Quantidade de DPPH (mg/mL) – (variável y) 7.34 7.55 7.45 6.98 6.55 6.45 6.76 6.66 6.25 1.98 2.09 1.75 2.45 2.56 2.56 4.54 4.07 4.76 5.09 5.12 5.23 5.55 5.76 5.43 8.12 8.09 7.75 Informações: ∑xi = 1542,832 ∑yi = 144,890 ∑xi2 = 92391,326 ∑yi2 = 883,402 ∑xiyi = 7675,717 1) Calcular o coeficiente de correlação linear de Pearson conforme equação dada em sala de aula e interpretar (os passos para facilitar o cálculo estão descritos na planilha excel). Obs.: Utilize duas casas após a vírgula. Após, seguir orientações do professor para encontrar rx,y. n 2)iy(2 i y n 2)ix(2 i x n iyix iyix 2 yσ 2 xσ xySPD xyr 𝑟𝑥𝑦 = 7675,717 − 1542 ,832∗144 ,890 27 92391,326− 1542 ,832 2 27 ∗ 883,402 − 144 ,890 2 27 = −603,58 447968,46 = −0,90 2) Determinar se o coeficiente de correlação amostral rx,y fornece evidência suficiente para concluir que o coeficiente de correlação da população p é significante. 1. Enunciar as hipóteses: H0: p=0 H1: p≠0 2. Especificar o nível de significância: α= 0,05 3. Identificar os graus de liberdade: t(α/2,n-2) 𝑔. 𝑙 = 27 − 2 = 25 4. Determinar os valores críticos: -t0= -2,06 ; t0= 2,06 5. Encontrar a estatística de teste padronizada 𝑡 = 𝑟 𝑛− 2 1− 𝑟2 = −0,90 27− 2 1− −0,90 2 = 10,44 6. Tomar uma decisão de rejeitar ou falhar em rejeitar a hipótese nula Sendo tcalculado>t0 Rejeita-se H0 7. Interpretar a decisão no contexto da afirmação original A correlação linear é diferente de zero, estatisticamente, ao nível de significância de 5%. E o coeficiente de correlação (-0,90) foi negativo, e próximo de 1, caracterizando uma forte relação negativa. 3) No exercício 2 você encontrou ∑x, ∑y, ∑xy, ∑x2e n. Você pode usar esses valores para calcular a inclinação e interseção y da linha de regressão. Assim, encontre a equação da reta de regressão. ∑xi = 1542,832 ∑yi = 144,890 ∑xi2 = 92391,326 ∑yi2 = 883,402 ∑xiyi = 7675,717 XbYb n x x n yx yx b 10 2 i2 i ii ii 1 )( 𝑏1 = 7675,717 − 1542 ,832∗144,890 27 92391,326− 1542 ,8322 27 = −603,58 4230,93 = −0,14 𝑏0 = 5,366− −0,14 ∗ 57,142 = 13,37 A equação estimada será: 𝑌 𝑖 = 13,37 − 0,14𝑋𝑖 4) Utilize a equação acima para prever os valores de y para os seguintes valores da capacidade antioxidante e interprete: 1) 3,27 e 2) 3,99. Se Xi = 3,27 e 3,99, então 𝑌 𝑖 = 13,37 − 0,14 3,27 = 12,91 𝑌 𝑖 = 13,37 − 0,14 3,99 = 12,81 5) Determinar a significância dos coeficientes de regressão estimados para a equação de regressão determinada no exercício 3. 1. Enunciar as hipóteses H0: β1=0 Ha: β1≠0 H0: β0=0 Ha: β0≠0 2. Especificar o nível de significância α= 0,05 3. Identificar os graus de liberdade t(α/2,n-2) g.l= 27-2=25 4. Determinar os valores críticos -t0= -2,06 ; t0= 2,06 5. Encontrar a estatística de teste padronizada ANOVA para verificar o ajustamento do modelo de regressão aos valores de Y.: 𝑆𝑄𝑡𝑜𝑡𝑎𝑙 = 𝑌𝑖 2 − 𝑦𝑖 2 𝑛 = 883,402− 144,8902 27 = 105,88 𝑆𝑄𝑟𝑒𝑔 = 𝑏0 𝑌𝑖 + 𝑏1 𝑌𝑖𝑋𝑖 − 𝑦𝑖 2 𝑛 = 13,37 ∗ 144,89 + 0,14 ∗ 7675,72 − 777,52 = 2234,26 𝑆𝑄𝑟𝑒𝑠 = 105,88 − 2234,26 = −2128,38 FV g.l SQ QM Fcal Regressão 1 2234,26 2234,26 26,24 Resíduo 25 -2128,38 -85,14 Total 26 105,88 𝑋 = 1542,832 27 = 57,14 𝑆𝑄𝐷𝑥 = 𝑥𝑖 − 𝑥 2 = 54,96 − 57,14 2 + 55,38 − 57,14 2 +⋯+ 34,37 − 57,14 2 = 4230,621 𝑆𝑃𝐷𝑥𝑦 = 𝑥𝑖𝑦𝑖 − 𝑥𝑖 𝑦𝑖 𝑛 = 7675,717 − 1542,832 ∗ 144,890 27 = −603,58 𝑠𝑏1 2 = 𝑄𝑀𝐸 𝑛−2 𝑆𝑄𝐷𝑥 = 𝑆𝐷𝑄𝑦−𝑏1𝑆𝑃𝐷𝑥𝑦 𝑛−2 𝑆𝑄𝐷𝑥 = 105 ,88− −0,14 ∗ −603 ,58 25 4230,62 = 0,855 4230,62 = 0,0002 𝑠𝑏1 = 0,0002 = 0,014 𝑠𝑏0 2 = 𝑄𝑀𝐸 𝑛 − 2 ∗ 1 𝑛 + 𝑥 2 𝑆𝑄𝐷𝑥 = 0,855 ∗ 1 27 + 57,142 4230,94 = 0,855 ∗ 0,809 = 0,69 𝑠𝑏0 = 0,69 = 0,83 b1: 𝑡𝑐𝑎𝑙 = 𝑏1 − 𝛽1 𝑆 𝑏1 = −0,14− 0 0,014 = −10 b0: 𝑡𝑐𝑎𝑙 = 𝑏0 − 𝛽0 𝑆 𝑏0 = 13,37 − 0 0,83 = 16,11 6. Determinar o ajuste da equação de regressão (coeficiente de determinação). 𝑅2 = 𝑆𝑃𝐷𝑥𝑦 2 𝑆𝑄𝐷𝑥 ∗ 𝑆𝑄𝐷𝑦 = −603,58 2 4230,62 ∗ 105,88 = 0,813 ∗ 100 = 81,3% 7. Tomar uma decisão de rejeitar ou falhar em rejeitar a hipótese nula tcal ≥ ttab. Rejeita H0 7. Interpretar a decisão no contexto da afirmação original Há relação significativa entre X e Y, onde Y pode ser explicada pela variável X.
Compartilhar