Baixe o app para aproveitar ainda mais
Prévia do material em texto
Levantamento e Análise de Dados Ambientais Aula 5. ANOVA Professora Fernanda A. Casares Email: fcasares00@hotmail.com UERJ – ZO | 2023.1 Tópicos de Hoje • Análise de Variância (ANOVA) - A análise - Hipóteses - Pressupostos - ANOVA unifatorial – Uma via • Teste para analisar que grupos são diferentes de quais • Fatores fixos e Aleatórios • ANOVA bifatorial – Duas vias Recapitulando Relação entre 2 variáveis contínuas 1 variável independente + 1 variável dependente 2 variáveis dependentes REGRESSÃO CORRELAÇÃO Comparação entre 2 médias (variável dependente numérica e variável independente categórica) Teste t Média amostral vs média populacional - teste t de uma amostra (one-sample t-test) Duas médias de amostras independentes - teste t de duas amostras (two-sample t-test) Duas médias de amostras dependentes – teste t pareado Análise de variância • Teste de hipóteses para uma variável dependente (resposta) numérica em função de uma ou mais variáveis independentes categóricas (ou fatores ou tratamentos) • Um dos tipos de análises mais utilizados • Pode ser usada para desenhos amostrais e experimentais complexos • Avalia diferenças entre médias de diferentes grupos, comparando a variância dentro e entre grupos Yik = μ + Ak+ εikModelo linear: Onde: Yik é a observação da réplica i no nivel k do fator A μ é a média de todas as populações amostradas, Ak representa o efeito do nível k do fator A sobre a média eik é o erro residual devido a réplicas dentro de cada nivel k • Hipóteses: Análise de variância Para comparação entre 2 grupos (pode-se usar teste t também) H0 : µ1 = µ2 Ha : µ1 ≠ µ2 a (número de grupos) = 2 Para comparação entre 3 grupos H0 : µ1 = µ2 = µ3 Ha : Ao menos um µk diferente a (número de grupos) = 3 Padrão de avaliação da ANOVA é a Distribuição de F de Fisher que permite saber a probabilidade dos dados observados serem produto do acaso Distribuição de F Como funciona? Exemplo efeito de predadores sobre crustáceos de água doce *Verificar se a presença de pistas químicas de predadores afeta a concentração de proteínas envolvidas na recepção de sinais químicos de crustáceos de água doce* Desenho experimental • 20 crustáceos em 20 aquários individuais: - 10 em aquários com exudado de predadores - 10 em aquários sem exudado (controle) • Após um tempo de exposição, medição da concentração da proteína envolvida na recepção de sinais nos 20 crustáceos. Resumindo: • Variável independente ou fator possui 2 níveis: A = com e B = sem Ou seja, temos dois grupos (a= 2) • N = 10 Exemplo efeito de predadores sobre crustáceos de água doce *Verificar se a presença de pistas químicas de predadores afeta a concentração de proteínas envolvidas na recepção de sinais químicos de crustáceos de água doce* .... 20 unidades experimentais A = com exsudados de predadores e B = sem exsudados n = 10 réplicas A A A BBB Concentração de proteínas (mg/mL) Animal com sem 1 0.069 0.01 2 0.067 0.013 3 0.071 0.014 4 0.063 0.015 5 0.076 0.01 6 0.065 0.009 7 0.066 0.011 8 0.064 0.014 9 0.069 0.008 10 0.068 0.012 Hipóteses: - Biológicas: H0 : Não existem diferenças na concentração de proteínas em crustáceos na presença versus ausência de exsudados de predadores Ha : Existem diferenças significativas entre os dois grupos experimentais, atribuíveis à presença ou ausência de exsudados de predadores. - Estatísticas: H0 : µ1 = µ2 Ha : µ1 ≠ µ2 Fr eq u ên ci a Conc. Proteína (mg/mL) Fr eq u ên ci a Conc. Proteína (mg/mL) H0 Ha µ2µ1 µ1 = µ2 SQdentro = 𝑘=1 𝑎 𝑖=1 𝑛 (𝑌𝑖𝑘 − 𝑌𝑘) 2 SQentre = 𝑛 𝑘=1 𝑎 (𝑌𝑘 − 𝑌) 2 SQtotal = 𝑖𝑘 𝑛 (𝑦𝑖𝑘 − 𝑌) 2 SQ Total = SQ dentro + SQ entre Conc. Proteína (mg/mL) Fr eq u ên ci a Na prática Y1 Y2 a= número de grupos (níveis do fator) n = número de réplicas Y y11 y12 Fonte de Variação GL SQ QM F obs p Fobs= QMentre/QMdentro ENTRE GRUPOS a-1 SQentre QMentre= SQentre/(a-1) DENTRO DE GRUPOS (Erro Experimental) a(n-1) SQdentro QMdentro= SQdentro/a(n-1) TOTAL an-1 SQtotal • Rejeitamos H0, se p ≤ α (nível de significância - normalmente 0,05) • Não rejeitamos H0, se p > α . Concentração de proteínas (mg/mL) Animal com sem 1 0.069 0.01 2 0.067 0.013 3 0.071 0.014 4 0.063 0.015 5 0.076 0.01 6 0.065 0.009 7 0.066 0.011 8 0.064 0.014 9 0.069 0.008 10 0.068 0.012 Ycom= 0.0678 Ysem= 0.0116 Y =0.0397 SQentre = 10 * (((0.0678-0.0397)^2)+((0.0116,-0.0397)^2)) = 0.0157922 SQdentro = ((0.069-0.0678)^2) ... + ((0.01-0.0116)^2)... = 0.00018 QMentre = SQentre/a-1 = 0.0157922/1= 0.0157922 QMdentro = SQdentro/a(n-1) = 0.00018/(2(10-1)) = 0.00018/18 = 0.00001 F = 0.0157922 0.00001 = 1579.22 Fr eq u ên ci a α = 0,05 Fcrítico = 4,414 α = 0.05 n = 10 G.L numerador = 1 G.L denominador = 18 F crítico [1,18] = 4,414 H0 : µ1 = µ2 Ha : µ1 ≠ µ2 F observado = 1579,22 Não rejeita H0 rejeita H0 Tabela de F Decisão: rejeitar H0 Conclusão: Existe diferença significativa na concentração de proteínas do crustáceo em aquários com e sem pistas químicas do predador Tabela de F para α = 0.05. V1 = numerador, V2 = denominador da fórmula de F. Graus de Liberdade Procuramos o F crítico [1,18] Test for equal means Sum of sqrs df Mean square F p (same) Between groups: 0,0157922 1 0,0157922 1579 5,466E-19 Within groups: 0,00018 18 1E-05 Permutation p (n=99999) Total: 0,0159722 19 2E-05 Components of variance (only for random effects): Var(group): 0,00157822 Var(error): 1E-05 ICC: 0,993704 omega2: 0,9875 Levene´s test for homogeneity of variance, from means p (same): 0,3464 Levene´s test, from medians p (same): 0,3501 Welch F test in the case of unequal variances: F=1579, df=15,08, p=1,109E-16 Fazendo no PAST Distribuição esperada com base em H0 Distribuição esperada com base em Ha No caso de 3 grupos - Variável dependente: Notas dos alunos - Fator: Turma, 3 níveis (turma 1, turma 2 e turma 3) Pressupostos • Amostragem aleatória • Normalidade • Erros independentes • Homogeneidade de variâncias (homoscedasticidade) Testes específicos Teste de Tukey para diferenciação entre grupos • Casos em que temos um fator com mais de 2 níveis • ANOVA só dá reposta sobre se há diferença entre grupos • Mas não diz qual é diferente de qual • Teste de Tukey: testa diferenças entre pares de grupos Tipos de ANOVA • ANOVA univariada (uma variável dependente e duas ou mais variáveis independentes) • ANOVA multivariada : mais de uma variável dependente e duas ou mais variáveis independentes -Uma via (uma variável dependente e uma variável independente) -Duas vias (uma variável dependente e duas variáveis independentes) -ANOVA em blocos (uma variável dependente e uma ou mais variáveis independentes + uma variável que se quer bloquear) -ANOVA aninhada (uma variável dependente e ao menos duas variáveis independentes hierarquicamente organizadas) *Tipos de fatores: fixo ou aleatório Exemplo anterior: *Verificar se a presença de pistas químicas de predadores afeta a concentração de proteínas envolvidas na recepção de sinais químicos de crustáceos de água doce* • ANOVA de uma via (unifatorial) com efeito fixo • Fator predador com dois níveis (com e sem) • Existem fatores fixos ou aleatórios, qual a diferença? Fatores fixos vs aleatórios • Mesmos pressupostos • Em ambos os casos a amostragem e a disposição dos níveis do fator nas unidades experimentais deve ser aleatória * Se relaciona com a maneira como os níveis do fator são incorporados ao estudo e com a intepretação que pode ser feita dos resultados Fatores fixos • Um fator é considerado fixo se todos os níveis de interesse do fator são incluídos no estudo • Exemplos: - Efeito da presença de predadores sobre a densidade de presas (com e sem predadores) - Efeito da sazonalidade sobre a taxa de crescimento de uma espécie (primavera, verão, outono e inverno) Fatores aleatórios • Um fator é consideradoaleatório, quando os níveis desse fator incluídos no estudo forem selecionados de forma aleatória de um universo muito maior de níveis possíveis. • Exemplos: - Diversidade genética de pequenos mamíferos em diferentes localidades do estado do RJ (algumas localidades selecionadas aleatoriamente) - Diferença na taxa fotossintética de espécies de arbustos (5 espécies de arbustos selecionadas ao acaso) Diferenciação fatores fixos e aleatórios • Existe intenção em se fazer um teste a posteriori para determinar que nível difere de qual? • Se o estudo fosse repetido os mesmos níveis do fator seriam utilizados novamente? • Se as respostas forem sim, então o fator deve ser considerado como fixo. • Cálculos são iguais • Conclusões são levemente diferentes: - Fator fixo: são feitas em cima dos níveis selecionados - Fator aleatório: são feitas em cima do fator como um todo ANOVA bi-fatorial (de 2 vias) • 2 fatores de interesse (C e D), cada um com vários níveis • Estamos interessados no efeito simultâneo dos dois fatores sobre a variável resposta C D D1 D2 D3 D4 C1 C2 C3 C4 Genótipo Ambiente A B 14oC Tipo A, 14oC Tipo B, 14oC 23oC Tipo A, 23oC Tipo B, 23oC 30oC Tipo A, 30oC Tipo B, 30oC 32oC Tipo A, 32oC Tipo B, 32oC Na ANOVA de 2 vias temos mais uma fonte de variação: a interação entre os dois fatores Modelo Linear ANOVA 2 vias Onde: • μ é a média de todas as populações amostradas, • Ykij é a observação da réplica j no nivel k do fator A no nivel i do fator B • Ak representa o efeito do nível k do fator A sobre a média • Bi representa o efeito do nível i do fator B sobre a média • ABki representa a interação para a combinação do nivel k de A e o nivel i de B • ekij é o erro residual debido a réplicas dentro de cada combinação de k vs i Ykij = μ + Ak + Bi + ABki + ekij Genótipo Ambiente C D 14oC Tipo A, 14oC Tipo B, 14oC 23oC Tipo A, 23oC Tipo B, 23oC 30oC Tipo A, 30oC Tipo B, 30oC 32oC Tipo A, 32oC Tipo B, 32oC Exemplo: deseja-se avaliar o efeito de dois genótipos sobre a taxa metabólica de indivíduos sujeitos a quatro diferentes condições ambientais Fator A - Genótipo Níveis - C e D , a = 2 Hipóteses: H01: Não existe efeito do genótipo sobre a taxa metabólica Ha1: Existe efeito do genótipo sobre a taxa metabólica Fator B- Ambiente Níveis - 14, 23, 30 e 32oC , a = 4 Hipóteses: H02: Não existe efeito do ambiente sobre a taxa metabólica Ha2: Existe efeito do ambiente sobre a taxa metabólica Interação: Efeito conjunto do genótipo e ambiente sobre a taxa metabólica Níveis - Analisam-se as diferenças entre níveis de um fator com respeito aos níveis do outro fator Hipóteses: H03: O efeito do genótipo é independente do ambiente Ha3: O efeito do genótipo depende da condição ambiental 1ª Hipótese a ser testada! Taxa metabólica Genótipo C D 32oC 30oC 23oC 14oC Só efeito do ambiente Taxa metabólica Genótipo C D 32oC 30oC 23oC 14oC Efeito do ambiente e do genótipo Taxa metabólica Genótipo C D 32oC 30oC 23oC 14oC Interação Desenho ortogonal e replicado • A única maneira de se avaliar o efeito da interação entre dois fatores é através de um desenho ortogonal e replicado • Desenho ortogonal: todos os níveis de um fator se combinam com os níveis do outro fator • Replicado: mais de uma unidade experimental por combinação de níveis de fatores • Desenhos fatoriais são mais poderosos do que ANOVA de uma via Genótipo Ambiente A B 14oC 23oC 30oC 32oC Testando Hipóteses • Teste F para o efeito do Fator A (Genótipo) H01: µ1 = µ2 Ha1: µ1 ≠ µ2 • Teste F para o efeito do Fator B (Ambiente) H02: µ1 = µ2 = µ3 = µ4 Ha2: Ao menos um µ diferente • Teste F para o efeito da Interação AB (Genótipo x Ambiente) H02: Interação entre AB é 0 Ha2: A interação entre AB não é O F = QMA QMerro F = QMB QMerro F = QMAB QMerro Rejeita H0 se p<0.05 Rejeita H0 se p<0.05 Rejeita H0 se p<0.05 1ª Hipótese a ser testada! • Rejeitamos H0, se p < α (nível de significância - normalmente 0,05) • Não rejeitamos H0, se p > α . Fonte de variação GL SQ QM Fobs p Fator A a-1 SQA SQA/a-1 QMA/QMerro Fator B b-1 SQB SQB/b-1 QMB/Qmerro Interação AB (a-1) (b-1) SQAB SQAB/(a-1)(b-1) QMAB/QMerro Erro (dentro de grupos) ab(n-1) SQerro SQerro/ab(n-1) Total n-1 SQTotal PRÁTICA Exercício 1. Efeito de uma planta competidora 1. Uma pesquisadora tem observado que uma espécie de planta de restinga parece ocorrer em menor abundância quando está na presença de outra planta que utiliza os mesmos recursos, que são escassos. Para avaliar se as duas plantas competem por recursos, a pesquisadora elaborou um experimento de campo em que pretende remover a competidora para avaliar seu efeito. Primeiramente, ela selecionou uma grande área na restinga e dispôs aleatoriamente 21 unidades experimentais com quadrados de 1m2. Em seguida, atribuiu três diferentes tratamentos experimentais a 7 unidades experimentais, cada: um tratamento sem manipulação com a presença da planta competidora (chamado de com ou controle), um tratamento sem a planta competidora (retirada manualmente) e um último tratamento que ela chamou de controle do procedimento em que ela manipulou um pouco, mas não removeu a espécie competidora. Após 30 dias de experimento, ela mediu a porcentagem de cobertura da planta focal e inseriu os dados na tabela abaixo: Porcentagem de cobertura Com Sem Controle do procedimento 30.4 58 29 27.3 56 28 26.4 55.6 28.5 28.6 54.3 28.6 31 54 29.1 30.2 57 27.4 29 56.5 30 Exercício 2. 2. Um pesquisador quer saber se o crescimento de uma planta é influenciado pela exposição a luz do sol e pela frequência de regas. Para avaliar isso, ele planta 40 sementes e deixa-as crescer por dois meses sob diferentes condições de luz do sol (nenhuma, baixa, média e alta ) e regas (diária e semanal) . Frequência de rega Exposição a Luz Crescimento Diária Nenhuma 4.8 Diária Nenhuma 4.4 Diária Nenhuma 3.2 Diária Nenhuma 3.9 Diária Nenhuma 4.4 Diária Baixa 5 Diária Baixa 5.2 Diária Baixa 5.6 Diária Baixa 4.3 Diária Baixa 4.8 Diária Média 6.4 Diária Média 6.2 Diária Média 4.7 Diária Média 5.5 Diária Média 5.8 Diária Alta 6.3 Diária Alta 6.4 Diária Alta 5.6 Diária Alta 4.8 Diária Alta 5.8 Semanal Nenhuma 4.4 Semanal Nenhuma 4.2 Semanal Nenhuma 3.8 Semanal Nenhuma 3.7 Semanal Nenhuma 3.9 Semanal Baixa 4.9 Semanal Baixa 5.3 Semanal Baixa 5.7 Semanal Baixa 5.4 Semanal Baixa 4.8 Semanal Média 5.8 Semanal Média 6.2 Semanal Média 6.3 Semanal Média 6.5 Semanal Média 5.5 Semanal Alta 6 Semanal Alta 4.9 Semanal Alta 4.6 Semanal Alta 5.6 Semanal Alta 5.5 Slide 1 Slide 2: Tópicos de Hoje Slide 3: Recapitulando Slide 4: Análise de variância Slide 5 Slide 6: Análise de variância Slide 7 Slide 8: Como funciona? Exemplo efeito de predadores sobre crustáceos de água doce *Verificar se a presença de pistas químicas de predadores afeta a concentração de proteínas envolvidas na recepção de sinais químicos de crustáceos de água doce* Slide 9: Exemplo efeito de predadores sobre crustáceos de água doce *Verificar se a presença de pistas químicas de predadores afeta a concentração de proteínas envolvidas na recepção de sinais químicos de crustáceos de água doce* Slide 10 Slide 11: Na prática Slide 12 Slide 13 Slide 14 Slide 15 Slide 16 Slide 17: No caso de 3 grupos Slide 18: Pressupostos Slide 19: Teste de Tukey para diferenciação entre grupos Slide 20: Tipos de ANOVA Slide 21: Exemplo anterior: *Verificar se a presença de pistas químicas de predadores afeta a concentração de proteínas envolvidas na recepção de sinais químicos de crustáceos de água doce* Slide 22: Fatores fixos vs aleatórios Slide 23: Fatores fixos Slide 24: Fatores aleatórios Slide 25: Diferenciação fatores fixos e aleatórios Slide 26: ANOVA bi-fatorial (de 2 vias) Slide 27: Modelo Linear ANOVA 2 vias Slide 28 Slide 29 Slide 30: Desenho ortogonal e replicado Slide31: Testando Hipóteses Slide 32 Slide 33: PRÁTICA Slide 34: Exercício 1. Efeito de uma planta competidora Slide 35 Slide 36: Exercício 2. Slide 37
Compartilhar