Buscar

LADA - Aula 5

Prévia do material em texto

Levantamento e 
Análise de Dados 
Ambientais
Aula 5. ANOVA
Professora Fernanda A. Casares
Email: fcasares00@hotmail.com 
UERJ – ZO | 2023.1
Tópicos de Hoje
• Análise de Variância (ANOVA)
- A análise
- Hipóteses
- Pressupostos
- ANOVA unifatorial – Uma via
• Teste para analisar que grupos são diferentes de quais
• Fatores fixos e Aleatórios
• ANOVA bifatorial – Duas vias
Recapitulando
Relação entre 2 
variáveis contínuas
1 variável independente 
+ 1 variável dependente
2 variáveis dependentes
REGRESSÃO
CORRELAÇÃO
Comparação entre 
2 médias
(variável dependente 
numérica e variável 
independente 
categórica)
Teste t
Média amostral vs média populacional - teste 
t de uma amostra (one-sample t-test)
Duas médias de amostras independentes -
teste t de duas amostras (two-sample t-test)
Duas médias de amostras dependentes – teste t 
pareado
Análise de variância
• Teste de hipóteses para uma variável dependente (resposta) numérica 
em função de uma ou mais variáveis independentes categóricas (ou 
fatores ou tratamentos)
• Um dos tipos de análises mais utilizados
• Pode ser usada para desenhos amostrais e experimentais complexos
• Avalia diferenças entre médias de diferentes grupos, comparando a 
variância dentro e entre grupos
Yik = μ + Ak+ εikModelo linear: 
Onde:
Yik é a observação da réplica i no nivel k do fator A
μ é a média de todas as populações amostradas, 
Ak representa o efeito do nível k do fator A sobre a média
eik é o erro residual devido a réplicas dentro de cada 
nivel k
• Hipóteses: 
Análise de variância
Para comparação entre 2 grupos (pode-se usar teste t também)
H0 : µ1 = µ2
Ha : µ1 ≠ µ2
a (número de grupos) = 2
Para comparação entre 3 grupos 
H0 : µ1 = µ2 = µ3
Ha : Ao menos um µk diferente
a (número de grupos) = 3
Padrão de avaliação da ANOVA é a 
Distribuição de F de Fisher que 
permite saber a probabilidade dos 
dados observados serem produto 
do acaso
Distribuição de F 
Como funciona? Exemplo efeito de predadores sobre 
crustáceos de água doce
*Verificar se a presença de pistas químicas de predadores 
afeta a concentração de proteínas envolvidas na recepção 
de sinais químicos de crustáceos de água doce* 
Desenho experimental
• 20 crustáceos em 20 aquários individuais:
- 10 em aquários com exudado de predadores
- 10 em aquários sem exudado (controle)
• Após um tempo de exposição, medição da concentração da proteína envolvida na recepção de 
sinais nos 20 crustáceos.
Resumindo:
• Variável independente ou fator possui 2 níveis: A = com e B = sem 
Ou seja, temos dois grupos (a= 2) 
• N = 10
Exemplo efeito de predadores sobre crustáceos de água doce
*Verificar se a presença de pistas químicas de predadores afeta a 
concentração de proteínas envolvidas na recepção de sinais químicos de 
crustáceos de água doce* 
....
20 unidades experimentais
A = com exsudados de predadores e B = sem exsudados
n = 10 réplicas
A A A BBB
Concentração de 
proteínas 
(mg/mL)
Animal com sem
1 0.069 0.01
2 0.067 0.013
3 0.071 0.014
4 0.063 0.015
5 0.076 0.01
6 0.065 0.009
7 0.066 0.011
8 0.064 0.014
9 0.069 0.008
10 0.068 0.012
Hipóteses:
- Biológicas: 
H0 : Não existem diferenças na concentração de proteínas 
em crustáceos na presença versus ausência de exsudados 
de predadores
Ha : Existem diferenças significativas entre os dois grupos 
experimentais, atribuíveis à presença ou ausência de 
exsudados de predadores.
- Estatísticas:
H0 : µ1 = µ2
Ha : µ1 ≠ µ2
Fr
eq
u
ên
ci
a
Conc. Proteína (mg/mL)
Fr
eq
u
ên
ci
a
Conc. Proteína (mg/mL)
H0
Ha
µ2µ1
µ1 = µ2
SQdentro = ෍
𝑘=1
𝑎
෍
𝑖=1
𝑛
(𝑌𝑖𝑘 − 𝑌𝑘)
2
SQentre = 𝑛 ෍
𝑘=1
𝑎
(𝑌𝑘 − 𝑌)
2
SQtotal = ෍
𝑖𝑘
𝑛
(𝑦𝑖𝑘 − 𝑌)
2
SQ Total = SQ dentro + SQ entre
Conc. Proteína (mg/mL)
Fr
eq
u
ên
ci
a
Na prática
Y1 Y2
a= número de grupos (níveis do fator)
n = número de réplicas 
Y
y11 y12
Fonte de Variação GL SQ QM F obs p
Fobs= QMentre/QMdentro
ENTRE GRUPOS a-1 SQentre QMentre= SQentre/(a-1)
DENTRO DE 
GRUPOS 
(Erro Experimental)
a(n-1) SQdentro QMdentro= SQdentro/a(n-1)
TOTAL an-1 SQtotal
• Rejeitamos H0, se p ≤ α (nível de significância - normalmente 0,05)
• Não rejeitamos H0, se p > α . 
Concentração de 
proteínas 
(mg/mL)
Animal com sem
1 0.069 0.01
2 0.067 0.013
3 0.071 0.014
4 0.063 0.015
5 0.076 0.01
6 0.065 0.009
7 0.066 0.011
8 0.064 0.014
9 0.069 0.008
10 0.068 0.012
Ycom= 0.0678 Ysem= 0.0116
Y =0.0397
SQentre = 10 * (((0.0678-0.0397)^2)+((0.0116,-0.0397)^2)) = 0.0157922
SQdentro = ((0.069-0.0678)^2) ... + ((0.01-0.0116)^2)... = 0.00018
QMentre = SQentre/a-1 = 0.0157922/1= 0.0157922
QMdentro = SQdentro/a(n-1) = 0.00018/(2(10-1)) = 0.00018/18 = 0.00001
F = 
0.0157922
0.00001
= 1579.22
Fr
eq
u
ên
ci
a
α = 0,05
Fcrítico = 4,414
α = 0.05
n = 10
G.L numerador = 1
G.L denominador = 18
F crítico [1,18] = 4,414
H0 : µ1 = µ2
Ha : µ1 ≠ µ2
F observado = 1579,22
Não rejeita H0 rejeita H0
Tabela de F
Decisão: rejeitar H0
Conclusão: Existe diferença 
significativa na concentração de 
proteínas do crustáceo em 
aquários com e sem pistas 
químicas do predador 
Tabela de F para α = 0.05. V1 = numerador, V2 = denominador da fórmula de F.
Graus de 
Liberdade
Procuramos o 
F crítico [1,18] 
Test for equal means
Sum of sqrs df Mean square F p (same)
Between groups: 0,0157922 1 0,0157922 1579 5,466E-19
Within groups: 0,00018 18 1E-05 Permutation p (n=99999)
Total: 0,0159722 19 2E-05
Components of variance (only for random effects):
Var(group): 0,00157822 Var(error): 1E-05 ICC: 0,993704
omega2: 0,9875
Levene´s test for homogeneity of variance, from means p (same): 0,3464
Levene´s test, from medians p (same): 0,3501
Welch F test in the case of unequal variances: F=1579, df=15,08, p=1,109E-16
Fazendo no PAST
Distribuição esperada com base em H0 Distribuição esperada com base em Ha
No caso de 3 grupos
- Variável dependente: Notas dos alunos
- Fator: Turma, 3 níveis (turma 1, turma 2 e turma 3) 
Pressupostos
• Amostragem aleatória
• Normalidade
• Erros independentes
• Homogeneidade de variâncias (homoscedasticidade)
Testes específicos
Teste de Tukey para diferenciação entre 
grupos
• Casos em que temos um fator com mais de 2 níveis 
• ANOVA só dá reposta sobre se há diferença entre grupos
• Mas não diz qual é diferente de qual
• Teste de Tukey: testa diferenças entre pares de grupos
Tipos de ANOVA
• ANOVA univariada (uma 
variável dependente e duas 
ou mais variáveis 
independentes)
• ANOVA multivariada : mais 
de uma variável dependente 
e duas ou mais variáveis 
independentes
-Uma via (uma variável dependente e uma variável 
independente)
-Duas vias (uma variável dependente e duas variáveis 
independentes)
-ANOVA em blocos (uma variável dependente e uma ou mais 
variáveis independentes + uma variável que se quer bloquear)
-ANOVA aninhada (uma variável dependente e ao menos duas 
variáveis independentes hierarquicamente organizadas)
*Tipos de fatores: fixo ou aleatório
Exemplo anterior: 
*Verificar se a presença de pistas químicas de predadores afeta a concentração de 
proteínas envolvidas na recepção de sinais químicos de crustáceos de água doce* 
• ANOVA de uma via (unifatorial) com efeito fixo
• Fator predador com dois níveis (com e sem)
• Existem fatores fixos ou aleatórios, qual a diferença?
Fatores fixos vs aleatórios
• Mesmos pressupostos
• Em ambos os casos a amostragem e a disposição dos níveis do fator 
nas unidades experimentais deve ser aleatória
* Se relaciona com a maneira como os níveis do fator são 
incorporados ao estudo e com a intepretação que pode ser feita dos 
resultados
Fatores fixos
• Um fator é considerado fixo se todos os níveis de interesse do fator 
são incluídos no estudo
• Exemplos:
- Efeito da presença de predadores sobre a densidade de presas (com e 
sem predadores)
- Efeito da sazonalidade sobre a taxa de crescimento de uma espécie 
(primavera, verão, outono e inverno) 
Fatores aleatórios
• Um fator é consideradoaleatório, quando os níveis desse fator 
incluídos no estudo forem selecionados de forma aleatória de um 
universo muito maior de níveis possíveis.
• Exemplos:
- Diversidade genética de pequenos mamíferos em diferentes 
localidades do estado do RJ (algumas localidades selecionadas 
aleatoriamente)
- Diferença na taxa fotossintética de espécies de arbustos (5 espécies 
de arbustos selecionadas ao acaso)
Diferenciação fatores fixos e aleatórios
• Existe intenção em se fazer um teste a posteriori para determinar que 
nível difere de qual?
• Se o estudo fosse repetido os mesmos níveis do fator seriam 
utilizados novamente?
• Se as respostas forem sim, então o fator deve ser considerado como 
fixo.
• Cálculos são iguais
• Conclusões são levemente diferentes:
- Fator fixo: são feitas em cima dos níveis selecionados
- Fator aleatório: são feitas em cima do fator como um todo
ANOVA bi-fatorial (de 2 vias)
• 2 fatores de interesse (C e D), cada um com vários níveis
• Estamos interessados no efeito simultâneo dos dois fatores sobre a variável 
resposta 
C D
D1
D2
D3
D4
C1
C2
C3
C4
Genótipo
Ambiente A B
14oC Tipo A, 14oC Tipo B, 14oC
23oC Tipo A, 23oC Tipo B, 23oC
30oC Tipo A, 30oC Tipo B, 30oC
32oC Tipo A, 32oC Tipo B, 32oC
Na ANOVA de 2 vias temos mais uma fonte de 
variação: a interação entre os dois fatores
Modelo Linear ANOVA 2 vias 
Onde:
• μ é a média de todas as populações amostradas, 
• Ykij é a observação da réplica j no nivel k do fator A no nivel i do fator B
• Ak representa o efeito do nível k do fator A sobre a média
• Bi representa o efeito do nível i do fator B sobre a média
• ABki representa a interação para a combinação do nivel k de A e o nivel i de B
• ekij é o erro residual debido a réplicas dentro de cada combinação de k vs i 
Ykij = μ + Ak + Bi + ABki + ekij
Genótipo
Ambiente C D
14oC Tipo A, 14oC Tipo B, 14oC
23oC Tipo A, 23oC Tipo B, 23oC
30oC Tipo A, 30oC Tipo B, 30oC
32oC Tipo A, 32oC Tipo B, 32oC
Exemplo: deseja-se avaliar o efeito de dois 
genótipos sobre a taxa metabólica de 
indivíduos sujeitos a quatro diferentes 
condições ambientais
Fator A - Genótipo 
Níveis - C e D , a = 2
Hipóteses:
H01: Não existe efeito do genótipo sobre a taxa metabólica 
Ha1: Existe efeito do genótipo sobre a taxa metabólica
Fator B- Ambiente
Níveis - 14, 23, 30 e 32oC , a = 4
Hipóteses:
H02: Não existe efeito do ambiente sobre a taxa metabólica
Ha2: Existe efeito do ambiente sobre a taxa metabólica
Interação: Efeito conjunto do genótipo e ambiente sobre a taxa metabólica
Níveis - Analisam-se as diferenças entre níveis de um fator com respeito aos níveis do outro fator
Hipóteses:
H03: O efeito do genótipo é independente do ambiente
Ha3: O efeito do genótipo depende da condição ambiental
1ª Hipótese a 
ser testada!
Taxa 
metabólica
Genótipo
C D
32oC
30oC
23oC
14oC
Só efeito do ambiente
Taxa 
metabólica
Genótipo
C D
32oC
30oC
23oC
14oC
Efeito do ambiente e do genótipo
Taxa 
metabólica
Genótipo
C D
32oC
30oC
23oC
14oC
Interação
Desenho ortogonal e replicado
• A única maneira de se avaliar o efeito da interação entre dois fatores 
é através de um desenho ortogonal e replicado
• Desenho ortogonal: todos os níveis de um fator se combinam com os 
níveis do outro fator
• Replicado: mais de uma unidade experimental por combinação de 
níveis de fatores
• Desenhos fatoriais são mais poderosos 
do que ANOVA de uma via
Genótipo
Ambiente A B
14oC 
23oC
30oC
32oC
Testando Hipóteses
• Teste F para o efeito do Fator A (Genótipo)
H01: µ1 = µ2
Ha1: µ1 ≠ µ2
• Teste F para o efeito do Fator B (Ambiente)
H02: µ1 = µ2 = µ3 = µ4
Ha2: Ao menos um µ diferente 
• Teste F para o efeito da Interação AB (Genótipo x Ambiente)
H02: Interação entre AB é 0
Ha2: A interação entre AB não é O
F = 
QMA
QMerro
F = 
QMB
QMerro
F = 
QMAB
QMerro
Rejeita H0
se p<0.05
Rejeita H0
se p<0.05
Rejeita H0
se p<0.05
1ª Hipótese a 
ser testada!
• Rejeitamos H0, se p < α (nível de significância - normalmente 0,05)
• Não rejeitamos H0, se p > α . 
Fonte de variação GL SQ QM Fobs p
Fator A a-1 SQA SQA/a-1 QMA/QMerro
Fator B b-1 SQB SQB/b-1 QMB/Qmerro
Interação AB (a-1) (b-1) SQAB SQAB/(a-1)(b-1) QMAB/QMerro
Erro (dentro de 
grupos)
ab(n-1) SQerro SQerro/ab(n-1)
Total n-1 SQTotal
PRÁTICA
Exercício 1. Efeito de uma planta competidora 
1. Uma pesquisadora tem observado que uma espécie de planta de restinga parece ocorrer em
menor abundância quando está na presença de outra planta que utiliza os mesmos recursos,
que são escassos. Para avaliar se as duas plantas competem por recursos, a pesquisadora
elaborou um experimento de campo em que pretende remover a competidora para avaliar seu
efeito. Primeiramente, ela selecionou uma grande área na restinga e dispôs aleatoriamente 21
unidades experimentais com quadrados de 1m2. Em seguida, atribuiu três diferentes
tratamentos experimentais a 7 unidades experimentais, cada: um tratamento sem manipulação
com a presença da planta competidora (chamado de com ou controle), um tratamento sem a
planta competidora (retirada manualmente) e um último tratamento que ela chamou de
controle do procedimento em que ela manipulou um pouco, mas não removeu a espécie
competidora. Após 30 dias de experimento, ela mediu a porcentagem de cobertura da planta
focal e inseriu os dados na tabela abaixo:
Porcentagem de cobertura 
Com Sem Controle do procedimento 
30.4 58 29 
27.3 56 28 
26.4 55.6 28.5 
28.6 54.3 28.6 
31 54 29.1 
30.2 57 27.4 
29 56.5 30 
 
Exercício 2. 
2. Um pesquisador quer saber se o crescimento de uma planta é
influenciado pela exposição a luz do sol e pela frequência de
regas. Para avaliar isso, ele planta 40 sementes e deixa-as crescer
por dois meses sob diferentes condições de luz do sol (nenhuma,
baixa, média e alta ) e regas (diária e semanal) .
Frequência de rega Exposição a Luz Crescimento 
Diária Nenhuma 4.8 
Diária Nenhuma 4.4 
Diária Nenhuma 3.2 
Diária Nenhuma 3.9 
Diária Nenhuma 4.4 
Diária Baixa 5 
Diária Baixa 5.2 
Diária Baixa 5.6 
Diária Baixa 4.3 
Diária Baixa 4.8 
Diária Média 6.4 
Diária Média 6.2 
Diária Média 4.7 
Diária Média 5.5 
Diária Média 5.8 
Diária Alta 6.3 
Diária Alta 6.4 
Diária Alta 5.6 
Diária Alta 4.8 
Diária Alta 5.8 
Semanal Nenhuma 4.4 
Semanal Nenhuma 4.2 
Semanal Nenhuma 3.8 
Semanal Nenhuma 3.7 
Semanal Nenhuma 3.9 
Semanal Baixa 4.9 
Semanal Baixa 5.3 
Semanal Baixa 5.7 
Semanal Baixa 5.4 
Semanal Baixa 4.8 
Semanal Média 5.8 
Semanal Média 6.2 
Semanal Média 6.3 
Semanal Média 6.5 
Semanal Média 5.5 
Semanal Alta 6 
Semanal Alta 4.9 
Semanal Alta 4.6 
Semanal Alta 5.6 
Semanal Alta 5.5 
 
	Slide 1
	Slide 2: Tópicos de Hoje
	Slide 3: Recapitulando
	Slide 4: Análise de variância
	Slide 5
	Slide 6: Análise de variância
	Slide 7
	Slide 8: Como funciona? Exemplo efeito de predadores sobre crustáceos de água doce *Verificar se a presença de pistas químicas de predadores afeta a concentração de proteínas envolvidas na recepção de sinais químicos de crustáceos de água doce* 
	Slide 9: Exemplo efeito de predadores sobre crustáceos de água doce *Verificar se a presença de pistas químicas de predadores afeta a concentração de proteínas envolvidas na recepção de sinais químicos de crustáceos de água doce* 
	Slide 10
	Slide 11: Na prática
	Slide 12
	Slide 13
	Slide 14
	Slide 15
	Slide 16
	Slide 17: No caso de 3 grupos
	Slide 18: Pressupostos
	Slide 19: Teste de Tukey para diferenciação entre grupos
	Slide 20: Tipos de ANOVA
	Slide 21: Exemplo anterior: *Verificar se a presença de pistas químicas de predadores afeta a concentração de proteínas envolvidas na recepção de sinais químicos de crustáceos de água doce* 
	Slide 22: Fatores fixos vs aleatórios
	Slide 23: Fatores fixos
	Slide 24: Fatores aleatórios
	Slide 25: Diferenciação fatores fixos e aleatórios
	Slide 26: ANOVA bi-fatorial (de 2 vias)
	Slide 27: Modelo Linear ANOVA 2 vias 
	Slide 28
	Slide 29
	Slide 30: Desenho ortogonal e replicado
	Slide31: Testando Hipóteses
	Slide 32
	Slide 33: PRÁTICA
	Slide 34: Exercício 1. Efeito de uma planta competidora 
	Slide 35
	Slide 36: Exercício 2. 
	Slide 37

Continue navegando