Buscar

Estatistica_aulas_33_34_ANOVA

Prévia do material em texto

EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 1
Estatística
Prof. Paulo Renato A. Firmino
praf62@gmail.com
Aulas 33 – 34
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 2
§ Observações importantes
§ ANOVA pode ser aplicada não apenas a modelos de regressão linear, 
mas a qualquer tipo de modelo
§ Pode-se, por exemplo, estudar a adequação do modelo 
μY|x = E[Y|x] = α + β1·x + β2·x2
§ De fato, para o modelo linear, a raiz de R2 (o coeficiente de 
determinação – aula anterior) leva ao coeficiente de correlação 
linear de Pearson
§ Dependências não-lineares podem ser também estudadas
§ Ela permite, também, estudar a associação entre variáveis 
categóricas (ou categorizadas) e uma variável quantitativa
§ Tema estudado a partir de agora
Modelos de Regressão X ANOVA
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 3
• Estudaremos a partir de agora ... 
1. Como comparar vários tratamentos
• Sempre baseando-se na ANOVA
2. Como delinear os experimentos necessários
Planejamento de um Experimento
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 4
• Noções básicas
ƒ Nível de um fator: é um particular valor (ou categoria) 
atribuído ao fator (variável sob a qual estuda-se a resposta das 
unidades experimentais)
• Se estuda-se a relação entre o fator (variável) consumo de fruto 
(X) e incidência de aborto (a resposta), X=0 g é um nível deste 
fator
• Assim, cada nível de um fator (ou combinação de níveis de 
vários fatores) pode ser visto como um tratamento sob o qual 
deseja-se estudar a variável resposta
Planejamento de um Experimento
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 5
• Noções básicas
ƒ Fatores & Tratamentos
• No planejamento de um experimento a determinação dos 
tratamentos sob estudo deve se dar de forma cautelosa
• Exemplo 1: Estuda-se qual de três procedimentos cirúrgicos é
mais eficiente (mais rápido): o 1, o 2 ou o 3
– Estes seriam os níveis do fator X≡ “procedimento cirúrgico”
• A princípio, há três tratamentos (X= 1, X=2, X=3)
Planejamento de um Experimento
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 6
• Noções básicas
ƒ Fatores & Tratamentos: do Exemplo,
• Para verificar qual é o melhor procedimento, o pesquisador deve
1. Permitir que os médicos escolham o procedimento a adotar?
– Alguns médicos podem ter suas preferências sobre qual dos 
métodos é o melhor
– Pode-se então sortear, para cada médico, qual procedimento 
adotar
» Considera-se o fator Y≡“preferência do médico”
2. Levar cada médico a aplicar todos os procedimentos, sem se 
preocupar com a ordem de aplicação?
– A ordem de aplicação dos procedimentos pode (des)favorecer 
um ou outro método
» Considera-se o fator Z≡”ordem de aplicação dos 
procedimentos”
• A ANOVA avaliaria a associação de cada um dos fatores e destes 
com a variável resposta
Planejamento de um Experimento
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 7
Planejamento de um Experimento X 
Regressão X ANOVA
T r
a t
a m
e n
t o
s
Consumo de tempo
Se X for quantitativo
ANOVA
Independente de X ser ou não quantitativo
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 8
• Modelos de ANOVA são usados para analisar a associação 
entre tratamentos e a variável resposta
ƒ Permitem concluir sobre 
1. Há diferença de desepmenho entre os tratamentos?
• Em modelos de regressão, estudamos
ƒ [Y|xi]=
• Enfatizamos
• Em modelos de ANOVA com 1 fator, estudaremos a média da 
variável-resposta (Y) sob o iº tratamento:
ƒ ni ≡ nº de unidades experimentais submetidas ao iº tratamento
ƒ k ≡ nº de tratamentos
ƒ n ≡ nº total de unidades experimentais 
Planejamento de um Experimento X ANOVA
ix|Yi
]x|Y[E μ=
ix|Y xi ⋅β+α=μ
ix|Y i
ε+μ
ix|Y i
μ=μ
⎟⎟⎠
⎞⎜⎜⎝
⎛ = ∑
=
k
1i
inn
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 9
• Experimento Inteiramente ao Acaso
ƒ Os tratamentos são destinados às unidades experimentais de 
maneira totalmente aleatória
• Cada tratamento é repetido por ni vezes
ƒ O modelo é Yij = μi + εij
• Yij ≡ o valor da variável-resposta diante da jª repetição do iº
tratamento
• εij ≡ erro aleatório para representar variações não captadas por 
μi na jª repetição do iº tratamento
Experimento Inteiramente ao Acaso X Modelo 
ANOVA com 1 fator
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 10
Experimento Inteiramente ao Acaso
Y..……
Soma
-……Média
nnk...ni...n2n1Nº repet.
-Yknk...Yini...Y2n2Y1n1
-.....................
-Ykj...Yij...Y2jY1jj
-……………......
-Yk2...Yi2...Y22Y122
-Yk1...Yi1...Y21Y111
k...i...21
Total
Tratamento
Repet. (j)
Nº de 
tratamentos
Valor-resposta da jª
aplicação do iº
tratamento
Yij = μi + εij
Tamanho da 
amostra
Nº de repetições do 
iº tratamento
Experimento Inteiramente ao Acaso X Modelo 
ANOVA com 1 fator
1Y 2Y iY kY
∑
=
1n
1j
j1Y ∑
=
2n
1j
j2Y ∑=
in
1j
ijY ∑
=
kn
1j
kjY
∑
=
==
k
1i
ii Ynn
1
n
..YY
∑∑
= =
=
k
1i
n
1j
ij
i
Y..Y
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 11
• Do Exemplo 1: Estuda-se qual procedimento é mais eficiente
ƒ Fator sob estudo: X≡”Procedimento cirúrgico”
ƒ Tratamentos: 1 (procedimento 1), 2 (procedimento 2) e 3 
(procedimento 3)
ƒ Variável-resposta: “Tempo de cirurgia”
ƒ Para cada cirurgião, o procedimento a adotar foi selecionado 
aleatoriamente
• Nº de repetições: 4 para o 1º tratamento e 3 para cada um dos 
restantes
Experimento Inteiramente ao Acaso X Modelo 
ANOVA com 1 fator
2133121321Tratamento
10987654321Médico
-47.93 38.36 37.31 Média
408.07 143.78 115.08 149.22 Soma 
---21.16 4 
-34.51 25.69 45.93 3 
-54.97 48.08 40.00 2 
-54.30 41.31 42.13 1 
321 Soma 
Tratamento
Repet
Média geral: 81.40Y =
Sorteio aleatório
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 12
• Do Exemplo 1: Estuda-se qual procedimento é mais eficiente
ƒ Vê-se que as médias amostrais variaram
• Até que ponto essa variação pode ser considerada devido ao 
acaso?
• A ANOVA nos auxiliará na resposta a esta pergunta
Experimento Inteiramente ao Acaso X Modelo 
ANOVA com 1 fator
-47.93 38.36 37.31 Média
408.07 143.78 115.08 149.22 Soma 
---21.16 4 
-34.51 25.69 45.93 3 
-54.97 48.08 40.00 2 
-54.30 41.31 42.13 1 
321 Soma 
Tratamento
Repet
Média geral: 81.40Y =
20
30
40
50
60
0 1 2 3 4
Xi
yij
y2j
y1j
y3j
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 13
• Fontes de variação da ANOVA com 1 fator
• De maneira geral, estuda-se três fontes de variação
ƒ Sabe-se que 
ƒ ... e que 
Modelo ANOVA com 1 fator
)yy()yy(yy iiijij −+−=−
( ) ( ) ( )∑∑∑∑∑
== == =
−⋅+−=−
k
1i
2
ii
k
1i
n
1j
2
iij
k
1i
n
1j2
ij yynyyyy
ii
Soma de Quadrados 
Total (SQT)
Soma de Quadrados 
dos Erros (SQE)
Soma de Quadrados da 
Média nos 
Tratamentos/Regressão 
(SQTr)Veja que 
S2Y = SQT/ (n-1)
Veja que o modelo é
a média para o 
tratamento
SQT = SQE + SQTr
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 14
• Outras formulações para SQT, SQE e SQTr
Modelo ANOVA com 1 fator
Fontes de variação
( ) 2k
1i
n
1j
ij
k
1i
n
1j
2
ij
k
1i
n
1j
2
ij
iii
y
n
1yyySQT ⎟⎟⎠
⎞
⎜⎜⎝
⎛−=−= ∑∑∑∑∑∑
= == == =
( ) SQESQTyynSQTr n
1i
2
ii −=−= ∑
=
( ) ∑∑∑∑ ∑∑∑∑∑
== == == == =
−=⎟⎟⎠
⎞
⎜⎜⎝
⎛−=−=
k
1i
2
ii
k
1i
n
1j
2
ij
k
1i
2n
1j
ij
i
k
1i
n
1j
2
ij
k
1i
n
1j
2
iij ynyyn
1yyySQE
iiii
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 15
• Cada fonte de variação está associada a certo nº de graus de 
liberdade
ƒ Aqueles mesmos graus de liberdade (gl) relacionados com as 
distribuições t-Student e Qui-quadrado
ƒ Basicamente, tem-se n gl para SQT e SQE
• Contudo, perde-se 1 gl por parâmetro estimado
• Para , estima-se μY: tem-se (n-1) gl
• Para , estima-se μi (i=1, ..., k): tem-se (n-k) gl
ƒ Como os gl da SQT são distribuídos na SQE e SQTr,
• Para , tem-se (n-1)-(n-k) = (k-1) gl
Modelo ANOVA com 1 fator
Graus de Liberdade
( )∑∑
= =
−=
k
1i
n
1j
2
iij
i
yySQE
( )∑∑
= =
−=
k
1i
n
1j
2
ij
i
yySQT
( )∑
=
−⋅=
k
1i
2
ii yynSQTr
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 16
• Tabela ANOVA
• fobs provem de uma distribuição F-Snedecor com v1=(k-1) gl e v2=(n-k) gl
ƒ A regra de decisão recorre, agora, à FS(k-1, n-k)
ƒ Rejeitar H0 implica em considerar que há diferenças entre as 
médias
Modelo ANOVA com 1 fator
Tabela
QMT = SQT/(n-1) = Sy2n-1Total
QME = SQE/(n-k)n-kErro
QMTr = SQTr/(k-1)k-1
Tratam
fobsQuadrado médio
Soma de 
quadrados
Graus de 
liberdade
Fonte de 
variação
QME
QMTr
( )∑
=
−⋅=
k
1i
2
ii yynSQTr
( )∑∑
= =
−=
k
1i
n
1j
2
iij
i
yySQE
( )∑∑
= =
−=
k
1i
n
1j
2
ij
i
yySQT
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 17
1. Do exemplo 1, monte a tabela de ANOVA
2. Para os dados abaixo, monte a tabela ANOVA
Modelo ANOVA com 1 fator
Exercício 1
-47.93 38.36 29.27 Média
375.94 143.78 115.08 117.09 Soma 
---21.16 4 
-34.51 25.69 45.93 3 
-54.97 48.08 40.00 2 
-54.30 41.31 10.001 
321 Soma 
Tratamento
Repetição
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 18
• Se fobs=QMTr/QME=0: Há indícios de independência entre X e 
Y
• ȳi→ ȳ: 
– SQTr→ 0
– SQE → SQT (SQT = SQE + SQTr)
• Mas até que ponto um fobs≠0 implica em associação entre X e Y?
– Do Exemplo 1: fobs = 0.85
– Teria fobs≠0 sido simplesmente devido ao acaso?
– Para responder, recorreremos a Testes de Hipóteses
( )
kn
yy
QME
k
1i
n
1j
2
iij
i
−
−
=
∑∑
= = ( )
1k
yyn
QMTr
k
1i
2
ii
−
−⋅
=
∑
=
Modelo ANOVA com 1 fator
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 19
• Passo 1: Identificando H0 e H1
• H0≡ não há relação entre X (fator) e Y (resposta)
– Para que se prove o contrário
• Passo 2: Escolha dos parâmetros e respectivos 
estimadores 
• Os parâmetros a estudar são as respostas médias aos tratamentos: 
E[Yij]= μi, i=1, 2, ..., k (μ1, μ2, ..., μk)
– Yij = μi + εij
– Os estimadores associados serão as médias amostrais, Ȳi
– Trata-se de um teste de hipóteses sobre a média de Y 
sob cada um dos tratamentos (μi)
Modelo ANOVA com 1 fator
Teste de Hipótese
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 2020
• Concluindo o Passo 1: Especificação das hipóteses
ƒ De acordo com H0 (passo 1), 
• Não há relação entre X e Y
ƒ Logo, concretizando o Passo 1, 
• Testa-se H0: μ1 = μ2 = ...=μk contra
H1: μi≠ μt (para algum i<t = 2, ..., k)
• Perceba que se H0 é verdadeira, μi = μ
– μ ≡ média populacional da variável-resposta (Y), 
independente dos tratamentos
Modelo ANOVA com 1 fator
Teste de Hipótese
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 21
• Passo 2: Distribuição do estimador
• Supõe-se que
• Os xi são valores de controle (prefixados)
• Yi são variáveis aleatórias mutuamente independentes
• Yij ~ Normal(μi, σe2)
– Veja que a variância é constante ao longo dos tratamentos
– Se2 é um estimador para σe2
• Assim, F ~ FS(v1=k-1, v2=n-k)
21
( )
2
e
n
1i
2
ii
S
)1k(
YYn
F −
−
=
∑
=
( )
kn
YY
S
k
1i
n
1j
2
iij
2
e
i
−
−
=
∑∑
= =
Modelo ANOVA com 1 fator: Teste de 
Hipótese
Independente de X ser ou não quantitativo
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 2222
VACs - Função Densidade de Probabilidade
• Distribuição F-Snedecor (F)
ƒ ΩX = {x real| x > 0}
ƒ .
ƒ com u (>0) e v (>4) sendo os graus de liberdade para X do 
numerador e denominador, respectivamente
• Também faz uso de valores tabelados
df() # density
pf() # probability
qf() # quantile
rf() # random
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 23
• Passo 3: Construção da regra de decisão
• Se μi= μt, então espera-se valores de F próximos de 0
– Ȳi se aproximará de Ȳ
• Se houver algum μi≠ μt, espera-se valores de F mais 
distantes de 0
– Ȳi e Ȳt se distanciarão de Ȳ
23
Modelo ANOVA com 1 fator
Teste de Hipótese
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 24
• Passo 3: Construção da regra de decisão
ƒ Método clássico: Determina-se um valor crítico vc para F segundo α
– Valores de F não superiores a vc são considerados perturbações 
naturais, não refutando H0
– vc = FS(k-1, n-k, 1-α)
» FS(k-1, n-k, 1-α) é o valor da distrbuição F-Snedecor com v1=(k-
1) e v2=(n-k) gl que acumula abaixo dele (1-α) de área
Região de rejeição de H0
Região favorável a H0
)kn ,1k(f −−vc
α
0
( )k21ck)-n 1,-(k00 ...|vFSPverdade) é H|H rej(P μ==μ=μ>==α
Modelo ANOVA com 1 fator
Teste de Hipótese
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 25
• Passo 3: Construção da regra de decisão
ƒ Método do valor-p: Para uma estimativa observada em uma amostra, 
fobs, calcula-se :
• Se α > p*, rejeita-se H0: μ1 = μ2 = ...=μk em favor de
H1: μi ≠ μt (para algum i<t = 2, ..., k)
• Caso contrário, não há porquê para rejeitar H0
fobs
p*
Região de rejeição de H0
Região favorável a H0
)kn ,1k(f −−vc
α
0
Modelo ANOVA com 1 fator
Teste de Hipótese
( ) ( )obsk)-n ,1k(k21obs fFSP...|fFP*p ≥=μ==μ=μ>= −
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 26
Passo 3: Construção da regra de decisão
Retornando ao Exemplo 1 (Os procedimentos cirúrgicos são igualmente 
eficientes?)ƒ A regra de decisão é: 
• Considerando que 
1. As realizações dos procedimentos são independentes entre si
2. O tempo consumido pelos procedimentos se distribue
normalmente, sob variância constante ao longo dos 
procedimentos
• Com n=10 cirurgias, k = 3 procedimentos, α = 0.01
– vc = FS(2, 7) = 9.547
– Como fobs = 0.85 e p*=P(FS(2, 7) > fobs|H0) > 10%, não rejeita-
se H0
» Não há porque duvidar que os procedimentos cirúrgicos 
são igualmente eficientes (μ1=μ2=μ3)
26
vc =9.547
Região favorável a H0 Região desfavorável a H0
fobs =0.850
Modelo ANOVA com 1 fator
Teste de Hipótese
aov
summary
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 27
1. Do exemplo 1, responda: (a) Em palavras, quais hipóteses estão sendo 
confrontadas? (b) Quais são os parâmetros utilizados para abordar o 
problema? Quais são os respectivos estimadores associados? (c) Como as 
hipóteses confrontadas podem ser matematicamente descritas a partir dos 
parâmetros utilizados? (d) O que você concluiria a um nível de significância 
de 10%? E sob um nível de significância de 0.5%? Quais são as respectivas 
regras de decisão? (e) Quais suposições embasam suas análises?
2. Um pesquisador deseja comparar a glicemia de ovelhas tratadas com 
glucagônio. Para tanto, três amostras aleatórias de 10, 8 e 5 ovelhas foram 
submetidas a 1g, 5g e 10g de glucagônio, respectivamente. No grupo-controle 
(com 17 ovelhas) foi utilizada uma solução salina. Após 5 dias, os animais 
foram sacrificados e sua glicemia (em mg%) foi medida, resultando na tabela 
exposta a seguir. Há relação entre os tratamentos e glicemia?
Modelo ANOVA com 1 fator
Exercício 2
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 28
2. Dados
Modelo ANOVA com 1 fator
Exercício 2
65921.9015701.8615651.0417330.2717238.73ni ȳi2
-62.6555.9553.7449.63média (ȳi)
1200.19250.61279.74322.46347.38Soma (yi. )
224 5 6 7 ni
----48.2 7 
---44.7 47.5 6 
--59.5 58.0 57.7 5 
-59.5 50.8 55.9 47.3 4 
-58.8 51.6 47.1 47.4 3 
-62.2 62.5 59.8 44.6 2 
-70.1 55.3 56.9 54.6 1 
10g5g 1g sol. Sal. Soma
Tratamento
Repetição

Continue navegando