Baixe o app para aproveitar ainda mais
Prévia do material em texto
EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 1 Estatística Prof. Paulo Renato A. Firmino praf62@gmail.com Aulas 33 – 34 EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 2 § Observações importantes § ANOVA pode ser aplicada não apenas a modelos de regressão linear, mas a qualquer tipo de modelo § Pode-se, por exemplo, estudar a adequação do modelo μY|x = E[Y|x] = α + β1·x + β2·x2 § De fato, para o modelo linear, a raiz de R2 (o coeficiente de determinação – aula anterior) leva ao coeficiente de correlação linear de Pearson § Dependências não-lineares podem ser também estudadas § Ela permite, também, estudar a associação entre variáveis categóricas (ou categorizadas) e uma variável quantitativa § Tema estudado a partir de agora Modelos de Regressão X ANOVA EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 3 • Estudaremos a partir de agora ... 1. Como comparar vários tratamentos • Sempre baseando-se na ANOVA 2. Como delinear os experimentos necessários Planejamento de um Experimento EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 4 • Noções básicas Nível de um fator: é um particular valor (ou categoria) atribuído ao fator (variável sob a qual estuda-se a resposta das unidades experimentais) • Se estuda-se a relação entre o fator (variável) consumo de fruto (X) e incidência de aborto (a resposta), X=0 g é um nível deste fator • Assim, cada nível de um fator (ou combinação de níveis de vários fatores) pode ser visto como um tratamento sob o qual deseja-se estudar a variável resposta Planejamento de um Experimento EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 5 • Noções básicas Fatores & Tratamentos • No planejamento de um experimento a determinação dos tratamentos sob estudo deve se dar de forma cautelosa • Exemplo 1: Estuda-se qual de três procedimentos cirúrgicos é mais eficiente (mais rápido): o 1, o 2 ou o 3 – Estes seriam os níveis do fator X≡ “procedimento cirúrgico” • A princípio, há três tratamentos (X= 1, X=2, X=3) Planejamento de um Experimento EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 6 • Noções básicas Fatores & Tratamentos: do Exemplo, • Para verificar qual é o melhor procedimento, o pesquisador deve 1. Permitir que os médicos escolham o procedimento a adotar? – Alguns médicos podem ter suas preferências sobre qual dos métodos é o melhor – Pode-se então sortear, para cada médico, qual procedimento adotar » Considera-se o fator Y≡“preferência do médico” 2. Levar cada médico a aplicar todos os procedimentos, sem se preocupar com a ordem de aplicação? – A ordem de aplicação dos procedimentos pode (des)favorecer um ou outro método » Considera-se o fator Z≡”ordem de aplicação dos procedimentos” • A ANOVA avaliaria a associação de cada um dos fatores e destes com a variável resposta Planejamento de um Experimento EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 7 Planejamento de um Experimento X Regressão X ANOVA T r a t a m e n t o s Consumo de tempo Se X for quantitativo ANOVA Independente de X ser ou não quantitativo EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 8 • Modelos de ANOVA são usados para analisar a associação entre tratamentos e a variável resposta Permitem concluir sobre 1. Há diferença de desepmenho entre os tratamentos? • Em modelos de regressão, estudamos [Y|xi]= • Enfatizamos • Em modelos de ANOVA com 1 fator, estudaremos a média da variável-resposta (Y) sob o iº tratamento: ni ≡ nº de unidades experimentais submetidas ao iº tratamento k ≡ nº de tratamentos n ≡ nº total de unidades experimentais Planejamento de um Experimento X ANOVA ix|Yi ]x|Y[E μ= ix|Y xi ⋅β+α=μ ix|Y i ε+μ ix|Y i μ=μ ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ = ∑ = k 1i inn EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 9 • Experimento Inteiramente ao Acaso Os tratamentos são destinados às unidades experimentais de maneira totalmente aleatória • Cada tratamento é repetido por ni vezes O modelo é Yij = μi + εij • Yij ≡ o valor da variável-resposta diante da jª repetição do iº tratamento • εij ≡ erro aleatório para representar variações não captadas por μi na jª repetição do iº tratamento Experimento Inteiramente ao Acaso X Modelo ANOVA com 1 fator EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 10 Experimento Inteiramente ao Acaso Y..…… Soma -……Média nnk...ni...n2n1Nº repet. -Yknk...Yini...Y2n2Y1n1 -..................... -Ykj...Yij...Y2jY1jj -……………...... -Yk2...Yi2...Y22Y122 -Yk1...Yi1...Y21Y111 k...i...21 Total Tratamento Repet. (j) Nº de tratamentos Valor-resposta da jª aplicação do iº tratamento Yij = μi + εij Tamanho da amostra Nº de repetições do iº tratamento Experimento Inteiramente ao Acaso X Modelo ANOVA com 1 fator 1Y 2Y iY kY ∑ = 1n 1j j1Y ∑ = 2n 1j j2Y ∑= in 1j ijY ∑ = kn 1j kjY ∑ = == k 1i ii Ynn 1 n ..YY ∑∑ = = = k 1i n 1j ij i Y..Y EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 11 • Do Exemplo 1: Estuda-se qual procedimento é mais eficiente Fator sob estudo: X≡”Procedimento cirúrgico” Tratamentos: 1 (procedimento 1), 2 (procedimento 2) e 3 (procedimento 3) Variável-resposta: “Tempo de cirurgia” Para cada cirurgião, o procedimento a adotar foi selecionado aleatoriamente • Nº de repetições: 4 para o 1º tratamento e 3 para cada um dos restantes Experimento Inteiramente ao Acaso X Modelo ANOVA com 1 fator 2133121321Tratamento 10987654321Médico -47.93 38.36 37.31 Média 408.07 143.78 115.08 149.22 Soma ---21.16 4 -34.51 25.69 45.93 3 -54.97 48.08 40.00 2 -54.30 41.31 42.13 1 321 Soma Tratamento Repet Média geral: 81.40Y = Sorteio aleatório EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 12 • Do Exemplo 1: Estuda-se qual procedimento é mais eficiente Vê-se que as médias amostrais variaram • Até que ponto essa variação pode ser considerada devido ao acaso? • A ANOVA nos auxiliará na resposta a esta pergunta Experimento Inteiramente ao Acaso X Modelo ANOVA com 1 fator -47.93 38.36 37.31 Média 408.07 143.78 115.08 149.22 Soma ---21.16 4 -34.51 25.69 45.93 3 -54.97 48.08 40.00 2 -54.30 41.31 42.13 1 321 Soma Tratamento Repet Média geral: 81.40Y = 20 30 40 50 60 0 1 2 3 4 Xi yij y2j y1j y3j EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 13 • Fontes de variação da ANOVA com 1 fator • De maneira geral, estuda-se três fontes de variação Sabe-se que ... e que Modelo ANOVA com 1 fator )yy()yy(yy iiijij −+−=− ( ) ( ) ( )∑∑∑∑∑ == == = −⋅+−=− k 1i 2 ii k 1i n 1j 2 iij k 1i n 1j2 ij yynyyyy ii Soma de Quadrados Total (SQT) Soma de Quadrados dos Erros (SQE) Soma de Quadrados da Média nos Tratamentos/Regressão (SQTr)Veja que S2Y = SQT/ (n-1) Veja que o modelo é a média para o tratamento SQT = SQE + SQTr EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 14 • Outras formulações para SQT, SQE e SQTr Modelo ANOVA com 1 fator Fontes de variação ( ) 2k 1i n 1j ij k 1i n 1j 2 ij k 1i n 1j 2 ij iii y n 1yyySQT ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛−=−= ∑∑∑∑∑∑ = == == = ( ) SQESQTyynSQTr n 1i 2 ii −=−= ∑ = ( ) ∑∑∑∑ ∑∑∑∑∑ == == == == = −=⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛−=−= k 1i 2 ii k 1i n 1j 2 ij k 1i 2n 1j ij i k 1i n 1j 2 ij k 1i n 1j 2 iij ynyyn 1yyySQE iiii EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 15 • Cada fonte de variação está associada a certo nº de graus de liberdade Aqueles mesmos graus de liberdade (gl) relacionados com as distribuições t-Student e Qui-quadrado Basicamente, tem-se n gl para SQT e SQE • Contudo, perde-se 1 gl por parâmetro estimado • Para , estima-se μY: tem-se (n-1) gl • Para , estima-se μi (i=1, ..., k): tem-se (n-k) gl Como os gl da SQT são distribuídos na SQE e SQTr, • Para , tem-se (n-1)-(n-k) = (k-1) gl Modelo ANOVA com 1 fator Graus de Liberdade ( )∑∑ = = −= k 1i n 1j 2 iij i yySQE ( )∑∑ = = −= k 1i n 1j 2 ij i yySQT ( )∑ = −⋅= k 1i 2 ii yynSQTr EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 16 • Tabela ANOVA • fobs provem de uma distribuição F-Snedecor com v1=(k-1) gl e v2=(n-k) gl A regra de decisão recorre, agora, à FS(k-1, n-k) Rejeitar H0 implica em considerar que há diferenças entre as médias Modelo ANOVA com 1 fator Tabela QMT = SQT/(n-1) = Sy2n-1Total QME = SQE/(n-k)n-kErro QMTr = SQTr/(k-1)k-1 Tratam fobsQuadrado médio Soma de quadrados Graus de liberdade Fonte de variação QME QMTr ( )∑ = −⋅= k 1i 2 ii yynSQTr ( )∑∑ = = −= k 1i n 1j 2 iij i yySQE ( )∑∑ = = −= k 1i n 1j 2 ij i yySQT EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 17 1. Do exemplo 1, monte a tabela de ANOVA 2. Para os dados abaixo, monte a tabela ANOVA Modelo ANOVA com 1 fator Exercício 1 -47.93 38.36 29.27 Média 375.94 143.78 115.08 117.09 Soma ---21.16 4 -34.51 25.69 45.93 3 -54.97 48.08 40.00 2 -54.30 41.31 10.001 321 Soma Tratamento Repetição EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 18 • Se fobs=QMTr/QME=0: Há indícios de independência entre X e Y • ȳi→ ȳ: – SQTr→ 0 – SQE → SQT (SQT = SQE + SQTr) • Mas até que ponto um fobs≠0 implica em associação entre X e Y? – Do Exemplo 1: fobs = 0.85 – Teria fobs≠0 sido simplesmente devido ao acaso? – Para responder, recorreremos a Testes de Hipóteses ( ) kn yy QME k 1i n 1j 2 iij i − − = ∑∑ = = ( ) 1k yyn QMTr k 1i 2 ii − −⋅ = ∑ = Modelo ANOVA com 1 fator EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 19 • Passo 1: Identificando H0 e H1 • H0≡ não há relação entre X (fator) e Y (resposta) – Para que se prove o contrário • Passo 2: Escolha dos parâmetros e respectivos estimadores • Os parâmetros a estudar são as respostas médias aos tratamentos: E[Yij]= μi, i=1, 2, ..., k (μ1, μ2, ..., μk) – Yij = μi + εij – Os estimadores associados serão as médias amostrais, Ȳi – Trata-se de um teste de hipóteses sobre a média de Y sob cada um dos tratamentos (μi) Modelo ANOVA com 1 fator Teste de Hipótese EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 2020 • Concluindo o Passo 1: Especificação das hipóteses De acordo com H0 (passo 1), • Não há relação entre X e Y Logo, concretizando o Passo 1, • Testa-se H0: μ1 = μ2 = ...=μk contra H1: μi≠ μt (para algum i<t = 2, ..., k) • Perceba que se H0 é verdadeira, μi = μ – μ ≡ média populacional da variável-resposta (Y), independente dos tratamentos Modelo ANOVA com 1 fator Teste de Hipótese EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 21 • Passo 2: Distribuição do estimador • Supõe-se que • Os xi são valores de controle (prefixados) • Yi são variáveis aleatórias mutuamente independentes • Yij ~ Normal(μi, σe2) – Veja que a variância é constante ao longo dos tratamentos – Se2 é um estimador para σe2 • Assim, F ~ FS(v1=k-1, v2=n-k) 21 ( ) 2 e n 1i 2 ii S )1k( YYn F − − = ∑ = ( ) kn YY S k 1i n 1j 2 iij 2 e i − − = ∑∑ = = Modelo ANOVA com 1 fator: Teste de Hipótese Independente de X ser ou não quantitativo EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 2222 VACs - Função Densidade de Probabilidade • Distribuição F-Snedecor (F) ΩX = {x real| x > 0} . com u (>0) e v (>4) sendo os graus de liberdade para X do numerador e denominador, respectivamente • Também faz uso de valores tabelados df() # density pf() # probability qf() # quantile rf() # random EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 23 • Passo 3: Construção da regra de decisão • Se μi= μt, então espera-se valores de F próximos de 0 – Ȳi se aproximará de Ȳ • Se houver algum μi≠ μt, espera-se valores de F mais distantes de 0 – Ȳi e Ȳt se distanciarão de Ȳ 23 Modelo ANOVA com 1 fator Teste de Hipótese EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 24 • Passo 3: Construção da regra de decisão Método clássico: Determina-se um valor crítico vc para F segundo α – Valores de F não superiores a vc são considerados perturbações naturais, não refutando H0 – vc = FS(k-1, n-k, 1-α) » FS(k-1, n-k, 1-α) é o valor da distrbuição F-Snedecor com v1=(k- 1) e v2=(n-k) gl que acumula abaixo dele (1-α) de área Região de rejeição de H0 Região favorável a H0 )kn ,1k(f −−vc α 0 ( )k21ck)-n 1,-(k00 ...|vFSPverdade) é H|H rej(P μ==μ=μ>==α Modelo ANOVA com 1 fator Teste de Hipótese EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 25 • Passo 3: Construção da regra de decisão Método do valor-p: Para uma estimativa observada em uma amostra, fobs, calcula-se : • Se α > p*, rejeita-se H0: μ1 = μ2 = ...=μk em favor de H1: μi ≠ μt (para algum i<t = 2, ..., k) • Caso contrário, não há porquê para rejeitar H0 fobs p* Região de rejeição de H0 Região favorável a H0 )kn ,1k(f −−vc α 0 Modelo ANOVA com 1 fator Teste de Hipótese ( ) ( )obsk)-n ,1k(k21obs fFSP...|fFP*p ≥=μ==μ=μ>= − EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 26 Passo 3: Construção da regra de decisão Retornando ao Exemplo 1 (Os procedimentos cirúrgicos são igualmente eficientes?) A regra de decisão é: • Considerando que 1. As realizações dos procedimentos são independentes entre si 2. O tempo consumido pelos procedimentos se distribue normalmente, sob variância constante ao longo dos procedimentos • Com n=10 cirurgias, k = 3 procedimentos, α = 0.01 – vc = FS(2, 7) = 9.547 – Como fobs = 0.85 e p*=P(FS(2, 7) > fobs|H0) > 10%, não rejeita- se H0 » Não há porque duvidar que os procedimentos cirúrgicos são igualmente eficientes (μ1=μ2=μ3) 26 vc =9.547 Região favorável a H0 Região desfavorável a H0 fobs =0.850 Modelo ANOVA com 1 fator Teste de Hipótese aov summary EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 27 1. Do exemplo 1, responda: (a) Em palavras, quais hipóteses estão sendo confrontadas? (b) Quais são os parâmetros utilizados para abordar o problema? Quais são os respectivos estimadores associados? (c) Como as hipóteses confrontadas podem ser matematicamente descritas a partir dos parâmetros utilizados? (d) O que você concluiria a um nível de significância de 10%? E sob um nível de significância de 0.5%? Quais são as respectivas regras de decisão? (e) Quais suposições embasam suas análises? 2. Um pesquisador deseja comparar a glicemia de ovelhas tratadas com glucagônio. Para tanto, três amostras aleatórias de 10, 8 e 5 ovelhas foram submetidas a 1g, 5g e 10g de glucagônio, respectivamente. No grupo-controle (com 17 ovelhas) foi utilizada uma solução salina. Após 5 dias, os animais foram sacrificados e sua glicemia (em mg%) foi medida, resultando na tabela exposta a seguir. Há relação entre os tratamentos e glicemia? Modelo ANOVA com 1 fator Exercício 2 EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino , Prof. Paulo Renato A. Firmino , AulasAulas 33 33 -- 34 34 -- ANOVAANOVA 28 2. Dados Modelo ANOVA com 1 fator Exercício 2 65921.9015701.8615651.0417330.2717238.73ni ȳi2 -62.6555.9553.7449.63média (ȳi) 1200.19250.61279.74322.46347.38Soma (yi. ) 224 5 6 7 ni ----48.2 7 ---44.7 47.5 6 --59.5 58.0 57.7 5 -59.5 50.8 55.9 47.3 4 -58.8 51.6 47.1 47.4 3 -62.2 62.5 59.8 44.6 2 -70.1 55.3 56.9 54.6 1 10g5g 1g sol. Sal. Soma Tratamento Repetição
Compartilhar