Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística para Cursos de Engenharia e Informática Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 2004 Cap. 9 – Comparação entre tratamentos APOIO: Fundação de Ciência e Tecnologia de Santa Catarina (FUNCITEC) Departamento de Informática e Estatística (INE/CTC/UFSC) Amostras independentes • Exemplo 9.1 – Considere o problema de comparar dois materiais (A e B), para sola de tênis, em termos do grau de desgaste após um certo período de uso. Seguem dois projetos de experimentos alternativos: • Projeto I – Um grupo de indivíduos usa tênis com solas feitas com o material A; e outro grupo usa tênis com solas feitas com o material B. Amostras independentes Material B Material A divisão aleatória Mensuração do grau de desgaste Mensuração do grau de desgaste Amostras pareadas (se g > 2, “em blocos”) • Exemplo 9.1: • Projeto II – Fabricam-se, para a realização do experimento, pares de tênis com os dois tipos de sola, isto é, um dos pés com o material A e o outro pé com o material B. Em cada par, o material usado em cada pé (direito ou esquerdo) é decidido por sorteio Amostras pareadas (se g > 2, “em blocos”) Mensuração do grau de desgaste B A B A A B B A A B alocação aleatória de A e B em cada par Amostras pareadas • Importância de considerar os pares na análise: criança 1 2 3 4 5 ... desgaste material A material B desgaste Teste t para duas amostras • H0: 1 = 2 e H1: 1 2 • H1: 1 > 2 • H1: 1 < 2. onde: 1 é o valor esperado da resposta sob o tratamento 1 e 2 é o valor esperado da resposta sob o tratamento 2. • Utilizando a variável “DIFERENÇA”. • H0: D = 0 e H1: D 0 • H1: D > 0 • H1: D < 0 Teste t para duas amostras pareadas • Exemplo 9.2 Seja o problema de verificar se um novo algoritmo de busca em um banco de dados é mais rápido que o algoritmo atualmente usado. Para se fazer a comparação dos dois algoritmos, planeja-se realizar uma amostra aleatória de 10 buscas experimentais (ensaios). Em cada ensaio, uma dada busca é realizada pelos dois algoritmos e o tempo de resposta de cada algoritmo anotado. Observamos que em cada ensaio os dois algoritmos são usados em condições idênticas, caracterizando 10 pares de observações. Teste t para duas amostras pareadas • H0: em média, os dois algoritmos são igualmente rápidos e • H1: em média, o algoritmo novo é mais rápido do que o algoritmo em uso. Hipóteses: H0: 1 =2 e H1: 1 < 2 ou A variável “diferença” D= X2 - X1 H0: μD = 0 e H1: μD > 0 onde: 1 é o tempo esperado de resposta do algoritmo novo e 2 é o tempo esperado de resposta do algoritmo antigo. Seja o problema de verificar se um novo algoritmo de busca em um banco de dados é mais rápido que o algoritmo atualmente usado. 3 7 -2 6 -1 6 2 9 -1 5 25 28 26 36 32 39 28 33 30 27 22 21 28 30 33 33 26 24 31 22 1 2 3 4 5 6 7 8 9 10 Diferença D = X2 - X1 Antigo X2 Novo X1 Ensaio Tempo de resposta (s) Teste t para duas amostras pareadas Estatística do teste • onde: n é o tamanho da amostra (número de pares); é a média das diferenças observadas; e é o desvio padrão das diferenças observadas. • Usa distribuição t de Student com gl = n – 1 graus de liberdade (supondo populações com distribuição normal). ds nd t d ds Pg 236- Exemplo 9.2 10n = 43, = d 813 9 4,310246 1 1 2 22 , = =d n. d n = s i id 822 813 1043 , = , . , = s n . d t = d Valores de D: 3, 7, -2, 6, -1, 6, 2, 9, -1, 5 Teste considerando nível de significância de 5%. Abordagem do Valor p: Conclusão: rejeita H0. Ver comentários e abordagem clássica no livro. Teste considerando nível de significância de 5%. • Abordagem clássica – 1) Hipóteses: H0: μD = 0 e H1: μD > 0 2) O valor crítico para t (n-1; alfa) = t(9; 0,05)= 1,833. 3) Estatística teste: tcalc = 2.824 4) Conclusão: Como tcalc = 2.82 > ttab = 1,833, rejeita-se Ho, detectando que que o algoritmo mais novo é, em média, mais rápido do que o algoritmo antigo, com nível de significância de 5%. Teste t para duas amostras independentes Exemplo 9.3 Desejamos verificar se os catalisadores A e B têm efeitos diferentes no rendimento de uma certa reação química. As hipóteses são: • H0: em média, os dois catalisadores são iguais em termos de rendimento; e • H1: em média, os dois catalisadores são diferentes em termos de rendimento. Ou, ainda: H0: 1 = 2 e H1: 1 2, onde 1: rendimento esperado com o catalisador A; e 2: rendimento esperado com o catalisador B. Teste t para duas amostras independentes H0: 1 = 2 e H1: 1 2, 1: rendimento esperado com do grupo A; 2: rendimento esperado com do grupo B. Suposições para realização do teste: 1. As observações devem ser independentes; 2. As variâncias populacionais devem ser iguais nos dois grupos; (Teste F) 3. Os dois conjuntos devem provir de distribuicões normais (Teste de Shapiro-Wilk) Teste t para duas amostras independentes Estatística do teste 2 2 2 2 12 ss s a 221 2 a s n xx t = Caso 1 -Se n1 = n2 = n, as fórmulas são mais fáceis. n: tamanho da amostra em cada grupo; 1 x 2 x2 1 s2 2 s2 a s média da amostra 1 média da amostra 2 variância da amostra 1 variância da amostra 2 variância agregada das duas amostras Usa distribuição t de Student com gl = 2n – 2 ou gl = n1+n2 – 2 graus de liberdade (supondo populações com distribuição normal). Teste t para duas amostras independentes Estatística do teste Caso 2 -Se n1 diferente n2 , as fórmulas são: 2 )1()1( 21 2 22 2 112 nn snsn sa 21 21 11 nn s xx t = ag n1: amostra grupo1; n2 amostra grupo2 1 x 2 x2 1 s2 2 s2 a s média da amostra 1 média da amostra 2 variância da amostra 1 variância da amostra 2 variância agregada das duas amostras Usa distribuição t de Student com gl = n1+n2-2 graus de liberdade Exemplo 9.3 – Catalisadores – Abordagem clássica Exemplo 9.3 (continuação). Abordagem valor p Portanto, 0,05 < Valor p < 0,10 Aceita H0. Ver comentários, abordagem clássica e exemplo com n1 n2 no livro. Comparação de duas topologias de rede de computadores. Avaliação do tempo de transmissão de pacotes de dados Tabela F – Teste de duas variâncias Abordagem clássica – caso bilateral 1) Hipóteses: 2) O valor crítico para Fsup ( gl1= n1 -1; gl2= n2 -1; ᵅ/2 ) e Finf ( gl1= n1 -1; gl2 = n2 -1; 1-ᵅ/2 ) Finf = 3) Estatística teste: fcalc = 4) Conclusão: Se fcalc > Fsup ou fcalc < Finf, rejeita-se Ho. Se Finf < fcalc < Fsup, aceita-se Ho. 2 2 2 11 2 2 2 10 :: HH 2 2 2 1 S S Comparação entre vários tratamentos. Amostras independentes (g>2 amostras)• Exemplo 9.4: Comparação de três tipos de rede. • Considere o problema de comparar 3 tipos de rede de computadores, C1, C2 e C3, em termos do tempo médio de transmissão de pacotes de dados entre duas máquinas. • Experimento (projeto completamente aleatorizado com um fator): 8 replicações com cada tipo de rede, aleatorizando a ordem dos 24 ensaios e mantendo fixos os demais fatores controláveis. Exemplo 9.4 : Projeto do experimento. Seqüência número Uso da dos testes do ensaio rede 1 16 C2 2 14 C2 3 24 C3 4 6 C1 ... ... ... 24 11 C3 ensaios de 1 a 8: C1 ensaios de 9 a 16: C2 ensaios de 17 a 24: C3 Exemplo 9.4. Dados do experimento: Seqüência número Tempo de dos testes do ensaio Rede resposta (y) 1 16 C2 7,8 2 14 C2 8,2 3 24 C3 6,3 4 6 C1 7,2 ... ... ... ... 24 11 C2 7,8 Exemplo 9.4: Perguntas a serem respondidas pela análise estatística. • Existe diferença real (significativa) entre os 3 tipos de rede? • Qual é a estimativa do tempo de resposta para cada tipo de rede? Exemplo 9.4: Dados do experimento 6,01 7,94 8,21 Média 48,1 63,5 65,7 Soma 6,8 7,8 8,0 8 7,2 7,1 8,8 7 5,2 8,2 7,2 6 6,2 8,7 7,6 5 5,1 8,6 8,9 4 5,3 7,1 8,7 3 6,0 8,2 9,3 2 6,3 7,8 7,2 1 C3 C2 C1 Replicação Tipo de rede Modelo da ANOVA g = 3 grupos tratamento (1) (2) (3) y11 y21 y31 y12 y22 y32 ... ... ... y1n y2n y3n Média global: Média: .1y .2y .3y ..y ijiij ey i = 1, 2, 3 j = 1, 2, ..., n observação efeito do tratamento i média global erro aleatório = média do fator i ii Hipóteses H0: 1 = 2 =...= g = 0 ou µ1 = µ2 =...= µg H1: i 0 ou µi µj para algum i para algum par (i, j) ijiij ey ijij ey As observações Sob H1: Sob H0: Hipóteses e modelo subjacente Sob H0: 1 = 2 =...= g = 0 ijiij ey ijij ey Hipóteses e modelo subjacente Sob H1: i 0 para algum i ijiij ey Análise de variância (ANOVA) com um fator ... Média yg. ... y2. y1. Soma ygn ... y2n y1n n ... ... ... ... ... yg2 ... y22 y12 2 yg1 ... y21 y11 1 g ... 2 1 Replicação Tratamento i iyy ... .1y .2y .gy i iy g y . 1 .. gl = N - 1 onde: N = ng Soma de quadrados total: Graus de liberdade: Análise de variância (ANOVA) com um fator ... Média yg. ... y2. y1. Soma ygn ... y2n y1n n ... ... ... ... ... yg2 ... y22 y12 2 yg1 ... y21 y11 1 g ... 2 1 Replicação Tratamento i iyy ... .1y .2y .gy i iy g y . 1 .. gl = g - 1 Soma de quadrados dos tratamentos: Graus de liberdade: Análise de variância (ANOVA) com um fator ... Média yg. ... y2. y1. Soma ygn ... y2n y1n n ... ... ... ... ... yg2 ... y22 y12 2 yg1 ... y21 y11 1 g ... 2 1 Replicação Tratamento i iyy ... .1y .2y .gy i iy g y . 1 .. gl = N - g Soma de quadrados do erro: Graus de liberdade: Análise de variância (ANOVA) com um fator Fórmulas equivalentes às anteriores Erro Trat QM QM f Estatística do teste (possíveis valores da razão f): Teste F • Se H0: 1 = 2 =...= g = 0 for verdadeira e considerando as suposições anteriormente enunciadas, a estatística f tem distribuição F com (g - 1) graus de liberdade no numerador e (N - g) graus de liberdade no denominador. Densidade de probabilidade F possíveis valores da estatística F, sob H 0 de ns id ad e de p ro ba bi lid ad e 0,00 0,25 0,50 0,75 0 1 2 3 4 f valor p Estimação das médias n QM tyIC erroii .),( Intervalo de confiança para o valor esperado da resposta sob o i-ésimo tratamento (nível de conf. ): C 1 C 2 C 3 R ede 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 Te m po d e tra ns m is sã o Teste F para amostras em blocos j j i i yyy .... yg. ... y2. y1. Soma y.h ygh ... y2h y1h h ... ... ... ... ... y.2 yg2 ... y22 y12 2 y.1 yg1 ... y21 y11 1 Soma g ... 2 1 Bloco Tratamento Notação para os dados: Teste F para amostras em blocos: quadro da ANOVA Exemplo 9.5 • Seja o problema de comparar 3 algoritmos de busca em um banco de dados. Realiza-se um experimento com 6 buscas experimentais, sendo que em cada uma é sorteado um número aleatório que indica o registro do banco de dados a ser localizado. Em cada um dos 6 processos de busca, são usados separadamente os três algoritmos em estudo, mas sob as mesmas condições, em termos dos fatores controláveis. São anotados os tempos de resposta ao usuário. • Hipóteses: – H0: em média, os três algoritmos são igualmente rápidos; e – H1: em média, os três algoritmos não são igualmente rápidos Exemplo 9.5 10,2 9,2 9,3 Média 61,2 55,2 55,8 Soma 13,1 11,2 10,9 6 8,9 8,1 8,2 5 10,3 9,6 9,9 4 9,9 9,3 9,1 3 9,8 8,9 9,4 2 9,2 8,1 8,3 1 A3 A2 A1 (bloco) Algoritmo de busca Ensaio Exemplo 9.5 17 26,86 Total 0,13 10 1,27 Erro 4,39 5 21,95 Blocos 14,29 1,82 2 3,64 Algoritmos f QM gl SQ Fonte da variação Qual é a conclusão?
Compartilhar