Buscar

Cap 9

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 43 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 43 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 43 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Estatística para Cursos de Engenharia e 
Informática 
Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia 
São Paulo: Atlas, 2004 
Cap. 9 – Comparação entre 
tratamentos 
APOIO: 
Fundação de Ciência e Tecnologia de Santa Catarina (FUNCITEC) 
Departamento de Informática e Estatística (INE/CTC/UFSC) 
 
Amostras independentes 
• Exemplo 9.1 – Considere o problema de comparar dois 
materiais (A e B), para sola de tênis, em termos do grau 
de desgaste após um certo período de uso. Seguem dois 
projetos de experimentos alternativos: 
 
• Projeto I – Um grupo de indivíduos usa tênis com solas 
feitas com o material A; e outro grupo usa tênis com solas 
feitas com o material B. 
 
Amostras independentes 
Material B Material A 
divisão aleatória 
Mensuração do grau de desgaste Mensuração do grau de desgaste 
Amostras pareadas (se g > 2, “em blocos”) 
• Exemplo 9.1: 
• Projeto II – Fabricam-se, para a realização do experimento, pares de 
tênis com os dois tipos de sola, isto é, um dos pés com o material A e 
o outro pé com o material B. Em cada par, o material usado em cada 
pé (direito ou esquerdo) é decidido por sorteio 
Amostras pareadas (se g > 2, “em blocos”) 
Mensuração do grau de desgaste 
B A B A A B B A A B 
alocação aleatória de A e B em cada par 
Amostras pareadas 
• Importância de considerar os pares na análise: 
criança 
1 2 3 4 5 ... 
desgaste 
material A 
material B 
desgaste 
Teste t para duas amostras 
• H0: 1 = 2 e H1: 1  2 
• H1: 1 > 2 
• H1: 1 < 2. 
 
onde: 1 é o valor esperado da resposta sob o tratamento 1 e 
 2 é o valor esperado da resposta sob o tratamento 2. 
 
• Utilizando a variável “DIFERENÇA”. 
• H0: D = 0 e H1: D  0 
• H1: D > 0 
• H1: D < 0 
 
Teste t para duas amostras pareadas 
• Exemplo 9.2 Seja o problema de verificar se um novo 
algoritmo de busca em um banco de dados é mais rápido 
que o algoritmo atualmente usado. Para se fazer a 
comparação dos dois algoritmos, planeja-se realizar uma 
amostra aleatória de 10 buscas experimentais (ensaios). 
Em cada ensaio, uma dada busca é realizada pelos dois 
algoritmos e o tempo de resposta de cada algoritmo 
anotado. Observamos que em cada ensaio os dois 
algoritmos são usados em condições idênticas, 
caracterizando 10 pares de observações. 
Teste t para duas amostras pareadas 
• H0: em média, os dois algoritmos são igualmente rápidos e 
• H1: em média, o algoritmo novo é mais rápido do que o algoritmo em 
uso. 
Hipóteses: 
 H0: 1 =2 e H1: 1 < 2 
ou 
A variável “diferença” D= X2 - X1 
 
 H0: μD = 0 e H1: μD > 0 
 
 
onde: 1 é o tempo esperado de resposta do algoritmo novo e 
 2 é o tempo esperado de resposta do algoritmo antigo. 
Seja o problema de verificar se um novo algoritmo de busca em 
um banco de dados é mais rápido que o algoritmo atualmente 
usado. 
 3 
 7 
-2 
 6 
-1 
 6 
 2 
 9 
-1 
 5 
25 
28 
26 
36 
32 
39 
28 
33 
30 
27 
22 
21 
28 
30 
33 
33 
26 
24 
31 
22 
1 
2 
3 
4 
5 
6 
7 
8 
9 
10 
Diferença 
D = X2 - X1 
Antigo 
X2 
Novo 
X1 
Ensaio 
Tempo de resposta (s) 
Teste t para duas amostras pareadas 
Estatística do teste 
• onde: n é o tamanho da amostra (número de pares); 
 é a média das diferenças observadas; e 
 é o desvio padrão das diferenças observadas. 
 
• Usa distribuição t de Student com gl = n – 1 graus de liberdade 
(supondo populações com distribuição normal). 
ds
nd
t


d
ds
Pg 236- Exemplo 9.2 
10n = 43, = d
  
813
9
4,310246
1
1
2
22
, =
 
 =d n. d
 n 
 = s
i
id












822
813
1043
, = 
,
 . ,
 = 
s
n . d
t = 
d
Valores de D: 3, 7, -2, 6, -1, 6, 2, 9, -1, 5 
Teste considerando nível de significância de 5%. 
Abordagem do Valor p: 
Conclusão: rejeita H0. 
Ver comentários e abordagem clássica no livro. 
Teste considerando nível de significância de 5%. 
• Abordagem clássica – 
1) Hipóteses: H0: μD = 0 e H1: μD > 0 
 
2) O valor crítico para t (n-1; alfa) = t(9; 0,05)= 1,833. 
 
3) Estatística teste: tcalc = 2.824 
 
4) Conclusão: Como tcalc = 2.82 > ttab = 1,833, rejeita-se 
Ho, detectando que que o algoritmo mais novo é, em média, 
mais rápido do que o algoritmo antigo, com nível de 
significância de 5%. 
 
Teste t para duas amostras independentes 
Exemplo 9.3 Desejamos verificar se os catalisadores A e B têm efeitos 
diferentes no rendimento de uma certa reação química. As hipóteses são: 
 
• H0: em média, os dois catalisadores são iguais em termos de rendimento; e 
• H1: em média, os dois catalisadores são diferentes em termos de rendimento. 
 
Ou, ainda: 
H0: 1 = 2 e H1: 1  2, 
onde 
1: rendimento esperado com o catalisador A; e 
2: rendimento esperado com o catalisador B. 
Teste t para duas amostras independentes 
H0: 1 = 2 e H1: 1  2, 
1: rendimento esperado com do grupo A; 
2: rendimento esperado com do grupo B. 
 
Suposições para realização do teste: 
 
1. As observações devem ser independentes; 
2. As variâncias populacionais devem ser iguais nos dois grupos; (Teste F) 
3. Os dois conjuntos devem provir de distribuicões normais (Teste de 
Shapiro-Wilk) 
Teste t para duas amostras independentes 
Estatística do teste 
2
2
2
2
12
ss
s
a


 
221 2
a
s
n
xx t = 
Caso 1 -Se n1 = n2 = n, as fórmulas são mais fáceis. 
n: tamanho da amostra em cada grupo; 1
x
2
x2
1
s2
2
s2
a
s
média da amostra 1 
média da amostra 2 
variância da amostra 1 
variância da amostra 2 
variância agregada das duas amostras 
Usa distribuição t de Student com gl = 2n – 2 ou gl = n1+n2 – 2 
graus de liberdade (supondo populações com distribuição normal). 
 
Teste t para duas amostras independentes 
Estatística do teste 
Caso 2 -Se n1 diferente n2 , as fórmulas são: 
 
2
)1()1(
21
2
22
2
112



nn
snsn
sa
 
21
21
11
nn
s
xx
 t =
ag 

n1: amostra grupo1; n2 amostra grupo2 1
x
2
x2
1
s2
2
s2
a
s
média da amostra 1 
média da amostra 2 
variância da amostra 1 
variância da amostra 2 
variância agregada das duas amostras 
 
Usa distribuição t de Student com gl = n1+n2-2 graus de liberdade 
Exemplo 9.3 – Catalisadores – Abordagem clássica 
Exemplo 9.3 (continuação). Abordagem valor p 
Portanto, 0,05 < Valor p < 0,10 
 Aceita H0. 
Ver comentários, abordagem clássica e exemplo com n1  n2 no livro. 
 
Comparação de duas topologias de rede de 
computadores. Avaliação do tempo de transmissão de 
pacotes de dados 
Tabela F – Teste de duas variâncias 
Abordagem clássica – caso bilateral 
1) Hipóteses: 
2) O valor crítico para 
Fsup ( gl1= n1 -1; gl2= n2 -1; ᵅ/2 ) e 
Finf ( gl1= n1 -1; gl2 = n2 -1; 1-ᵅ/2 ) Finf = 
 
3) Estatística teste: fcalc = 
 
4) Conclusão: 
Se fcalc > Fsup ou fcalc < Finf, rejeita-se Ho. 
Se Finf < fcalc < Fsup, aceita-se Ho. 
2
2
2
11
2
2
2
10 ::   HH
2
2
2
1
S
S
Comparação entre vários tratamentos. 
Amostras independentes (g>2 amostras)•
Exemplo 9.4: Comparação de três tipos de rede. 
• Considere o problema de comparar 3 tipos de rede de 
computadores, C1, C2 e C3, em termos do tempo médio de 
transmissão de pacotes de dados entre duas máquinas. 
 
• Experimento (projeto completamente aleatorizado com um 
fator): 8 replicações com cada tipo de rede, aleatorizando a ordem 
dos 24 ensaios e mantendo fixos os demais fatores controláveis. 
Exemplo 9.4 : Projeto do experimento. 
Seqüência número Uso da 
dos testes do ensaio rede 
 1 16 C2 
 2 14 C2 
 3 24 C3 
 4 6 C1 
 ... ... ... 
 24 11 C3 
ensaios de 1 a 8: C1 
ensaios de 9 a 16: C2 
ensaios de 17 a 24: C3 
Exemplo 9.4. Dados do experimento: 
Seqüência número Tempo de 
dos testes do ensaio Rede resposta (y) 
 1 16 C2 7,8 
 2 14 C2 8,2 
 3 24 C3 6,3 
 4 6 C1 7,2 
 ... ... ... ... 
 24 11 C2 7,8 
Exemplo 9.4: Perguntas a serem respondidas 
pela análise estatística. 
• Existe diferença real (significativa) entre os 3 tipos de 
rede? 
 
• Qual é a estimativa do tempo de resposta para cada tipo 
de rede? 
Exemplo 9.4: Dados do experimento 
6,01 7,94 8,21 Média 
48,1 63,5 65,7 Soma 
6,8 7,8 8,0 8 
7,2 7,1 8,8 7 
5,2 8,2 7,2 6 
6,2 8,7 7,6 5 
5,1 8,6 8,9 4 
5,3 7,1 8,7 3 
6,0 8,2 9,3 2 
6,3 7,8 7,2 1 
C3 C2 C1 Replicação 
 
Tipo de rede 
Modelo da ANOVA 
g = 3 grupos 
tratamento 
(1) (2) (3) 
y11 y21 y31 
y12 y22 y32 
... ... ... 
y1n y2n y3n 
 
 
 
Média 
global: 
Média: 
.1y .2y .3y ..y ijiij ey  
i = 1, 2, 3 
j = 1, 2, ..., n 
observação 
efeito do tratamento i 
média 
global 
erro aleatório 
= média do fator i 
ii  
Hipóteses 
H0: 1 = 2 =...= g = 0 ou µ1 = µ2 =...= µg 
H1: i  0 ou µi  µj 
 para algum i para algum par (i, j) 
ijiij ey   ijij ey As observações Sob H1: Sob H0: 
Hipóteses e modelo subjacente 
Sob H0: 1 = 2 =...= g = 0 ijiij ey   ijij ey 
Hipóteses e modelo subjacente 
Sob H1: i  0 para algum i ijiij
ey  
Análise de variância (ANOVA) com um fator 
... Média 
yg. ... y2. y1. Soma 
ygn ... y2n y1n n 
... ... ... ... ... 
yg2 ... y22 y12 2 
yg1 ... y21 y11 1 
g ... 2 1 Replicação 
Tratamento 
i
iyy ...
.1y .2y .gy

i
iy
g
y .
1
..
gl = N - 1 
onde: N = ng 
Soma de quadrados total: Graus de liberdade: 
Análise de variância (ANOVA) com um fator 
... Média 
yg. ... y2. y1. Soma 
ygn ... y2n y1n n 
... ... ... ... ... 
yg2 ... y22 y12 2 
yg1 ... y21 y11 1 
g ... 2 1 Replicação 
Tratamento 
i
iyy ...
.1y .2y .gy

i
iy
g
y .
1
..
gl = g - 1 
Soma de quadrados dos tratamentos: Graus de liberdade: 
Análise de variância (ANOVA) com um fator 
... Média 
yg. ... y2. y1. Soma 
ygn ... y2n y1n n 
... ... ... ... ... 
yg2 ... y22 y12 2 
yg1 ... y21 y11 1 
g ... 2 1 Replicação 
Tratamento 
i
iyy ...
.1y .2y .gy

i
iy
g
y .
1
..
gl = N - g 
Soma de quadrados do erro: Graus de liberdade: 
Análise de variância (ANOVA) com um fator 
Fórmulas equivalentes 
às anteriores 
Erro
Trat
QM
QM
f 
Estatística do teste (possíveis valores da razão f): 
Teste F 
• Se H0: 1 = 2 =...= g = 0 for verdadeira e considerando as suposições 
anteriormente enunciadas, a estatística f tem distribuição F com (g - 1) graus 
de liberdade no numerador e (N - g) graus de liberdade no denominador. 
Densidade de probabilidade F
possíveis valores da estatística F, sob H 0
de
ns
id
ad
e 
de
 p
ro
ba
bi
lid
ad
e
0,00
0,25
0,50
0,75
0 1 2 3 4
f 
valor p 
Estimação das médias 
n
QM
tyIC erroii   .),(
Intervalo de confiança para o valor esperado da resposta 
sob o i-ésimo tratamento (nível de conf. ): 
C 1 C 2 C 3
R ede
5,0
5,5
6,0
6,5
7,0
7,5
8,0
8,5
9,0
9,5
Te
m
po
 d
e 
tra
ns
m
is
sã
o
Teste F para amostras em blocos 

j
j
i
i yyy ....
yg. ... y2. y1. Soma 
y.h ygh ... y2h y1h h 
... ... ... ... ... 
y.2 yg2 ... y22 y12 2 
y.1 yg1 ... y21 y11 1 
Soma g ... 2 1 Bloco 
Tratamento 
Notação para os dados: 
Teste F para amostras em blocos: 
quadro da ANOVA 
Exemplo 9.5 
• Seja o problema de comparar 3 algoritmos de busca em um banco de 
dados. Realiza-se um experimento com 6 buscas experimentais, sendo 
que em cada uma é sorteado um número aleatório que indica o 
registro do banco de dados a ser localizado. Em cada um dos 6 
processos de busca, são usados separadamente os três algoritmos em 
estudo, mas sob as mesmas condições, em termos dos fatores 
controláveis. São anotados os tempos de resposta ao usuário. 
• Hipóteses: 
– H0: em média, os três algoritmos são igualmente rápidos; e 
– H1: em média, os três algoritmos não são igualmente rápidos 
Exemplo 9.5 
10,2 9,2 9,3 Média 
61,2 55,2 55,8 Soma 
13,1 11,2 10,9 6 
8,9 8,1 8,2 5 
10,3 9,6 9,9 4 
9,9 9,3 9,1 3 
9,8 8,9 9,4 2 
9,2 8,1 8,3 1 
A3 A2 A1 (bloco) 
Algoritmo de busca Ensaio 
Exemplo 9.5 
17 26,86 Total 
0,13 10 1,27 Erro 
4,39 5 21,95 Blocos 
14,29 1,82 2 3,64 Algoritmos 
f QM gl SQ Fonte da 
variação 
Qual é a conclusão?

Outros materiais