Buscar

AULA 4 Inferência Estatística para Duas Amostras

Prévia do material em texto

Inferência Estatística 
para Duas Amostras 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias conhecidas 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias conhecidas 
 
 
 
 
 
 
 
 
 
tem uma distribuição N(0, 1). 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias conhecidas 
• Hipótese Nula: 
 
 
• Estatística de Teste: 
 
 
 
Hipótese Alternativa Critério de Rejeição 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias conhecidas 
Exemplo: Tempo de Secagem de uma Tinta 
Uma pessoa que desenvolve produtos está interessada em reduzir o tempo 
de secagem de um zarcão. Duas formulações de tinta são testadas; a 
formulação 1 tem uma química padrão e a formulação 2 tem um novo 
ingrediente para secagem, que deve reduzir o tempo de secagem. Da 
experiência, sabe-se que o desvio-padrão do tempo de secagem é igual a 8 
minutos. E essa variabilidade inerente não deve ser afetada pela adição do 
novo ingrediente. Dez espécimes são pintados com a formulação 1 e outros 
dez espécimes são pintados com a formulação 2. Os vinte espécimes são 
pintados em uma ordem aleatória. Os tempos médios de secagem das duas 
amostras são x1 = 121 minutos e x2 = 112 minutos, respectivamente. Quais as 
conclusões que o idealizador de produtos pode tirar sobre a eficiência do 
novo ingrediente, usando a = 0,05? 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias conhecidas 
H0: m1 – m2 = 0 ou m1 = m2 
H1: m1 – m2 > 0 ou m1 > m2 
 
• Estatística de Teste: 2,52 
 
 
 
• (z0 = 2,52) > (z0,05 = 1,64)  Rejeita H0, logo a adição do novo ingrediente 
à tinta reduz significativamente o tempo de secagem. 
 
 
• (Valor P = 0,005868) < (a = 0,05)  Rejeita H0. 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias conhecidas 
• Cálculo de P(erro tipo II) = b 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias conhecidas 
• Tamanho de amostra (n1 = n2 = n) em função de b: 
 
Testes Bilaterais 
 
 
 
 
Testes Unilaterais 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias conhecidas 
 
• Intervalo de Confiança: 
 
 
 
 
 
• Escolha do tamanho da amostra (n1 = n2 = n): 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias conhecidas 
Limites Unilaterais de Confiança: 
 
• Superior: 
 
 
 
 
• Inferior: 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias conhecidas 
Exercício 10-1: 
Considere o teste de hipóteses H0: m1 = m2 contra H1: m1 ≠ m2, com variâncias 
conhecidas s1 = 10 e s2 = 5. Suponha que os tamanhos de amostra sejam 
n1 = 10 e n2 = 15 e que x1 = 4,7 e x2 = 7,8. Use a = 0,05. 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias conhecidas 
Exercício 10-1: 
(a) Teste a hipótese e encontre o valor P. 
H0: m1 = m2 ou m1 – m2 = 0 
H1: m1 ≠ m2 ou m1 – m2 ≠ 0 
 
• Estatística de Teste: 
 
 
• (– z0,025 = – 1,96) < (z0 = – 0,9) < (z0,025 = 1,96)  Falha em rejeitar H0, 
logo não há evidências para concluirmos que m1 ≠ m2. 
 
 
• (Valor P = 2  0,184060 = 0,368120) > (a = 0,05)  Falha em rejeitar H0. 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias conhecidas 
Exercício 10-1: 
(b) Explique como o teste poderia ser conduzido com um intervalo de 
confiança. 
H0: m1 = m2 ou m1 – m2 = 0 
H1: m1 ≠ m2 ou m1 – m2 ≠ 0 
• Intervalo de Confiança: 
 
 
 
– 9,79 ≤ m1 – m2 ≤ 3,59 
 
(m1 – m2 = 0)  IC  Falha em rejeitar H0. 
2 2 2 2
1 2
10 5 10 5
(4,7 7,8) 1,96 (4,7 7,8) 1,96
10 15 10 15
m m        
Inferência na diferença de médias de duas 
distribuições Normais, variâncias conhecidas 
Exercício 10-1: 
(c) Qual a potência do teste do item (a) para uma diferença verdadeira nas 
médias de 3? 
 
 
 
 
 
 
Potência = 1 – b = 1 – 0,86 = 0,14 
(  ( 
( 
1 2 1 2
0 0
0,025 0,025
2 2 2 2 2 2 2 2
1 2 1 2
3 0 3 0
1,96 1,96
10 5 10 5
10 15 10 15
 1,08 ( 2,83) 0,8599 0,002327 0,86
z z
n n n n
b
s s s s
       
       
                                 
                       
       
Inferência na diferença de médias de duas 
distribuições Normais, variâncias conhecidas 
Exercício 10-1: 
(d) Considerando tamanhos iguais de amostras, que tamanho de amostra 
deveria ser usado para obter b = 0,05, se a diferença verdadeira nas 
médias fosse 3? Suponha a = 0,05. 
 
 
 
 
 
za/2 = 1,96; zb = 1,645; ( – 0) = 3 – 0 = 3 
 
n  181 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias desconhecidas 
Caso 1: s1
2 = s2
2 = s2 
 
 
• Estatística de Teste: 
 
 
 
tem uma distribuição t com n1 + n2 – 2 graus de liberdade. 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias desconhecidas 
Caso 1: s1
2 = s2
2 = s2 
 
 
• Hipótese Nula: 
 
Hipótese Alternativa Critério de Rejeição 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias desconhecidas 
Caso 1: s1
2 = s2
2 = s2 
 
• Intervalo de Confiança: 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias desconhecidas 
Exemplo: Rendimento de um Catalisador 
Dois catalisadores estão sendo analisados para determinar como eles afetam 
o rendimento médio de um processo químico. Especificamente, o 
catalisador 1 está correntemente em uso, mas o catalisador 2 é aceitável. 
Uma vez que o catalisador 2 é mais barato, ele deve ser adotado, desde que 
não mude o rendimento do processo. Um teste é feito em uma planta piloto, 
resultando nos dados mostrado na Tabela a seguir. Há alguma diferença entre 
os rendimentos médios? Use α = 0,05 e considere variâncias iguais. 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias desconhecidas 
Exemplo: Rendimento de um Catalisador 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias desconhecidas 
Exemplo: Rendimento de um Catalisador 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias desconhecidas 
Exemplo: Rendimento de um Catalisador 
H0: m1 – m2 = 0 ou m1 = m2 
H1: m1 – m2 ≠ 0 ou m1 ≠ m2 
 
 
 
 
 
• Estatística de Teste: 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias desconhecidas 
Exemplo: Rendimento de um Catalisador 
 
• (– t0,025; 14 = – 2,145) < (t0 = – 0,35) < (t0,025; 14 = 2,145)  Falha em rejeitar 
H0, logo não temos evidência forte para concluir que o catalisador 2 resulta 
em um rendimento médio que difere do rendimento médio quando o 
catalisador 1 é empregado. 
 
 
• (0,50 < Valor P < 0,80) > (a = 0,05)  Falha em rejeitar H0. 
 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias desconhecidas 
Exemplo: Rendimento de um Catalisador 
 
• (– t0,025; 14 = – 2,145) < (t0 = – 0,35) < (t0,025; 14 = 2,145)  Falha em rejeitar 
H0, logo não temos evidência forte para concluir que o catalisador 2 resulta 
em um rendimento médio que difere do rendimento médio quando o 
catalisador 1 é empregado. 
 
 
• (0,50 < Valor P < 0,80) > (a = 0,05)  Falha em rejeitar H0. 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias desconhecidas 
Caso 2: s1
2 ≠ s2
2 
 
 
• Estatística de Teste: 
 
 
 
tem uma distribuição t com graus de liberdade dados por: 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias desconhecidas 
Caso 2: s1
2 ≠ s2
2 
 
• Intervalo de Confiança: 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias desconhecidas 
Exemplo: Arsênio em Água Potável 
A concentração de arsênio em suprimentospúblicos de água potável é um 
risco potencial à saúde. Um artigo no jornal Arizona Republic (Domingo, 27 de 
maio de 2001) reportou as concentrações em partes por bilhão (ppb), de 
arsênio em água potável para 10 comunidades metropolitanas de Fênix e 10 
comunidades rurais do Arizona. Desejamos determinar se há alguma 
diferença nas concentrações médias de arsênio entre as comunidades 
metropolitanas de Fênix e as comunidades rurais do Arizona. Use α = 0,05. 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias desconhecidas 
Exemplo: Arsênio em Água Potável 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias desconhecidas 
Exemplo: Arsênio em Água Potável 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias desconhecidas 
Exemplo: Arsênio em Água Potável 
H0: m1 – m2 = 0 ou m1 = m2 
H1: m1 – m2 ≠ 0 ou m1 ≠ m2 
 
 
 
 
 
• Estatística de Teste: 
Inferência na diferença de médias de duas 
distribuições Normais, variâncias desconhecidas 
Exemplo: Arsênio em Água Potável 
 
• (t0 = – 2,77) < (– t0,025; 13 = – 2,160)  Rejeita H0, logo há uma forte 
evidência para concluir que a concentração média de arsênio na água 
potável na zona rural do Arizona seja diferente da concentração média de 
água potável na área metropolitana de Phoenix. 
 
 
• (0,01 < Valor P < 0,02) < (a = 0,05)  Rejeita H0. 
Teste t Emparelhado 
• Hipótese Nula: 
 
 
• Estatística de Teste: 
 
 
 
Hipótese Alternativa Critério de Rejeição 
Teste t Emparelhado 
 
• Intervalo de Confiança: 
Teste t Emparelhado 
Exemplo: Resistência para Vigas de Aço 
Um artigo no Journal of Strain Analisys (Vol. 18, No. 2, 1983) compara vários 
métodos para prever a resistência ao cisalhamento em vigas planas de aço. 
Dados para dois desses métodos, os procedimentos de Karlsruhe e Lehigh, 
quando aplicados a nove vigas específicas, são mostrados na Tabela a seguir. 
Desejamos determinar se há qualquer diferença (na média) entre os dois 
métodos. Use α = 0,05. 
Teste t Emparelhado 
Exemplo: Resistência para Vigas de Aço 
 
 
 
 
 
 
 
 
 
 
n = 9 ; d = 0,2739; sD = 0,1350 
Teste t Emparelhado 
Exemplo: Resistência para Vigas de Aço 
H0: mD = 0 
H1: mD ≠ 0 
 
• Estatística de Teste: 6,08 
 
 
• (t0 = 6,08) > (t0,025; 8 = 2,306)  Rejeita H0, logo há forte evidência de que 
os métodos de previsão da resistência fornecem resultados diferentes. 
 
 
• (Valor P < 0,001) < (a = 0,05)  Rejeita H0. 
Inferência para as variâncias de duas 
distribuições Normais 
H0: s1
2 = s2
2
 
H1: s1
2 ≠ s2
2
 
 
Neste caso, utiliza-se a distribuição F. A variável aleatória F é definida como: 
 
 
 
 
 
sendo W e Y variáveis aleatórias independentes qui-quadrado, com u e v 
graus de liberdade, respectivamente. 
Inferência para as variâncias de duas 
distribuições Normais 
• Função densidade de probabilidade da distribuição F: 
Inferência para as variâncias de duas 
distribuições Normais 
Inferência para as variâncias de duas 
distribuições Normais 
• Hipótese Nula: 
 
 
• Estatística de Teste: 
 
 
 
 Hipótese Alternativa Critério de Rejeição 
Inferência para as variâncias de duas 
distribuições Normais 
• Intervalo de Confiança: 
Inferência para as variâncias de duas 
distribuições Normais 
Exemplo: Variabilidade em Pastilhas de Semicondutores 
Camadas de óxidos em pastilhas de semicondutores são atacadas com uma 
mistura de gases, de modo a atingir a espessura apropriada. A variabilidade 
na espessura dessas camadas de óxidos é uma característica crítica da 
pastilha. Uma baixa variabilidade é desejada para as etapas subsequentes do 
processo. Duas misturas diferentes de gases estão sendo estudadas para 
determinar se uma delas é superior na redução da variabilidade de espessura 
das camadas de óxido. Dezesseis pastilhas são atacadas com cada gás. Os 
desvios-padrão da espessura de óxido são s1 = 1,96 angstroms e s2 = 2,13 
angstroms, respectivamente. Há qualquer evidência que indique ser um gás 
preferível em relação ao outro? Use um teste de nível fixo, considerando 
α = 0,05. 
Inferência para as variâncias de duas 
distribuições Normais 
Exemplo: Variabilidade em Pastilhas de Semicondutores 
H0: s1
2 = s2
2
 
H1: s1
2 ≠ s2
2 
 
• Estatística de Teste: 
 
f 0 = s1
2/s2
2 = 3,84/4,54 = 0,85 
 
• (f0,975; 15; 15 = 0,35) < (f0 = 0,85) < (f0,025; 15; 15 = 2,86)  Falha em rejeitar 
H0, logo não há evidência forte para indicar um gás que resulte em uma 
variância da espessura de óxido menor. 
 
 
 
Inferência de proporções de duas 
populações 
H0: p1 = p2 
H1: p1 ≠ p2 
 
• Estatística de Teste para amostras grandes: 
Inferência de proporções de duas 
populações 
H0: p1 = p2 
H1: p1 ≠ p2 
 
• Se H0: p1 = p2 for verdadeira, ou seja, p1 = p2 = p: 
Inferência de proporções de duas 
populações 
• Hipótese Nula: 
 
 
• Estatística de Teste: 
 
 
 
Hipótese Alternativa Critério de Rejeição 
Inferência de proporções de duas 
populações 
• Intervalo de Confiança: 
Inferência de proporções de duas 
populações 
Exemplo: Erva-de-São-João 
Extratos de erva-de-são-joão são largamente usados para tratar depressão. 
Um artigo na edição de 18 de abril de 2001 da revista Journal of the American 
Medical Association comparou a eficácia de um extrato-padrão de erva-de-
são-joão com um placebo em 200 pacientes diagnosticados com depressão 
unipolar. Pacientes foram designados aleatoriamente em dois grupos: um 
grupo recebeu a erva-de-são-joão e o outro recebeu placebo. Depois de 8 
semanas, 19 dos pacientes tratados com placebo mostraram melhoria, 
enquanto 27 daqueles tratados com a erva-de-são-joão melhoraram. Há 
alguma razão para acreditar que a erva-de-são-joão seja efetiva no 
tratamento de depressão unipolar? Use α = 0,05. 
Inferência de proporções de duas 
populações 
Exemplo: Erva-de-São-João 
H0: p1 = p2 
H1: p1 ≠ p2 
 
• Estatística de Teste: 1,34 
 
 
• (– z0,025 = – 1,96) < (z0 = 1,34) < (z0,025 = 1,96)  Falha em rejeitar H0, 
logo não há evidência suficiente para confirmar que a erva-de-são-joão seja 
efetiva no tratamento de depressão unipolar. 
 
• (Valor P = 2  0,090123 = 0,180246) > (a = 0,05)  Falha em rejeitar H0.

Continue navegando