Buscar

Apostila 23 - Testes de Hipoteses[1]

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 33 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 33 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 33 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Caṕıtulo 8 - Testes de hipóteses
Conceição Amado e Ana M. Pires
Caṕıtulo 8 - Testes de hipóteses 3
8.1 Noções básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
8.2 Testes de hipóteses para a média de uma população normal . . . . . . . . . . . . . . . . . . . . . . 22
8.3 Testes de hipóteses sobre a igualdade das médias de duas populações normais . . . . . . . . . 35
8.4 Testes de hipóteses para a variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
8.5 Testes de hipóteses para outros parâmetros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
8.5 Testes de hipóteses para parâmetros de populações não normais uniparamétricas . . . . . . . 44
8.6 Teste de ajustamento do qui-quadrado de Pearson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
8.7 Teste de independência do qui-quadrado de Pearson em tabelas de contingência . . . . . . . 62
1
Sumário
Caṕıtulo 8 - Testes de hipóteses
PE 2
Caṕıtulo 8 - Testes de hipóteses 3
8.1 Noções básicas
Nos caṕıtulos anteriores vimos como estimar um parâmetro desconhecido a partir de uma
amostra (obtendo estimativas pontuais e intervalos de confiança para o parâmetro).
Muitas situações práticas têm uma natureza diferente, requerendo que em função dos valores
observados se tomem decisões acerca dos parâmetros (ou de outros aspectos) da população.
Exemplo 8.1:
Máquina de encher pacotes de açúcar. O peso de cada pacote deve ser ≈ 8 g (isto é, µ = 8).
Será que, num dado momento, podemos decidir — a partir da medição do peso de um certo
número de pacotes — se a máquina está a funcionar correctamente?
PE 4
2
8.1 (cont.)
Definição: Uma hipótese estat́ıstica é uma afirmação acerca de parâmetros (testes paramétri-
cos) ou acerca da distribuição (testes de ajustamento) de uma ou mais populações.
Vamos estudar em primeiro lugar os testes paramétricos.
Exemplo 8.1 (cont.):
Temos duas hipóteses, a máquina funciona correctamente (µ = 8) ou a máquina não funciona
correctamente (µ 6= 8), que se representam e denominam assim
H0 : µ = 8 versus H1 : µ 6= 8
(hipótese nula) (hipótese alternativa)
PE 5
8.1 (cont.)
Suponha que θ0 é um valor que se pretende testar para o parâmetro θ de uma determinada população
FX(x; θ), θ ∈ Θ as hipóteses paramétricas são, genericamente:
H0 : θ ∈ Θ0 versus H1 : θ ∈ Θ1
(hipótese nula) (hipótese alternativa)
Hipótese simples: é especificado apenas um valor para o parâmetro.
Hipótese composta: é especificado mais de um valor para o parâmetro.
Podemos estar interessados nos seguintes conjuntos de hipóteses:
Quando H0 : θ = θ0 (hipótese nula simples)
a hipótese alternativa (H1) pode ser uma de:
H1 : θ = θ1 hipótese alternativa simples
H1 : θ 6= θ0 hipótese alternativa bilateral
H1 : θ > θ0 hipótese alternativa unilateral superior
H1 : θ < θ0 hipótese alternativa unilateral inferior
PE 6
3
8.1 (cont.)
Quando H0 : θ ≤ θ0 hipótese nula composta
a hipótese alternativa deverá ser:
H1 : θ > θ0 hipótese alternativa unilateral inferior
Quando H0 : θ ≥ θ0 hipótese nula composta
a hipótese alternativa deve ser:
H1 : θ < θ0 hipótese alternativa unilateral inferior
Nota: Idealmente os valores especificados nas hipóteses devem ser definidos antes de se obter a
amostra.
Definição: Teste de hipóteses é um procedimento estat́ıstico que, baseado numa amostra, conduz
a uma decisão acerca das hipóteses formuladas.
PE 7
8.1 (cont.)
Exemplo 8.1 (cont.): Defina-se a v.a. X que representa o peso de um pacote de açúcar, com
E(X) = µ e V (X) = σ2. Pretende-se testar
H0 : µ = 8 versus H1 : µ 6= 8
Para se testar as hipóteses formuladas é necessário saber qual estimativa pontual do parâmetro
em estudo. É necessário, então, recolher uma amostra aleatória na população em estudo.
Seja a amostra com 10 observações, (x1, . . . , x10), concretização de uma a.a. (X1, . . . ,X10).
Como µ é o valor médio da população faz sentido decidir com base na estimativa x̄ (respectivo
estimador X̄).
PE 8
4
8.1 (cont.)
■ Para definir a regra de decisão, que consiste em rejeitar ou não rejeitar a hipótese nula,
precisamos de encontrar um valor (ou valores), o chamado ponto ou valor cŕıtico, que nos
auxilia nessa decisão.
■ No Exemplo 8.1, dever-se-á rejeitar o valor 8 desde que uma estimativa da média (x̄) esteja
“longe” deste valor e não rejeitar H0 se x̄ estiver “próxima” de 8.
x̄8 − c 8 8 + c
b
região cŕıtica região cŕıtica
“Aceitar” H1 “Aceitar” H1
Rejeitar H0 Rejeitar H0
região de aceitação
“Aceitar” H0
Não rejeitar H0
Região cŕıtica (RC): x̄ < 8− c ou x̄ > 8 + c (⇔ |x̄− 8| > c)
Valores cŕıticos: são os pontos de fronteira (8− c e 8 + c).
PE 9
8.1 (cont.)
Mas quando se toma a decisão podemos cometer dois tipos de erro: rejeitar uma hipótese verdadeira (erro
tipo I ou de 1.a espécie) ou não rejeitar uma hipótese falsa (erro tipo II ou de 2.a espécie). A tabela
seguinte resume as diferentes possibilidades associadas à decisão:
Tipos de erro:
Situação real mas desconhecida:
Decisão: H0 é verdadeira H0 é falsa
Não Rejeitar H0 decisão correcta erro do tipo II
Rejeitar H0 erro do tipo I decisão correcta
Probabilidades dos erros:
α = P (erro do tipo I) = P (rejeitar H0|H0 é verdadeira)
β = P (erro do tipo II) = P (Não Rejeitar H0|H0 é falsa)
PE 10
5
8.1 (cont.)
Voltando ao exemplo, vamos admitir que se fixava c = 0.5 e que σ = 1 e n = 10.
A região cŕıtica é |x̄− 8| > 0.5.
Supondo que X ∼ N(µ, 1) então X̄ ∼ N
(
µ,
1
10
)
,
α = P
(
|X̄ − 8| > 0.5|H0 é verd.
)
= 1− P
(
|X̄ − 8| ≤ 0.5|µ = 8
)
=
= 1− P
(
7.5 ≤ X̄ ≤ 8.5|µ = 8
)
= 1−
[
Φ
(
8.5− 8√
0.1
)
− Φ
(
7.5 − 8√
0.1
)]
= 0.1142
Para n obs. tem-se α = 1− [Φ (0.5√n)− Φ (−0.5√n)] = 2Φ (−0.5√n)
Exerćıcio: verificar que α decresce com n.
PE 11
Representação gráfica de α (n = 10 e c = 0.5)
x̄8 − c 8 8 + c
b
A1 A2
região cŕıtica região cŕıtica
X̄|µ = 8(n = 10)
A1 = A2 = A
α = 2A = 0.1142
Variação de α com n (c = 0.5)
x̄8 − c 8 8 + c
b
região cŕıtica região cŕıtica
X̄|µ = 8(n = 20) α = 0.0253
X̄|µ = 8(n = 10) α = 0.1142
PE 12
6
8.1 (cont.)
Quanto a β, não vamos ter um único valor mas uma função, ou seja, para cada µ de H1 podemos
calcular um valor β(µ). Por exemplo, para µ = 9:
β(9) = P (Não RejeitarH0|µ = 9) = P
(
7.5 ≤ X̄ ≤ 8.5|µ = 9
)
=
= Φ
(
8.5− 9√
0.1
)
− Φ
(
7.5 − 9√
0.1
)
= Φ(−1.58) − Φ(−4.74) = 0.0571
ou para µ = 10
β(10) = P (Não RejeitarH0|µ = 10) = P
(
7.5 ≤ X̄ ≤ 8.5|µ = 10
)
=
= Φ
(
8.5− 10√
0.1
)
− Φ
(
7.5− 10√
0.1
)
= Φ(−4.74) − Φ(−7.91) ≃ 10−6
Por simetria vem β(7) = β(9) e β(6) = β(10)
PE 13
8.1 (cont.)
Representação gráfica de α e β (n = 10 e c = 0.5)
x̄8 − c 8 8 + c
b
região cŕıtica região cŕıtica
β = 0.0289 X̄|µ = 9.1α = 0.1142 X̄|µ = 8
β
Alteração da região cŕıtica, com n fixo:
■ Se c diminuir, α aumenta e, para cada µ, β(µ) diminui.
■ Se c aumentar, α diminui e, para cada µ, β(µ) aumenta.
PE 14
7
8.1 (cont.)
Da discussão anterior conclui-se que é mais fácil controlar α do que controlar β (que depende de
µ em H1). Logo:
■ rejeitar H0 é uma conclusão “forte” (porque o erro que se pode cometer ao rejeitar H0 está
bem controlado).
■ não rejeitar H0 é uma conclusão “fraca” (porque o erro que se pode cometer ao não rejeitar
H0 não está bem controlado). Em vez de dizer “não se rejeita H0” é prefeŕıvel dizer que “não
há evidência suficiente para rejeitar H0”.
PE 15
8.1 (cont.)
Como decidir entre alternativa unilateral ou bilateral?
I H0 : µ = 8 versus H1 : µ > 8
Região cŕıtica: X̄ > 8 + c
Ponto de vista do fabricante! (quando rejeitar H0 pára a produção para afinar a
máquina)
II H0 : µ = 8 versus H1 : µ < 8
Região cŕıtica: X̄ < 8− c
Ponto de vista do consumidor! (quando rejeitar H0 não aceita a encomenda)
III H0 : µ = 8 versusH1 : µ 6= 8
Região cŕıtica: X̄ < 8− c ou X̄ > 8 + c
Compromisso entre os dois!
PE 16
8
8.1 (cont.)
Definição: O ńıvel de significância do teste é:
supP (RejeitarH0|θ) = supα (θ) ,
No exemplo, como a hipótese nula é simples, o ńıvel de significância do teste é 0.1142.
Definição: A potência do teste é:
P (RejeitarH0|θ) = π (θ) =
{
α (θ) , θ ∈ Θ0
1− β (θ) , θ ∈ Θ1
No exemplo, a potência do teste quando µ = 9 é 1− 0.0571 = 0.9429, ou seja, se a verdadeira
média for 9, a diferença em relação a 8 será detectada 94.29% das vezes.
Ainda no exemplo, a potência do teste quando µ = 10 é ≈ 1, ou seja, se a verdadeira média for
10, a diferença em relação a 8 será detectada quase sempre.
PE 17
8.1. (cont.) - Valor-p
Outro método de decisão: valor-p
Em vez de se fixar o ńıvel de significância, α, determinar a região cŕıtica e, em seguida, verificar
se o valor observado pertence à região cŕıtica, pode olhar-se directamente para o valor observado
da estat́ıstica de teste e determinar para que ńıvel de significância a decisão muda.
Definição: Dado o valor observado da estat́ıstica de teste, o valor-p (p-value) é o maior ńıvel
de significância que levaria à não rejeição da hipótese nula (ou o menor que levaria à rejeição), se
hipótese nula é verdadeira.
■ Quanto mais baixo for o valor-p maior é a evidência contra a hipótese nula.
■ Pode também dizer-se que o valor-p representa a probabilidade de obter, sendo H0 verdadeira,
um resultado (valor da estat́ıstica do teste) tão ou mais desfavorável do que o que foi obtido.
PE 18
9
8.1 (cont.)
Relação entre intervalos de confiança e testes de hipóteses:
Dado um parâmetro desconhecido θ, um I.C. a 100 × (1− α) para θ = [l, u], baseado numa dada
amostra, (x1, . . . , xn), e obtido a partir de uma certa v.a. fulcral, então a mesma amostra leva à
rejeição de
H0 : θ = θ0 versus H1 : θ 6= θ0
ao ńıvel de significância α se e só se θ0 /∈ [l, u] ou à não rejeição de H0 se e só se θ0 ∈ [l, u].
Nota: é necessário que a v.a. fulcral e a estat́ıstica de teste sejam da mesma forma.
PE 19
Procedimento geral dos testes de hipóteses
1. Pelo contexto do problema identificar o parâmetro de interesse
2. Formular as hipóteses
3. Escolher uma estat́ıstica de teste adequada
(esta escolha e a sua distribuição amostral depende do parâmetro em estudo, dos dados conhecidos
(desconhecidos) da população e da dimensão da amostra (ou amostras). De uma forma geral, as
variáveis fulcrais utilizadas nos intervalos de confiança transformam-se numa estat́ıstica do teste
quando se substitui o parâmetro populacional em estudo pelo valor a testar, que se encontra na
hipótese nula.)
4. Recolher uma amostra e calcular o valor observado da estat́ıstica de teste
5. Decidir sobre a rejeição ou não de H0 (definindo a região cŕıtica ou determinando o valor-p)
PE 20
10
8.1 (cont.)
Denote-se TH0 a estat́ıstica de teste sob a validade de H0 e tobs o valor observado dessa estat́ıstica com
base numa amostra, de dimensão n, seleccionada ao acaso da população em estudo.
Três métodos para a realização de testes hipóteses paramétricos, ao ńıvel de significância α:
1. Baseando-se na construção da região cŕıtica RCα:
Rejeitar H0 se o valor tobs ∈ RCα
Não Rejeitar H0 se o valor tobs /∈ RCα;
2. Determinando o valor − p:
Rejeitar H0 se valor − p < α
Não Rejeitar H0 se valor − p > α;
3. Através de intervalo de confiança a (1− α)× 100% (constrúıdo com v.a. fulcral da mesma forma que a
estat́ıstica de teste):
Rejeitar H0 se o valor do parâmetro especificado em H0 não pertencer ao intervalo de confiança
Não Rejeitar H0 se o valor do parâmetro especificado em H0 pertencer ao intervalo de confiança.
PE 21
8.2 Testes de hipóteses para a média de uma população normal
Tal como no caṕıtulo 7 estuda-se primeiro o caso em que a variância é conhecida. Assim,
considere-se uma população X tal que:
E(X) = µ (desconhecido)
V (X) = σ2 (conhecida)
Seja (X1, . . . ,Xn) uma a.a. de X com dimensão n e µ̂ = X̄ o estimador pontual de µ.
Admite-se que X ∼ N(µ, σ2) ou X tem outra distribuição qualquer mas n é elevado
Teste de H0 : µ = µ0 versus H1 : µ 6= µ0
Sabemos já que, quando H0 é verdadeira
X̄ ∼ N
(
µ0,
σ2
n
)
ou X̄
a∼ N
(
µ0,
σ2
n
)
PE 22
11
8.2 (cont.)
Em vez de trabalhar directamente com X̄, é conveniente estandardizar e usar como
estat́ıstica de teste:
ZH0 =
X̄ − µ0
σ/
√
n
Quando H0 é verdadeira ZH0 ∼ N(0, 1). Então se a hipótese alternativa for bilateral, a região
cŕıtica deve ser |ZH0 | > a (notar que isto é equivalente a considerar |X̄ − µ0| > c, como foi feito
no Exemplo 8.1), pelo que α = P (|ZH0 | > a | H0):
z0
−a a
1 − α
α
2
α
2
P (ZH0 > a) =
α
2
⇔
a = Φ−1
(
1− α
2
)
PE 23
8.2 (cont.)
Dada uma amostra concreta, calcula-se o o valor observado da estat́ıstica de teste
zobs =
x̄− µ0
σ/
√
n
Então
rejeita-se H0 se zobs < −a ou zobs > a
e não se rejeita H0 se −a ≤ zobs ≤ a
Notar que estas regras podem ser expressas em termos de x̄:
rejeita-se H0 se x̄ < µ0 − a
σ√
n
ou x̄ > µ0 + a
σ√
n
e não se rejeita H0 se µ0 − a
σ√
n
≤ x̄ ≤ µ0 + a
σ√
n
PE 24
12
8.2 (cont.)
Vamos prosseguir com o Exemplo 8.1 que, como vimos, refere-se a um teste de hipóteses
paramétrico e ilustraremos cada uma das formas de realização do teste:
Exemplo (cont.): X é a v.a. que representa o peso de um pacote de
açúcar. Supõe-se que X ∼ N(µ, 1). A máquina está afinada quando µ = 8.
Numa amostra de 25 pacotes (recolhida ao acaso) observou-se x̄ = 8.5.
Quer-se saber se, ao ńıvel de significância de 5%, se pode afirmar que a
máquina continua afinada.
Hipóteses: H0 : µ = 8 versus H1 : µ 6= 8
Estat́ıstica de teste ZH0 =
X̄ − 8
1/
√
25
∼ N(0, 1)
(teste para o valor médio de uma v.a. normal com variância conhecida).
PE 25
8.2 (cont.)
Exemplo (cont.):
Região Cŕıtica ao ńıvel de significância de α = 0.05:
RCα =
{
x̄ : |zobs| =
∣∣∣∣
x̄− 8
1/
√
25
∣∣∣∣ > Φ
−1
(
1− α
2
)}
Como α = 0.05 ⇒ a = Φ−1(0.975) = 1.96 donde
RCα = {zobs < −1.96 ∨ zobs > 1.96} = {|zobs| > 1.96}
Decisão:
Com x̄ = 8.5 obtém-se zobs =
8.5 − 8
1/
√
25
= 2.5. Como zobs > 1.96 rejeita-se H0, ou seja, existe
evidência (ao ńıvel de significância considerado) de que a máquina está desafinada.
PE 26
13
8.2 (cont.)
Alternativas unilaterais:
I Se fosse H0 : µ = µ0 versus H1 : µ > µ0
Estat́ıstica de teste: a mesma
Região Cŕıtica ao ńıvel de significância de α:
RCα =
{
x̄ : zobs =
x̄− 8
1/
√
25
> Φ−1(1− α)
}
z0
a′
1 − α α
PE 27
8.2 (cont.)
Alternativas unilaterais:
II Se fosse H0 : µ = µ0 versus H1 : µ < µ0
Estat́ıstica de teste: a mesma
Região Cŕıtica ao ńıvel de significância de α:
RCα =
{
x̄ : zobs =
x̄− 8
1/
√
25
< Φ−1(α)
}
z0
−a′
1 − αα
PE 28
14
8.2 (cont.)
Decisão com o valor − p
Calcular o valor − p do teste tendo em conta a hipótese alternativa considerada, assim:
■ se teste unilateral à direita: valor − p = P (T > tobs|H0) = P (TH0 > tobs)
■ se teste unilateral à esquerda: valor − p = P (T < tobs|H0) = P (TH0 < tobs)
■ se teste bilateral: valor − p = 2min(P (T < tobs |H0), P (T > tobs |H0))
Decisão: rejeitar H0 para valores de α ≥ valor − p; não rejeitar H0 para valores de α < valor− p.
No exemplo, zobs = 2.5, logo
valor−p = 2min(P (T < 2.5 |H0), P (T > 2.5 |H0)) = 2P (T > 2.5 |H0) = 2(1−Φ−1(2.5)) = 0.0124.
Rejeita-se H0 para α > valor − p = 0.0124
Não se rejeita-se H0 para α < valor − p = 0.0124
z0
−2.5 2.5
1 − valor-p
valor-p
2
valor-p
2
PE 29
8.2 (cont.)
Usando a relação entre intervalos de confiança e testes de hipóteses: aplicação para o
teste que estamos a estudar (teste para a média com variância conhecida, H0: µ = µ0 versus H1:
µ 6= µ0):
Não se rejeita H0, ao ńıvel de significância α, se e só se
|zobs| ≤ a ⇔
∣∣∣∣
x̄− µ0
σ/
√
n
∣∣∣∣ ≤ a ⇔ µ0 − a
σ√
n
≤ x̄ ≤ µ0 + a
σ√
n
⇔
⇔ x̄− a σ√
n
≤ µ0 ≤ x̄+ a
σ√
n
⇔ µ0 ∈ IC100×(1−α)%(µ)
Exemplo (cont.): n = 25, x̄= 8.5, σ = 1, γ = 95% (α = 5%) ⇒ a = 1.96
IC95%(µ) =
[
8.5 − 1.96× 1√
25
; 8.5 + 1.96 × 1√
25
]
= [8.108; 8.892].
como µ0 = 8 não pertence ao I.C. a 95%, rejeita-se H0 (contra H1: µ 6= 8) ao ńıvel de
significância α = 5%.
PE 30
15
8.2 (cont.)
Testes para a média com variância desconhecida:
■ O teste que acabámos de estudar é aplicável com σ2 desconhecida (substitúıda por S2) desde
que a dimensão da amostra seja grande (n ≥ 30).
Ou seja, usa-se a estat́ıstica
ZH0 =
X̄ − µ0
S/
√
n
a qual tem distribuição aproximadamente N(0, 1) sob H0, seja qual for a distribuição da
população, desde que n seja elevado (a aproximação é razoável para n ≥ 30).
PE 31
8.2 (cont.)
Testes para a média com variância desconhecida (cont.):
■ Se n não for elevado (n < 30) mas X ∼ N(µ, σ2) então a estat́ıstica anterior ainda pode ser
utilizada, sabendo-se que a distribuição sob H0 é a distribuição t-Student com n− 1 graus de
liberdade. Ou seja, a estat́ıstica do teste é
TH0 =
X̄ − µ0
S/
√
n
e, quando H0 é verdadeira, TH0 ∼ tn−1.
Trata-se então de um teste em tudo semelhante ao caso com variância conhecida que foi
estudado, excepto que os pontos cŕıticos são calculados com recurso a F−1tn−1 (em vez de Φ
−1).
Nota: Para os testes em que a estat́ıstica de teste tem distribuição normal o valor − p é fácil de determinar. Para
as estat́ısticas com distribuição t ou qui-quadrado esse valor só pode ser obtido usando um programa de
computador ou em certas calculadoras. Recorrendo às tabelas o melhor que se consegue é obter um intervalo que
contém (de certeza) o valor − p.
PE 32
16
8.2 (cont.)
Exemplo: Determinação da constante de acidez do ácido orto-hidroxiben-
zóico. O valor tabelado é 2.81. Queremos saber se os valores determina-
dos experimentalmente (variáveis de experiência para experiência devido a
factores não controláveis/erro experimental) estão ou não de acordo com
o valor tabelado. Ou seja, em termos de testes de hipóteses e sendo Y a
v.a. que representa um valor da constante determinado experimentalmente,
queremos testar, admitindo que Y ∼ N(µY , σ2Y ), se
H0: µY = 2.81 versus H1: µY 6= 2.81
Temos as seguintes 5 observações (que podem ser consideradas como obtidas
por amostragem aleatória):
y1 = 3.0935 y2 = 3.0894 y3 = 3.1111 y4 = 3.1113 y5 = 3.1262
para as quais se obtém: n = 5, ȳ = 3.1063, sy = 0.014946
PE 33
8.2 (cont.)
Estat́ıstica do teste: TH0 =
Ȳ − 2.81
S/
√
5
(se H0 for verdadeira TH0 ∼ t4)
Valor observado da estat́ıstica de teste: tobs =
3.1063 − 2.81
0.014946/
√
5
= 44.33
Determinação do valor-p:
■ (Tabelas) o percentil mais elevado tabelado para a distribuição t4 é
F−1t4 (0.9995) = 8.61, o que corresponderia a um ńıvel de significância
de α = 2×(1−0.9995) = 0.001 = 0.1%. Como 44.33 ≫ 8.61 conclui-se
que valor-p ≪ 0.001.
■ (Em MSExcel)
=2*TDIST(44.33,4,1) → 1.54842E-06
(Em R)
2*(1-pt(44.33,4)) → 1.548419e-06
t0
F−1
t4
(0.9995) = 8.61
0.9995 0.0005
b
Qual deverá ser a decisão?
PE 34
17
8.3 Testes de hipóteses sobre a igualdade das médias de duas populações normais
Nesta situação pretende-se comparar duas populações (métodos, experiên-
cias, materiais, etc.) através da realização de um teste de hipóteses relativo
à igualdade entre os valores esperados das duas populações, ou a um valor
espećıfico da diferença entre esses valores esperados.
Notação:
X1 representa a população 1, com E(X) = µ1 e V (X) = σ
2
1
X2 representa a população 2, com E(X) = µ2 e V (X) = σ
2
2
(X11,X12, . . . X1n1) é uma a.a. da pop. 1, com média X̄1 e variância S
2
1
(X21,X22, . . . X2n2) é uma a.a. da pop. 2, com média X̄2 e variância S
2
2
Nota importante: para todos os testes aqui considerados é necessário
que estas amostras sejam independentes.
Nota: Estes testes estão obviamente relacionados com os intervalos de confiança estudados em
7.3...
PE 35
8.3 (cont.)
Pretende-se então testar H0: µ1 = µ2 versus uma das alternativas
H1: µ1 6= µ2 ou H1: µ1 > µ2 ou H1: µ1 < µ2
A partir da v.a.
Z =
(X̄1 − X̄2)− (µ1 − µ2)√
σ21
n1
+
σ22
n2
(ver explicação mais detalhada em 7.3)
obtém-se, sob H0: µ1 = µ2, ⇔ µ1 − µ2 = 0, a estat́ıstica de teste
ZH0 =
X̄1 − X̄2√
σ21
n1
+
σ22
n2
que pode ser utilizada se as variâncias (σ21 e σ
2
2) forem conhecidas.
PE 36
18
8.3 (cont.)
Quando H0 é verdadeira: ZH0



∼ N(0, 1), se Xi ∼ N(µi, σ2i )
a∼ N(0, 1), se Xi qq e ni ≥ 30
Região cŕıtica (ao ńıvel de significância α) depende de H1 da seguinte forma:
H1: µ1 6= µ2
H1: µ1 > µ2
H1: µ1 < µ2
RCα : |ZH0 | > c, com c = Φ−1 (1− α/2).
RCα : ZH0 > c, com c = Φ
−1 (1− α).
RCα : ZH0 < c, com c = Φ
−1 (α).
Nota: Qualquer que seja a distribuição das populações X1 e X2, se ni ≥ 30 pode aplicar-se este
teste com σ2i desconhecidas, substitúıdas por S
2
i , i = 1, 2.
PE 37
8.3 (cont.)
De igual modo se obtém a estat́ıstica de teste para a diferença entre as
médias de duas populações normais com variâncias desconhecidas:
TH0 =
X̄1 − X̄2
Sp
√
1
n1
+ 1
n2
com Sp =
√
(n1 − 1)S21 + (n2 − 1)S22
n1 + n2 − 2
Quando H0 é verdadeira: TH0 ∼ tn1+n2−2
(se Xi ∼ N(µi, σ2i ), σ21 = σ22 = σ2)
Região cŕıtica (ao ńıvel de significância α) depende de H1 da forma habitual:
H1: µ1 6= µ2
H1: µ1 > µ2
H1: µ1 < µ2
RCα : |TH0 | > c, com c = F−1t(n1+n2−2) (1− α/2).
RCα : TH0 > c, com c = F
−1
t(n1+n2−2)
(1− α).
RCα : TH0 < c, com c = F
−1
t(n1+n2−2)
(α).
PE 38
19
8.3 (cont.)
Exemplo: Pretende-se saber se o efeito médio de dois catalizadores em
determinado processo qúımico pode ser considerado igual ou diferente.
Resultados das experiências:
Catalizador 1: 91.50 94.18 92.18 95.39 91.79 89.07 94.72 89.21 n1 = 8
Catalizador 2: 85.19 90.95 90.46 93.21 97.19 97.04 91.07 92.75 n2 = 8
Sejam X1 – v.a. que representa o resultado da exp. com o cat. 1
X2 – v.a. que representa o resultado da exp. com o cat. 2
Admitindo que (hipóteses de trabalho):
• A 1.a amostra é uma concretização de uma a.a. de X1 ∼ N(µ1, σ21);
• A 2.a amostra é uma concretização de uma a.a. de X2 ∼ N(µ2, σ22);
• As duas amostras são independentes;
• σ21 = σ22 = σ2 (é razoável se s21 e s22 forem da mesma ordem de grandeza).
(na prática há que validar estas suposições)
PE 39
8.3 (cont.)
Hipóteses: Ho: µ1 = µ2 versus H1: µ1 6= µ2
supondo verificadas as condições de utilização da estat́ıstica
TH0 =
X̄1 − X̄2
Sp
√
1
n1
+ 1
n2
com Sp =
√
(n1 − 1)S21 + (n2 − 1)S22
n1 + n2 − 2
Cálculos: x̄1 = 92.255 x̄2 = 92.733 s1 = 2.39 s2 = 2.98
V. obs. da estat́ıstica de teste: tobs =
92.255 − 92.733√
7×2.392+7×2.982
14
√
1
8 +
1
8
= −0.35
Conclusão: Para α = 5% vem c = F−1t14 (0.975) = 2.145. Como −2.145 < −0.35 < 2.145 não se
rejeita H0 ao ńıvel de significância de 5%.
Também se poderia concluir que 0.6 < valor − p < 0.8, pelo que não faz sentido rejeitar H0 para
nenhum dos ńıveis de significância usuais (1%,5% e 10%).
PE 40
20
8.3 (cont.)
Output do Excel para este exemplo:
PE 41
8.4 Testes de hipóteses para a variância de uma população normal
Considere-se X ∼ N(µ, σ2) população onde µ = E(X) e σ2 = V ar(X) desconhecidos. Seja
(X1, X2, · · · , Xn) uma a.a. de dimensão n proveniente da população X .
Hipótese nula: H0 : σ
2 = σ20 .
Quando H0 é verdadeira a estat́ıstica de teste é:
QH0 =
(n− 1)S2
σ20
∼ χ2(n−1)
Pretende-se testar H0 : σ
2 = σ20 contra uma das alternativas:
1. H1 : σ
2 6= σ20 (teste bilateral)
2. H1 : σ
2 > σ20 (teste unilateral superior)
3. H1 : σ
2 < σ20 (teste unilateral inferior)
Região cŕıtica (ao ńıvel de significância α):
1. RCα : QH0 < a ou T0 > b, com a = F
−1
χ2
(n−1)
(α/2) e b = F−1
χ2
(n−1)
(1− α/2).
2. RCα : QH0 > b, com b = F
−1
χ2
(n−1)
(1− α).
3. RCα : QH0 < a, com a = F
−1
χ2
(n−1)
(α).
Decisão usual.
PE 42
21
8.5 Testes de hipóteses para parâmetros de populações não normais uni-
paramétricas
De forma idêntica ao caṕıtulo anterior (Intervalos de Confiança) também aqui se vai recorrer ao
Teoremado Limite Central para se efectuarem inferências sobre o parâmetro de uma população
não normal. Consideram-se populações cujo parâmetro pode ser estimado por uma soma (média)
de v.a. independentes.
Seja (X1, . . . ,Xn) uma a.a. de dimensão n (suficientemente grande) proveniente da população
fX(x; θ). Se considerarmos a v.a. Sn =
∑n
i=1 Xi então
Z =
Sn − E (Sn)√
V (Sn)
=
X̄ − E
(
X̄
)
√
V
(
X̄
) =
X̄ − E (X)√
V (X)
n
a∼N (0, 1) ,
em que E(X) e V (X) dependem do parâmetro de interesse θ.
PE 43
8.5 Testes de hipóteses para parâmetros de populações não normais uni-
paramétricas
Exemplos de aplicação:
■ Testes de hipóteses para uma proporção (parâmetro p da distribuição de Bernoulli).
■ Testes de hipóteses para o parâmetro da distribuição exponencial.
■ Testes de hipóteses para o parâmetro da distribuição Poisson.
■ Outras situações de distribuições uniparamétricas nas quais se possa aplicar a v.a. fulcral
anterior e estat́ıstica de teste associada.
De seguida exemplifica-se para as primeiras duas situações (pop. Bernoulli e exponencial).
PE 44
22
8.5 Caso I: testes de hipóteses para uma proporção
Consideres-se a população X ∼ Bernoulli(p) com p = E(X), onde p representa a proporção
(desconhecida) de indiv́ıduos/objectos dessa população que pertencem a uma dada categoria de interesse.
Seja (X1, X2, · · · , Xn) uma a.a. de dimensão n proveniente da população X , com n grande (n ≥ 30).
Recordar que Y =
n∑
i=1
Xi ∼ Binomial(n, p) e que o estimador pontual (de máxima verosimilhança) de p é
X̄ =
n∑
i=1
Xi
n
=
Y
n
.
Hipótese nula: H0 : p = p0.
Quando H0 é verdadeira a estat́ıstica de teste é:
ZH0 =
X̄ − p0√
p0(1−p0)
n
a∼N(0, 1)
PE 45
8.5 Caso I: testes de hipóteses para uma proporção
Pretende-se testar H0 : p = p0 contra uma das alternativas:
1. H1 : p 6= p0 (teste bilateral)
2. H1 : p > p0 (teste unilateral superior)
3. H1 : p < p0 (teste unilateral inferior)
Região cŕıtica (ao ńıvel de significância α):
1. RCα : |ZH0 | > c, com c = Φ−1 (1− α/2).
2. RCα : ZH0 > c, com c = Φ
−1 (1− α).
3. RCα : ZH0 < c, com c = Φ
−1 (α).
Decisão usual.
Nota: Naturalmente que também se pode determinar o valor − p da forma usual e decidir com
base no seu valor.
PE 46
23
8.5 Caso I: testes de hipóteses para uma proporção
Exemplo: População de eleitores portugueses. Sondagem (aleatória) a
1200 eleitores revelou que 683 tencionam votar no partido ABC. Entretanto
o presidente do partido tinha afirmado “estou convencido que vamos obter
mais de 50% dos votos”. Será que, em face dos resultados da sondagem, a
afirmação é razoável, ou não?
Já sabemos que p̂ = 683/1200 = 0.569 (ver Caṕıtulo 6)
Podemos testar H0: p = 0.5 contra H1: p > 0.5, e se rejeitarmos a hipótese nula (conclusão
“forte”) então a afirmação é corroborada pela sondagem.
zobs =
0.569 − 0.5√
0.5(1 − 0.5)
1200
= 4.79 valor-p = 1− Φ(4.79) = 0.000001
Como o valor − p é muito baixo rejeita-se H0 para os ńıveis de significância usuais, ou seja, a
afirmação do presidente do partido é perfeitamente corroborada pela sondagem.
PE 47
8.5 Caso II: Testes de hipóteses para o parâmetro da distribuição exponencial
Vimos no Caṕıtulo 7 que para uma população X ∼ Exp(λ) (E(X) = µ = λ−1 e
V (X) = λ−2 ⇔ σ = λ−1) se tem
Z =
X̄ − µ
σ/
√
n
=
X̄ − λ−1
λ−1/
√
n
=
√
n
(
λX̄ − 1
) a∼ N(0, 1)
Então para testar H0 : λ = λ0 contra H1 : λ 6= λ0 (ou H1 : λ < λ0, ou H1 : λ > λ0), usa-se a
estat́ıstica de teste
Z =
√
n
(
λ0X̄ − 1
)
Quando H0 é verdadeira, conclui-se que ZH0
a∼ N(0, 1). Para H1: λ 6= λ0, rejeita-se H0 ao ńıvel
de significância α se
zobs =
√
n (λ0x̄− 1) < −c ou zobs > c
onde c = Φ−1(1− α/2).
PE 48
24
8.6 Teste de ajustamento do qui-quadrado de Pearson
Até agora os testes de hipóteses estudados diziam respeito a parâmetros,
mas, como foi referido no ińıcio deste caṕıtulo, também se podem efec-
tuar testes a hipóteses sobre a própria forma da distribuição de uma dada
população. Este teste é um exemplo disso.
Este teste tem como objectivo verificar a hipótese de que um conjunto de
observações segue uma determinada distribuição (discreta ou cont́ınua, com
ou sem parâmetros desconhecidos).
Exemplo: O lançamento de um dado 1000 vezes conduziu à seguinte tabela de frequências observadas (oi)
i oi
1 174
2 174
3 154
4 179
5 154
6 165
Total 1000
PE 49
8.6 (cont.)
Será que os resultados obtidos sustentam a hipótese de que “o dado é perfeito”?
Seja X a v.a. que representa o número de pontos obtido num lançamento.
A hipótese de interesse pode ser escrita como
H0: P (X = i) =
1
6
, i = 1, . . . , 6 ou H0: X ∼ Unif.Disc.(1, . . . , 6)
contra H1: ∃i: P (X = i) 6=
1
6
ou H1: X ∼/ Unif.Disc.(1, . . . , 6)
Quando H0 é verdadeira sabemos calcular a probabilidade de cada valor (ou classe, em geral),
que designamos por pi, e o valor esperado para o número de observações em cada classe
(abreviadamente, frequências esperadas),
Ei = n pi
onde n é a dimensão da amostra (neste caso n = 1000).
(Notar que a v.a. que indica o número de observações, em n, que “cai” em cada classe ou valor
tem distribuição Bin(n, pi).)
PE 50
25
8.6 (cont.)
Vamos acrescentar essas duas colunas à tabela anterior:
i oi pi Ei = n pi
1 174 1/6 166.67
2 174 1/6 166.67
3 154 1/6 166.67
4 179 1/6 166.67
5 154 1/6 166.67
6 165 1/6 166.67
Total 1000 1 1000.02
Mesmo quando H0 é verdadeira não estamos à espera que as colunas oi e
Ei coincidam. É então necessário medir o afastamento entre oi e Ei e saber
até que ponto esse afastamento é razoável para H0 verdadeira.
Se determinarmos que o afastamento é razoável, não rejeitamos H0, caso
contrário rejeitamos H0.
PE 51
8.6 (cont.)
A variável que é usada para medir o afastamento entre oi e Ei é (estat́ıstica de teste)
QH0 =
k∑
i=1
(Oi − Ei)2
Ei
Pode mostrar-se que, quando H0 é verdadeira,
QH0
a∼ χ2k−β−1
onde k representa o número de classes (no exemplo, 6) e β o número de parâmetros estimados (no
exemplo, 0).
Deve rejeitar-se H0 se o valor observado de QH0 for muito elevado, ou seja, a região cŕıtica do
teste, para o ńıvel de significância α, é:
RCα : QH0 > c, com c = F
−1
χ2
k−β−1
(1− α)
PE 52
26
8.6 Teste do qui-quadrado de ajustamento
Tabela incluindo os cálculos para obter o valor observado de QH0 :
i oi pi Ei = n pi
(oi − Ei)2
Ei
1 174 1/6 166.67 0.322
2 174 1/6 166.67 0.322
3 154 1/6 166.67 0.963
4 179 1/6 166.67 0.912
5 154 1/6 166.67 0.963
6 165 1/6 166.67 0.017
Total 1000 1 1000.02 3.499 (= qobs)
Se fixarmos α = 0.05, com k − β − 1 = 5, obtém-se c = F−1
χ25
(0.95) = 11.07.
Uma vez que qobs = 3.499 < 11.07, não há evidência para rejeitar H0 ao ńıvel de sig. de 5%.
valor-p = P (QH0 > 3.499) = 0.6235 (R); 0.6 < valor-p < 0.7 (tabelas)
PE 53
8.6 Teste do qui-quadrado de ajustamento
Vejamos como proceder num caso geral:
Considere-se X uma população com função de distribuição F desconhecida. Seja (X1, X2, · · · , Xn) uma
a.a. de dimensão n proveniente da população X , com n grande.
Hipótese nula: H0 : X tem distribuição F ;
Hipótese alternativa: H1 : X não tem distribuição F ;
A ideia que se utiliza para se desenvolver o teste de ajustamento é essencialmente a seguinte:
1. Considera-se uma partição, C1, C2, · · · , Ck, do conjunto dos valores posśıveis de X , RX :
i) Ci ∩Cj = ∅, ∀i 6= j, i, j = 1, 2, · · · , k;
ii)
k∪
i=1
Ci = RX .
No caso de variáveis aleatórias cont́ınuas ou discretas com muitos valores distintos pode-se usar as
regras para a construção de histogramas e, em geral, classes de amplitude constante.
Agrupam-se os dados observados segundo essa partição.
PE 54
27
8.6 Teste do qui-quadrado de ajustamento
2. Como vimos no exemplo anterior comparam-se as frequências absolutas na amostra aleatória (Oi) com
as frequências absolutas esperadas (ou estimador de) quando H0 é verdadeira (Ei) e mede-se o
afastamento entre Oi e Ei. Em seguida verifica-sese esse afastamento é razoável para H0 verdadeira.
Objectivo: Testar se X ∼ F , isto é se as probabilidades desconhecidas:
pi = P (X ∈ Ci)
são iguais às probabilidades
p0i = P (X ∈ Ci|H0) = P (X ∈ Ci|X ∼ F )
.
PE 55
8.6 Teste do qui-quadrado de ajustamento
As hipóteses anteriores podem agora reformular-se do seguinte modo:
Hipóteses: H0 : pi = p
0
i , ∀i = 1, 2, · · · , k vs H1 : ∃i : pi 6= p0i
Quando H0 é verdadeira a estat́ıstica de teste é:
QH0 =
k∑
i=1
(Oi − Ei)2
Ei
a∼χ2(k−β−1),
onde
Oi : frequências absolutas na amostra aleatória
Ei : frequências absolutas esperadas (ou estimador de) quando H0 é verdadeira, Ei = np
0
i (ou Êi = niP̂
0
i ,
com P̂ 0i estimador de p
0
i );
k : no de classes;
β: no de parâmetros a estimar;
Notas:
Observar que Oi é uma v.a. que indica a frequência absoluta na classe i dentro de n observações, logo
Oi ∼ Binomial(n, pi).;
Observar também que Ei = E(Oi) = npi, que sob a validade de H0 é igual a np
0
i
PE 56
28
8.6 Teste do qui-quadrado de ajustamento
Decisão:
■ Com base na região cŕıtica (ao ńıvel de significância α):
RCα = {q ∈ R+ : q > F−1χ2
(k−β−1)
(1− α)}.
Decisão: sendo qobs =
k∑
i=1
(oi−Ei)
2
Ei
o valor observado da estat́ıstica de teste então há evidência
para rejeitar H0 se qobs ∈ RCα ao ńıvel de significância α.
■ Com base no valor-p:
Tendo em conta as hipóteses especificadas, o valor − p = P (QH0 > qobs|H0) = 1− FQH0 (qobs).
Rejeita-se H0 para ńıveis de significância > valor − p.
Observação: Antes de se calcular o valor observado da estat́ıstica de teste deve averiguar-se se
todos os valores de Ei ≥ 1 e pelo menos 80% dos Ei ≥ 5, se isto não ocorrer é necessário agrupar
classes.
PE 57
8.6 (cont.)
Exemplo: Pensa-se que o número de defeitos por circuito, num certo tipo
de circuitos, deve seguir uma distribuição de Poisson. De uma amostra (es-
colhida aleatoriamente) de 60 circuitos obtiveram-se os resultados seguintes
N.o de def. oi
0 32
1 15
2 9
3 4
Total 60
X - v.a. que representa o n.o de defeitos num circuito
H0: X ∼ Poisson(λ) contra H1: X ∼ outra distribuição
PE 58
29
8.6 (cont.)
O parâmetro λ é desconhecido pelo que deve ser estimado (pelo método da
máxima verosimilhança). Sabe-se que para a distribuição de Poisson
λ̂ = x̄ =
0× 32 + 1× 15 + 2× 9 + 3× 4
60
= 0.75
donde
p̂1 = P̂ (X = 0|H0) =
e−0.750.750
0!
= 0.472 Ê1 = 28.32
p̂2 = P̂ (X = 1|H0) =
e−0.750.751
1!
= 0.354 Ê2 = 21.24
p̂3 = P̂ (X = 2|H0) =
e−0.750.752
2!
= 0.133 Ê3 = 7.98
p̂4 = P̂ (X ≥ 3|H0) = 1− (p̂1 + p̂2 + p̂3) = 0.041 Ê4 = 2.46
Deve verificar-se se todos os Êi ≥ 1 e pelo menos 80% dos Êi ≥ 5. Como não se verifica a
segunda condição é necessário agrupar classes.
PE 59
8.6 (cont.)
Obtém-se então a tabela final:
N.o de def. oi p̂i Êi = n p̂i
(oi − Êi)2
Êi
0 32 0.472 28.32 0.478
1 15 0.354 21.24 1.833
≥2 13 0.174 10.44 0.628
Total 60 1.000 60.00 2.939 (= q)
k − β − 1 = 3− 1− 1 = 1, α = 0.05 ⇒ c = F−1
χ21
(0.95) = 3.841
Como 2.939 < 3.841, não se rejeita H0 ao ńıvel de significância de 5%.
Ou seja, esta amostra não fornece evidência para rejeitar a hipótese de que a variável X segue a
distribuição de Poisson.
PE 60
30
8.6 (cont.)
Observações:
1) Para variáveis cont́ınuas o procedimento é semelhante (ver exemplo dado na aula);
2) É necessário n relativamente elevado para fazer este teste (no mı́nimo, cerca de 10
observações por classe).
3) Existem outros testes que não requerem tantas observações (teste de Kolmogorov-Smirnov e
papel de probabilidade) mas não fazem parte do programa.
PE 61
8.7 - Teste de independência do qui-quadrado de Pearson em tabelas de con-
tingência
Situação - cada elemento de uma população pode ser classificado consoante duas categorias (variáveis
categóricas naturais ou não categóricas mas agrupadas), denotadas, por exemplo, por X (com r categorias)
e Y (com s categorias), respectivamente.
Objectivo - Verificar se existe independência entre essas duas variáveis.
Para testar a independência (H0) entre X e Y tem-se:
Hipótese nula: H0 : P (X = i, Y = j) = P (X = i)P (Y = j), ∀(i,j)
Hipótese alternativa: H1 : ∃(i,j) : P (X = i, Y = j) 6= P (X = i)P (Y = j)
onde:
P (X = i, Y = j) representa a probabilidade conjunta de (X,Y ) pertencer à categoria (i, j);
P (X = i) =
∑s
j=1 P (X = i, Y = j), representa a probabilidade (marginal) de X pertencer à categoria i;
P (Y = j) =
∑r
i=1 P (X = i, Y = j), representa a probabilidade (marginal) de Y pertencer à categoria j.
PE 62
31
8.7 - Teste de independência do qui-quadrado de Pearson em tabelas de con-
tingência
Para testar essas hipóteses devemos ter observações relativas à ocorrência simultânea dos valores posśıveis
das duas variáveis. Essas n observações organizam-se numa tabela de frequências a que se chama tabela de
contingência. Um tabela de contingência para as variáveis X (linha) e Y (coluna):
X\Y 1 2 · · · s Total
1 O11 O12 · · · O1s O1•
2 O21 O22 · · · O2s O2•
. . . · · · · · ·
r Or1 Or2 · · · Ors Or•
Total O•1 O•2 · · · O•s n
onde
■ Oij : frequência observada na categoria i da
variável linha e na categoria j da variável
coluna;
■ Oi•: total de observações na categoria i da
variável linha;
■ O•j : total de observações na categoria j da
variável coluna.
PE 63
8.7 - Teste de independência do qui-quadrado de Pearson em tabelas de con-
tingência
■ Como no teste anterior, a ideia é a comparação entre as frequências observadas, Oij , agora,
em cada uma das células da tabela de contingência, e as frequências esperadas, Eij , na
hipótese das variáveis X e Y serem independentes.
■ Essa comparação é feita usando a estat́ıstica do qui-quadrado.
■ Se H0 é verdadeira vem:
nP (X = i, Y = j) = nP (X = i)P (Y = j) (independência)
mas P (X = i) e P (Y = j) são desconhecidas (não especificadas em H0)...
PE 64
32
8.7 - Teste de independência do qui-quadrado de Pearson em tabelas de con-
tingência
... usam-se, então, as suas estimativas de máx. verosimilhança, vindo:
n ̂P (X = i) ̂P (Y = j) = n
Oi•
n
O•j
n
(1)
=
Oi•O•j
n
(2)
= Eij (3)
Assim quando H0 é verdadeira a estat́ıstica de teste é:
QH0 =
r∑
i=1
s∑
j=1
(Oij − Eij)2
Eij
a∼χ2(r−1)(s−1),
onde r = n. de linhas e s = n. de colunas da tabela.
PE 65
8.7 - Teste de independência do qui-quadrado de Pearson em tabelas de con-
tingência
Decisão:
■ Com base na região cŕıtica (ao ńıvel de significância α):
RCα = {q ∈ R+ : q > F−1χ2
(r−)(s−1)
(1− α)}.
Decisão: sendo qobs =
r∑
i=1
s∑
j=1
(oij−Eij)
2
Eij
o valor observado da estat́ıstica de teste então há
evidência para rejeitar H0 se qobs ∈ RCα ao ńıvel de significância α.
■ Com base no valor-p:
Tendo em conta as hipóteses especificadas, o valor − p = P (QH0 > qobs|H0) = 1− FQH0 (qobs).
Rejeita-se H0 para ńıveis de significância > valor − p.
Exemplo (aula)
PE 66
33
	Capítulo 8 - Testes de hipóteses
	8.1 Noções básicas
	8.2 Testes de hipóteses para a média de uma população normal
	8.3 Testes de hipóteses sobre a igualdade das médias de duas populações normais
	8.4 Testes de hipóteses para a variância de uma população normal
	8.5 Testes de hipóteses para parâmetros de populações não normais uniparamétricas
	8.5 Testes de hipóteses para parâmetros de populações não normais uniparamétricas
	8.6 Teste de ajustamento do qui-quadrado de Pearson
	8.7 - Teste de independência do qui-quadrado de Pearson em tabelas de contingência
	8.7 - Teste de independência do qui-quadrado de Pearson em tabelas de contingência
	8.7 - Teste de independência do qui-quadrado de Pearson em tabelas de contingência
	8.7 - Teste de independência do qui-quadrado de Pearson em tabelas de contingência
	8.7 - Teste de independência do qui-quadrado de Pearson em tabelas de contingência

Continue navegando