Aula 8 Professor Gastão

•

UFRJ

Claudio Roberto

27/05/2014

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 57 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 57 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 57 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística I

57.441 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Teste de Hipótese
Conceitos a serem introduzidos neste capítulo:
•Procedimento de teste de hipótese
•Hipótese nula e hipótese alternativa
•Estatística de teste
•Região de aceitação e região de rejeição
•Erro I e Erro II
•Probabilidades de erro: α e β
•Hipótese simples e hipótese composta
•Nível de significância, nível crítico ou valor-p•Nível de significância, nível crítico ou valor-p
•Teste bilateral e teste unilateral
•Teste de proporção
•Teste t para amostras não pareadas –
Variância amostral combinada
•Teste t para amostras pareadas
•Distribuição qui-quadrado
•Teste Qui-quadrado para independência
•Distribuição F de Fisher-Snedecor
•Análise de Variância (ANOVA) –
Comparações múltiplas
Propaganda enganosa? 
A propaganda da Companhia de Cigarros Tabacox afirma que o teor médio 
de nicotina dos cigarros da marca Delicious, que ela fabrica é no máximo, de 
0,7 mg. Um organismo fiscalizador analisa 16 cigarros dessa marca, obtendo 
um valor médio para a amostra analisada de 0,708 mg de nicotina. O 
organismo decide denunciar o fabricante à Justiça, que o autua por 
propaganda enganosa e o condena a pagar uma elevada multa. 
A Companhia decide recorrer. O seu advogado contrata um estatístico para 
saber se tem alguma chance de ganhar o recurso. O estatístico solicita os 
Teste de Hipótese
saber se tem alguma chance de ganhar o recurso. O estatístico solicita os 
dados relativos às análises feitas pelo organismo fiscalizador e calcula as 
estatísticas adequadas. Sorrindo, diz para o advogado da Companhia: “Não 
tem problema não, pode apresentar o recurso.” Dias depois o recurso é 
deferido e a sentença inicial é revogada. 
A tranqüilidade do estatístico e sua confiança no julgamento positivo do 
recurso residem no conhecimento da teoria estatística, que, por meio de um 
teste de hipótese, lhe permitiram verificar que uma média amostral de 0,708 
mg pode muito provavelmente ser proveniente de uma população com média 
0,7. Para o advogado e para a diretoria da Companhia, ficou evidente a 
conveniência de se ter algum conhecimento das técnicas estatísticas, mesmo 
em uma área aparentemente tão distante dela como o Direito.
Algumas outras situações em que a metodologia 
dos Testes de Hipótese pode ser utilizada para 
dirimir questões aparentemente controversas:
� Será que o fato de a TV transmitir um debate 
entre os 2 únicos candidatos em uma eleição 
presidencial, pode alterar significativamente as 
chances de vitória de cada um ?
Teste de Hipótese
� Será que existem diferenças expressivas entre 
as eficácias de 5 diferentes tratamentos para 
combater uma determinada doença?
� Será que existe relação entre o nível de estresse 
de um trabalhador e o tipo de atividade que ele 
realiza dentro da sua empresa? 
Suponha que o modelo matemático
representado pela função de densidade f,
descreve adequadamente o comportamento
probabilístico de uma certa variável.
Admita que f depende de um parâmetro θ,
cujo valor é desconhecido. Deseja-se, através
Conceitos Básicos
cujo valor é desconhecido. Deseja-se, através
de um experimento, envolvendo a coleta de
dados reais, decidir entre duas afirmações
conflitantes a respeito do valor correto de θ:
a hipótese nula H0
e
a hipótese alternativa H1.
Sejam X1, X2, ..., Xn variáveis aleatórias iid (que
representam n réplicas do mesmo experimento), todas elas
obedecendo a esse mesmo modelo, que depende do parâmetro θ
de valor desconhecido.
Deseja-se estabelecer um critério de decisão que nos leve a :
Aceitar H0
ou
Conceitos Básicos(Cont.)
Rejeitar H0 (em favor de H1), 
com base nos valores medidos de X1, X2, ..., Xn.
Usualmente, a escolha desse critério passa por eleger uma
função t de X1, X2, ..., Xn chamada estatística de teste e dividir o
conjunto dos valores possíveis de t(X1, X2, ..., Xn) em duas partes
chamadas
Região de Aceitação A
e
Região de Rejeição R.
Assim, conforme o valor de t, calculado a partir
dos dados coletados, pertença a A ou pertença a R,
aceita-se H0 ou rejeita-se H0 .
Ocorre que há dois tipos possíveis de erro de
decisão, que seria conveniente evitar :
Erro I - Rejeitar H0, quando H0 é verdadeira;
Conceitos Básicos(Cont.)
Erro I - Rejeitar H0, quando H0 é verdadeira;
Erro II - Aceitar H0, quando H0 é falsa;
Com Probabilidades:
αααα = P [ Erro I ] = P[ Rejeitar H0 ] , sendo H0 é verdadeira
e
ββββ = P [ Erro II ] = P[ Aceitar H0 ] , sendo H0 é falsa.
● População: todos os cigarros da marca Delicious 
produzidos pela Companhia de Cigarros Tabacox
● Propriedade da população a ser analisada: teor de 
nicotina, representado pela v.a. X.
● Proposição sobre a propriedade da população: O teor de 
nicotina destes cigarros é no máximo 0,7 mg 
● Função de densidade: podemos supor distribuição 
Normal
Exemplo: No caso da situação, sobre a suspeita de 
propaganda enganosa temos:
Normal
● Parâmetro: teor médio de nicotina dos cigarros 
Delicious, µ (em mg)
● Hipótese Nula: O teor médio de nicotina da marca 
Delicious é no máximo igual a 0,7 mg. Simbolicamente, 
H0: µ ≤ 0,7
● Hipótese Alternativa: O teor médio de nicotina da marca 
Delicious é maior que 0,7 mg. Simbolicamente, 
H1: µ > 0,7
● Amostra aleatória X1, X2, ..., Xn: teor de nicotina em 
cada cigarro dessa marca selecionado para análise 
Como devemos especificar o que são H0 e H1?
É usual que na formulação de um teste de hipótese, no 
momento em que se define o que serão H0 e H1, seja 
reservado para: 
H0 o papel da hipótese mais conservadora; 
H1 o papel da hipótese mais inovadora. 
1. No caso da propaganda supostamente enganosa, 
consideremos que 0,7 mg de nicotina em um cigarro pode 
ser considerado um baixo teor e é o que o fabricante 
informa no rótulo da embalagem. Então, a hipótese nula; 
H0: µµµµ ≤≤≤≤ 0,7; pode ser entendida como
“O teor de nicotina dos cigarros Delicious segue as 
especificações divulgadas pelo fabricante”. especificações divulgadas pelo fabricante”. 
Já a hipótese alternativa; H1: µµµµ > 0,7; pode ser entendida 
como “O teor de nicotina dos cigarros Delicious não segue 
as especificações divulgadas pelo fabricante”. 
H0 é a mais conservadora no sentido de que, se ela for 
verdadeira, não há nada a ser corrigido. 
H1 seria a mais inovadora, no sentido de que, se ela for 
verdadeira, provavelmente se justificaria uma medida mais 
drástica, porque neste caso estaria caracterizada uma 
propaganda enganosa.
2. No caso do debate televisado entre os dois candidatos a 
presidente, 
H0: “O debate não afetará as preferências do 
eleitorado” 
H1: “O debate alterará as preferências do eleitorado”. 
É claro que H0 é a mais conservadora, já que ela significa 
que tudo permanece inalterado, enquanto H1 é a mais 
inovadora porque implica em uma mudança no cenário 
eleitoral.
3. No caso dos 5 tratamentos para a mesma doença, 
H0: (conservadora) “Os 5 tratamentos são igualmente 
eficazes”, ou seja, “Tanto faz usar o tratamento A ou B 
ou C ou D ou E, porque a chance de cura é a mesma em ou C ou D ou E, porque a chance de cura é a mesma em 
todos os casos”. 
H1: (inovadora) seria “Há diferenças entre as eficácias dos 
5 tratamentos”, ou seja, “As chances de cura não são as 
mesmas”.
4. No caso da relação entre tipo de atividade e estresse, 
H0: (conservadora) seria “O nível de estresse do 
trabalhador independdo tipo de atividade que ele exerce”, 
ou seja, “Todas as atividades são igualmente 
estressantes”. 
H1: (inovadora) seria “Há uma relação de dependência 
entre o nível de estresse do trabalhador e o tipo de 
atividade que ele exerce”.
O que são hipótese simples e hipótese composta?
Dizemos que H0 (ou H1) é uma hipótese simples se a ela 
corresponde um único valor do parâmetro θ. Neste caso fica 
também definida de forma únicaa distribuição de probabilidade 
comum às v.a.’s X1, X2,..., Xn . Caso contrário, trata-se de uma 
hipótese composta. Ou seja, a igualdade θθθθ = θθθθ0 define uma 
hipótese simples, enquanto as desigualdades 
θθθθ ≤≤≤≤ θθθθ0 , θθθθ < θθθθ0 , θθθθ ≥≥≥≥ θθθθ0 e θθθθ > θθθθ0 definem hipóteses compostas.
A hipótese nula H0 vista como uma hipótese simples
A hipótese H0 sempre será tratada como uma hipótese simples.
Já a hipótese alternativa H1 é, em geral, uma hipótese composta, Já a hipótese alternativa H1 é, em geral, uma hipótese composta, 
ou seja, inclui mais de um valor de θ e, conseqüentemente, mais 
de uma distribuição de probabilidade.
Em outras palavras, mesmo que as hipóteses sejam do tipo:
H0: θθθθ ≤≤≤≤ θθθθ0 vs. H1: θθθθ > θθθθ0, ou H0: θθθθ ≥≥≥≥ θθθθ0 vs. H1: θθθθ < θθθθ0,
a hipótese nula será considerada como H0: θθθθ=θθθθ0, já que em ambas
as situações θθθθ0 é o valor limite entre H0 e H1 e portanto é o caso
mais desfavorável a H0, além de especificar uma única
distribuição de probabilidade.
O que podemos dizer sobre as prob. de erro αααα e ββββ?
Vimos acima que há dois tipos possíveis de erro de decisão: 
o Erro I, rejeitar H0 quando ela é verdadeira, tem 
probabilidade αααα de ocorrer
o Erro II, aceitar H0 quando ela é falsa, tem probabilidade ββββ
de ocorrer
● O ideal seria que ambas as probabilidades de erro, αααα e ββββ, ● O ideal seria que ambas as probabilidades de erro, αααα e ββββ, 
fossem tão pequenas quanto possível.
● Mas infelizmente, se o tamanho n da amostra está fixado, 
uma diminuição de ββββ traz como conseqüência um aumento 
em αααα e vice-versa. Por que? Para diminuirmos a 
probabilidade do Erro II, teríamos que fazer com que a 
região de aceitação A diminuísse. Conseqüentemente, a 
região de rejeição R aumentaria, o que inevitavelmente 
provocaria um aumento na probabilidade do Erro I.
● Assim, a única forma de fazer com que ambos, αααα e ββββ, 
diminuíssem, seria aumentar o tamanho n da amostra. 
(Ver Seção 8.6).
O Erro I no centro das atenções
Por definição, αααα é calculada supondo-se H0 verdadeira, ou 
seja, a partir da distribuição de probabilidade única postulada por 
H0. 
Por outro lado, ββββ é calculada supondo H1 verdadeira. Então, 
em geral há infinitos valores possíveis para ββββ, correspondentes a 
infinitas distribuições de probabilidade. Assim, o cálculo de ββββ é 
Normalmente bem mais complexo que o de αααα. 
O Erro I é o mais importante a ser evitado, isto é, as 
hipóteses são formuladas de forma a que H0 seja aquela hipótese 
O Erro I é o mais importante a ser evitado, isto é, as 
hipóteses são formuladas de forma a que H0 seja aquela hipótese 
cuja rejeição equivocada constitui o erro de maior importância.
Costuma-se fixar um valor pequeno para αααα (digamos: 0,05 ou 
0,01) e, ao mesmo tempo, procurar usar procedimentos de teste 
para os quais os valores de ββββ sejam os menores possíveis. 
A formulação adequada da hipótese H0 vem a ser, nestas 
circunstâncias, vital na realização de uma experiência. 
A questão é que o julgamento da importância de um erro de 
decisão pode ser bastante subjetivo. 
Consideremos, por exemplo, o caso da 
suposta propaganda enganosa.
A hipótese H0, tal como foi formulada acima, atende 
aos interesses do fabricante, dado que para ele o erro que 
mais interessa evitar é o de se concluir (erradamente) que 
o teor médio de nicotina do seu produto é maior do que o 
afirmado por ele. 
Do ponto de vista do consumidor a situação pode ser 
diametralmente oposta. O erro que este quer minimizar é diametralmente oposta. O erro que este quer minimizar é 
que se conclua que o teor médio de nicotina é menor que 
0,7 mg, se de fato ele for maior. Assim, para o 
consumidor, a hipótese H0 deveria ser: “O teor médio de 
nicotina é maior ou igual a 0,7 mg”. 
A nossa atenção estará normalmente voltada para o 
Erro I, e naturalmente admitiremos que a hipótese H0 foi 
corretamente formulada. 
Considerações sobre o Erro II serão feitas quando 
examinarmos com mais detalhe o conceito de poder de um 
teste de hipótese (Ver Exemplo 8.7).
Suponha que a longitude máxima de crânios humanos
de uma certa raça A da antiguidade pode ser encarada como
uma variável aleatória com distribuição Normal de média 145
mm e desvio padrão 12 mm.
Por outro lado, para uma segunda raça B, a longitude
máxima dos crânios segue uma distribuição Normal com média
149 mm e o mesmo desvio padrão de 12 mm.
Exemplo 8.2: Arqueologia – Os crânios 
encontrados são de que raça?
149 mm e o mesmo desvio padrão de 12 mm.
Admita agora que, em uma escavação, foram
encontrados 36 crânios e há dúvidas quanto à raça da
população da qual eles são provenientes. Evidências adicionais
encontradas nessa escavação mostram que os crânios só
podem ser de uma das duas raças: A ou B. Os
antropólogos consultados acreditam que a longitude máxima
do crânio fornece uma boa medida para se especificar a raça.
Como podemos decidir de que raça são os crânios?
Formule o problema em um contexto de Teste de Hipótese.
Uma hipótese será que µ = 145 (raça A), enquanto a 
outra será que µ = 149 (raça B), mas qual deve ser a hipótese 
nula e qual a alternativa?
Suponha que, por razões históricas, sabe-se que o povo 
da raça A habitava na região onde foram encontrados os 
crânios. Logo, não seria surpreendente que fossem encontrados 
crânios dessa raça na referida região. Por outro lado, suponha 
que se os crânios fossem da raça B isso representaria um 
achado de valor científico. 
Nesse caso, o erro a minimizar deve ser o de rejeitar a 
hipótese H0, quando ela é verdadeira, ou seja, o erro de decidir 
Solução do exemplo 8.2:
Nesse caso, o erro a minimizar deve ser o de rejeitar a 
hipótese H0, quando ela é verdadeira, ou seja, o erro de decidir 
pela raça B quando os crânios são de fato da raça A. 
Devemos fazer com que a probabilidade α de se cometer o Erro 
I tenha um valor pequeno. Portanto a hipótese nula deverá ser 
µ = 145 (conservadora) e a hipótese alternativa µ = 149 
(inovadora), ou seja:
H0: µ = 145 versus H1: µ = 149.
Dizer que os crânios são da raça A equivale a dizer que suas 
longitudes máximas provêm de uma Normal(145; 122). Já se 
eles são da raça B seus comprimentos máximos obedecem a 
uma Normal(149; 122).
Como as hipóteses são relativas à média populacional, 
uma boa medida para se usar na decisão entre as duas 
populações é a média da amostra, que será, portanto, a nossa 
estatística de teste. 
Os 36 crânios encontrados podem ser considerados 
como uma amostra aleatória da população de raça A ou da 
população de raça B. Suponha que a média amostral da 
longitude máxima, calculada com base nos 36 crânios 
Solução do exemplo 8.2:
longitude máxima, calculada com base nos 36 crânios 
encontrados foi = 147,3 mm. 
Qual seria o critério de decisão a ser adotado se quisermos 
“amarrar” o valor de α em 0,05 ?
Denotemos por o valor que serve como fronteira de decisão 
entre as regiões de aceitação A e de rejeição R. Esse ponto é 
usualmente chamado ponto de corte ou valor crítico. Então, 
aceitamos H0, se ≤ ; e decidimos pela rejeição de H0
obsX
Cx
X
Cx
Exemplo 8.2: Arqueologia – Os 
crânios encontrados são de que raça?
Seja p a proporção dos profissionais formados por uma
Instituição de Ensino Superior (IES) que estão bem preparados.
Suponha que em um determinado país, entre as IES que
oferecem cursos de graduação em Administração, há :
- Cursos de Boa Qualidade, onde p = 0,80
- Cursos de Má Qualidade, onde p = 0,60
O governo decide então adotar um sistema que visa
avaliar, por amostragem, o nível de ensino de Administração em
Exemplo A:
avaliar, por amostragem, o nível de ensino de Administração em
uma dada IES (qualquer semelhança é mera coincidência!)e usa
como critério de decisão o seguinte :
Sorteia aleatoriamente n = 50 entre os formandos daquela
IES e os submete a uma prova de conhecimento (a mesma para
todas as IES). Se o número de aprovados na amostra for inferior
a 35, aquele curso está descredenciado. Caso contrário, ele é
autorizado a continuar funcionando.
Formule o problema em um contexto de Teste de Hipótese.
Admitindo que essa prova mede adequadamente o grau de
preparo das pessoas, o modelo probabilístico para a situação de um
formando de uma IES genérica é a distribuição de Bernoulli com
parâmetro p , onde
P(sucesso) = P(aprovação na prova) = p
-A hipótese nula é H0 : p = 0.80 (Ensino de Boa Qualidade);
Solução do Exemplo A
0
-A hipótese alternativa é H1 : p = 0.60 (Ensino de Má Qualidade);
Temos então X1, X2, ..., X50 variáveis aleatórias iid, todas
com distribuição de Bernoulli com parâmetro p, onde p é
desconhecido.
A estatística de teste é t = . O critério de decisão
adotado é: Rejeitar H0 se < 35 . Caso contrário, aceitar H0.
X i
i 1
50
=
∑
Xi
i 1
50
=
∑
Esquema do Exemplo A
......
35 ∑
=
=
50
1i
ixt
ERRO I
As probabilidades associadas aos Erros I e II são :
α = P [ Erro I ] = , sendo p = 0.80
Logo 
α = = = 
P X 35i
i 1
50
=
∑ <






P X 34i
i 1
50
=
∑ ≤





 P X 34.5 P X
34.5
50
i
i 1
50
=
∑ ≤





 = ≤




= = = 0.0262
(aproximando a Binomial por uma Normal)
Isto significa que, mesmo que o curso da IES seja de boa
qualidade, existiria uma chance de 2,62% de que, como resultado da
regra estabelecida, ele erradamente viesse a ser descredenciado.
i 1=  50i 1=   
P
X 0.80
0.80x0.20
50
34.5
50
0.80
0.80x0.20
50
−
≤
−












[ ]P Z 1.94≤ −
ERRO II
Analogamente, 
β = P [ Erro II ] = , sendo p = 0.60
Logo β = = = 
P X 35i
i 1
50
=
∑ ≥






P X 35i
i 1
50
=
∑ ≥





 P X 34.5 P X
34.5
50
i
i 1
50
=
∑ ≥





 = ≥




34.5
−
 
= = = 0.0559
Isto significa que, mesmo que o curso da IES seja de má
qualidade, existiria uma chance de 5,59% de que, como resultado da
regra estabelecida, ele erradamente fosse autorizado a continuar
funcionando.
P
X 0.60
0.60x0.40
50
34.5
50
0.60
0.60x0.40
50
−
≥
−












[ ]P Z 1.59≥
Rotina para Obtenção do Critério de Decisão
(1o)Escolher um valor para α = P [ Erro I ], também chamado nível de
significância do teste (usualmente α = 0,01 ou α = 0,05);
(2o)Eleger a estatística de teste t (X1, X2, ..., Xn), uma variável
aleatória que depende de X1, X2, ..., Xn e que, supostamente, “resume
toda a informação relevante” para que se decida por H0 ou por H1;
(3o)Determinar a distribuição de probabilidade de t, quando H0 é
verdadeira;verdadeira;
(4o)Especificar a região de rejeição R, ou seja, o conjunto de valores
de t que nos levarão a rejeitar H0, de tal forma que o nível de
significância do teste seja igual ao α escolhido no 1o passo.
Automaticamente estará também especificada a Região de Aceitação
A;
(5o)Coletar os dados x1, x2, ..., xn, calcular valor de t (X1, X2, ..., Xn)
e decidir pela rejeição ou pela aceitação de H0, conforme o critério
especificado no 4o passo;
Nível Crítico ou Valor-p
Vamos agora definir o conceito de nível crítico ou
valor-p associado a uma determinada amostra x1, x2, ...,
xn (onde xi é o valor assumido pela variável aleatória Xi
em um determinado experimento da coleta de dados ,
i = 1, 2, ..., n) :
Trata-se do menor valor de α (nível de significância
do teste) para o qual, ao trabalhar com os valores
observados x1, x2, ..., xn, ainda rejeitaríamos H0 .
Exemplo B:
Deseja-se testar a hipótese H0 de que em média os
habitantes de uma certa localidade vivem pelo menos 60 anos.
Para isso foi extraída uma amostra com 16 casos dos registros de
óbitos da localidade, ao longo do último ano e foram registrados os
tempos de vida em anos de cada um desses 16 indivíduos. A média
e o desvio padrão amostrais foram, respectivamente, 50 e 20.e o desvio padrão amostrais foram, respectivamente, 50 e 20.
(a) Qual seria a sua conclusão, ao nível de significância de 5% ?
(b) Qual o nível crítico ?
Solução do Exemplo B
(a) Será que, mesmo que se viva em média pelo menos 60
anos nessa localidade, a chance de se obter, com uma amostra de
16 pessoas, uma média amostral de 50 anos ou menos, não pode
ser razoavelmente grande? Se, ao contrário, ela for bem pequena,
teremos evidências suficientes de que H0 é falsa.
Na falta de maiores informações sobre a distribuição deNa falta de maiores informações sobre a distribuição de
probabilidade do tempo de vida das pessoas, admitiremos que se
trata de uma Normal com média µ (desconhecida) e desvio padrão
σ (também desconhecido).
Temos então 16 variáveis aleatórias iid X1, X2, ..., Xn, onde
Xi ∼ N(µ, σ), para todo i.
As hipóteses nula e alternativa podem ser expressas como :
H0 : µµµµ ≥≥≥≥ 60 H1 : µµµµ <<<< 60
Solução do Exemplo B
Vamos então seguir os passos da Rotina acima
recomendada :
(1o) Escolher α = 0.05
(2o) Eleger como estatística de teste a média amostral(2o) Eleger como estatística de teste a média amostral
,
já que estamos tentando fazer inferências sobre a média
populacional µ.
X
X
16
i
i 1
16
= =
∑
Solução do Exemplo B
(3o) A distribuição de probabilidade de é uma Normal
com média µ e desvio padrão .
Padronizando temos que
, tem distribuição N(0, 1).
Quando o desvio padrão σ é também desconhecido (o que
X
σ σ16 4=
Z
X
=
− µ
σ 4
Quando o desvio padrão σ é também desconhecido (o que
é a situação mais comum), o procedimento usual é então substituir
na expressão acima, o desvio padrão populacional , σ , pelo desvio
padrão amostral, S.
Assim, a estatística de teste passaria a ser ,
cuja distribuição, seja H0 verdadeira ou falsa, é uma distribuição t
de Student com 16 − 1 = 15 graus de liberdade (ver Estimação
por Intervalo).
T
X
S 4
=
− µ
Solução do Exemplo B
(4o) Para especificar a Região de Rejeição, R, do teste
inicialmente observemos que quanto menor for , maiores serão
as razões para se rejeitar H0. Então, um critério de decisão
razoável seria :
Rejeitar H0, se onde B é uma constante a ser especificada.
Por outro lado, como T é uma função crescente de , este
X
BX <
XPor outro lado, como T é uma função crescente de , este
critério é equivalente a:
Rejeitar H0, se T < C, onde C é uma outra constante a ser
especificada no eixo da estatística t-student.
O valor de C deve ser então escolhido de tal forma a que :
P [ Erro I ] = P[ Rejeitar H0 ] = αααα , se H0 é verdadeira ou seja,
devemos ter
= 0,05, se µµµµ ≥≥≥≥ 60 .
Isto implica que C = t0,05 (15) = -1,753
X
[ ]P T C<
Solução do Exemplo B
Nosso critério de decisão passa a ser então :
Rejeitar H0, se
Porém, embora este valor de T dependa de e S (que são
calculáveis a partir dos dados), ele depende também do próprio µ.
Que valor deve ser atribuído a µ no momento de se
X
1.753
4S
µX
T −<
−
=
calcular o valor de T a partir dos dados, para poder decidir pela
rejeição ou não da hipótese H0?
Como, para H0 ser verdadeira, µ ≥ 60 , usamos aqui a
situação limite , isto é, µµµµ = 60.
O nosso critério de decisão é então, finalmente:
Rejeitar H0, se
1.753
4S
60X
T −<
−
=
Solução do Exemplo B
(5o) Uma vez coletados os dados, obtivemos
= 50 e S = 20Logo, o “valor observado” de T é
X
= - 2.00 ,
que está na Região de Rejeição R .
A decisão a ser tomada é então rejeitar a hipótese H0 de que nessa
localidade as pessoas vivem em média pelo menos 60 anos.
50 60
20 4
−
Solução do Exemplo B
(b) Usando αααα = 0,05, H0 foi rejeitada à luz dos dados coletados.
E se tivéssemos usado αααα = 0,01, qual seria a nossa decisão ?
Reproduzindo o raciocínio acima vemos que t0,01(15) = -2,602.
Isto mostra que ao nível de significância αααα = 0,01 , a decisão
indicada seria aceitar H0.
Então se formos reduzindo progressivamente o valor de α desdeEntão se formos reduzindo progressivamente o valor de α desde
0,05 até 0,01, vai existir um ponto em que a nossa decisão passa de
rejeição para aceitação. Este é o nível crítico (p-valor) associado à
nossa amostra. No caso do exemplo considerado, temos = 0,032 .
OBS.: É claro que o nível crítico ( ou valor-p ), , nos fornece uma
medida do “grau de veracidade” de H0: Quanto menor for o valor de
, mais motivos teremos para acreditar que H0 é falsa.
ɵα
ɵα
ɵα
ɵα
Figura - O nível crítico – Exemplo B
tobs= −−−−2,000
-1,753-2,602
Testes Paramétricos versus Testes Não Paramétricos
Em um Teste Paramétrico admite-se conhecida a família de
distribuições de probabilidade das variáveis aleatórias envolvidas.
Exemplo: No exemplo precedente, admitimos que os Xi ’s têm
todos a distribuição Normal(µ, σ). O teste aplicado, que se baseia
em uma estatística com distribuição t de Student sob H0, é um
teste paramétrico.
Em um Teste Não Paramétrico não é especificada a forma
matemática das distribuições de probabilidade das variáveis
envolvidas.
Testes para Comparação das médias de duas variáveis
Testes com amostras
pareadas
Teste t
Teste de Wilcoxon
Teste do Sinal
Paramétrico
Não Paramétricos
Testes com amostras
não pareadas
Teste t
Teste da mediana
Teste de Mann-Whitney
Teste de Wald-Wolfowitz
Paramétrico
Não Paramétricos
Teste t para amostras não pareadas
Sejam X1, X2, ..., Xm v.a.’s iid com distribuição comum
Normal (µX, σX) e Y1, Y2, ..., Yn v.a.’s iid com distribuição comum
Normal (µY, σY). Admite-se também que há independência entre os
Xi’s e os Yj’s.
Queremos testar H0: µX = µY contra H1: µX ≠ µY.
Admitiremos válida também a premissa de que os desvios
padrão σX e σY são iguais, isto é, σX = σY = σ, embora o seu valor
σ seja desconhecido.
Exemplo C
Um analista de portfolio deseja verificar se a habilidade do
seu antecessor em identificar boas oportunidades de investimento
era significativamente superior a um critério aleatório de escolha de
ações. São selecionadas então duas amostras de ações:
• a primeira com 12 ações da carteira apontada pelo• a primeira com 12 ações da carteira apontada pelo
antecessor, cujos retornos ao longo de um período fixado
foram x1, x2, ..., x12;
• a segunda com 15 ações sorteadas ao acaso entre todas as
disponíveis, cujos retornos ao longo do mesmo período
foram y1, y2, ..., y15.
Se , que conclusão pode
ser extraída?
x 15%,s 3%,y 10%,s 2%X Y= = = =
Teste a ser usado
A estatística de teste a ser usada é
onde:
é a média amostral dos Xi’s, i = 1,..., m;
T
X Y
S
1
m
1
n
p
2
=
−
+




=>X
é a média amostral dos Yj’s, j = 1,..., n;
é a variância amostral dos Xi’s, i = 1,..., m;
é a variância amostral dos Yj’s, j = 1,..., n;
é o estimador combinado de σ2.
=>Y
=>2xS
=>2YS
( ) ( )
S
m 1S n 1S
m n 2
p
2 X
2
Y
2
=
− + −
+ −
Prova-se que se H0 é verdadeira, T tem distribuição t de
Student com m + n − 2 graus de liberdade. Assim, uma vez
escolhido o nível de significância α, rejeita-se H0 se
Obs.: Quando a hipótese alternativa é do tipo H1: µX ≠ µY como
.2)n(m t tT
2
α
1
0 −+=>
−
acima, diz-se que o teste é bilateral. Caso a alternativa fosse do
tipo H1: µX > µY, o critério de decisão seria rejeitar H0 se
Teríamos então um teste unilateral.
(E se H1: µX < µY, qual seria o critério?)
.2)n(m t tT 10 −+=> −α
Justificativa para o procedimento
Decorre das premissas que ∼ e ∼
e e são v.a.’s independentes. Então pode-se provar que
∼
Daí, padronizando,
N
m
Xµ
σ
,





X Y N
n
Yµ
σ
,






X Y
X Y− .
11
, 2 










 +−
nm
N
YX
σµµ
− − −µ µ
∼ N (0 ; 1).
Note que, ao substituir σ por sua estimativa combinada Sp (já
que, sob H0, µX − µY = 0) obtemos exatamente a estatística de
teste T, cuja distribuição será uma t de Student com m + n −
2 graus de liberdade.
( ) ( )X Y
m n
X Y− − −
+




µ µ
σ2
1 1
Solução do Exemplo C
Neste caso queremos testar H0: µX = µY contra H1: µX > µY.
Por que?
Aplicando o teste t, temos: ( ) ( )S 12 1 3 15 1 2
12 15 2
6,2p
2
2 2
=
− × + − ×
+ −
=
15 10−Logo,
Como T = 5,18 > 2,49 = t0,01(25), rejeita-se a hipótese
H0 ao nível α = 0,01. Ou seja, os dados parecem indicar que o
critério de escolha do administrador anterior era significativamente
superior a um critério aleatório.
( )T 15 10
6,2
1
12
1
15
5,18.
obs
=
−
+




=
Testando a Independência entre duas variáveis
Teste Qui-Quadrado para Independência
Dadas duas variáveis aleatórias discretas X e Y, a idéia aqui é
comparar a sua distribuição conjunta amostral com o produto
das respectivas distribuições marginais amostrais (lembrando
que, se X e Y são independentes, devemos ter:que, se X e Y são independentes, devemos ter:
P[X=x, Y=y] = P[X=x] . P[Y=y] , para todo par (x,y) ).
A estatística de teste, em um certo sentido, mede uma distância
entre essas duas distribuições empíricas. Quanto menor for essa
distância, mais fortes serão as razões para se supor que X e Y
são independentes.
Testando a Independência entre duas variáveis(Cont2.)
Teste Qui-Quadrado para Independência(Cont.)
Admita que X pode assumir os valores a1 , a2 , ..., aK e Y pode
assumir os valores b1 , b2 , ..., bL.
Queremos testar:
Ho: P[X = ak , Y = bl] = P[X = ak] . P[Y = bl] ,
∀ k=1, ..., K e ∀ l =1, ...,L∀ k=1, ..., K e ∀ l =1, ...,L
contra
H1: P[X = ak , Y = bl] ≠ P[X = ak] . P[Y = bl] ,
para algum par (k,l)
Suponha que foram levantados experimentalmente n pares de
observações independentes (xi, yi), i=1,2,...,n.
Monta-se então uma Tabela de Contingência de acordo com o
próximo slide:
Testando a Independência entre duas variáveis(Cont.3)
Valores
de X
Valores de Y Total
b1 . . . bl . . . bL
a1 n11 . . . n1l . . . n1L n1.
. . . . . . . . . . . . . . .
ak Nk1 . . . nkl . . . nkL nk.a N . . . n . . . n n .
. . . . . . . . . . . . . . .
aK nK1 . . . nKl . . . nKL nK.
Total n..1 . . . n.l . . . n.L n
onde nkl = # { i: 1 ≤ i ≤ n, xi = ak e yi = bl}, para todo par (k,l)
nk. = nk1 + ... + nkL, ∀ k = 1,...,K
n.l = n1l + ... + nKl, ∀ l = 1,...,L
n = n n . n.kl
lk
k
k
l
l
∑∑ ∑ ∑= =
Exemplo D
Será que existe alguma relação entre as quantidades de
calorias e de colesterol presentes nos alimentos?
A Tabela 3.4 foi obtida com base em uma amostra sistemática
extraída da relação de alimentos contida na publicação “The Complete
Book of Food Counts “ de 1997 e a partir desta foi construida a Tabela
3.2 no próximo slide.
Como as duas variáveis aqui consideradas são ambas
contínuas, para aplicar o teste do qui-quadrado para independência, ocontínuas, para aplicar o teste do qui-quadrado para independência, o
primeiro passo foi discretizá-las. Assim, os 77 alimentos que compõem
a amostra foram divididos em duas categorias, conforme o seu
conteúdo de colesterol:
- Pobre em colesterol, se elecontém menos de 1 mg de colesterol
- Rico em colesterol, se ele contém no mínimo 1 mg de colesterol.
Da mesma forma, esses 77 alimentos foram divididos em
outras duas categorias:
- Pobre em calorias, se ele contém menos de 150 cal
- Rico em calorias, se ele contém, no mínimo 150 cal.
Exemplo D(Cont.)
Tabela 3.2 - Tabela de Contingência Calorias x Colesterol
com base em uma amostra de 77 alimentos.
Colesterol Calorias Total
Pobre Rico
Pobre 29 15 44
Rico 9 24 33Rico 9 24 33
Total 38 39 77
Trata-se portanto de uma tabela de contingência 2 x 2. 
Voltando à situação geral, seja 
, para todo par (k,l)
(note que Ekl corresponde ao valor esperado de nkl, se Ho fosse 
verdadeira, dados nk. e n.l)
Fonte: “The Complete Book of Food Counts”, C.T. Netzer, Dell
Publishing, 1997
n
n..n
E lkkl
×
=
Exemplo D(Cont2.)
A Estatística de teste é:
e pode-se provar que, se H0 é
verdadeira, quando n →→→→ ∞∞∞∞ ela tem uma distribuição que tende a
( )n E
E
kl kl
2
kll 1
L
k 1
K −
==
∑∑
verdadeira, quando n →→→→ ∞∞∞∞ ela tem uma distribuição que tende a
uma Qui-Quadrado com (K − 1) (L − 1) graus de liberdade.
O critério de decisão é: Rejeitar H0, se o valor
observado da estatística de teste for superior ao quantil 1 − αααα de
uma Qui-Quadrado com (K − 1) (L − 1) g.l.
Solução do Exemplo D
A Tabela 3.3 contém os valores esperados em cada posição
da tabela anterior, caso houvesse independência entre as variáveis.
Colesterol x Calorias - Tabela com os valores esperados sob a hipótese de independência
Colesterol Calorias Total
Pobre Rico
Pobre 21,71 22,29 44
Rico 16,29 16,71 33
Total 38 39
O valor da estatística de teste é então
( ) ( ) ( ) ( )29 2171
2171
15 2229
2229
9 16 29
16 29
24 1671
1671
977
2 2 2 2
−
+
−
+
−
+
−
=
,
,
,
,
,
,
,
,
, .
Solução do Exemplo D(Cont.)
Já que o número de graus de liberdade aqui é:
(2 − 1) (2 − 1) = 1 ,
vemos da tabela de distribuição qui-quadrado que, ao nível de
significância αααα = 1%, H0 deve ser rejeitada se a estatística de teste
for superior a 6,635.
Como 9,77 > 6,635 , rejeitamos H neste caso.Como 9,77 > 6,635 , rejeitamos H0 neste caso.
Conclui-se então que os dados disponíveis trazem evidência
suficiente de que há interdependência entre as quantidades de
calorias e de colesterol nos alimentos. Mais ainda: com base em
uma comparação entre as duas tabelas anteriores, vemos que
quanto mais rico o alimento for em calorias, mais rico ele tende a
ser em colesterol (e vice-versa ).
Análise de Variância com 1 efeito
Suponha que desejamos comparar os efeitos de m
“tratamentos”, usando a variável Y como a nossa variável resposta.
Cada tratamento será experimentado n vezes. Assim Yij
representará a resposta obtida quando for feita a j-ésima tentativa
com o i-ésimo tratamento, i=1,2,...,m e j=1,2,...,n.
O modelo de Análise da Variância pressupõe que se possa
representar esse fenômeno na forma:representar esse fenômeno na forma:
Yij = µ + αi + eij i = 1,...,m ; j = 1,...,n
onde: - µ , α1, α2, ...,αm são constantes desconhecidas e tais que
- eij‘s - são v.a.’s iid com distribuição de probabilidade Normal de
média 0 e desvio padrão σ, σ desconhecido.
Assim, os Yij serão também v.a.’s onde E(Yij) = µ + αi e
Var(Yij) = σ2, para todo i,j.
0α
m
1i
i =∑
=
Observação
Observe que, neste modelo :
(a) é o valor esperado da resposta quando for aplicado o
i-ésimo tratamento, .
(b) os eij representam uma perturbação aleatória, isto é, a
variabilidade da resposta que o modelo não explica.
ii αµµ ++++====
∀i
variabilidade da resposta que o modelo não explica.
Queremos testar a hipótese nula de que não há diferença
entre os m tratamentos em termos do seu efeito esperado, isto é,
H0: α1 = ... = αm = 0
Versus
H1: αi ≠ 0, para algum i 
Exemplo E
Deseja-se investigar a resistência à tensão de uma fibra
sintética usada na fabricação de tecido para camisas masculinas.
Em particular suspeita-se que essa resistência é afetada pelo
percentual de algodão na composição (em termos de peso) da fibra.
Foi então realizado um experimento em que, para cada umFoi então realizado um experimento em que, para cada um
dos 5 seguintes níveis do percentual de algodão na fibra: 15%,
20%, 25%, 30%, 35%, foram realizados 5 replicações
independentes do processo de mensuração da resistência.
Os dados coletados estão na Tabela a seguir. (Prox. Slide)
Tabela - Resultados do experimento referente à
resistência da fibra sintética Replicações
% de peso do Algodão
Replicações
1 2 3 4 5
15 7 7 15 11 9
20 12 17 12 18 18
25 14 18 18 19 19
30 19 25 22 19 23
35 7 10 11 15 11
Existe diferença significativa entre os 5 níveis de percentual
de algodão na fibra no que se refere ao seu efeito sobre a
resistência à tensão?
Existe uma identidade matemática que nos permite
expressar a variabilidade total dos dados SStotal como a soma de
duas parcelas:
Exemplo E(Cont.1)
duas parcelas:
- a variabilidade entre tratamentos SSentre e
- a variabilidade intra tratamentos SSintra.
SStotal= SSentre+ Ssintra
onde: SStotal = SSentre =
SSintra = ; , ;
2
m
ii
n
1j
ij )Y(Y
i
..−∑∑
= =
2
..i.
m
ii
i )YY(n −∑
=
2
i.
m
ii
n
1j
ij )Y(Y
i
−∑∑
= = i
n
1=j
ij
n
Y
=Y
i
∑
i. ∀i
i∑
∑∑
nm
Y
=Y
m
1i=
n
1=j
ij
..
i
Esta identidade é a base sobre a qual repousa a
metodologia usada para testar H0 contra H1. Intuitivamente, quanto
maior for SSentre quando comparado com SSintra, mais motivos
teremos para rejeitar H0.
A estatística de teste usual é então:
Exemplo E(Cont.2)
1m
SS
F
entre
−=A estatística de teste usual é então:
e é possível provar que , se H0 é verdadeira, ela tem distribuição F
de Snedecor com graus de liberdade m-1 e (n-1)m.
Assim, uma vez fixado o nível de significância a do teste, H0
deve ser rejeitada se (F)obs > F1-α (m−1,(n−1)m),
sendo que a expressão do membro direito representa o quartil 1− α
da distribuição F com graus de liberdade m-1 e (n-1)m.
1)m(n
SS
1mF
intra
−
−=
Justificativa para o Procedimento Adotado
Devido à forma como foram definidas SSentre e SSintra:
1. Quanto mais afastadas (resp. próximas) entre si estiverem as
médias amostrais , i = 1,2,...,m; e
2. Quanto mais próximos (resp. afastadas) entre si estiverem os
yij, j = 1,2,...,n, relativos a um mesmo tratamento j;
iY
yij, j = 1,2,...,n, relativos a um mesmo tratamento j;
mais motivos teremos para rejeitar (resp. aceitar) H0.
Por outro lado, se as condições 1 e 2 acima forem atendidas
(resp. se valer o que está entre parênteses), o valor da
estatística de teste F tende a ser grande (resp. pequeno)
Solução do Exemplo E
Temos aqui m = n = 5.
Admitindo válidas as premissas do modelo de análise de
variância no que se refere a esses dados, podemos calcular:
SStotal = 636,96 ; SSentre= 475,76 ; SSintra= 161,20
47576
5 1
,
( )−Logo F =
Como F0,95 (4,20) = 2,87, H0 deve ser rejeitada ao nível de
significância de 0,05. Isto significa que os dados nos fornecem
evidências de diferenças estatisticamente significativas entre as
resistências à tensão correspondentes aos diferentes níveis do
percentual de algodão na fibra.
47576
5 1
16120
5 1 5
1476
,
( )
,
(( ) )
, .
−
− ×
=