Aula inferencia 2

•

UFRPE

3

0

3

0

Joed Freire

26/03/2016

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística I

57.606 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Muitas vezes temos alguma ideia sobre o comportamento de uma variável (afirmações sobre uma 
população ou sobre um parâmetro desta). 
 
 Estas ideias são chamadas de HIPÓTESES e podem ser verificadas através dos dados de uma 
amostra. 
 
 
o O Teste de Hipóteses consiste em uma regra de decisão elaborada para rejeitar (ou não) uma 
afirmação (hipótese) feita a respeito de um parâmetro populacional desconhecido, com base em 
informações colhidas de uma amostra aleatória. 
 
o Verificar se o salário médio de certa categoria profissional no Brasil é de R$1.500,00 
 
o Testar se o percentual de aceitação de um determinado produto é de 40% ou mais. 
 
 
 
TESTE DE HIPÓTESES 
 
 
CONCEITOS FUNDAMENTAIS 
 
 
Hipótese Nula (H0): É a hipótese a ser testada, em geral representa o contrário do que queremos provar e é 
formulada em termos de igualdade. 
 
Hipótese Alternativa (H1): É a hipótese a ser confrontada com H0, em geral, corresponde ao que se quer 
provar. 
 
• Quando os dados mostram evidências suficientes de que H0 é falsa, devemos rejeitá-la e 
aceitar em seu lugar H1. 
• O teste será feito de tal forma que deverá sempre concluir na rejeição (ou não) 
de H0. 
 
 
EXEMPLOS: Formule as seguintes hipóteses. 
 
1. A proporção de peças defeituosas é 3%. 
2. Aumentando a dosagem de cimento aumenta-se a resistência média do concreto. 
3. O tempo médio para execução de uma etapa em um processo produtivo é de 20 minutos. 
4. Um programa de melhoria de qualidade de uma empresa melhora a satisfação de seus clientes. 
 
 
o Como estamos tomando uma decisão com base em informações de uma amostra, estaremos 
sujeitos a cometer dois tipos de erros: 
 
 
 Erro do tipo I (αααα): Rejeitar H0 quando H0 é verdadeira. A probabilidade de cometer esse erro é chamada 
nível de significância do teste e é representada por αααα. 
 
 
αααα = P(erro do tipo I) = P(rejeitar H0 / H0 é verdadeira) 
 
 Erro do tipo II (ββββ): Não rejeitar H0 quando H0 é falsa. A probabilidade de cometer esse erro é 
representada por ββββ. 
 
 
ββββ = P(erro do tipo II) = P(não rejeitar H0 / H0 é falsa) 
 
IMPORTANTE: 
1. α é um valor arbitrário e quanto menor, o resultado da amostra é mais significante para rejeitar H0. 
2. β é uma função que depende dos valores do parâmetro sob H1 e 1-β é denominado poder do teste. 
 
Poder do Teste( 1 −−−− ββββ) ou Potência do Teste 
 
 
1 −−−− ββββ = 1 − P(não rejeitar H0 / H0 é falsa) 
= P(rejeitar H0 / H0 é falsa) 
 
 
 
Nossas decisões em um teste de hipóteses podem ser resumidas na seguinte tabela 
 
 
 
 População 
 
 Amostra 
Realidade (desconhecida) 
H0 é verdadeira H0 é falsa 
d 
e 
c 
i 
s 
ã 
o 
 
 
Rejeitar H0 
 
 
 
 
 
 
Não rejeitar H0 
 
 
Erro do tipo I 
 
 
 
Decisão correta 
Decisão correta Erro do tipo II 
 
 
 
o PROBLEMA: Ao minimizar α, aumentamos β e vice-versa. 
o SOLUÇÃO: Fixar α bem pequeno e diminuir β aumentando o tamanho da amostra. 
 
 
o IMPORTANTE: 
 
1. Fixamos o α porque nos preocupamos mais com a possibilidade de rejeitar uma 
hipótese sendo ela verdadeira. 
 
2. Rejeitar H0 em favor de H1 significa que podemos afirmar que H1 é verdadeira pois 
conhecemos o risco de errar (α). 
 
3. Aceitar H0 não significa que H0 seja a hipótese verdadeira, mas que os dados não nos 
mostram evidências suficientes para rejeitá-la. Não temos muito controle do risco de 
tomarmos a decisão errada pois não conhecemos β. 
 
4. Devemos sempre estabelecer como hipótese nula aquela que pretendemos rejeitar. 
 
5. Para manter a uniformidade o resultado final deve ser enunciado em termos de H0. 
 
6. Os testes de hipóteses também são baseados nas distribuições amostrais dos 
estimadores. 
 
 
OUTRAS DEFINIÇÕES IMPORTANTES 
 
o Estatística do teste: É a estatística utilizada para testar H0. É baseada nos dados amostrais e 
construída sob H0. 
 
o Região crítica do teste (RC): É formada pelo conjunto de valores que levam à rejeição de H0. Ela 
depende do tipo de hipótese alternativa, do nível de significância (α) adotado, e da distribuição de 
probabilidade da estatística do teste. 
 
o Região de aceitação do teste (RA): É formada pelo conjunto de valores que levam à aceitação de H0. 
 
 
ETAPAS NA ELABORAÇÃO DE UM TESTE DE HIPÓTESES 
 
 
1- Definir as hipóteses nula(H0) e alternativa(H1); 
2- Fixar o nível de significância (α); 
3- Determinar a estatística do teste ; 
4- Determinar a região crítica do teste; 
5- Calcular o valor da estatística do teste, sob H0 e baseada nos dados amostrais; 
6- Se o valor calculado da estatística ∈ a RC, rejeitamos H0, caso contrário, não rejeitamos H0; 
7- Conclusão do teste. 
 
 
TESTE DE HIPÓTESES PARA MÉDIA POPULACIONAL 
 
 
Caso 1: 2σ conhecida 
 
 
1. Definição das hipóteses: 
 
 
H0: µ = µ0 
H1: µ ≠ µ0 
 
 
2. Fixar o nível de significância α 
 
 
3. Definir a estatística do teste 
 
 
Z = nσ
µX −
 ~ N(0,1) 
 
 
4. Definir a região crítica do teste (RC) 
 ou 
H0: µ ≥ µ0 
H1: µ < µ0 
 
 ou H0: µ ≤ µ0 
H1: µ > µ0 
 
a) H0: µ = µ0 
 H1: µ ≠ µ0 
 
b) H0: µ ≥ µ0 
 H1: µ < µ0 
 
 
 
c) H0: µ ≤ µ0 
 H1: µ > µ0 
 
 
5. Com base nos valores observados da amostra, calcular o valor da Estatística do Teste Z 
 
Zc = 
nσ
µX 0− 
 
 
6. Se Zc ∈ RC ⇒ rejeitar H0 (conseqüentemente aceitar H1). 
 Se Zc ∉ RC ⇒ Não rejeitar H0 (conseq. não aceitar H1) 
 
 
7. Concluir sobre a decisão tomada no passo 6. 
Exemplo 
 
1) Os Brasileiros que deram entrada na declaração do imposto de renda de 2010 antes de 31 de 
março de 2011 têm uma restituição média de R$ 1.056,00. Considere a população de 
entregadores de “última hora” que despacharam suas declarações durante os últimos cinco dias 
do período de entrega do imposto de renda (26 até 30 de abril). Sabe-se que o desvio padrão é 
de R$ 800,00. Um pesquisador sugere que uma das razões para que os indivíduos esperem até 
os últimos dias para entregar suas declarações é que em média eles têm uma restituição mais 
baixa do que os primeiros entregadores. Para uma amostra de 100 indivíduos que entregaram a 
declaração nos últimos 5 dias, a restituição média da amostra foi de R$ 950,00. Qual é a sua 
conclusão? Considere um nível de significância de 5%. 
 
 
 
 
 
 
 
 
 
2) Uma fábrica de automóveis anuncia que seus carros consomem em média 9,4 km/l, com desvio 
padrão de 0,79 litros. Uma revista com base em resultados preliminares desconfia da 
afirmação acima do fabricante e resolve testar tal hipótese analisando 32 automóveis dessa 
marca, obtendo 9 km/l como consumo médio. O que a revista pode concluir sobre o anúncio da 
fábrica ao nível de significância de 5%? 
 
 
 
 
 
 
3) Uma amostra aleatória de 49 doentes revelou uma taxa média de 47 mg/l de uma substância 
tóxica na urina. Se a população é suposta normal, com desvio padrão de 16 mg/l, verifique se 
podemos aceitar que a taxa média da substância tóxica na urina é de 43 mg/l, aos níveis de 
significância de: a) 5% ; b) 10%. 
 
 
 
 
 
 
 
 
 
 
 
 
Caso 2: 2σ desconhecida 
 
 
1. Definição das hipóteses: 
 
 
H0: µ = µ0 
H1: µ ≠ µ0 
 
 
 
2. Fixar o nível de significância α 
 
 
 
3. Definir a estatística do teste 
 
 
 
T = 
nS
µX − ~ t(n-1) 
 
(distr. t-Student com n-1 graus de liberdade) 
 
 
 
 
 
4. Definir a região crítica do teste (RC) 
 
 
 
 
ou 
H0: µ ≥ µ0 
H1: µ < µ0 
 
ou 
H0: µ ≤ µ0 
H1: µ > µ0 
 
a)H0: µ = µ0 
 H1: µ ≠ µ0 
b) H0: µ ≥ µ0 
 H1: µ < µ0c) H0: µ ≤ µ0 
 H1: µ > µ0 
 
5. Com base nos valores observados da amostra, calcular o valor da Estatística do Teste T 
 
Tc = 
nS
µX 0− 
 
 
6. Se Tc ∈ RC ⇒ rejeitar H0 (conseqüentemente aceitar H1). 
 Se Tc ∉ RC ⇒ Não rejeitar H0 (conseq. não aceitar H1) 
 
 
7. Concluir sobre a decisão tomada no passo 6. 
 
 
 
Observação: 
 
 
o Quando n > 30, podemos ter dificuldades de achar o valor tabelado na 
tabela t-student que define os limites entre a região crítica e a região de 
aceitação do teste. Nesses casos, alguns autores sugerem definir a região 
crítica através da distribuição Normal padrão. 
 
o No entanto, em nossa disciplina iremos sempre usar o valor tabelado 
obtido da tabela t-student. 
 
o Justificativa: Os softwares computacionais (Excel, por exemplo) 
calculam os valores da distribuição t-student. 
 
 
 
Exemplo 
 
1) Um fabricante afirma que seus cigarros contêm não mais que 30 mg de nicotina. Uma amostra 
de 31 cigarros fornecem média de 31,5mg e desvio padrão de 3mg. Ao nível de significância de 
5%, os dados refutam ou não a afirmação do fabricante? 
 
 
 
 
2) Uma empresa paga atualmente aos seus operários um salário médio de R$ 15,00 a hora. A 
empresa está planejando construir uma nova fábrica e está considerando diversos locais. A 
disponibilidade de mão de obra a uma taxa menor que R$ 15,00 a hora é um grande fator na 
decisão do local. Uma amostra de 40 trabalhadores forneceu um salário horário médio atual de 
R$ 14,00 e um desvio padrão de R$ 2,40. Com um nível de confiança de 0,99, os dados da 
amostra indicam que o local tem uma taxa de salário médio significativamente abaixo da taxa 
de R$ 15,00 por hora? 
 
 
 
 
 
3) Foi admitido que o preço médio de livros em Química industrial e Ciências Atuariais é de R$ 
18,00. Descobriu-se que o preço médio de uma amostra aleatória de 16 livros, adquiridos em um 
ano, é de R$ 21,60, com um desvio padrão de R$ 2,70. Baseado nos dados amostrais e, 
admitindo distribuição normal para a população, podemos aceitar a afirmação admitida? Use um 
nível de significância de 5%. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
TESTE DE HIPÓTESES PARA PROPORÇÃO POPULACIONAL 
 
 
 
1. Definição das hipóteses: 
 
 
H0: p = p0 
H1: p ≠ p0 
 
 
2. Fixar o nível de significância α 
 
 
 
3. Definir a estatística do teste 
 
 
 
Z = 
n
p)-p(1
ppˆ − ~ N(0,1) 
 
 
4. Definir a região crítica do teste (RC) 
 
 
 
ou 
H0: p ≥ p0 
H1: p < p0 
 
ou 
H0: p ≤ p0 
H1: p > p0 
 
a) H0: p = p0 
 H1: p ≠ p0 
 
 
 
b) H0: p ≥ p0 
 H1: p < p0 
 
 
 
b) H0: p ≤ p0 
 H1: p > p0 
 
 
5. Com base nos valores observados da amostra, calcular o valor da Estatística do Teste Z 
 
 
Zc = 
n
p )1(p
ppˆ
00
0
−
− 
 
 
6. Se Zc ∈ RC ⇒ rejeitar H0 (conseqüentemente aceitar H1). 
 Se Zc ∉ RC ⇒ Não rejeitar H0 (conseq. não aceitar H1) 
 
 
7. Concluir sobre a decisão tomada no passo 6. 
 
Exemplo 
 
1) Uma estação de televisão afirma que 60% dos televisores estavam ligados no seu programa especial 
da última segunda-feira. Uma rede competidora deseja contestar essa afirmação, e decide, para 
isso, usar uma amostra aleatória de 200 famílias, das quais 104 responderam afirmativamente. Qual 
deve ser o procedimento adotado para julgar a afirmação da estação? Utilize um nível de 
significância de 5%. 
 
 
 
 
 
 
 
 
 
 
 
 
 
2) Até o ano passado, apenas 40% dos estudantes de uma certa cantina universitária aprovaram a 
qualidade das refeições servidas no seu refeitório. Após uma série de medidas corretivas, 40 
estudantes foram escolhidos ao acaso, entrevistados, e o número daqueles que aprovaram a 
qualidade das refeições foram usados para verificar se as medidas corretivas surtiram efeito. O 
número dos que ficaram satisfeitos foi 22. Realize o teste de hipóteses apropriado usando o nível 
de significância de 5%. Podemos afirmar que as medidas corretivas surtiram efeito? E se 
adotarmos um nível de confiança de 99%?