Teste de hipotese

•

UEA

1

0

1

0

ALESSANDRA VIEIRA DACIO

24/09/2019

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Probabilidade e Estatística

29.727 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1
DISCIPLINA: PROBABILIDADE E ESTATÍSTICA
PROFª ROSEANI PARENTE 2019/1
1. INTRODUÇÃO
Na teoria de estimação, vimos que é possível, por meio de estatísticas amostrais adequadas, estimar parâmetros
de uma população, dentro de certo intervalo de confiança.
Nos testes de hipóteses, em vez de se construir um intervalo de confiança no qual se espera que o parâmetro da
população esteja contido, testa-se a validade de uma afirmação sobre um parâmetro da população.
Então, em um teste de hipótese, procura-se tomar decisões a respeito de uma população com base em
informações obtidas de amostras desta mesma população.
A essa afirmação denominamos de Hipótese e o procedimento de tomada de decisão sobre a hipótese de Teste de
Hipótese ou Teste de Significância.
2. HIPÓTESES ESTATÍSTICAS
O contexto em que se baseia a teoria de teste de hipótese é basicamente o mesmo da teoria de estimação por
intervalo de confiança. Temos uma população representada por uma variável aleatória X cuja distribuição de
probabilidade depende de algum parâmetro θ. O interesse agora está em testar a veracidade de alguma afirmativa
sobre θ.
Uma Hipótese Estatística é uma afirmação sobre os parâmetros de uma ou mais populações.
Para se ter certeza absoluta se uma hipótese estatística é verdadeira ou falsa seria necessário que fosse examinada
toda a população, o que é impraticável na maioria das situações. Em vez disso, retiramos uma amostra aleatória da
população de interesse e usamos os dados contidos nela para fornecer evidência que apoie ou refute a hipótese.
São exemplos de hipóteses estatísticas:
a) A altura média da população brasileira é de 1,65 m, isto é: H: µ = 1,65 m;
b) A variância populacional dos salários é de $ 500, isto é, H: σ2 = 500;
c) A proporção de manauaras fumantes é de 25%, ou seja, H: p = 0,25;
2.1 HIPÓTESES NULA E ALTERNATIVA
Formulamos um par de afirmações (hipóteses) competitivas, mutuamente exclusivas e coletivamente
exaustivas sobre o valor do parâmetro θ.
Designa-se por hipótese nula (Ho) a hipótese estatística a ser testada. É a alegação que se conhece como
verdadeira acerca do valor de um parâmetro populacional (recomenda-se que sempre contenha a condição de
igualdade). Ao testarmos uma hipótese nula, chegamos a uma conclusão: rejeitá-la ou não rejeitá-la.
A hipótese alternativa (H1) é a afirmação que deve ser verdadeira se a hipótese nula é falsa.
É a hipótese do pesquisador e é, em geral, formulada em termos de uma desigualdade (≠, < ou >).
Nesse texto consideraremos apenas hipóteses nulas simples, isto é, hipóteses que estabelecem que o
parâmetro de interesse é igual a um determinado valor.
2.2 TIPOS DE ERROS
Para entendermos os erros associados a um teste de hipóteses, precisa ficar claro que estamos avaliando
uma afirmação (hipótese) sobre a população. Enfatizamos que a verdade ou a falsidade de uma hipótese particular
pode nunca ser conhecida com certeza, a menos que possamos examinar a população inteira. Isso é geralmente
impossível em muitas situações práticas.
Num teste de hipóteses podemos cometer dois tipos de erro: pode-se rejeitar uma hipótese nula quando ela
é de fato verdadeira ou não rejeitar uma hipótese nula quando ela é, de fato, falsa. A decisão é sempre tomada em
referência à hipótese nula.
O quadro abaixo resume os possíveis erros e acertos de um teste:
DECISÃO BASEADA NO
TESTE
SITUAÇÃO REAL (DESCONHECIDA)
H0 é verdadeira H1 é verdadeira
Rejeite H0 Decisão incorreta(Erro Tipo I) Decisão correta
Não Rejeite H0 Decisão correta Decisão incorreta(Erro Tipo II)
A rejeição de uma hipótese nula verdadeira é chamada "Erro Tipo I" e a aceitação de uma hipótese nula falsa
constitui um "Erro Tipo II". As probabilidades desses dois tipos de erros são designadas, respectivamente, por α e β.
2
A probabilidade  do erro do tipo I é denominada Nível de Significância do teste.
Observe que o erro tipo I só poderá acontecer se for rejeitada Ho e o erro tipo II quando não for rejeitada Ho.
Os riscos de α e β só podem ser simultaneamente reduzidos pelo aumento do tamanho da amostra
(coletando-se mais evidências), o que nem sempre é possível ou possui custo benefício positivo.
A escolha do nível de significância (α) do teste deve preceder a realização do mesmo.
2.3 ESTATÍSTICA DE TESTE
É uma estatística amostral ou um valor baseado nos dados amostrais. Mede a distância entre o que foi
observado na amostra e o que é esperado caso a hipótese nula seja verdadeira. Utiliza-se uma estatística de teste
para tomar uma decisão sobre a rejeição da hipótese nula.
2.4 REGIÃO CRÍTICA (REGIÃO DE REJEIÇÃO)
É formada pelo conjunto de todos os valores da estatística de teste que levam à rejeição da hipótese nula.
2.5 VALOR CRÍTICO
É o valor, ou valores, que separa(m) a região crítica dos valores da estatística de teste que não levam à
rejeição da hipótese nula.
Exemplo 1: Uma máquina automática de encher pacotes de café enche-os segundo uma distribuição normal , com
média µ e variância igual a 400 g2. A máquina foi regulada para encher os pacotes com uma média de µ = 500g.
Periodicamente é colhida uma amostra de 16 pacotes para se verificar se a produção esta sob controle. Se uma dessas
amostras apresentasse uma média de 492g ( g) você pararia ou não a produção sob a suspeita da máquina
estar desregulada? Considere um nível de significância de 1%.
Solução: X: peso dos pacotes de café de 500g ~ N(µ ; 400)
Hipóteses: Hipótese nula H0: µ = 500 g
Hipótese alternativa H1: µ ≠ 500 g
Uma amostra de 16 pacotes: g. Lembrando que ~ N .
Nível de significância: α = 0,01.
Nível de confiança: (1 - α) = 0,99.
3. TESTE DE SIGNIFICÂNCIA PARA UMA MÉDIA POPULACIONAL
O teste para a média populacional é aplicável quando queremos verificar se uma variável na população pode ser
considerada, em média, igual a certo valor µ0.
As hipóteses possíveis são:
H0: µ = µ0 versus H1: µ µ0 (teste bilateral)
H1: µ > µ0 (teste unilateral à direita)
H1: µ < µ0 (teste unilateral à esquerda)
a) No caso bilateral (H1: µ µ0 ) as regiões de rejeição (crítica) e de aceitação serão definidas de acordo com
o α (nível de significância) desejado:
O valor tabelado da distribuição normal, nesse caso, |Zα/2|, é definido como valor crítico que delimitada a
entrada na região de rejeição da hipótese nula.
3
b) No caso do teste unilateral à direita (H1: µ > µ0), as regiões de rejeição (crítica) e de aceitação são
definidas em função do nível de significância conforme figura abaixo:
O valor tabelado da distribuição normal, nesse caso, Zα, é definido como valor crítico que delimitada a
entrada na região de rejeição da hipótese nula.
c) E, finalmente, no caso do teste unilateral à esquerda (H1: µ < µ0), as regiões de rejeição (crítica) e de
aceitação são definidas em função do nível de significância conforme figura abaixo:
O valor tabelado da distribuição normal, nesse caso, - Zα, é definido como valor crítico que delimitada a
entrada na região de rejeição da hipótese nula.
Consideraremos duas situações:
a) Quando existe alguma informação sobre a variância populacional (σ2); e
b) Quando não há essa informação (σ2 desconhecida).
3.1 TESTE DE UMA AFIRMAÇÃO SOBRE UMA MÉDIA (2 CONHECIDA)
De acordo com o Teorema Central do Limite, se obtemos amostras grandes (n > 30) de qualquer população
com qualquer distribuição, a distribuição das médias amostrais pode ser aproximada por uma distribuição
normal com média µ e variância . A estatística de teste neste caso é definida por:
, onde:
µ0 = o valor da média sob a hipótese nula.
n = o tamanho da amostra.
= a média amostral;
σ = o desvio padrão populacional.
Regra de Rejeição da Hipótese Nula: Se o valor da estatística do teste ZCALC cair na região de rejeição (Região
Crítica) definida pelo valor crítico tabelado da distribuição normal, rejeita-se Ho.
Ao rejeitar a hipótese nula (Ho) existe uma forte evidência de sua falsidade.Ao contrário, quando não
rejeitamos Ho, dizemos que não houve evidência amostral significativa no sentido de permitir a sua rejeição.
Se a variância da população for desconhecida e a amostra for grande (n > 30), mesmo com a substituição de
σ por S (desvio padrão amostral), ainda será possível usar a aproximação pela distribuição normal.
4
Exemplo 2: O tempo para transmitir 10MB em determinada rede de computadores varia segundo um modelo
normal, com média de 7,4 segundos e variância de 1,3 segundos2. Depois de algumas mudanças na rede,
acredita-se numa redução no tempo de transmissão de dados. Foram realizados 10 ensaios independentes
com um arquivo de 10MB e foram anotados os tempos de transmissão, em segundos: 6,8 7,1 5,9 7,5 6,3
6,9 7,2 7,6 6,6 e 6,3.
Existe evidência suficiente de que o tempo médio de transmissão foi reduzido? Considere um nível de
significância de 1%,
Solução: X = tempo de transmissão de pacotes de 10MB
µ = 7,4 segundos e σ2 = 1,3 segundos2 X ~ N (7,4 ; 1,3)
N = 10 e segundos. Lembrando que ~ N
As hipóteses são: H0: µ = 7,4 segundos
H1: µ < 7,4 segundos
A estatística de teste:
O valor tabelado da distribuição Normal padrão considerando um nível de significância de 1% é igual a: -2,33.
Logo, como o valor calculado é maior que o valor crítico não se rejeita a hipótese nula. Logo, não há
evidências amostrais suficientes para se afirmar que o tempo médio de transmissão foi reduzido.
3.2 TESTE DE UMA AFIRMAÇÃO SOBRE UMA MÉDIA (2 DESCONHECIDA)
Se a população tem distribuição normal o desvio padrão da população é desconhecido e a amostra é,
estatisticamente pequena (n ≤ 30), a estatística de teste segue a distribuição t de Student com (n - 1) graus de
liberdade.
A estatística de teste fica então definida por: , onde:
µ0 = o valor da média sob a hipótese nula.
n = o tamanho da amostra.
= a média amostral;
S = o desvio padrão amostral.
Regra de Rejeição da Hipótese Nula: Se o valor da estatística do teste tCALC cair na região de rejeição (Região
Crítica), definida pelo valor crítico tabelado da distribuição t de Student, rejeita-se Ho.
Ao rejeitar a hipótese nula (Ho) existe uma forte evidência de sua falsidade.
Ao contrário, quando não rejeitamos Ho, dizemos que não houve evidência amostral significativa no sentido
de permitir a sua rejeição.
4. TESTE DE SIGNIFICÂNCIA PARA UMA PROPORÇÃO POPULACIONAL
As proporções são frequentemente usadas em situações de controle de qualidade porque a coleta de dados de
proporção é simples.
Para conduzir um teste de hipótese, precisamos saber qual é o parâmetro a ser testado, qual é a estatística
amostral usada para estimar o parâmetro e qual é a distribuição amostral dessa estatística.
Já vimos que uma proporção amostral estima a proporção populacional p.
Pelo teorema Central do Limite, conforme o tamanho da amostra aumenta, a distribuição da proporção amostral
se aproxima de uma distribuição normal com média p e desvio padrão .
As hipóteses possíveis são:
H0: p = p0 versus H1: p p0 (teste bilateral)
H1: p > p0 (teste unilateral à direita)
H1: p < p0 (teste unilateral à esquerda)
5
A estatística de teste neste caso é definida por:
onde:
p0 = o valor da proporção sob a hipótese nula.
n = o tamanho da amostra.
= a proporção amostral;
a) Regra de Rejeição da Hipótese Nula: Se o valor da estatística do teste ZCALC cair na região de rejeição (Região
Crítica) definida pelo valor crítico tabelado da distribuição normal, rejeita-se Ho.
Ao rejeitar a hipótese nula (Ho) existe uma forte evidência de sua falsidade. Ao contrário, quando não
rejeitamos Ho, dizemos que não houve evidência amostral significativa no sentido de permitir a sua rejeição.
O valor de p0 (proporção na população) a ser testado é um valor de referência, tal como o desempenho no
passado ou uma especificação do produto.
EXERCÍCIOS
1. A associação dos proprietários de indústrias metalúrgicas está muito preocupada com o tempo perdido com
acidentes de trabalho, cuja média, nos últimos tempos, tem sido da ordem de 60 horas/homem por ano e desvio
padrão de 20 horas/homem. Assuma uma distribuição normal para os tempos perdidos com acidentes nessas
indústrias. Tentou-se um programa de prevenção de acidentes, após o qual foi tomada uma amostra aleatória de
nove indústrias e medido o número médio de horas/homens perdidos por acidentes, que foi de 50 horas. Você
diria no nível de significância de 5% que há evidência de melhoria?
2. O tempo médio, por operário, para executar uma tarefa, tem sido 100 minutos, com um desvio-padrão de 15
minutos. Introduziu-se uma modificação para diminuir esse tempo, e, após certo período, sorteou-se uma amostra
de 16 operários, medindo-se o tempo de execução de cada um. O tempo médio da amostra foi de 85 minutos, e o
desvio-padrão foi 12 minutos. Esses resultados trazem evidências estatísticas da melhoria desejada? Considere um
nível de significância de 5%.
3. Uma empresa produz saquinhos de salgadinhos com peso médio de 500g. Para verificar se a máquina de
empacotar está trabalhando corretamente o controle de qualidade tomou uma amostra aleatória de 50 saquinhos,
que apresentou uma média de 475g e desvio padrão de 30g. Os dados obtidos proporcionam evidências
suficientes para concluir que a máquina de empacotar não está trabalhando adequadamente (ou seja, a máquina
empacota com pesos diferentes do proposto)? Realize o teste com nível de significância de 1%.
4. A duração das lâmpadas produzidas por certo fabricante tem distribuição normal com média igual a 1200 horas e
desvio padrão igual a 300 horas. O fabricante introduz um novo processo na produção das lâmpadas. Para verificar
se o novo processo produz lâmpadas de maior duração, o fabricante observa uma amostra aleatória de 100
lâmpadas produzidas pelo novo processo e constata que as mesmas duram em média 1265 horas. Admitindo-se
um nível de significância de 5%, pode-se concluir que o novo processo produz lâmpadas com maior duração?
5. O controle de qualidade das peças produzidas por certa fábrica exige que o diâmetro médio das mesmas seja 57
mm. Para verificar se o processo de produção está sob controle, observam-se os diâmetros de uma amostra
aleatória de 10 peças, constatando-se os seguintes valores em mm: 56,5; 56,6; 57,3; 56,9; 57,1; 56,7; 57,1; 56,8;
57,1; 57,0. Admitindo-se um nível de significância de 5%, pode-se concluir que o processo de produção está sob
controle?
6. O tempo de montagem de determinados conectores utiliza um processo já há algum tempo, que dura em média
3,5 segundos. Está sendo analisada a possibilidade de troca deste processo para outro que se afirma possuir um
tempo de montagem menor. Para esta análise foram observados numa amostra aleatória os tempos de montagem
de conectores por um operário padrão utilizando o novo processo e foram anotados os seguintes valores (em
segundos):
2,5 2,5 2,6 3,0 3,2 3,5 3,7 3,7 2,1 2,4
6
2,7 2,8 3,1 3,1 3,6 3,6 2,5 2,9 2,8 3,8
Considerando a situação exposta acima e utilizando um nível de confiança de 95%:
a) Estime o tempo médio de montagem dos conectores utilizando o novo processo.
b) Calcule o tamanho mínimo da amostra que seria necessária para estimar a média com 95% de confiança e erro
de 0,1 segundos.
c) A empresa deve mudar para o novo processo ou manter o atual?
7. O tempo médio de atendimento em uma agência lotérica está sendo analisado por técnicos. Uma amostra
aleatória de 40 clientes foi sistematicamente monitorada em relação ao tempo que levavam para serem
atendidos, obtendo-se as seguintes estatísticas: tempo médio de atendimento de 195 segundos e desvio padrão
de 15 segundos. Considerando que o tempo de utilização segue uma distribuição normal:
a) Faça uma estimação por intervalo para o tempo médio de utilização para toda a população de clientes da
agência lotérica, utilizando um nível de confiança de 95%.
b) A amostra utilizada seria suficiente se fosse exigidauma precisão de 1 minuto?
c) O dono da agência garante que o tempo médio de atendimento é de 3 minutos (se for maior ele se
compromete a contratar mais um atendente). Com base nos dados da amostra a afirmação do dono é
verdadeira ou ele deve contratar um novo atendente? Use um nível de significância de 1%?
8. Buscando melhorar a qualidade do serviço, uma empresa estuda o tempo de atraso na entrega dos pedidos
recebidos. Supondo que o tempo de atraso se encontra normalmente distribuído, e conhecendo o tempo de
atraso de uma amostra aleatória dos últimos 20 pedidos, descritos abaixo (em dias), determine:
5 1 0 3 6 10 2 3 4 1
5 3 1 6 6 9 0 0 1 0
a) Estime por intervalo o atraso médio na entrega dos pedidos com confiança de 90%.
b) Para a situação do item a (variância populacional desconhecida), o tamanho da amostra é suficiente, se é
necessária uma precisão de 0,5 dias, para o mesmo nível de confiança?
c) Um cliente enfurecido quer testar estatisticamente a hipótese (declarada pela empresa) de que o atraso médio
será de no máximo 1 dia. Ele argumenta que deve ser maior e quer uma confiança de 99%. O cliente tem razão
na sua reclamação?
9. O nível de aprovação da qualidade das refeições servidas em um restaurante universitário era de 20%, quando
houve uma movimentação geral dos estudantes que forçou a direção do restaurante a fazer mudanças. Feitas as
mudanças, sorteia-se uma amostra de 64 estudantes usuários do restaurante e 25 aprovam a qualidade da
comida. Você diria, ao nível de significância de 5%, que as mudanças surtiram efeito?
10. Uma máquina produz peças classificadas como boas ou defeituosas. Retirou-se uma amostra aleatória de 1000
peças da produção, verificando-se que 35 eram defeituosas. O controle de qualidade faz a parada da linha de
produção para rearranjo dos equipamentos envolvidos quando o percentual de defeituosos é superior a 3%.
a) Determinar um intervalo de 95% de confiança para a proporção de peças defeituosas.
b) Se há interesse em obter um intervalo de 95% de confiança, com precisão de 1,5%, para a proporção de peças
defeituosas, a amostra retirada é suficiente?
c) Baseado nos dados amostrais a linha de produção deve ser parada?
11. A satisfação da população em relação a determinado governo foi pesquisada através de uma amostra aleatória
com a opinião de 1000 habitantes do estado. Destes, 585 se declararam insatisfeitas com a administração
estadual. Admitindo-se um nível de significância de 5%, solucione os itens abaixo.
a) Estime o percentual da população que está insatisfeita com a administração estadual.
b) Qual o tamanho da amostra necessária para a estimação se a empresa responsável pela pesquisa estipulou
uma folga máxima de 2,5%?
c) A atual administração decidiu que se o percentual de descontentamento fosse superior a 50% deveria ser
redirecionado o plano governamental. Utilizando a informação amostral o que você concluiria?
7
12. Em uma pesquisa de mercado, acerca da preferência pelo produto X, 300 consumidores foram entrevistados,
sendo que 100 declararam consumir o produto.
a) O fabricante quer que você determine um intervalo de 95% de confiança para a proporção populacional de
pessoas que consomem o produto.
b) Um dos diretores do fabricante exige que o intervalo de confiança para a proporção populacional tenha 99% de
confiança, com um erro máximo de 2,5%. A amostra retirada satisfaz estes critérios?
c) No passado, o produto X era a marca líder de mercado, com cerca de 40% da preferência do consumidor. Com
base nos dados, e usando uma significância de 1%, a marca ainda tem a liderança?
RESPOSTAS:
1) Zcalc = -1,50 Conclusão: Não rejeitar H0;
2) Zcalc = -4,00 Conclusão: Rejeitar H0;
3) Zcalc = -5,90 Conclusão: Rejeitar H0;
4) Zcalc = 2,17 Conclusão: Rejeitar H0;
5) tcalc = -1,13 Conclusão: Não Rejeitar H0;
6) a) IC = [2,77 ; 3,25]; b) n = 114; c) tcalc = -4,45 Conclusão: Rejeitar H0
7) a) IC = [190,35 ; 199,65]; b) Sim; c) Zcalc = 6,33 Conclusão: Rejeitar H0
8) a) IC = [2,136 ; 4,464]; b) n = 109 Não; c) tcalc = 3,418 Conclusão: Rejeitar H0
9) Zcalc = 4,34 Conclusão: Rejeitar H0;
10) a) IC = [0,024 ; 0,046]; b) n = 577 Sim; c) zcalc = 1 Conclusão: Não Rejeitar H0
11) a) 0,585; b) n = 1493 c) Zcalc = 5,313 Conclusão: Rejeitar H0;
12) a) IC = [0,280 ; 0,386]; b) n = 968 Não; c) zcalc = -2,393 Conclusão: Rejeitar H0