Buscar

TEste de hipotese

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

*
Teste de hipóteses
7
Estatística Aplicada
Larson Farber
*
Seção 7.1
Introdução ao teste de hipóteses
*
Uma hipótese estatística é uma alegação
 sobre uma população.
A hipótese alternativa Ha contém uma afirmativa de desigualdade, tal como < , ¹ ou >.
A hipótese nula H0 
contém uma alternativa de igualdade, tal como ³ , = ou £.
Se eu sou verdadeiro, 
você é falso.
Se eu sou falso, 
você é verdadeiro.
*
 Uma revista de consumidores alega que a proporção das chamadas telefônicas via celular feitas durante as tardes e os fins de semana é de no máximo 60%.
Estabeleça uma alegação sobre a população. Em seguida, estabeleça seu complemento. Cada hipótese, tanto a nula quanto a alternativa, pode representar a alegação.
Um hospital alega que o tempo de resposta de sua ambulância é inferior a dez minutos.
Estabelecendo hipóteses
(alegação)
(alegação)
H0
Ha
H0
Ha
0,60
0,60
min
min
*
Antes de mais nada, admita que a condição de igualdade na hipótese nula é verdadeira. Não importa se a alegação está representada pela hipótese nula ou pela alternativa. 
Estratégia para o
 teste de hipóteses
Colha os dados de uma amostra aleatória, retirada da população, e calcule as estatísticas amostrais cabíveis.
Se a estatística amostral tiver baixa probabilidade de ser extraída de uma população na qual a hipótese nula seja verdadeira, você rejeitará H0. (Em conseqüência, você aceitará a hipótese alternativa.) 
Se a probabilidade não for baixa o bastante, você não poderá rejeitar H0.
*
Erro do tipo I: A hipótese nula é realmente verdadeira, mas optou-se por rejeitá-la.
Nível de significância, 
Probabilidade máxima de se cometer um erro do tipo I.
 Verdade real de H0
Erros e nível de significância
H0 verdadeira
H0 falsa
Não rejeitar H0
Rejeitar H0
Erro do tipo II
Erro do tipo I
Decisão
*
Teste monocaudal direito
Teste bicaudal
Teste monocaudal esquerdo
Tipos de teste de hipóteses
Ha é mais provável.
Ha é mais provável.
Ha é mais provável.
Ha
Ha
valor
valor
valor
Ha
*
O valor P é a probabilidade de se obter uma estatística amostral com um valor tão ou mais extremo que o determinado pelos dados da amostra. 
Se z é negativo, P é o dobro da área da cauda esquerda.
Se z é positivo, P é o dobro da área da cauda direita.
Valores P
Valor P = área indicada
z
z
z
z
Área na cauda esquerda.
Área na cauda direita.
Em um teste monocaudal esquerdo.
Em um teste monocaudal direito.
Em um teste bicaudal.
*
Determinando valores P: 
teste monocaudal
A estatística teste para um teste monocaudal direito é z = 1,56. Determine o valor P.
A área à direita de z = 1,56 é 1 – 0,9406 = 0,0594.
Logo, o valor P é 0,0594.
z = 1,56
Área na cauda direita.
*
Determinando valores P: 
teste bicaudal
A estatística teste para um teste bicaudal é z = –2,63. Determine o correspondente valor P.
A área à esquerda de z = –2,63 é 0,0043.
O valor P é 2(0,0043) = 0,0086.
z = –2,63
*
Decisões baseadas no valor P
Após comparar o valor P ao valor de , o nível de significância do teste, podemos decidir se há evidência suficiente para rejeitar a hipótese nula.
 Se , não rejeite a hipótese nula.
 Se , rejeite a hipótese nula.
P
P
*
O valor P de um teste de hipóteses é 0,0749. Tome sua decisão a um nível de significância de 0,05.
Compare o valor P a . Como 0,0749 > 0,05, não rejeite H0.
Se P = 0,0246, qual será sua decisão se:
1) Como , rejeite H0.
2) Como 0,0246 > 0,01, não rejeite H0.
Usando os valores P
0,05
0,01
0,05,
0,0246
*
Há evidência suficiente para rejeitar a alegação.
 Alegação
Interpretando a decisão
A alegação é H0 
A alegação é Ha
Rejeite H0
Não rejeite H0
Decisão
Não há evidência suficiente para rejeitar a alegação.
Há evidência suficiente para aceitar a alegação.
Não há evidência suficiente para aceitar a alegação.
*
1. Estabeleça as hipóteses alternativa e nula.
2. Estabeleça o nível de significância.
3. Identifique a distribuição amostral.
Escreva H0 e Ha como afirmativas matemáticas. Lembre que H0 sempre contém o símbolo =.
Ele representa a probabilidade máxima de se rejeitar a hipótese nula, caso ela seja a realmente verdadeira (ou seja, de se cometer um erro do tipo I).
A distribuição amostral é a distribuição da estatística teste, supondo-se que a condição de igualdade na H0 seja verdadeira e que o experimento foi repetido infinitas vezes. 
Etapas do teste de hipóteses
*
4. Determine a estatística teste e padronize-a.
Faça os cálculos para padronizar sua estatística amostral.
5. Calcule o valor P da estatística teste.
Ele representa a probabilidade de se obter a estatística teste (ou outro valor mais extremo) na distribuição amostral.
*
Se o valor P for menor que (o nível de significância), rejeite H0. 
Se o valor P for maior que , não rejeite H0.
6. Tome sua decisão.
7. Interprete sua decisão.
Se a alegação for a hipótese nula, você poderá rejeitá-la ou determinar que não há evidência suficiente para isso.
Se a alegação for a hipótese alternativa, você poderá aceitá-la ou determinar que não há evidência suficiente para isso.
*
Seção 7.2
Teste de hipóteses para determinar a média (n  30)
*
O teste z para 
determinar a média
O teste z é um teste estatístico capaz de determinar a média populacional. Ele pode ser usado:
 (1) se a população é normal e s é conhecido ou
 (2) quando o tamanho da amostra, n, é de pelo menos 30. 
A estatística teste é a média amostral e a estatística teste padronizada é z.
Quando n  30, use s no lugar de .
onde
*
Um fabricante de cereais alega que a média de sódio em cada porção de seu produto não passa de 230 mg. Você trabalha para um serviço nacional de saúde e precisa testar essa alegação. Em uma amostra aleatória de 52 porções, você encontrou uma média de 232 mg de sódio, com um desvio padrão de 10 mg. Sendo = 0,05, você tem evidência suficiente para rejeitar a alegação do fabricante?
1. Escreva as hipóteses nula e alternativa.
2. Estabeleça o nível de significância.
 = 0,05
3. Determine a distribuição amostral.
Como o tamanho da amostra é maior que 30, a distribuição amostral será normal.
O teste z para determinar
 a média (valor P)
Ha
H0
mg
mg
(alegação)
*
4. Determine a estatística teste e padronize-a.
5. Calcule o valor P para a estatística teste.
Como se trata de um teste monocaudal direito, o valor P será a área encontrada à direita de z = 1,44 na distribuição normal. A partir da tabela, temos que P = 1 – 0,9251
n = 52
s = 10
Estatística teste
z = 1,44
Área na cauda direita.
P = 0,0749.
1,387
1,44
1,387
*
6. Tome sua decisão.
7. Interprete sua decisão.
Compare o valor P a . 
Como 0,0749 > 0,05, não rejeite H0.
Não há evidência suficiente para rejeitar a alegação do fabricante de que a média de sódio em cada porção de cereal não passa de 230 mg.
*
Distribuição amostral de 
Um valor crítico separa as regiões de rejeição e de não-rejeição.
Regiões de rejeição
Região de rejeição
Valor crítico z0
z
z0
*
Um valor crítico z0 separa as regiões de rejeição e de não-rejeição. A área da região de rejeição é .
Determine –z0 e z0 para um teste bicaudal com = 0,01. 
z0 = –2,33
–z0 = –2,575 
e z0 = 2,575
z0 = 1,645
Valores críticos
z0
z0
Região de rejeição
Região de rejeição
z0
z0
Região de
rejeição
Região de rejeição
Determine z0 para um teste monocaudal direito com = 0,05.
*
1. Estabeleça as hipóteses nula e alternativa.
2. Estabeleça o nível de significância.
3. Identifique a distribuição amostral.
Escreva H0 e Ha como afirmativas matemáticas. Lembre-se de que H0 sempre contém o símbolo =.
Ele representa a probabilidade máxima de se rejeitar a hipótese nula, caso ela seja a realmente verdadeira (ou seja, de se cometer um erro do tipo I).
A distribuição amostral é a distribuição da estatística teste, supondo-se que a condição de igualdade na H0 é verdadeira e que o experimento foi repetido infinitas vezes. 
Usando o valor crítico para tomar decisões
*
6. Determine a estatística teste.
5. Determine a região
de rejeição.
4. Determine o valor crítico. 
O valor crítico separa as regiões de rejeição e de não-rejeição. A área da região crítica é igual ao nível de significância do teste.
Faça os cálculos para padronizar sua estatística amostral.
z0
Região de rejeição
*
7. Tome sua decisão.
8. Interprete sua decisão.
Se a estatística teste cair na região crítica, rejeite H0. Caso contrário, não rejeite H0. 
Se a alegação for a hipótese nula, você pode rejeitá-la ou determinar que não há evidência suficiente para isso.
Se a alegação for a hipótese alternativa, você pode aceitá-la ou determinar que não há evidência suficiente para isso.
*
Um fabricante de cereais alega que a média de sódio em cada porção de seu produto não passa de 230 mg. Você trabalha para um serviço nacional de saúde e precisa testar essa alegação. Em uma amostra aleatória de 52 porções, você encontrou uma média de 232 mg de sódio, com um desvio padrão de 10 mg. Sendo = 0,05, você tem evidência suficiente para rejeitar a alegação do fabricante?
2. Estabeleça o nível de significância.
= 0,05
3. Determine a distribuição amostral.
Como o tamanho da amostra é maior que 30, a distribuição amostral será normal.
Usando o teste z para determinar a média
1. Escreva as hipóteses nula e alternativa.
H0
mg
mg
(alegação)
Ha
*
n = 52 = 232 s = 10
7. Tome sua decisão.
6. Determine a estatística teste e padronize-a.
8. Interprete sua decisão.
5. Determine a região de rejeição.
Como Ha contém o símbolo >, trata-se de um teste monocaudal direito.
z = 1,44 não cai na região de rejeição, portanto não rejeite H0.
Não há evidência suficiente para rejeitar a alegação do fabricante de que a média de sódio em cada porção de cereal não passa de 230 mg.
1,645
4. Determine o valor crítico. 
z0
*
Usando o valor P de um teste
 para comparar áreas
z0
Região de rejeição 0,05
z0 = –1,645
z
Área à esquerda de z
0,1093
z = –1,23
Para tomar uma decisão com base no valor crítico, descubra se z está na região de rejeição.
Em caso positivo, rejeite H0 e, em caso negativo, não rejeite H0.
= 0,05
Para tomar uma decisão com base no valor P, compare as áreas.
 Se , rejeite H0. Se , não rejeite H0.
P = 0,1093
*
Seção 7.3
Teste de hipóteses para determinar a média (n < 30)
*
Determine o valor crítico t0 para um teste monocaudal esquerdo, dados = 0,01 e n = 18.
Determine os valores críticos –t0 e t0 para um teste bicaudal, dados 
g.l. = 18 – 1 = 17
 t0
t0 = –2,567 
g.l. = 11 – 1 = 10
–t0 = –2,228 e t0 = 2,228 
A distribuição amostral t
= 0,05 e n = 11.
Área na cauda esquerda
 t0
 t0
*
Uma universidade diz que o número médio de horas-aula por semana, nos cursos de período integral, é 11,0. Uma amostra aleatória do número de horas-aula por semana, nos cursos de período integral, está relacionada a seguir. Solicitam a você, que trabalha em uma organização estudantil, que teste essa alegação. Sendo = 0,01, você tem evidência suficiente para rejeitar a alegação da universidade?
11,8 8,6 12,6 7,9 6,4 10,4 13,6 9,1 
1. Estabeleça as hipóteses nula e alternativa.
2. Estabeleça o nível de significância.
= 0,01
3. Determine a distribuição amostral.
Como o tamanho da amostra é 8, a distribuição amostral é uma distribuição t com 8 – 1 = 7 g.l.
Testando em uma
 amostra pequena
Ha
H0
(alegação)
11,0
11,0
*
t = –1,08 não cai na região de rejeição, portanto não rejeite H0 a = 0,01
n = 8 = 10,050 s = 2,485
7. Tome sua decisão.
6. Determine a estatística teste e padronize-a.
8. Interprete sua decisão.
Não há evidência suficiente para rejeitar a alegação da universidade de que o curso tem uma média de 11 horas-aula semanais. 
5. Determine a região de rejeição.
Como Ha contém o símbolo ≠, trata-se de um teste bicaudal.
4. Determine os valores críticos. 
–3,499
3,499
t0
–t0
0,878
10,050 – 11,0
0,95
1,08
2,485
*
Teste t para determinar a média
Test of = 11.000 vs not = 11.000
Variable N Mean StDev SE Mean T P
Hours 8 0.050 2.485 0.879 –1.08 0.32
Insira os dados em C1, “Hours”. 
Escolha teste t no menu STAT. 
O Minitab registra a estatística t e o valor P.
Como o valor P é maior que o nível de significância (0,32 > 0,01), você não deve rejeitar a hipótese nula a um nível de significância de 0,01.
Solução no Minitab
*
Seção 7.4
Testes de hipóteses para determinar proporções
*
Teste para 
determinar proporções
p é a proporção populacional de sucessos. A estatística teste é .
Se e , a distribuição amostral de é normal.
A estatística teste padronizada é:
(a proporção de sucessos na amostra)
*
Teste para 
determinar proporções
Um porta-voz do setor de comunicações alega que mais de 40% dos norte-americanos têm celular próprio ou, pelo menos, têm alguém na família com celular. Em um levantamento aleatório de 1.036 norte-americanos, 456 disseram que eles ou alguém da família tinham um celular. Teste a alegação do porta-voz a = 0,05. O que você pode concluir?
1. Escreva as hipóteses nula e alternativa.
2. Estabeleça o nível de significância.
 = 0,05
H0
Ha
0,40
0,40
(alegação)
*
3. Determine a distribuição amostral.
7. Tome sua decisão.
6. Determine a estatística teste e padronize-a.
8. Interprete sua decisão.
z = 2,63 cai na região de rejeição, portanto rejeite H0.
Há evidência suficiente para aceitar a alegação de que mais de 40% dos norte-americanos têm celular próprio ou, pelo menos, têm alguém na família com celular.
1.036(0,40) > 5 e 1.036(0,60) > 5. A distribuição amostral é normal.
n = 1.036 x = 456
4. Determine o valor crítico. 
1,645
5. Determine a região de rejeição.
Região de
rejeição
1.036
0,44
0,44
0,40
0,04
0,01522
2,63
1.036
(0,40) (0,60)
*
Seção 7.5
Teste de hipóteses para determinar a variância e o desvio padrão
*
Determine um valor crítico c20 para um teste monocaudal esquerdo, sendo n = 17 e = 0,05.
s2 é a estatística teste para a variância populacional. Sua distribuição amostral é uma distribuição c2 com n – 1 g.l.
Determine os valores críticos c20 para um teste bicaudal, sendo n = 12 e = 0,01.
 A estatística teste padronizada é 
c20 = 7,962
c2L = 2,603 e c2R = 26,757
Valores críticos para 
*
Em uma escola pública, os alunos da 8a série fizeram uma prova de biologia. Segundo o diretor da escola, o desvio padrão das notas é inferior a 30. Solicitaram a você, que trabalha para o diretor, que teste essa alegação. Em uma amostra aleatória de 10 provas, você encontrou um desvio padrão de 28,8. Sendo = 0,01, você tem evidência suficiente para aceitar a alegação do diretor? Suponha que as notas sejam normalmente distribuídas. 
1. Escreva as hipótese nula e alternativa.
2. Estabeleça o nível de significância.
= 0,01
3. Determine a distribuição amostral.
A distribuição amostral é c2 com 10 – 1 = 9 g.l.
Teste para determinar
H0
Ha
(alegação)
*
7. Tome sua decisão.
6. Determine a estatística teste.
8. Interprete sua decisão.
n = 10
s = 28,8
c2 = 8,2944 não cai na região de rejeição, portanto você não pode rejeitar H0.
Não há evidência suficiente para aceitar a alegação do diretor de que o desvio padrão é inferior a 30.
2,088
4. Determine o valor crítico.
5. Determine a região de rejeição.
28,82
8,2944
The null hypothesis says things are fine. No problem. In a hypothesis test, you will always assume this is the case (null hypothesis is true). If the evidence shows the null hypothesis is improbable, then you will reject it in support of the alternative hypothesis. You can never actually prove the null hypothesis is true.
Always write the claim first. Then write the complement. Identify the null hypothesis as the statement that contains the = condition. The claim can be represented in either hypothesis.
The level of significance should be a low probability value. It is usually 0.01, 0.05 or 0.10. A type II error is made when the null hypothesis is false but you fail to reject it. The probability
of a type II error is β. 1- β is called the power of the test. Discuss the analogy to the American justice system. 
In the examples, the parameter is mu and the sampling distribution is normal. When testing other parameters, the same 3 types of tests are used. The category for the test is the region in which the null hypothesis is likely to be rejected and the alternative hypothesis is more probable. 
Students will encounter results expressed in P-values in professional journals. TI-83 and Minitab results for hypothesis tests are given in P-value form.
The example here is for a right tail test. For a left tail test, calculate the area in the left tail from the cumulative area in the table.
For a two tail test, find the standardized test statistic. Then find the area in the tail of the statistic and then double the area.
In a hypothesis test, the equality condition (contained in the null hypothesis) is assumed to be true. If the P value is less than the level of significance then the probability of obtaining a statistic that is equal to the one in the test or even more extreme is lower than the level of significance.
The second example shows why many statisticians use a P-value to report the results of their hypothesis test.
You can never prove a claim that is represented by the null hypothesis. You can only say there is not enough evidence to reject it. Use the analogy of a court case. The null hypothesis says the defendant is innocent. An attorney doesn’t need to prove a client’s innocence. It is sufficient to say there is not enough evidence to find the defendant guilty.
When you wish to prove a claim, set it up as the alternative hypothesis. If an attorney wants to claim the defendant is guilty, the attorney must show that assuming the defendant innocent, the resulting conditions would be extremely improbable.
These steps remain the same for all hypothesis tests. Discuss the normal sampling distribution that is the one for the sample mean with a large sample. 
The test statistic for the population mean is the sample mean. You will standardize each test statistic to determine probabilities. For a normal distribution, use z-scores. There will be other standardized scores.
The formula for z should be familiar from the Central Limit theorem. 
The fact that the sampling distribution is normal comes from the Central Limit Theorem studied in Chapter 5.
Since n is at least 30, use s in place of the population standard deviation. 
The claim was the null hypothesis. When the claim is the null hypothesis there will either be enough evidence to reject the claim or not enough evidence to reject the claim. You can never prove that the null hypothesis is true.
Using rejection regions is another way to make a decision about a hypothesis test. Show that the larger the value of alpha, the larger the rejection area will be. In a two tail test, the rejection region is divided between the left and right tails.
Students will need the normal distribution table here. For those using TI-83, this would be a good time to describe the inverse normal distribution. Students will be introduced to other sampling distributions in later sections.
For the left tail test look up the cumulative area of .01. The closest is.0099 with a z-score of –2.33
For the right tail test, look up the cumulative area of .95. The closest are .9495 and .9505. Choose the z-score in the middle.
For the two tail test, look up the cumulative area of .005 for the left tail value. The closest areas are .0049 and .0051 with s-scores of –2.57 and z=-2.58. Choose the midpoint.
These steps remain the same for all hypothesis tests. Discuss the normal sampling distribution that is the one for the sample mean with a large sample. 
A right tail test is shown here. 
The fact that the sampling distribution is normal comes from the Central Limit Theorem studied in Chapter 5.
The critical value is 1.645. The cumulative area is .9500. Regardless of the decision rule that is used, the decision will be the same.
The decision will be the same regardless of whether the test statistic is compared to the critical value or if the P-value of the test statistic is compared to the level of significance. When using critical value compare z-scores. When using P-values, compare areas.
Draw several t-distribution graphs. Explain that if there are more than 30 d.f. the distribution is very close to a normal distribution. 
Note that the population standard deviation is unknown. Also, the key to saying this is a two-tail test is the fact that the claim uses the word “is” which translates to “is equal to”. The complement is “not equal to”
The Minitab output reports the t value (-1.08) and the corresponding P-value. If you kow the P-vlaue you need not look up the critical number on the table.
Discuss why conditions of np 5 and nq  5 are important. Introduce p-hat symbol for the test statistic. Be sure students know to use the assumed values (found in H0) for p and q when they calculate the standard error.
Discuss why conditions of np>5 and nq>5 are important. Introduce p-hat symbol for the test statistic. Be sure students know to use the assumed values (found in H0) for p and q when they calculate the standard error.
Calculations shown may be slightly different from those displayed when using TI-83 tests. Results are the same. Tell students not to worry about slight differences. They are as a result of intermediate rounding off. If you wish, have students calculate the P-value for this test (it is 0.004) and make the decision using P-value techniques.
Show several chi-square graphs. Show how the distribution looks for 1 and 2 d.f. This distribution is skewed right. All values are non-negative.

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Continue navegando