Buscar

cap14-teste hip.

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

EXERCÍCIOS 
CAPÍTULO 14 – TESTES DE HIPÓTESES
Exercício 1
Como vimos no exercício 2 do capítulo anterior, o valor retornado pela função int.confiança é igual ao erro padrão ((/(n) multiplicado pela ordenada da normal reduzida z. No caso daquele exercício, z = 1,96, já que Pr(Z<1,96) = 0,975.
Quando o desvio padrão é desconhecido o procedimento é semelhante; apenas substitui-se ( por s e z por t.
Abra a pasta 14exercícios01 e a planilha intervalo; calcule os intervalos (com confiança de 95%) da maneira descrita acima (colunas F, G e H). Observe que todos os valores de t são superiores ao valor da normal reduzida z = 1,96, obtido no exercício 2 do capítulo anterior; como você interpreta esse resultado?
Compare os valores de t entre as cidades e regiões; por que os valores são diferentes?
Compare os valores da coluna H com aqueles retornados pela função int.confiança no exercício do capítulo anterior (coluna I). Conclusão? 
Resolução:
Vá para G4 e clique no botão fx. Em Categoria da função escolha Estatística; em Nome da função clique em invt e OK. Na caixa que se abre, indique o valor de Probabilidade, que deve ser igual a “1-nível de confiança” (neste caso, ( = 0,05 = 1-0,95), os graus de liberdade (digite C4-1), e clique em OK.
Em F4 digite =E4/C4^0,5 e em H4 digite =G4*F4. Copie F4:H4 para as demais cidades: marque F4:H4 e puxe pela alça (retângulo no canto inferior à direita) até a linha 21. Em J4 digite =D4-H4 e em K4 digite =D4+H4.
Confira os resultados em intervalo-r.
Respondendo às perguntas:
Considerando o desvio padrão amostral igual ao populacional e o mesmo intervalo de confiança, as ordenadas de t são sempre superiores a da normal reduzida. Neste caso, todas as ordenadas da coluna G são superiores a 1,96. 
Esse resultado pode ser interpretado da seguinte maneira: quando o desvio padrão é desconhecido, sendo necessário estimá-lo a partir da amostra, a estimativa perde precisão; sendo assim, para um mesmo nível de confiança, é necessário ampliar o intervalo.
Além disso, a estimativa do desvio padrão é tanto pior quanto menor a amostra; assim, quanto menor a amostra maior deve ser o intervalo e, conseqüentemente, maior a ordenada de t. Repare que o maior e o menor valor de t correspondem, respectivamente, ao Rio de Janeiro Centro (n=8) e a Belo Horizonte (n=97).
Exercício 2
Abra a pasta 14exercícios02 e a planilha notas, que contém as notas dos 648 candidatos não eliminados no vestibular de Economia da Universidade Federal Fluminense (UFF) em 2001.
Sua tarefa é testar se as médias de redação (G3), português (H3) e matemática (I3) são significativamente diferentes das médias (hipotéticas) do ano anterior (K3, L3 e M3, respectivamente), adotado o nível de significância de 10%. Admita que o desvio padrão de cada população é o mesmo em 2000 e em 2001 (G4, H4 e I4).
Resolução:
Como, em princípio, as notas podem ser melhores ou piores do que no ano anterior, cada teste deve ser bicaudal. Assim, por exemplo, o teste para redação deve ser: 
H0 : ( = 5,72 
H1 : ( ( 5,72
Como vimos, existem várias maneiras de se fazer um teste; aqui, vamos apresentar três delas: usando as funções dist.norm, inv.norm e int.confiança.
Antes de iniciar qualquer teste, lembre-se que a distribuição da média amostral tem desvio padrão igual a n (G5, H5 e I5). Lembre-se também que, como o teste é bicaudal, a área da região de rejeição (10%) fica dividida em duas áreas de 5%, conforme figura abaixo.
 
Método 1: Calculando a probabilidade de 
, normalmente distribuída com média ( e desvio padrão n, ser menor do que um valor especificado.
Vá para G10 e clique no botão fx. Em Categoria da função escolha Estatística; em Nome da função clique em dist.norm e OK. 
Na caixa que se abre, indique os valores de X (digite G3), da Média (digite K3), do Desv_padrão (digite G5) e de Cumulativo (digite 1), e clique em OK. Copie G10 para H10 e I10.
Acabamos de obter as probabilidades das distribuições das médias de redação, português e matemática serem menores do que os valores observados em 2001. 
Se alguma dessas probabilidades for inferior a 0,05 significa que a média de 2001 está dentro da região de rejeição do lado esquerdo; ou seja, é significativamente menor do que no ano anterior. Este é o caso de português: marque H10 utilizando negrito.
Agora devemos verificar se as médias de redação e matemática estão dentro da região de rejeição do lado direito. Assim, na linha 11, devemos calcular as probabilidades das médias serem maiores do que os valores observados em 2001. 
Em G11 digite =1-G10 e copie para H11 e I11.
Se alguma dessas probabilidades for inferior a 0,05 significa que a média de 2001 está dentro da região de rejeição do lado direito; ou seja, é significativamente maior do que no ano anterior. Este é o caso de redação: marque G11 utilizando negrito.
Conclusão: no bloco G10:I11, se alguma das colunas apresentar uma célula em negrito devemos rejeitar H0; assim, rejeitamos H0 nos casos de redação (é significativamente maior) e de português (é significativamente menor) e aceitamos H0 no caso de matemática.
Método 2: Calculando as ordenadas de 
, normalmente distribuída com média ( e desvio padrão n, que limitam as regiões de rejeição.
 
Vá para G16 e clique sobre o botão fx. Em Categoria da função escolha Estatística. Em Nome da função clique em inv.norm e OK. 
Na caixa que se abre, indique o valor da Probabilidade (neste caso 0,95), indique o valor da Média (digite K3) e do Desv_padrão (digite G5) e clique em OK. Copie G16 para H16 e I16.
Acabamos de obter os limites das regiões de rejeição, do lado direito.
Se alguma das médias de redação, português e matemática for superior ao valor que acabamos de obter, significa que a média de 2001 está dentro da região de rejeição do lado direito; ou seja, é significativamente maior do que no ano anterior. Este é o caso de redação (5,817 > 5,812): marque G16 utilizando negrito.
Agora devemos verificar se as médias de português e matemática estão dentro da região de rejeição do lado esquerdo. Assim, em G17:I17, devemos especificar a função inv.norm da mesma maneira, trocando apenas Probabilidade (de 0,95 para 0,05).
Se alguma das médias for inferior ao valor que acabamos de obter, significa que a média de 2001 está dentro da região de rejeição do lado esquerdo; ou seja, é significativamente menor do que no ano anterior. Este é o caso de português (3,988 < 4,022): marque H17 utilizando negrito.
Conclusão: no bloco G16:I17, se alguma das colunas apresentar uma célula em negrito devemos rejeitar H0; assim, rejeitamos H0 nos casos de redação (é significativamente maior) e de português (é significativamente menor) e aceitamos H0 no caso de matemática.
Método 3: Calculando um Intervalo de Confiança para a Média de 
, normalmente distribuída com média ( e desvio padrão n 
Vá para G22 e clique sobre o botão fx. Em Categoria da função escolha Estatística. Em Nome da função clique em int.confiança e OK. 
Na caixa que se abre, indique o valor de Alfa, que deve ser igual ao nível de significância do teste (neste caso, ( = 0,1), indique o valor do Desv_padrão da população X (atenção! agora estamos falando de digite G4), e o Tamanho da amostra (digite 648) e clique em OK. Copie G22 para H22 e I22.
Para obter o limite superior, deve-se somar a média ao resultado da função int.confiança. Assim, em G23 digite =K3+G22 e copie para H23 e I23.
Para obter o limite inferior, deve-se subtrair da média o resultado da função int.confiança. Assim, em G24 digite =K3-G22 e copie para H24 e I24.
Observe que os resultados de G23:I24 são idênticos aos do bloco G16:I17. Ou seja, estar fora do intervalo de confiança é o mesmo que cair na região de rejeição.
As conclusões, obviamente, são as mesmas.
Exercício 3
Repita o teste anterior admitindo que o desvio padrão é desconhecido.Resolução:
Abra a planilha testeT1. Vamos apresentar dois métodos alternativos, usando as funções distt e invt.
Primeiramente, cabe lembrar que a distribuição t é definida para a variável reduzida. Assim, em G10:I10 calculamos tobs = (média 2001 – média 2000)/erro padrão para cada uma das provas.
Além disso, as funções distt e invt não admitem valores negativos, de modo que calculamos o módulo de tobs em G11:I11. 
Método 1: Calculando a probabilidade de t ser maior do que o módulo de tobs.
 
Vá para G15 e clique sobre o botão fx, em Categoria da função escolha Estatística. Em Nome da função clique em distt e OK. 
Na caixa que se abre, indique o valor de x com sinal positivo (digite G11), indique o número de Graus_liberdade (digite G6-1), o número de Caudas (digite 2) e clique em OK. Copie G15 para H15 e I15.
Observe que, como especificamos duas caudas, a função distt retorna a probabilidade de t ser maior do que o módulo do valor especificado. Em G15, por exemplo, é a probabilidade de t ser maior do que 1,72774 mais a probabilidade de t ser menor do que 1,72774; ou seja, é a soma das áreas de rejeição à direita e à esquerda.
Sendo assim, se o valor retornado for menor do que o nível de significância (0,10), rejeita-se H0: são os casos de redação (G15) e português (H15); pelo mesmo raciocínio, não se pode rejeitar a hipótese de igualdade de médias no caso de matemática.
Método 2: Calculando a ordenada de t que limita as regiões de rejeição.
Vá para G20 e clique sobre o botão fx, em Categoria da função escolha Estatística. Em Nome da função clique em invt e OK. 
Na caixa que se abre, indique o valor da probabilidade (neste caso 0,1), indique o número de graus de liberdade (digite G6-1) e clique em OK. Copie G20 para H20 e I20.
O valor retornado significa que devemos rejeitar H0 se tobs for menor que -1,64 ou maior que 1,64. Mais uma vez, deve-se rejeitar a hipótese de igualdade de médias nos casos de redação e português.
Exercício 4
 Repita o teste do exercício anterior utilizando a ferramenta Teste T: duas amostras em par para médias
Resolução:
Abra a planilha testeT2. Clique em Ferramentas, Análise de dados, Teste T: duas amostras em par para médias e OK. 
Na caixa de diálogo que se abre, em Intervalo da variável 1 digite B2:B649; em Intervalo da variável 2 digite C2:C649; em Hipótese da diferença de média digite 0; em Alfa digite 0,10; confira se a opção de saída Nova planilha está assinalada e clique em OK.
Na planilha resultante, aumente a largura da coluna A dando dois cliques rápidos entre as colunas A e B. Confira o resultado em testeT2-r.
Há duas maneiras de fazer o teste: 
- como tobs (Stat t = 1,73) é maior que t crítico bicaudal (1,65), deve-se rejeitar H0
- como P(T ≥ t) bicaudal = 0,085 é menor que o nível de significância (0,1) ), deve-se rejeitar H0 
Repita os procedimento para português e matemática e confira o resultado em testeT2-r.
Exercício 5
Como você deve se recordar, no exercício 1 do capítulo 7 analisamos os histogramas das notas de redação, português e matemática. Concluímos que os melhores resultados foram obtidos em redação, já que suas notas se concentravam nas classes mais altas; ou seja, sua distribuição situava-se mais “à direita” da distribuição de matemática que se situava “à direita” da distribuição de português.
Agora chegou o momento de testar se essas diferenças são estatisticamente significativas. Vá para a planilha notas e, adotando o nível de significância de 1%, construa os testes entre redação e matemática, entre matemática e português e entre redação e português. Conclua rejeitando, ou não, a hipótese de igualdade de médias.
Resolução:
Este é um autêntico caso de amostras emparelhadas, já que dispomos de um par de notas (redação e matemática, por exemplo) para o mesmo candidato. Assim, devemos usar a mesma ferramenta do teste anterior.
Quanto à construção formal do teste, como, em princípio, as notas de redação podem ser melhores ou piores do que as de matemática, por exemplo, cada teste deve ser bicaudal. Assim, o teste entre as médias de redação e matemática deve ser:
 
H0 : (r = (m
H1 : (r ( (m
Abra a planilha notas. Clique em Ferramentas, Análise de dados, Teste T: duas amostras em par para médias e OK. 
Na caixa de diálogo que se abre, em Intervalo da variável 1 digite B2:B649; em Intervalo da variável 2 digite C2:C649; em Hipótese da diferença de média digite 0; em Alfa digite 0,01; confira se a opção de saída Nova planilha está assinalada e clique em OK.
Na planilha resultante, aumente a largura da coluna A dando dois cliques rápidos entre as colunas A e B. Confira o resultado em testeT3-r.
Repita os procedimento entre português e matemática e entre redação e matemática; confira o resultado em testeT3-r.
A conclusão é que as diferenças são extremamente significativas, já que tobs (Stat t) supera, em muito, t crítico (que já é alto, tendo em vista que adotamos o nível de significância de 1%). Assim, devemos rejeitar H0 nos três casos. Por fim, como se poderia esperar, os valores de tobs apresentam uma certa transitividade: se a média de redação é maior que a de matemática (Stat t = 11,7) e a média de matemática é maior que a de português (Stat t = 7,2), então a média de redação é “muito maior” (Stat t = 22,0) que a de português.
Exercício 6
A planilha sexo apresenta, separadamente, as notas dos homens e das mulheres (não eliminados) em cada uma das provas do vestibular de Administração da UFF. Desejamos testar se existem diferenças entre as notas desses dois grupos em cada uma das provas, adotado o nível de significância de 10%.
Resolução: 
A formulação da hipótese alternativa (H1) é particularmente importante neste caso. Por um lado, pode-se argumentar que as mulheres possuem natural aptidão para “as letras”, enquanto os homens se sentem mais à vontade entre os “números”. Nessa linha de raciocínio, deve-se esperar que as mulheres apresentem melhor rendimento nas provas de redação e de língua portuguesa, e que os homens superem as mulheres em matemática. Sendo assim, os testes devem ser construídos da seguinte maneira:
Argumentação 1
Redação Português Matemática 
H0 : (m = (h H0 : (m = (h H0 : (m = (h
H1 : (m > (h H1 : (m > (h H1 : (m < (h
Por outro lado, pode-se argumentar que as diferenças devem se manifestar principalmente na eleição da carreira: os homens e mulheres com habilidades matemáticas devem seguir a área tecnológica, e vice-versa. Assim, os candidatos e candidatas à Administração teriam perfis semelhantes, de modo que os testes devem ser:
Argumentação 2
Redação Português Matemática 
H0 : (m = (h H0 : (m = (h H0 : (m = (h
H1 : (m ( (h H1 : (m ( (h H1 : (m ( (h
Para gerar os resultados necessários ao teste, vá para a planilha sexo, clique em Ferramentas, Análise de dados, Teste T: duas amostras presumindo variâncias equivalentes e OK. 
Na caixa de diálogo que se abre, em Intervalo da variável 1 digite B3:B89; em Intervalo da variável 2 digite G3:G158; em Hipótese da diferença de média digite 0; em Alfa digite 0,10; confira se a opção de saída Nova planilha está assinalada e clique em OK.
Na planilha resultante, aumente a largura da coluna A dando dois cliques rápidos entre as colunas A e B. Confira o resultado em testeT4-r.
Repita os procedimentos para as notas de português e matemática econfira o resultado em testeT4-r.
A conclusão é que, adotada a argumentação 1, devemos rejeitar a hipótese de igualdade de médias entre homens e mulheres nas três provas, já que o valor de tobs (Stat t) é maior do que t crítico uni-caudal nos três casos.
Adotada a argumentação 2, devemos rejeitar a hipótese nula nas provas de redação e matemática, mas não podemos rejeitá-la no caso de português, já que neste caso tobs (Stat t) é menor do que t crítico bi-caudal.
Uma vez mais, constate que o teste estatístico nem sempre coincide com a análise tradicional: a diferença percentual entre as médias de português (9,2%) é maior do que entre as médias de redação (7,5%), mas tobs é maior no segundo caso (2,12 contra 1,60).
Exercício 7
Repita o teste anterior utilizando a ferramenta Teste T: duas amostras presumindo variâncias diferentes.
Confira os resultados em testeT5-r. 
 
_1033923549.unknown

Outros materiais

Perguntas Recentes