Prévia do material em texto
Universidade Federal do Sul e Sudeste do Pará Faculdade de Engenharia da Computação Estatística Capítulo 4 - Teste de Hipótese Profº. Dr. Elton Alves Hipóteses • Genericamente falando, hipótese é sinônimo de suposição ou conjectura. • Em estatística, uma hipótese é uma alegação, ou afirmação, sobre uma característica da população através de dados amostrais. • Esta hipótese será testada com base em resultados amostrais, sendo aceita ou rejeitada. • Teste de hipótese é uma regra de decisão para aceitar ou rejeitar uma hipótese estatística com base em elementos amostrais. Hipóteses Hipóteses • Exemplos de hipóteses: a) Substituindo o processador A pelo processador B, altera-se o tempo de resposta de um computador; b) Aumentando a dosagem de cimento, aumenta-se a resistência do concreto; c) Uma campanha publicitária produz efeitos positivos nas vendas. Como verificar a veracidade destas hipótese? Através da coleta de um conjunto de dados , observados adequadamente em termos do problema. Hipóteses • As hipóteses podem ser descritas em termos de parâmetros populacionais. • Então pelo exemplo anterior de hipóteses. Tem-se: a) A média dos tempos de resposta do equipamento com o processador A é diferente da média dos tempos de resposta com o processador B. b) A média dos valores de resistência do concreto com a dosagem d2 de cimento é maior do que a média dos valores de resistência com a dosagem d1. c) A proporção de vendas depois da campanha publicitária é maior do que a proporção de vendas antes da campanha publicitária. Hipóteses • Dado um problema de teste de hipótese, é preciso formular as chamadas hipótese nula e hipótese alternativa. I. A hipótese nula (H0): é a hipótese aceita como verdadeira até a prova estatística em contrário. • Alegação inicialmente aceita como verdadeira (=) • Representa o contrario do que queremos provar. II. A hipótese alternativa (H1) é fruto da rejeição da hipótese nula. • É formulada em termos de desigualdade (≠, < ou >) • Corresponde ao que se quer provar, ou seja, corresponde à própria hipótese de pesquisa formulada em termos de parâmetros. Hipóteses • Com respeito ao exemplo de hipóteses. Tem-se: a) H0: µa=µb e H1: µa≠µb Onde: µa é o tempo médio de resposta com o processador A; e µb é o tempo médio de resposta com o processador B. b) H0: µ2=µ1 e H1: µ2>µ1 Onde : µ2 é a resistência média do concreto com a dosagem d2 de cimento; e µ1 é a resistência média do concreto com a dosagem d1 de cimento. c) H0: p2=p1 e H1: p2>p1 Onde: p1 é a proporção da vendas antes da campanha publicitária; e p2 é a proporção das vendas depois da campanha publicitária. Hipóteses • Uma universidade alega que a proporção de seus alunos formados em quatro anos é de 82%. H0: p0=82% H1:p1≠82% • Um fabricante de torneiras alega que a taxa de fluxo médio de um determinado tipo é inferior ou igual a 2,5 galões por minuto. H0:µ1=2,5 H1:µ2<=2,5 Conceitos Básicos • Exemplo: suspeita-se que uma moeda não seja perfeitamente equilibrada (honesta). p = probabilidade de cara H0: p=0,5 H1: p≠0,5 Planejamento da Amostra • n = 10 lançamentos imparciais e independentes da moeda. Resultado da Amostra • Situação 1: valor obtido y = 10 caras. Qual seria a conclusão? Exemplo da Moeda Probabilidade de Significância (valor p) • Probabilidade da estatística do teste acusar um resultado tão ou mais distante do esperado, como resultado ocorrido na particular amostra observada, suponho H0 como hipótese verdadeira. Exemplo da Situação 1 Conclusão • Valor de p = 0,2% (probabilidade de uma moeda honesta acusar um valor tão distante quanto ao que se observou na amostra, é uma probabilidade muito pequena. • Qual a conclusão? • O teste rejeita H0, ou seja, prova estatisticamente que a moeda é viciada. Situação 2 • Vejamos agora uma situação B, em que observamos y=7 caras e n=10 lançamentos. Conclusão • Valor de p = 34,4% (probabilidade de uma moeda honesta acusar um valor tão distante quanto ao que se observou na amostra). Não é muito pequeno!!!! • Qual é a conclusão? • O teste aceita H0, ou seja, não se pode afirmar que a moeda é viciada. Nível de Significância (α) • É a probabilidade tolerável para confirmar ou rejeitar alguma hipótese H0, quando H0 for verdadeira. • É comum adorar níveis de α de 5%. • Quando se deseja maior segurança ao afirmar H1, podemos adotar níveis de significância menores, como α=0,01. Tipos de Erros num Teste Estatístico Tipos de Erros num Teste Estatístico Tipos de teste • Graficamente, podemos representar as regiões de aceitação em rejeição da seguinte forma: Testes Unilaterais e Bilaterais • Teste Unilateral (unicaudais): a hipótese alternativa apenas contempla possibilidades à direita ou à esquerda da hipótese nula. I. Teste unilateral à direita: Exemplo: H0:µ=1 H1:µ>1 Testes Unilaterais e Bilaterais I. Teste unilateral à esquerda: Exemplo: H0:µ=1 H1:µ<1 Testes Unilaterais e Bilaterais • Teste Bilateral (bicaudais): Nos testes bilaterais a hipótese alternativa contempla possibilidades à direita e à esquerda da hipótese nula. Exemplo: H0:µ=1 H1:µ≠1 Aplicação de Testes Estatísticos • Para fazer o cálculo é necessário seguir os seguintes passos: I. Definição da Hipótese: hipóteses H0 e H1. II. Calcular a estatística do Teste: é o valor calculado a partir da amostra, que será usado na tomada de decisão. Uma maneira de tomar-se uma decisão é comparar o valor tabelado com a estatística do teste. III. Região crítica: a região crítica é a região onde Ho é rejeitada. - A área da região crítica é igual ao nível de significância (α) Aplicação de Testes Estatísticos IV.Regra de decisão: se o valor da estatística do teste cair na região de crítica, rejeita-se H0. Regra de Decisão: Abordagem do valor de p Regra de Decisão: Abordagem pela regra clássica Regra de Decisão: Abordagem pela regra clássica Teste para Média • O teste para média é aplicável quando se quer verificar se uma variável na população pode ser considerada, em média, igual a certo valor µ0. • Teste bilateral: H0:µ=µ0 e H1:µ≠µ0 • Teste unilateral à esquerda: H0:µ=µ0 e H1:µ<µ0 • Teste unilateral à direita: H0:µ=µ0 e H1:µ>µ0 • Obs.: o teste é aplicado quando a variância da população é conhecida e quando é desconhecida. Teste para a Média: variância conhecida • Para amostras consideradas grandes (n≥50) usa-se o Teorema do Limite Central. • Considerados uma aproximação da distribuição normal. • Onde: - µ0 é o valor da média segundo H0; - n é o tamanho da amostra; - σ é o desvio padrão populacional; - é a média da amostra. ( )0x n z − = x Exemplo 1 • Na indústria cerâmica, avalia-se sistematicamente a resistência de amostras de massas cerâmicas, após o processo de queima. Dessas avaliações, sabe-se que certo tipo de massa tem resistência mecânica aproximadamente normal, com média 53 MPa e variância 16 MPa². Após a troca de alguns fornecedores de matérias primas, deseja-se verificar se houve alteração na qualidade. Uma amostra de 15 corpos de prova de massa cerâmica acusou média igual a 50 MPa. Qual é a conclusão com nível de significância de 5% Exemplo 2 • Os sistemas de escape da tripulação de uma aeronave funcionam devido a um propelente solido. A taxa de queima desse propelente é uma característica importante do produto. As especificações requerem que a taxa média de queima tem de ser 50 cm/s. Sabemos que o desvio padrão da taxa de queima é 2 cm/s. O experimentalista decide especificar um nível de significância de 5%. Ele seleciona uma amostra aleatória de n=25 e obtém uma taxa média amostral de 51,3 cm/s. Houve alteração?Que conclusões poderiam ser tiradas? Teste para a Média: variância desconhecida • Uma situação comum ocorre quando não se tem informação sobre a variância. • Calculo da estatística do teste: • Onde: - é a média da amostra; - n é o tamanho da amostra; - µ0 é o valorda média da amostra H0. - s é o desvio padrão da amostra. ( )0x n t s − = x Exemplo 3 • O tempo para transmitir 10 MB em determinada rede de computadores varia segundo um modelo normal, com média 7,4. Depois de algumas mudanças da rede, acredita-se numa redução no tempo de transmissão de dados, além de uma possível alteração na variabilidade. Foram realizados 10 ensaios independentes com um arquivo de 10 MB e foram anotados os tempos de transmissão, em segundos: 6,8 7,1 5,9 7,5 6,3 6,9 7,2 7,6 6,6 6,3 Existe evidência suficiente de que o tempo médio do transmissor foi reduzido?Use α=1%. Exemplo 4 • Certo tipo de pneu dura, em média, 50.000 km. O fabricante investiu em uma nova composição de borracha para pneus. Vinte pneus, fabricados com essa nova composição, duraram em média, 55.000 km, com desvio padrão de 4.000 km. Suponha que a durabilidade dos pneus segue uma distribuição aproximadamente normal, verificar se os dados provam que os novos pneus são mais duráveis. Use α=1%. Slide 1: Universidade Federal do Sul e Sudeste do Pará Faculdade de Engenharia da Computação Estatística Slide 2: Hipóteses Slide 3: Hipóteses Slide 4: Hipóteses Slide 5: Hipóteses Slide 6: Hipóteses Slide 7: Hipóteses Slide 8: Hipóteses Slide 9: Conceitos Básicos Slide 10: Planejamento da Amostra Slide 11: Resultado da Amostra Slide 12: Exemplo da Moeda Slide 13: Probabilidade de Significância (valor p) Slide 14: Exemplo da Situação 1 Slide 15: Conclusão Slide 16: Situação 2 Slide 17: Conclusão Slide 18: Nível de Significância (α) Slide 19: Tipos de Erros num Teste Estatístico Slide 20: Tipos de Erros num Teste Estatístico Slide 21: Tipos de teste Slide 22: Testes Unilaterais e Bilaterais Slide 23: Testes Unilaterais e Bilaterais Slide 24: Testes Unilaterais e Bilaterais Slide 25: Aplicação de Testes Estatísticos Slide 26: Aplicação de Testes Estatísticos Slide 27: Regra de Decisão: Abordagem do valor de p Slide 28: Regra de Decisão: Abordagem pela regra clássica Slide 29: Regra de Decisão: Abordagem pela regra clássica Slide 30: Teste para Média Slide 31: Teste para a Média: variância conhecida Slide 32: Exemplo 1 Slide 33: Exemplo 2 Slide 34: Teste para a Média: variância desconhecida Slide 35: Exemplo 3 Slide 36: Exemplo 4