Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3 1 Prof. M.Sc. Eng. Braitner Lobato - Notas de Aula 02/2012 1. Hipótese estatística 2. Formulação de hipóteses 3. Tipos de erros 4. Nível de significância 5. Estatística de teste 6. Região crítica 7. Regra de decisão 8. Teste de hipóteses 9. Teste Qui-quadrado 10. Procedimento básico para o teste 2 1. HIPÓTESE ESTATÍSTICA Na prática, o maior problema enfrentado por engenheiros e cientistas não é estimar os parâmetros populacionais como a média e o desvio padrão, por exemplo, mas descrever um método que gere conclusões confiáveis a partir de um conjunto de dados. Veja os exemplos as seguir: Um engenheiro pode ter que conferir se há diferença de massa entre dois lotes de cimento da mesma marca, baseado em dados amostrais. Um cientista pode ter que investigar se a ingestão de refrigerante aumenta o risco de infarto, com base em evidências experimentais. Um estudante de ciências sociais, ao avaliar os resultados do censo, pode desejar saber se há alguma relação entre o poder aquisitivo e a estatura de uma comunidade. Cada um desses casos envolve uma conjectura a respeito daquilo que se deseja saber, ou seja, uma hipótese. A inferência estatística engloba os procedimentos de tomada de decisão, com base em dados experimentais, sobre a aceitação ou a rejeição da hipótese postulada. A hipótese estatística é uma afirmação ou conjectura sobre uma ou mais populações (Walpole et al., 2009). É impossível afirmar, com 100% de certeza que uma determinada hipótese estatística é verdadeira ou falsa, a menos que se faça uma investigação em toda população. Todavia, trabalhar com todos os dados de uma população é muito oneroso e exaustivo, por isso é comum retirar uma amostra aleatória e a partir dela fazer análises que forneçam evidências amostrais suficientes para aceitar ou refutar a hipótese sobre a população como um todo. 2. FORMULAÇÃO DE HIPÓTESES Hipótese Nula (H0): hipótese existente ou a ser testada. Hipótese Alternativa (H1): hipótese que contraria a hipótese nula, complementar de H0. H0: o réu é inocente H1: o réu é culpado 3. TIPOS DE ERROS Pelo fato de se trabalhar com resultados amostrais para se fazer inferência sobre uma população, o processo está sujeito a erros, ou seja, pode-se tomar decisões corretas ou erradas, por exemplo: Pode-se rejeitar a hipótese nula (H0) mesmo sendo verdadeira. Pode-se aceitar a hipótese nula (H0) mesmo sendo falsa. A Tabela 1 resume bem as possibilidades de erros e acertos, para tanto considere que: = P(erro do tipo I) = P(rejeitar H0 / H0 é verdadeira) = P(erro do tipo II) = P(aceitar H0 / H0 é falsa) Tabela 1. Resumo das possibilidades de erro e aceito em uma decisão. ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3 2 Prof. M.Sc. Eng. Braitner Lobato - Notas de Aula 02/2012 Realidade H0 verdadeira H0 falsa Decisão Aceitar H0 Decisão correta (1 - ) Erro do tipo II () Rejeitar H0 Erro do tipo I () Decisão correta (1-) A partir do quadro acima pode-se inferir que: Se na realidade H0 é verdadeira e a decisão é aceitar H0, a decisão é correta. Se na realidade H0 é falsa e a decisão é rejeitar H0, a decisão é correta. Se na realidade H0 é verdadeira e a decisão é rejeitar H0, a decisão é um erro denominado erro do tipo I. Se na realidade H0 é falsa e a decisão é aceitar H0, a decisão é um erro chamado de erro do tipo II. Na prática, estes conceitos podem ser extrapolados de tal forma que os erros do tipo I e II podem ser aplicados da seguinte maneira: Risco do produtor: risco associado à possibilidade de erro do tipo I, ou seja, quando um lote bom é rejeitado. Risco do consumidor: risco associado à possibilidade de erro do tipo II, ou seja, quando um lote ruim é aceito. 4. NÍVEL DE SIGNIFICÂNCIA O nível de significância indica qual a probabilidade de erro se está disposto a aceitar, por exemplo, = 1%, significa que a probabilidade de aceitar o erro do tipo I é de 1%. Pela distribuição normal, uma área de 0,01 abaixo da curva normal corresponde ao escore padrão de 2,58. Na prática, os valores mais adotados são: = 1% z = 2,58 = 5% z = 1,64 5. ESTATÍSTICA DE TESTE A estatística de teste é o cálculo do escore padrão que será usado para comparar com o nível de significância determinado no problema. No entanto, há dois casos distintos para o cálculo da estatística de teste. Quando o desvio padrão da população for conhecido usa-se a distribuição normal; quando o desvio padrão populacional for desconhecido recomenda-se usar a distribuição t-Student, indicada para amostras menores ou iguais a 30. A Tab. 2 sintetiza a estatística de teste quando o desvio padrão populacional é conhecido ou desconhecido. 6. REGIÃO CRÍTICA A região crítica é aquela onde os valores da estatística dos testes conduzem à rejeição da hipótese nula (H0). A área delimitada por essa região é definida como o nível de significância e sua direção é a mesma da hipótese alternativa (H1). ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3 3 Prof. M.Sc. Eng. Braitner Lobato - Notas de Aula 02/2012 Unilateral à esquerda Unilateral à direita Bilateral 0 0 1 0 : : H H 0 0 1 0 : : H H 0 0 1 0 : : H H Figura 1. Região crítica unilateral à esquerda, unilateral à direita e bilateral. Tabela 2. Estatística de teste para o desvio padrão populacional conhecido e desconhecido. Desvio padrão populacional conhecido Desvio padrão populacional desconhecido teste x z n onde: z : estatística de teste x : média :média populacional : desvio padrão populacional n : número de elementos na amostra teste x t s n onde: t : estatística de teste x : média :média da população s : desvio padrão da amostra n : número de elementos na amostra 7. REGRA DE DECISÃO Se o valor da estatística do teste cair dentro da região crítica deve-se rejeitar H0. Ao rejeitar a hipótese nula (H0) existe uma forte evidência nos dados de sua falsidade. Ao aceitar a hipótese nula (H0) não existe uma forte evidência amostral significativa para rejeitar H0. 8. TESTE DE HIPÓTESES OU TESTE DE SIGNIFICÂNCIA 1. Formulação de H0 e H1. 0 0 0 1 0 0 : : H H 2. Escolha de um nível de significância (a) e definição da região crítica. Se o desvio padrão populacional for conhecido, a variável teste será Normal (z) para 30n . Se o desvio padrão populacional for desconhecido, a variável teste será t de Student com 1n para 30n . ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3 4 Prof. M.Sc. Eng. Braitner Lobato - Notas de Aula 02/2012 3. Cálculo de uma estatística de teste. 0 cal x z n ou 0 cal x t s n 4. Comparação do valor teste, calz ou calt , com o valor tabelado, tabz ou tabt . 5. Rejeitar H0 se o valor teste excede a região crítica ou aceitar em caso contrário. Se a variável de teste (calculada) cair dentro da região de aceitação não se pode rejeitar H0. Se a variável de teste (calculada) cair fora da região de aceitação, rejeita-se H0. Poder-se-ia, também, fazer uso da abordagem valor-p ou p-valor. Esta estratégia consiste em determinar o menor nível de significância no qual a hipótese nula é rejeitada e é composta pelas seguintes etapas: (i) declaração das hipóteses nula e alternativa, (ii) seleção da distribuição a ser adotada, (iii) calculo do valor-p, (iv) tomada de decisão. Exemplo 01 (Teste de significância para a média). Uma amostra aleatória de 100 registros de mortes em Cabrobró da Serra durante o ano passado revelouuma expectativa de vida de 72 anos. Assumindo um desvio padrão de 9 anos, isso parece indicar que a média da expectativa de vida hoje é maior do que 70 anos? Adote um nível de significância de 0,05. a) Defina as hipóteses: H1: m > 70 anos b) Calcule a estatística de teste: c) Identifique a estatística tabelada: d) Comparar o cal z com o tab z : d) Através da tabela de distribuição de probabilidades determine ( ) cal P P z z . e) Conclusão ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3 5 Prof. M.Sc. Eng. Braitner Lobato - Notas de Aula 02/2012 Exemplo 02 (Teste de significância para a média). Um novo fabricante de Cabrobrolândia desenvolveu um novo traço de concreto com carga de ruptura de 8 MPa com desvio padrão de 0,5 MPa. Teste a hipótese de que m = 8 MPa contra a alternativa de que m 8 MPa, se uma amostra aleatória de 50 vigas de concreto foi testada e descobriu-se uma carga de ruptura de 7,8 MPa. Adote um nível de significância de 0,01. a) Defina as hipóteses: b) Calcule a estatística de teste: c) Identifique a estatística tabelada: d) Comparar o cal z com o tab z : d) Através da tabela de distribuição de probabilidades determine ( ) cal P P z z . e) Conclusão ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3 6 Prof. M.Sc. Eng. Braitner Lobato - Notas de Aula 02/2012 Exemplo 03 (Teste de significância para a média). A Thomas Franscisvaldo Edson Lumino Eletric divulgou recentemente um relatório com o consumo semanal de energia elétrica de alguns eletrodomésticos. Verificou-se que um “chapinha” gasta em média 46 kW/h. Se uma amostra aleatória de 12 quartos femininos indica que uma “chapinha” consome 42 kW/h semanalmente, para um nível de significância de 5%, as “chapinhas” gastam, em média, 46 kW/h por semana? Assuma que a distribuição de quilowatts-hora é normal. a) Defina as hipóteses: b) Calcule a estatística de teste: c) Identifique a estatística tabelada: d) Comparar o cal t com o tab t : d) Através da tabela de distribuição de probabilidades determine ( ) cal P P t t . e) Conclusão ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3 7 Prof. M.Sc. Eng. Braitner Lobato - Notas de Aula 02/2012 9. TESTE QUI-QUADRADO Até aqui temos estudado testes paramétricos, testes de hipóteses com relação a um parâmetro populacional ou a comparação entre dois parâmetros. Todavia, há casos em que os testes não dependem de um parâmetro populacional nem de suas estimativas. É nesse cenário que surge o teste do Qui- quadrado. Esse teste é usado quando o objetivo é comparar freqüências observadas com freqüências esperadas e podem ser divididos em três grupos: Teste de adequação do ajustamento: indicado para verificar se as freqüências observadas concordam ou não com as freqüências teóricas esperadas. Teste de aderência: indicado quando se deseja testar a natureza da distribuição amostral, ou seja, verificar se determinado conjunto de dados tem uma boa ou má aderência a um determinado modelo de distribuição de probabilidade (normal, binomial, Poisson etc) Teste de independência (tabela de contingência): indicado quando se deseja verificar a relação entre duas ou mais variáveis de forma que as frequências esperadas podem ser observadas através de uma tabela de contingência. 10. PROCEDIMENTO BÁSICO PARA O TESTE DO QUI-QUADRADO 1. Determina as hipóteses: 0 0 1 0 : : e e H F F H F F 2. Escolha o nível de significância (a) 3. Calcule a estatística: 2 2 1 k o e cal i e F F F 4. Identificar a estatística tabelada: 2 2 ,tab 5. Comparar o 2 cal com o 2 tab 6. Conclusão: Se 2 2 cal tab , aceita-se 0H . Se 2 2 cal tab , rejeita-se 0H . ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3 8 Prof. M.Sc. Eng. Braitner Lobato - Notas de Aula 02/2012 Exemplo 04 (Teste de adequação do ajustamento). Francisvaldo, funcionário do Departamento Nacional de Trânsito, recebe a missão de verificar se os acidentes em uma das rodovias de Cabrobró da Serra se distribuem igualmente de segunda a sexta-feira. Para tanto, ele fez uma pesquisa e levantou os dados dispostos na tabela abaixo. Admita nível de significância de 5%. Dia da semana Segunda Terça Quarta Quinta Sexta Número de acidentes 8 12 23 27 30 a) Defina as hipóteses: b) Calcule a estatística: 2 2 1 k o e cal i e F F F Dia da semana Segunda Terça Quarta Quinta Sexta k = 5 Número de acidentes 8 12 23 27 30 Pi Fe = n.pi c) Identifique a estatística tabelada: 2 2 ,tab 1k : quando as frequências esperadas podem ser calculadas sem as estimativas dos parâmetros populacionais a partir das distribuições amostrais. 1k m : quando para a determinação das frequências esperadas, m parâmetros tiverem suas estimativas determinadas a partir das distribuições amostrais. d) Comparar o 2 cal com o 2 tab e) Conclusão ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3 9 Prof. M.Sc. Eng. Braitner Lobato - Notas de Aula 02/2012 Exemplo 05 (Teste de independência – tabela de contingência). Cabrobró da Serra é uma cidade que tem crescido bastante. No intuito de investigar se há relação entre o nível de renda e a escolaridade dos Cabroboenses, Francisvaldo fez um censo a partir de uma amostra de 200 moradores, como mostra a tabela abaixo. Verifique se há independência entre a renda e a escolaridade para um nível de significância de 1%. Nível de renda Nível de escolaridade Fundamental Médio Pobre 56 42 Rico 38 44 a) Defina as hipóteses: b) Calcule a estatística: 22 1 k o e cal i e F F F ( . . . )( . . . ) . . eij soma da linha i soma da coluna j F total de observações ( 1)( 1)l c , onde l (linha) e c (coluna) Nível de renda Nível de escolaridade Total Fundamental Médio Pobre 90 30 120 Rico 20 60 80 Total 110 90 200 11e F 12e F 21e F 22e F c) Identifique a estatística tabelada: ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3 10 Prof. M.Sc. Eng. Braitner Lobato - Notas de Aula 02/2012 d) Comparar o 2 cal com o 2 tab e) Coeficiente de contingência (grau de relacionamento): 2 2 cal cal C n f) Conclusão H0 Valor da estatística de teste H1 Região crítica 0 0xz n ; conhecido 0 0 0 z z z z 2z z ou 2z z 0 0xt s n ; 1v n desconhecido 0 0 0 t t t t 2t t ou 2t t EXERCÍCIOS PROPOSTOS Questão 01 (Walpode, 2009). Uma indústria elétrica fabrica lâmpadas cuja vida útil tem distribuição aproximadamente normal com média de 800 horas e desvio padrão de 40 horas. Teste a hipótese de que m = 800 horas contra a alternativa m 800 horas, se uma amostra aleatória de 30 lâmpadas tem média de vida de 768 horas e determine o valor de a abaixo do qual a média não é significante. Questão 02 (Walpode, 2009). Afirma-se que um automóvel é dirigido, em média, mais de 20.000 quilômetros por ano. Para testar essa afirmação, uma amostra aleatóriade 100 proprietários de automóveis registra os quilômetros viajados. Você concordaria com essa afirmação, se esta amostra mostrasse uma média de 23.500 quilômetros e desvio padrão de 3.900 quilômetros? Use um valor P em sua conclusão? ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3 11 Prof. M.Sc. Eng. Braitner Lobato - Notas de Aula 02/2012 Questão 03 (Walpode, 2009). Em uma pesquisa feita na Escola de Medicina da Universidade da Califórnia, afirmou-se que os ratos com média de vida de 32 meses viveriam por mais ou menos 40 meses se 40% das calorias de suas refeições fossem substituídas por vitaminas e proteínas. Há alguma razão para acreditarmos que m< 40 se 64 ratos colocados sob essa dieta têm uma média de vida de 38 meses com desvio padrão de 5,8 meses? Use um valor P em sua conclusão. Questão 04 (Walpode, 2009). Teste a hipótese de que o conteúdo médio de recipientes de certo lubrificante é dez litros, se os conteúdos de uma amostra aleatória de dez recipientes são 10,2; 10,1; 10,3; 10,1; 9,8; 9,9; 10,4; 10.3 e 9.8 litros. Use o nível de significância 0,01 e assuma que a distribuição dos conteúdos dos recipientes é normal. Questão 05 (Walpode, 2009). A altura média de estudantes calouras do sexo feminino de certa universidade é 162,5 cm, com desvio padrão de 6,9 cm. Há alguma razão para acreditar que houve uma mudança na média das alturas se uma amostra de 50 mulheres na atual classe de calouros tem altura média de 165,2 cm? Use um valor P em sua conclusão. Assuma que o desvio padrão continua o mesmo. Questão 06 (Lopes, 2003). Teste para 5% se há alguma relação entre as notas escolares e o salário. Salário Notas Escolares Alta Baixa Média Alto 18 5 17 Médio 26 16 38 Baixo 6 9 15 Questão 07 (Lopes, 2003). Com o objetivo de investigar a relação entre a situação do emprego no momento em que se aprovou um empréstimo e se saber se o empréstimo está, agora, pago ou não, o gerente de uma financeira selecionou ao acaso 100 clientes obtendo os resultados da tabela abaixo. Teste a hipótese nula de que a situação de emprego e a de empréstimo são variáveis independentes, com 5% . Estado atual do empréstimo Situação de empregado Empregado Desempregado Em mora 10 8 Em dia 60 22 Questão 08 (Walpole, 2009). Em um experimento para estudar a relação entre hipertensão e o hábito de fumar, os seguintes dados forma obtidos de 180 indivíduos. Teste a hipótese de que a presença ou ausência da hipertensão depende dos hábitos relacionados ao fumo. Use um nível de significância de 0,05. Não Fumante Fumante Moderado Fumante Inveterado Empregado Desempregado Desempregado Hipertenso 21 36 30 Não hipertenso 48 26 19 ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3 12 Prof. M.Sc. Eng. Braitner Lobato - Notas de Aula 02/2012 Questão 09 (Walpole, 2009). Uma amostra aleatória de 90 adultos é classificada de acordo com o gênero e o número de horas que eles assistem à televisão durante a semana. Use o nível de significância de 0,01 e teste a hipótese de que o tempo gasto com televisão é independente do gênero do telespectador. Gênero Masculino Feminino Mais de 25 horas 15 29 Menos de 25 horas 27 19 Questão 10 (Walpole, 2009 - adaptada). Um perito criminal conduziu uma investigação para determinar se a incidência de certos tipos de crime varia de acordo com a região de uma cidade grande. Os tipos de crime de interesse são: agressão, arrombamento, roubo e homicídio. A tabela a seguir mostra o número de crimes cometidos em quatro áreas da cidade no ano passado. Pode-se concluir, com base nesses dados, num nível de significância de 0,01, que a ocorrência desses tipos de crime depende da área da cidade? REFERÊNCIA BIBLIOGRÁFICA Aula 11, Estatística-UVB, Faculdade On-line UVB. Kato, Sérgio, Teste de hipótese, Departamento de estatística, FAMAT, PUCRS. Lopes, Luis Felipe Dias, (2003), Apostila de Estatística, DE-UFSM. Neto, Pedro Luiz de Oliveira Costa (2002); Estatística; Edgard Blücher; 2ª ed.; São Paulo. Walpole, Ronald E., Myers, Raymond H., Myers, Sharon L., Ye, Keying (2009); Probabilidade e Estatística para Engenharia e Ciências; Ed. Pearson, Ed. 8ª; São Paulo. GABARITO Questão 01 z = -1,64 P = 0,10 Questão 02 z = 8,97; sim, m >20.000 Km; P = 0,001 Questão 03 z = -2,76; sim, m <40 meses; P = 0,0029 Questão 04 t = 0,77; não rejeitar H0 Questão 05 z = 2,77; rejeitar H0 e concluir que m162,5. Questão 06 Resposta: aceitar Ho Questão 07 Resposta: aceitar Ho Questão 08 Resposta: rejeitar Ho Questão 09 Resposta: rejeitar Ho Questão 10 Resposta: rejeitar Ho “Porque Deus amou o tanto o mundo, que deu o seu único Filho, para que todo aquele que nele crer não morra, mas tenha a vida eterna” João 3.16
Compartilhar