Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 DISCIPLINA: PROBABILIDADE E ESTATÍSTICA PROFª ROSEANI PARENTE 2019/1 1. INTRODUÇÃO Na teoria de estimação, vimos que é possível, por meio de estatísticas amostrais adequadas, estimar parâmetros de uma população, dentro de certo intervalo de confiança. Nos testes de hipóteses, em vez de se construir um intervalo de confiança no qual se espera que o parâmetro da população esteja contido, testa-se a validade de uma afirmação sobre um parâmetro da população. Então, em um teste de hipótese, procura-se tomar decisões a respeito de uma população com base em informações obtidas de amostras desta mesma população. A essa afirmação denominamos de Hipótese e o procedimento de tomada de decisão sobre a hipótese de Teste de Hipótese ou Teste de Significância. 2. HIPÓTESES ESTATÍSTICAS O contexto em que se baseia a teoria de teste de hipótese é basicamente o mesmo da teoria de estimação por intervalo de confiança. Temos uma população representada por uma variável aleatória X cuja distribuição de probabilidade depende de algum parâmetro θ. O interesse agora está em testar a veracidade de alguma afirmativa sobre θ. Uma Hipótese Estatística é uma afirmação sobre os parâmetros de uma ou mais populações. Para se ter certeza absoluta se uma hipótese estatística é verdadeira ou falsa seria necessário que fosse examinada toda a população, o que é impraticável na maioria das situações. Em vez disso, retiramos uma amostra aleatória da população de interesse e usamos os dados contidos nela para fornecer evidência que apoie ou refute a hipótese. São exemplos de hipóteses estatísticas: a) A altura média da população brasileira é de 1,65 m, isto é: H: µ = 1,65 m; b) A variância populacional dos salários é de $ 500, isto é, H: σ2 = 500; c) A proporção de manauaras fumantes é de 25%, ou seja, H: p = 0,25; 2.1 HIPÓTESES NULA E ALTERNATIVA Formulamos um par de afirmações (hipóteses) competitivas, mutuamente exclusivas e coletivamente exaustivas sobre o valor do parâmetro θ. Designa-se por hipótese nula (Ho) a hipótese estatística a ser testada. É a alegação que se conhece como verdadeira acerca do valor de um parâmetro populacional (recomenda-se que sempre contenha a condição de igualdade). Ao testarmos uma hipótese nula, chegamos a uma conclusão: rejeitá-la ou não rejeitá-la. A hipótese alternativa (H1) é a afirmação que deve ser verdadeira se a hipótese nula é falsa. É a hipótese do pesquisador e é, em geral, formulada em termos de uma desigualdade (≠, < ou >). Nesse texto consideraremos apenas hipóteses nulas simples, isto é, hipóteses que estabelecem que o parâmetro de interesse é igual a um determinado valor. 2.2 TIPOS DE ERROS Para entendermos os erros associados a um teste de hipóteses, precisa ficar claro que estamos avaliando uma afirmação (hipótese) sobre a população. Enfatizamos que a verdade ou a falsidade de uma hipótese particular pode nunca ser conhecida com certeza, a menos que possamos examinar a população inteira. Isso é geralmente impossível em muitas situações práticas. Num teste de hipóteses podemos cometer dois tipos de erro: pode-se rejeitar uma hipótese nula quando ela é de fato verdadeira ou não rejeitar uma hipótese nula quando ela é, de fato, falsa. A decisão é sempre tomada em referência à hipótese nula. O quadro abaixo resume os possíveis erros e acertos de um teste: DECISÃO BASEADA NO TESTE SITUAÇÃO REAL (DESCONHECIDA) H0 é verdadeira H1 é verdadeira Rejeite H0 Decisão incorreta(Erro Tipo I) Decisão correta Não Rejeite H0 Decisão correta Decisão incorreta(Erro Tipo II) A rejeição de uma hipótese nula verdadeira é chamada "Erro Tipo I" e a aceitação de uma hipótese nula falsa constitui um "Erro Tipo II". As probabilidades desses dois tipos de erros são designadas, respectivamente, por α e β. 2 A probabilidade do erro do tipo I é denominada Nível de Significância do teste. Observe que o erro tipo I só poderá acontecer se for rejeitada Ho e o erro tipo II quando não for rejeitada Ho. Os riscos de α e β só podem ser simultaneamente reduzidos pelo aumento do tamanho da amostra (coletando-se mais evidências), o que nem sempre é possível ou possui custo benefício positivo. A escolha do nível de significância (α) do teste deve preceder a realização do mesmo. 2.3 ESTATÍSTICA DE TESTE É uma estatística amostral ou um valor baseado nos dados amostrais. Mede a distância entre o que foi observado na amostra e o que é esperado caso a hipótese nula seja verdadeira. Utiliza-se uma estatística de teste para tomar uma decisão sobre a rejeição da hipótese nula. 2.4 REGIÃO CRÍTICA (REGIÃO DE REJEIÇÃO) É formada pelo conjunto de todos os valores da estatística de teste que levam à rejeição da hipótese nula. 2.5 VALOR CRÍTICO É o valor, ou valores, que separa(m) a região crítica dos valores da estatística de teste que não levam à rejeição da hipótese nula. Exemplo 1: Uma máquina automática de encher pacotes de café enche-os segundo uma distribuição normal , com média µ e variância igual a 400 g2. A máquina foi regulada para encher os pacotes com uma média de µ = 500g. Periodicamente é colhida uma amostra de 16 pacotes para se verificar se a produção esta sob controle. Se uma dessas amostras apresentasse uma média de 492g ( g) você pararia ou não a produção sob a suspeita da máquina estar desregulada? Considere um nível de significância de 1%. Solução: X: peso dos pacotes de café de 500g ~ N(µ ; 400) Hipóteses: Hipótese nula H0: µ = 500 g Hipótese alternativa H1: µ ≠ 500 g Uma amostra de 16 pacotes: g. Lembrando que ~ N . Nível de significância: α = 0,01. Nível de confiança: (1 - α) = 0,99. 3. TESTE DE SIGNIFICÂNCIA PARA UMA MÉDIA POPULACIONAL O teste para a média populacional é aplicável quando queremos verificar se uma variável na população pode ser considerada, em média, igual a certo valor µ0. As hipóteses possíveis são: H0: µ = µ0 versus H1: µ µ0 (teste bilateral) H1: µ > µ0 (teste unilateral à direita) H1: µ < µ0 (teste unilateral à esquerda) a) No caso bilateral (H1: µ µ0 ) as regiões de rejeição (crítica) e de aceitação serão definidas de acordo com o α (nível de significância) desejado: O valor tabelado da distribuição normal, nesse caso, |Zα/2|, é definido como valor crítico que delimitada a entrada na região de rejeição da hipótese nula. 3 b) No caso do teste unilateral à direita (H1: µ > µ0), as regiões de rejeição (crítica) e de aceitação são definidas em função do nível de significância conforme figura abaixo: O valor tabelado da distribuição normal, nesse caso, Zα, é definido como valor crítico que delimitada a entrada na região de rejeição da hipótese nula. c) E, finalmente, no caso do teste unilateral à esquerda (H1: µ < µ0), as regiões de rejeição (crítica) e de aceitação são definidas em função do nível de significância conforme figura abaixo: O valor tabelado da distribuição normal, nesse caso, - Zα, é definido como valor crítico que delimitada a entrada na região de rejeição da hipótese nula. Consideraremos duas situações: a) Quando existe alguma informação sobre a variância populacional (σ2); e b) Quando não há essa informação (σ2 desconhecida). 3.1 TESTE DE UMA AFIRMAÇÃO SOBRE UMA MÉDIA (2 CONHECIDA) De acordo com o Teorema Central do Limite, se obtemos amostras grandes (n > 30) de qualquer população com qualquer distribuição, a distribuição das médias amostrais pode ser aproximada por uma distribuição normal com média µ e variância . A estatística de teste neste caso é definida por: , onde: µ0 = o valor da média sob a hipótese nula. n = o tamanho da amostra. = a média amostral; σ = o desvio padrão populacional. Regra de Rejeição da Hipótese Nula: Se o valor da estatística do teste ZCALC cair na região de rejeição (Região Crítica) definida pelo valor crítico tabelado da distribuição normal, rejeita-se Ho. Ao rejeitar a hipótese nula (Ho) existe uma forte evidência de sua falsidade.Ao contrário, quando não rejeitamos Ho, dizemos que não houve evidência amostral significativa no sentido de permitir a sua rejeição. Se a variância da população for desconhecida e a amostra for grande (n > 30), mesmo com a substituição de σ por S (desvio padrão amostral), ainda será possível usar a aproximação pela distribuição normal. 4 Exemplo 2: O tempo para transmitir 10MB em determinada rede de computadores varia segundo um modelo normal, com média de 7,4 segundos e variância de 1,3 segundos2. Depois de algumas mudanças na rede, acredita-se numa redução no tempo de transmissão de dados. Foram realizados 10 ensaios independentes com um arquivo de 10MB e foram anotados os tempos de transmissão, em segundos: 6,8 7,1 5,9 7,5 6,3 6,9 7,2 7,6 6,6 e 6,3. Existe evidência suficiente de que o tempo médio de transmissão foi reduzido? Considere um nível de significância de 1%, Solução: X = tempo de transmissão de pacotes de 10MB µ = 7,4 segundos e σ2 = 1,3 segundos2 X ~ N (7,4 ; 1,3) N = 10 e segundos. Lembrando que ~ N As hipóteses são: H0: µ = 7,4 segundos H1: µ < 7,4 segundos A estatística de teste: O valor tabelado da distribuição Normal padrão considerando um nível de significância de 1% é igual a: -2,33. Logo, como o valor calculado é maior que o valor crítico não se rejeita a hipótese nula. Logo, não há evidências amostrais suficientes para se afirmar que o tempo médio de transmissão foi reduzido. 3.2 TESTE DE UMA AFIRMAÇÃO SOBRE UMA MÉDIA (2 DESCONHECIDA) Se a população tem distribuição normal o desvio padrão da população é desconhecido e a amostra é, estatisticamente pequena (n ≤ 30), a estatística de teste segue a distribuição t de Student com (n - 1) graus de liberdade. A estatística de teste fica então definida por: , onde: µ0 = o valor da média sob a hipótese nula. n = o tamanho da amostra. = a média amostral; S = o desvio padrão amostral. Regra de Rejeição da Hipótese Nula: Se o valor da estatística do teste tCALC cair na região de rejeição (Região Crítica), definida pelo valor crítico tabelado da distribuição t de Student, rejeita-se Ho. Ao rejeitar a hipótese nula (Ho) existe uma forte evidência de sua falsidade. Ao contrário, quando não rejeitamos Ho, dizemos que não houve evidência amostral significativa no sentido de permitir a sua rejeição. 4. TESTE DE SIGNIFICÂNCIA PARA UMA PROPORÇÃO POPULACIONAL As proporções são frequentemente usadas em situações de controle de qualidade porque a coleta de dados de proporção é simples. Para conduzir um teste de hipótese, precisamos saber qual é o parâmetro a ser testado, qual é a estatística amostral usada para estimar o parâmetro e qual é a distribuição amostral dessa estatística. Já vimos que uma proporção amostral estima a proporção populacional p. Pelo teorema Central do Limite, conforme o tamanho da amostra aumenta, a distribuição da proporção amostral se aproxima de uma distribuição normal com média p e desvio padrão . As hipóteses possíveis são: H0: p = p0 versus H1: p p0 (teste bilateral) H1: p > p0 (teste unilateral à direita) H1: p < p0 (teste unilateral à esquerda) 5 A estatística de teste neste caso é definida por: onde: p0 = o valor da proporção sob a hipótese nula. n = o tamanho da amostra. = a proporção amostral; a) Regra de Rejeição da Hipótese Nula: Se o valor da estatística do teste ZCALC cair na região de rejeição (Região Crítica) definida pelo valor crítico tabelado da distribuição normal, rejeita-se Ho. Ao rejeitar a hipótese nula (Ho) existe uma forte evidência de sua falsidade. Ao contrário, quando não rejeitamos Ho, dizemos que não houve evidência amostral significativa no sentido de permitir a sua rejeição. O valor de p0 (proporção na população) a ser testado é um valor de referência, tal como o desempenho no passado ou uma especificação do produto. EXERCÍCIOS 1. A associação dos proprietários de indústrias metalúrgicas está muito preocupada com o tempo perdido com acidentes de trabalho, cuja média, nos últimos tempos, tem sido da ordem de 60 horas/homem por ano e desvio padrão de 20 horas/homem. Assuma uma distribuição normal para os tempos perdidos com acidentes nessas indústrias. Tentou-se um programa de prevenção de acidentes, após o qual foi tomada uma amostra aleatória de nove indústrias e medido o número médio de horas/homens perdidos por acidentes, que foi de 50 horas. Você diria no nível de significância de 5% que há evidência de melhoria? 2. O tempo médio, por operário, para executar uma tarefa, tem sido 100 minutos, com um desvio-padrão de 15 minutos. Introduziu-se uma modificação para diminuir esse tempo, e, após certo período, sorteou-se uma amostra de 16 operários, medindo-se o tempo de execução de cada um. O tempo médio da amostra foi de 85 minutos, e o desvio-padrão foi 12 minutos. Esses resultados trazem evidências estatísticas da melhoria desejada? Considere um nível de significância de 5%. 3. Uma empresa produz saquinhos de salgadinhos com peso médio de 500g. Para verificar se a máquina de empacotar está trabalhando corretamente o controle de qualidade tomou uma amostra aleatória de 50 saquinhos, que apresentou uma média de 475g e desvio padrão de 30g. Os dados obtidos proporcionam evidências suficientes para concluir que a máquina de empacotar não está trabalhando adequadamente (ou seja, a máquina empacota com pesos diferentes do proposto)? Realize o teste com nível de significância de 1%. 4. A duração das lâmpadas produzidas por certo fabricante tem distribuição normal com média igual a 1200 horas e desvio padrão igual a 300 horas. O fabricante introduz um novo processo na produção das lâmpadas. Para verificar se o novo processo produz lâmpadas de maior duração, o fabricante observa uma amostra aleatória de 100 lâmpadas produzidas pelo novo processo e constata que as mesmas duram em média 1265 horas. Admitindo-se um nível de significância de 5%, pode-se concluir que o novo processo produz lâmpadas com maior duração? 5. O controle de qualidade das peças produzidas por certa fábrica exige que o diâmetro médio das mesmas seja 57 mm. Para verificar se o processo de produção está sob controle, observam-se os diâmetros de uma amostra aleatória de 10 peças, constatando-se os seguintes valores em mm: 56,5; 56,6; 57,3; 56,9; 57,1; 56,7; 57,1; 56,8; 57,1; 57,0. Admitindo-se um nível de significância de 5%, pode-se concluir que o processo de produção está sob controle? 6. O tempo de montagem de determinados conectores utiliza um processo já há algum tempo, que dura em média 3,5 segundos. Está sendo analisada a possibilidade de troca deste processo para outro que se afirma possuir um tempo de montagem menor. Para esta análise foram observados numa amostra aleatória os tempos de montagem de conectores por um operário padrão utilizando o novo processo e foram anotados os seguintes valores (em segundos): 2,5 2,5 2,6 3,0 3,2 3,5 3,7 3,7 2,1 2,4 6 2,7 2,8 3,1 3,1 3,6 3,6 2,5 2,9 2,8 3,8 Considerando a situação exposta acima e utilizando um nível de confiança de 95%: a) Estime o tempo médio de montagem dos conectores utilizando o novo processo. b) Calcule o tamanho mínimo da amostra que seria necessária para estimar a média com 95% de confiança e erro de 0,1 segundos. c) A empresa deve mudar para o novo processo ou manter o atual? 7. O tempo médio de atendimento em uma agência lotérica está sendo analisado por técnicos. Uma amostra aleatória de 40 clientes foi sistematicamente monitorada em relação ao tempo que levavam para serem atendidos, obtendo-se as seguintes estatísticas: tempo médio de atendimento de 195 segundos e desvio padrão de 15 segundos. Considerando que o tempo de utilização segue uma distribuição normal: a) Faça uma estimação por intervalo para o tempo médio de utilização para toda a população de clientes da agência lotérica, utilizando um nível de confiança de 95%. b) A amostra utilizada seria suficiente se fosse exigidauma precisão de 1 minuto? c) O dono da agência garante que o tempo médio de atendimento é de 3 minutos (se for maior ele se compromete a contratar mais um atendente). Com base nos dados da amostra a afirmação do dono é verdadeira ou ele deve contratar um novo atendente? Use um nível de significância de 1%? 8. Buscando melhorar a qualidade do serviço, uma empresa estuda o tempo de atraso na entrega dos pedidos recebidos. Supondo que o tempo de atraso se encontra normalmente distribuído, e conhecendo o tempo de atraso de uma amostra aleatória dos últimos 20 pedidos, descritos abaixo (em dias), determine: 5 1 0 3 6 10 2 3 4 1 5 3 1 6 6 9 0 0 1 0 a) Estime por intervalo o atraso médio na entrega dos pedidos com confiança de 90%. b) Para a situação do item a (variância populacional desconhecida), o tamanho da amostra é suficiente, se é necessária uma precisão de 0,5 dias, para o mesmo nível de confiança? c) Um cliente enfurecido quer testar estatisticamente a hipótese (declarada pela empresa) de que o atraso médio será de no máximo 1 dia. Ele argumenta que deve ser maior e quer uma confiança de 99%. O cliente tem razão na sua reclamação? 9. O nível de aprovação da qualidade das refeições servidas em um restaurante universitário era de 20%, quando houve uma movimentação geral dos estudantes que forçou a direção do restaurante a fazer mudanças. Feitas as mudanças, sorteia-se uma amostra de 64 estudantes usuários do restaurante e 25 aprovam a qualidade da comida. Você diria, ao nível de significância de 5%, que as mudanças surtiram efeito? 10. Uma máquina produz peças classificadas como boas ou defeituosas. Retirou-se uma amostra aleatória de 1000 peças da produção, verificando-se que 35 eram defeituosas. O controle de qualidade faz a parada da linha de produção para rearranjo dos equipamentos envolvidos quando o percentual de defeituosos é superior a 3%. a) Determinar um intervalo de 95% de confiança para a proporção de peças defeituosas. b) Se há interesse em obter um intervalo de 95% de confiança, com precisão de 1,5%, para a proporção de peças defeituosas, a amostra retirada é suficiente? c) Baseado nos dados amostrais a linha de produção deve ser parada? 11. A satisfação da população em relação a determinado governo foi pesquisada através de uma amostra aleatória com a opinião de 1000 habitantes do estado. Destes, 585 se declararam insatisfeitas com a administração estadual. Admitindo-se um nível de significância de 5%, solucione os itens abaixo. a) Estime o percentual da população que está insatisfeita com a administração estadual. b) Qual o tamanho da amostra necessária para a estimação se a empresa responsável pela pesquisa estipulou uma folga máxima de 2,5%? c) A atual administração decidiu que se o percentual de descontentamento fosse superior a 50% deveria ser redirecionado o plano governamental. Utilizando a informação amostral o que você concluiria? 7 12. Em uma pesquisa de mercado, acerca da preferência pelo produto X, 300 consumidores foram entrevistados, sendo que 100 declararam consumir o produto. a) O fabricante quer que você determine um intervalo de 95% de confiança para a proporção populacional de pessoas que consomem o produto. b) Um dos diretores do fabricante exige que o intervalo de confiança para a proporção populacional tenha 99% de confiança, com um erro máximo de 2,5%. A amostra retirada satisfaz estes critérios? c) No passado, o produto X era a marca líder de mercado, com cerca de 40% da preferência do consumidor. Com base nos dados, e usando uma significância de 1%, a marca ainda tem a liderança? RESPOSTAS: 1) Zcalc = -1,50 Conclusão: Não rejeitar H0; 2) Zcalc = -4,00 Conclusão: Rejeitar H0; 3) Zcalc = -5,90 Conclusão: Rejeitar H0; 4) Zcalc = 2,17 Conclusão: Rejeitar H0; 5) tcalc = -1,13 Conclusão: Não Rejeitar H0; 6) a) IC = [2,77 ; 3,25]; b) n = 114; c) tcalc = -4,45 Conclusão: Rejeitar H0 7) a) IC = [190,35 ; 199,65]; b) Sim; c) Zcalc = 6,33 Conclusão: Rejeitar H0 8) a) IC = [2,136 ; 4,464]; b) n = 109 Não; c) tcalc = 3,418 Conclusão: Rejeitar H0 9) Zcalc = 4,34 Conclusão: Rejeitar H0; 10) a) IC = [0,024 ; 0,046]; b) n = 577 Sim; c) zcalc = 1 Conclusão: Não Rejeitar H0 11) a) 0,585; b) n = 1493 c) Zcalc = 5,313 Conclusão: Rejeitar H0; 12) a) IC = [0,280 ; 0,386]; b) n = 968 Não; c) zcalc = -2,393 Conclusão: Rejeitar H0
Compartilhar