Baixe o app para aproveitar ainda mais
Prévia do material em texto
Curso de Administração - UVA Estatística Aplicada à Administração – Notas de aulas –Profª Marta Numa pesquisa para estudar a preferência do eleitorado a uma semana da eleição presidencial, qual o tamanho de uma amostra aleatória simples de eleitores, que garanta, com alta confiança, um erro amostral não superior a 2%; 3%; 4% e 5.7%? Maioria defende fechamento de bares à 1 h em SP*. A maioria absoluta dos paulistanos é favorável ao projeto que proíbe o funcionamento na cidade e restaurante que não tenham isolamento acústico, seguranças e estacionamento. Foi o que disseram 67% dos 630 entrevistados pelo DataFolha na última quinta-feira na cidade de São Paulo. A margem de erro é de quatro pontos percentuais, para mais ou para menos. Uma das principais explicações para um percentual tão grande de apoio à medida é que oitenta por cento da população da cidade não costuma freqüentar bares após 1h e, portanto, não se sente prejudicada pela restrição ao funcionamento das casas”. 56% reprovam lei que fecha bares à 1 hora**. A maioria dos moradores de São Paulo é contra o fechamento dos bares à 1 hora. Pesquisa InformEstado feita na capital mostra que 56% da população não concorda com o projeto de lei aprovado na semana passada pela Câmara Municipal. A resistência à medida vem, principalmente, dos jovens de 18 a 29 anos (67,5% contra), dos que têm instrução superior (62,85) dos entrevistados. Ele é maior entre as mulheres (45,4% a favor do fechamento), os que têm mais de 50 anos (55,1%), o primeiro grau incompleto (67,1%) e entre os que recebem até cinco salários mínimos (53,5%)... O InformEstado entrevistou 622 pessoas. A margem de erro é de quatro pontos percentuais. *Artigo de José Roberto de Toledo publicado no Jornal Folha de São Paulo em 27/06/99 ** artigo de Marcelo Godoy no Jornal de São Paulo em 27/06/99. ESTIMAÇÃO - é o processo que consiste em utilizar dados amostrais para estimar os valores de parâmetros populacionais desconhecidos. Essencialmente, qualquer característica de uma população pode ser estimada a partir de uma amostra aleatória. Entre os mais comuns, estão a média e o desvio padrão de uma população e a proporção populacional. As estatísticas amostrais são utilizadas como estimadores de parâmetros populacionais. Assim, uma média amostral é usada como estimativa de uma média populacional; um desvio padrão amostral serve de estimativa do desvio padrão da população; e a proporção de itens numa amostra, com determinada característica, serve para estimar a proporção da população que apresenta aquela característica. Tais estimativas chamam-se pontuais, porque originam uma única estimativa do parâmetro. Mas já sabemos que a amostragem aleatória apresenta tendência a gerar amostras em que a média amostral, por exemplo, não é igual à média da população, embora os dois valores em geral sejam próximos. Em virtude da variabilidade amostral, é usual incluir uma "estimativa intervalar" para acompanhar a estimativa pontual. Essa nova estimativa proporciona um intervalo, ou âmbito, de possíveis valores do parâmetro populacional. Estimativa pontual - estimativa única de um parâmetro populacional Estimativa intervalar - dá um intervalo de valores possíveis, no qual se admite esteja o parâmetro populacional. Confiança desejada Z Fórmula 90% 1,65 X ± 1,65 /n 95% 1,96 X ± 1,96 /n 99% 2,58 X ± 2,58 /n Intervalo de confiança - dá um intervalo de valores, centrado na estatística amostral, no qual julgamos, com um risco conhecido de erro, estar o parâmetro da população. Suponhamos que uma amostra aleatória de 100 alunos de certa universidade apresente uma renda anual média de R$ 3.800. Como esses dados resultam de apenas uma amostra aleatória, e não toda a população de alunos, não há uma maneira segura de garantir que essa renda média reflita, de fato, a renda média da população de alunos da universidade. Os intervalos de confiança podem ser construídos para qualquer nível de probabilidade. O uso do intervalo de confiança de 95% permite obter o cálculo através do qual a média populacional é estimada com a certeza de que há 95 possibilidades em 100 de estar correto; e há possibilidades em 100 de estar errado. Entretanto, mesmo usando o intervalo de confiança de 95%, deve-se Ter sempre em mente que a média amostral do pesquisador poderia ser uma daquela cinco médias amostrais que caíram fora do intervalo estabelecido. Estimação da média de uma população - é uma distribuição que indica quão prováveis são diversas médias amostrais. A distribuição é função da média e do desvio padrão da população e do tamanho da amostra. Para cada combinação de média, desvio padrão e tamanho da população haverá uma única distribuição amostral. Característica A média da distribuição amostral é sempre igual a média populacional; O desvio padrão da distribuição amostral decresce quando o tamanho da amostra aumenta Estimação da proporção numa população- o pesquisador procura obter uma estimativa duma proporção populacional a partir de uma outra proporção resultante do estudo de uma amostra casual. Uma circunstância em que isso ocorre com frequência é a chamada prévia eleitoral, cujos dados sugerem que certa proporção de votos irá para determinado partido ou determinado candidato. Quando um pesquisador de opinião pública anuncia que 45% dos votos serão a favor de certo candidato, ele o faz com a convicção de que não está 100% correto. Em geral, ele tem 95% ou 99% de confiança de que sua proporção estimada cai dentro de certa faixa de proporções (por exemplo, entre 40% e 50%). Estimamos proporções da mesma maneira utilizada para a estimação de médias. Todas as estatísticas-inclusive médias e proporções - possuem distribuições amostrais próprias. O valor esperado de uma proporção amostral é sempre igual à verdadeira proporção da população. Usa-se portanto, a proporção amostral como estimativa pontual da verdadeira proporção. Estimação 1) A polícia rodoviária fez recentemente uma pesquisa secreta sobre as velocidades desenvolvidas na rodovia no período de 2 às 4 horas da madrugada. No período de observação, 100 carros passaram por um aparelho de radar a uma velocidade média de 70 mph, com desvio padrão de 15 mph. Construa um intervalo de 98% de confiança para a média da população. 2) A tabela seguinte mostra os valores das médias e desvios padrão da renda familiar, de uma amostra de 120 famílias, da Cidade de Sobral, extraídas de três localidades (bairro). Localidade Tamanho da amostra Renda familiar (sal. Min.) Média Desvio padrão Centro 40 8,1 4,3 Junco 42 5,8 2,6 Sumaré 37 5,0 4,5 Construa um intervalo de confiança ao nível de 99% de confiança, para a renda familiar média de cada localidade, Interprete as estimativas. 3) A média aritmética dos gastos com livros de uma amostra aleatória simples de 100 estudantes do primeiro ano de Química é R$ 70,00 com desvio padrão de R$ 15,00. Construa um intervalo de 95% de confiança para o gasto médio de todos os estudantes. 4) Uma amostra aleatória de 50 empregados é tomada de uma linha de produção de 500. A média aritmética de horas extras trabalhadas por semana é cinco horas com desvio- padrão de uma hora. Construa um intervalo de 99% de confiança para a média das horas trabalhadas por semana para toda a linha de produção. 5) Seja X a variável aleatória que representa a pressão sangüíneas sistólica em indivíduos com idade entre 20 e 25 anos. Essa variável tem distribuição aproximadamente normal. Suponha que, com base em uma amostra de 100 indivíduos, foi obtida a média de 123 mm de mercúrio e desvio padrão de 8 milímetros de mercúrio. Determine o intervalo de 90% de confiança para X. 6) Numa pesquisa mercadológica, deseja-se estimar, dentre os consumidores em potencial de uma certa cidade,a proporção de consumidores que passariam a usar certo produto, após experimentá-lo pela primeira vez. Para atingir este objetivo, selecionou-se uma amostra aleatória simples de n= 200 consumidores potenciais, fornecendo-lhes amostras grátis do produto. Depois de um mês, voltou-se a contatar os consumidores da amostra, oferecendo-lhes o produto por um certo preço. Trinta por cento da amostra decidiu adquirir o produto. Construa uma estimativa intervalar, com nível de confiança de 95%. 7) Numa amostra aleatória simples de 120 domicílios, realizadas num certo bairro da cidade, observou-se que apenas 33,3% possuíam instalações sanitárias adequadas. Considerando que existam 460 domicílios no bairro, encontre um intervalo de 95% de confiança para a proporção de domicílios com instalações sanitárias adequadas. 8) Uma amostra aleatória de 100 fregueses da parte da manhã de um supermercado revelou que apenas 10 não incluem leite em suas compras. Qual seria a estimativa pontual da percentagem dos que compram leite? Construa um intervalo de 90% de confiança para a verdadeira proporção dos que compram leite. 9) De um grupo de 20 alunos de uma sala de aula, escolhidas aleatoriamente, cinco não se mostraram satisfeitos com a disciplina de Português. Há 50 alunos nessa sala de aula. Construa um intervalo de 90% de confiança para a proporção de alunos insatisfeitos. Extra 1) Uma amostra formada por 18 eixos de aço fabricados pela metalúrgica Thor Ltda. apresentou um comprimento médio igual a 1,653 m, com desvio padrão amostral igual a 0,056 m. Estime qual deve ser o verdadeiro comprimento médio dos eixos fabricados pela empresa. Assuma α igual a 5% e população normalmente distribuída. 2) Procurando diminuir o tempo de atendimento na venda de seu produto na sua loja, um administrador procurou estimar o tempo médio que a loja gasta com cada cliente. Utilizando uma amostra aleatória de 64 clientes, atendidos em uma semana, obteve um tempo médio de atendimento igual a 2,5 minutos por cliente, com desvio padrão de 1,2 minutos. Pede-se: (a) para α = 5%, estime o intervalo da média populacional; (b) determine qual o erro associado a essa estimativa. 3) Uma empresa de pesquisa mercadológica estava procurando estimar o gasto médio de uma amostra de consumidores de determinada bebida alcoólica no fim de semana. Após analisar uma amostra aleatória de 100 clientes, encontrou uma média de $ 250,00 e desvio padrão de $ 32,00. Determine a estimativa pontual da média da população e construa um intervalo de 95% de confiança para média populacional. 4) Em uma mostra aleatória por 20 comerciantes autônomos de uma região central da cidade, revelou-se que a média de rendimentos era igual a $ 200,00, com um desvio padrão de $ 45,00. Assumindo uma população normalmente distribuída, pede-se: (a) construa um intervalo de 90% de confiança para a verdadeira média; (b) construa um intervalo com 95% de confiança para verdadeira média; (c) estime o erro máximo para um intervalo de 99%. 5) Um analista obtém dados de uma amostra de 225 consumidores de um total de 600 que adquiriram uma oferta especial. As 225 pessoas gastaram, na loja, uma média de x = $ 33,42 com um desvio padrão de S = $ 5,20. Estime, com um intervalo de confiança de 95%: (a) o valor médio de compras para todos os 600 clientes; (b) o valor total das compras dos 600 clientes. 6) Uma amostra com 20 dos 85 domicílios de determinada região revelou um consumo médio de energia elétrica de 42 kw/h, com um desvio padrão igual a 13 kw/h. Qual deve ser o verdadeiro consumo médio de todos os domicílios? Assuma um nível de confiança igual a 95% e suponha população normalmente distribuída. 7) Um grupo de 153 consumidores dos Magazines Mulher Bonita indicou que 89 eram do sexo feminino. Qual deve ser a proporção de consumidores mulheres, supondo alfa igual a 5%? 8) Dos rolamentos fabricados pelas Indústrias Timbira Ltda., 82 de um lote formado por 1.564 peças apresentaram defeitos de fabricação. Supondo que a amostra fosse representativa do universo, qual deve ser o número de rolamentos com defeitos na produção mensal da empresa, formada por 100.000 unidades? Assuma alfa igual a 2%. Trabalhe com intervalos: (a) bilateral (b) unilateral 9) A tabela seguinte apresenta os dados referentes a uma amostra representativa de funcionários da Multilar Equipamentos Ltda. Com base nos números fornecidos, encontre, para a população: (a) a proporção de indivíduos do sexo masculino; (b) a proporção de indivíduos com mais de 40 anos; (c) a proporção de mulheres com igual ou menos de 40 anos em relação ao total de funcionários. Assuma α igual a 3%. Idade Homem Mulher Igual anos ou menor que 40 14 23 Mais que 40 anos 39 47 10) Numa pesquisa com 150 eleitores, o candidato Fulano de Tal obteve 0,38 da preferência dos eleitores. Construa, para um nível de confiança a 95%, o intervalo para a proporção de votos a serem recebidos pelo candidato mencionado, supondo que a eleição fosse nesse momento. 11) Em uma amostra de 500 pessoas, 350 mostraram-se dispostas a fazer cursos de reciclagem profissional. Calcule o valor da proporção populacional de pessoas que gostariam de fazer cursos de reciclagem profissional. Assuma um nível de confiança de 95%. 12) Qual seria o tamanho da amostra necessária para estimar o tempo médio para acessar a Internet através do provedor Acesso Grátis, sabendo-se que o erro máximo deve ser de 0,9 min para um nível de confiança de 99% e que o tempo de acesso tem desvio de 3 min? 13) Imagine-se que as compras médias por pessoa em um determinado centro comercial seja aproximadamente igual a $ 35,00, com um desvio de $ 7,50. Assumindo um erro tolerável de 1%, qual deveria ser o tamanho da amostra analisada para poder realizar um processo de inferência estatística mais correto? Assuma alfa igual a 5% 14) Para uma amostra aleatória de 100 domicílios em uma grande metropolitana, o número de domicílios nos quais ao menos um adulto se encontra atualmente desempregado é igual a 15. Estima a percentagem de domicílios na área nos quais há pelos menos um adulto desempregado, utilizando o intervalo de confiança de 90%. 15) Um auditor analisou 20% de todas as 130 vendas efetuadas pela empresa Atacados Preço Bom Ltda. no mês de fevereiro de 2.000. Encontrou uma média igual a $ 1.575,00 e um desvio padrão igual a $ 285,00. Qual deve ser a verdadeira venda média da empresa? Estime um nível de confiança igual a 95% e suponha população normalmente distribuída. 16) Após analisar dez vendas, a empresa Comercial de Doces Saborosos Ltda. encontrou uma média igual a $ 56,98 e um desvio padrão igual a $ 3,12. Qual o valor da verdadeira média populacional das vendas da empresa? Estime um nível de confiança igual a 95% e suponha população normalmente distribuída. 17) Numa tentativa de melhorar o atendimento do serviço de atendimento ao cliente (SAC), os funcionários procuraram estimar o tempo médio que gastam em cada cliente. Uma amostra aleatória formada por 60 atendimentos colhida no período de três semanas acusou uma média de 30 min. Com desvio padrão de 6 min. Construa o intervalo de confiança de 95% para o verdadeiro tempo médio gasto em cada atendimento. Testes de hipóteses A Divisão de Comunicações da Harris Corporation, em Melbourne, Flórida, é uma grande fabricante de equipamento de rádiocomunicação ponto a ponto. Ela é uma empresa de fabricação integrada horizontalmente com uma fábrica de várias aplicações. A maioria dos produtos da Harris exige operações de produção de médio a grande volume, incluindo montagem de circuitos impressos, montagem do produto final e testes. Um dos produtos de grande volume da empresa possui uma montagem chamada de módulo de RF. Cada módulo de RF consiste de 16 componentes eletrônicos soldados a uma forma usinada que compõea superfície chapeada do módulo. Durante uma campanha de fabricação, um problema se desenvolveu no processo de soldagem, o fluxo de solda sobre o módulo não satisfez o critério de qualidade estabelecido para o produto. Depois de considerar uma variedade de fatores que poderiam Ter afetado o processo de soldagem, um engenheiro teve a constatação preliminar de que o problema de soldagem foi, muito provavelmente, devido ao chapeamento defeituso. O engenheiro questionou-se se a proporção de chapeamentos defeituosos no estoque da Harris excedeu aquele estabelecido pelas especificações de projeto do fornecedor. Com indicando a proporção de chapeamento defeituosos no estoque da Harris e o indicando a proporção de chapeamentos defeituosos estabelecida pelas especificações de projeto do fornecedor, as seguintes hipóteses foram formuladas. Ho: o H1: p o Ho indica que o estoque da Harris tem uma proporção de chapeamento defeituosa menor ou igual àquela estabelecida pelas especificações de projeto. Tal proporção seria julgada aceitável e o engenheiro necessitaria procurar por outras causas do problema de soldagem. No entanto, H1 indica que o estoque da Harris tem uma proporção de chapeamentos defeituosos maior do que aquela estabelecida pelas especificações de projeto. Naquele caso, excessivos chapeamentos defeituosos bem poderiam ser a causa do problema de soldagem, e ações seriam tomadas para se determinar por que a proporção defeituosa no estoque é tão alta. Testes feitos na amostra dos chapeamentos do estoque da Harris resultaram na rejeição de Ho. A conclusão foi de que H1 era verdadeiro e que a proporção dos chapeamentos defeituosos no estoque excedia aquela estabelecida pelas especificações de projeto do fornecedor. Investigação posterior da área de estoque levou à conclusão de que o problema subjacente era contaminação nas prateleiras durante a estocagem. Alterando-se o meio ambiente da estocagem, o engenheiro foi capaz de resolver o problema Nesta apostila você aprenderá como formular hipóteses sobre a média e a proporção da população. O teste de hipótese estatístico é o mais generalizado instrumento de indução estatística, tendo aplicações em variados setores das ciências naturais e sociais. Dado um problema de pesquisa, o pesquisador precisa saber escrever a chamada hipótese de trabalho ou hipótese nula. Esta hipótese é, basicamente uma negação daquilo que o pesquisador deseja provar. Hipótese nula - tornou-se habitual em análise estatística começar pelo teste da chamada hipótese nula - que, em termos bem simples, afirma terem duas amostrar sido extraídas da mesma população. De acordo com a hipótese nula, qualquer diferença observada entre as amostras é considerada como uma ocorrência casual, mero resultado de erro amostral. Portanto, uma diferença entre duas médias amostrais não representa, à luz da hipótese nula, uma verdadeira diferença entre as médias populacionais. A hipótese nula é em geral (embora não necessariamente) estabelecida com a esperança de que possa ser rejeitada. Quando os dados mostrarem evidência suficiente de que a hipótese nula (Ho) é falsa, o teste a rejeita, aceitando em seu lugar a chamada hipótese alternativa (H1). Hipótese alternativa - é, em geral, aquilo que o pesquisador quer provar, ou seja, a própria hipótese de pesquisa, considerando a forma do planejamento e execução da pesquisa. É comum Ho ser apresentada em termos de igualdade de parâmetros populacionais, enquanto H1 em forma de desigualdades (maior, menor ou diferente) Resumo das formas para as hipóteses Nula e Alternativa Seja o denotado o valor numérico específico que está sendo considerado nas hipóteses nula e alternativa. Em geral, um teste de hipótese ao redor dos valores de uma média de população precisa tomar uma das seguintes três formas: Ho: o Ho: o Ho: = o H1: o H1: o Ho: o Em muitas situações, a escolha de Ho e H1 não é óbvia e é necessário julgamento para selecionar a forma apropriada. No entanto, como as formas acima mostram, a parte da igualdade da expressão (tanto , ou =) sempre aparecerá na hipótese nula. Ao selecionar a forma apropriada de Ho e H1 tenha em mente que a hipótese alternativa é que o teste está tentando estabelecer. Para melhor compreender a formulação das hipóteses procure resolver os exercícios abaixo: Exercício 1. o gerente do Hotel Vila Real estabeleceu que a quantia média gasta pelos hospedes em um fim de semana é de R$ 400,00 ou menos. Um membro do corpo de funcionários de contabilidade do hotel notou que as despesas totais para os hóspedes de fim de semana têm aumentado nos últimos meses. O contador usará uma amostra de contas de hóspedes de fim de semana para testar a afirmação do gerente. a) que forma de hipóteses deve ser usada para testar a afirmação do gerente? Explique. Ho: 400 Ho: 400 Ho: = 400 H1: 400 H1: 400 Ho: 400 b) que conclusão é apropriada quando Ho não pode ser rejeitada? c) Que conclusão é apropriada quando Ho pode ser rejeitada? 2. o gerente de uma revenda de automóveis está considerando um novo plano de bônus concebido para aumentar o volume de vendas. Atualmente, o volume médio de vendas é de 14 automóveis por mês. O gerente quer realizar uma pesquisa para ver se o novo plano de bônus aumentará o volume de vendas. Para coletar dados sobre o plano, uma amostra do pessoal de vendas terá permissão de realizar vendas sob o novo plano de bônus por um período de um mês. a) desenvolva as hipóteses nula e alternativa mais apropriadas para essa situação de pesquisa. b) Comente a conclusão quando Ho não pode ser rejeitada c) Comente a conclusão quando Ho pode ser rejeitada. Nível de significância () - de um teste é a probabilidade de uma hipótese nula ser rejeitada, quando verdadeira 3. Uma operaçõa de lina de produção foi programa para colocar 320 mg de detergente em pó em cada caixa de papelão. Uma amostra de caixas de papelão é periodicamente selecionada e pesada para determinar se está ocorrendo subenchimento ou sobreenchimento. Se os dados da amostra levarem à conclusão de subenchimento ou sobreenchimento, a linha de produção será paralisada e calibrada para se obter o enchimento apropriado das caixas. a) formule as hipóteses nula e alternativa que auxiliarão a decisão de paralisar e calibrar a linha de produção. Tipos de erros seja: Na realização de um teste de hipótese, dois erros podem ser contidos, ou 1 - Erro tipo I - é aquele que se comete ao rejeitar uma hipótese que é correta; a probabilidade desse erro será simbolizado por e é definida pelo nível de significância exigido no teste. 2 - Erro tipo II - é aquele que se comete ao aceitar uma hipótese que é incorreta; a probabilidade desse erro será simbolizada por . Esquematicamente, o quadro a seguir mostra as diversas situações que podem ocorrer num teste de hipóteses: Decisão / Realidade Ho verdadeira H1 falsa Aceitar Ho Decisão correta Probabilidade = 1 - Erro tipo II Probabilidade = Rejeitar Ho Erro tipo I Probabilidade = Decisão correta Probabilidade = 1 - Na realização de uma pesquisa quando se deseja confirmar ou rejeitar alguma hipótese, é comum estabelecer, a priori, o valor da probabilidade tolerável de incorrer no erro de rejeitar Ho, quando como nível de significância do teste e é designada pela letra . Em pesquisa social é comum adotar o nível de significância de 5% (0,05) e 1% (0,01). Embora a maioria das aplicações de teste de hipóteses esteja atenta à probabilidade de se cometer um erro do tipo I, nem sempre estão atentas à probabilidade de se cometer um erro do tipo I. Por isso se decidimos aceitar Ho não podemos estar com aquela decisão. Por causada incerteza associada com o cometer um erro do tipo II, os estatísticos freqüentamente recomendam que usemos a declaração "não rejeitar Ho", em vez de "aceitar Ho". Com muitas aplicações de teste de hipóteses tem um objetivo de tomada de decisão. A declaração "não rejeitar Ho", embora inconclusiva, freqüentemente força as pessoas a se comportarem como se Ho fosse verdadeira. Neste caso, precisamos estar cientes do fato de que tal comportamento pode revestir num erro do tipo II. O quadro abaixo dá os valores de z tanto para testes unilaterais como para testes bilaterais, a vários níveis de significância. Os valores críticos de z para outros níveis de significância podem ser obtidos utilizando-se a tábua de áreas sob a curva normal. Níveis de significância 0,10 0,05 0,01 0,005 0,002 Valores críticos de z para testes unilaterais - - - - - 1,28 ou 1,645 ou 2,33 ou 2,58 ou 2,88 ou 1,28 1,645 2,33 2,58 2,88 Valores críticos de z para testes bilaterais - - - - - 1,645 e 1,96 e 2,58 e 2,81 e 3,08 e 1,645 1,96 2,58 2,81 3,08 Fonte: SPIEGEL, 1978; 302 Exercício 1) Os americanos gastam uma média de 8,6 minutos por dia lendo jornais. Um pesquisador acredita que os indivíduos nas posições de gerência gastam mais do que o tempo médio nacional por dia lendo jornais. Uma amostra dos indivíduos em posições de gerenciamento será selecionado pelo pesquisador. Os dados sobre os tempos de leitura de jornais serão usados para testas as seguintes hipóteses nula e alternativa Ho: 8,6 H1: 8,6 Qual é o erro do tipo I nessa situação? Quais as conseqüencias de se cometer esse erro? 2) O rótulo em um recipiente de três quartos de suco de laranja indica que o suco de laranja contém uma média de uma grama de gordura ou menos. Responda às seguintes questões para um teste de hipóteses que poderia ser usado para testar a declaração no rótulo. a) desenvolva as apropriadas hipóteses nula e alternativa. b) Qual é o erro do tipo I nessa situação? Quais são as consequencias de se cometer esse erro? Testes unicaudais Examinemos o seguinte caso: o rótulo em um grande recipiente de lata afirma que o recipiente contém pelo menos três quilos de uma determinada substância. Suponha que queiramos verificar esta afirmação usando o teste de hipóteses. n / Suponha que uma amostra de 36 recipientes forneça uma média de X = 2,97 kg e que nós sabemos por estudos prévios que o desvio padrão da população é = 0,18. A 1ª etapa é desenvolver as hipóteses nula e alternativa. Ho: = 3,0 kg H1: 3,0 kg 2ª etapa: selecionar a estatística de teste que será usada para decidir rejeitar ou não a hipótese nula. Sabemos que sempre que o tamanho da amostra é grande (n 30), a distribuição de amostragem de x pode ser aproximada por uma distribuição normal de probabilidade. Para testes de hipóteses ao redor da média da população, usaremos Z como uma estatística do teste. 3ª etapa: especificar o nível de significância para o teste: = 1% = 0,01 4ª etapa: utilizar o nível de significância para desenvolver a regra de rejeição que indica os valores da estatística teste que levará à rejeição de Ho. 5ª etapa - Calcular o valor da estatística teste. Z = x - o 6ª etapa - compara o valor da estatística do teste com o(s) valor (es) crítico (tabelado) especificado na regra de rejeição para determinar se Ho deve ser rejeitado. Teste de hipótese de grande amostra (n 30) da média da população para um teste unicaudal da forma Ho: o H1: o Estatística do teste: conhecido Z = x - o n / Estatística do teste: desconhecido Z = x - o n s / Regra de rejeição a um nível de significância de Rejeitar Ho se z - z Teste de hipótese de grande amostra (n 30) da média da população para um teste unicaudal da forma Ho: o H1: o Estatística do teste: conhecido Z = x - o n / Estatística do teste: desconhecido Z = x - o n s / Regra de rejeição a um nível de significância de Rejeitar Ho se z - z Teste unicaudais da média da população 1º caso 2º caso Uso dos valores de p Pequenos valores p levam à rejeição de Ho, enquanto grandes valores p indicam que a hipótese nula não pode ser rejeitada, ou seja, p é menor do que o nível de significância rejeita-se Ho. Uma outra abordagem que pode ser usada para se decidir rejeitar Ho ou não está baseada numa probabilidade chamada de uma valor p. se assumirmos que a hipótese nula é verdadeira, o valor p é a probabilidade de se obter um resultado de amostra que é pelos menos tão improvável quanto aquele que é observado. O valor de p pode ser usado para se tomar a decisão em um teste de hipótese notando-se que se o valor de p é menor do que o nível de significância , o valor da estatística do teste está na região de rejeição. Analogamente, se o valor p, é maior ou igual a , o valor da estatística do teste, não está na região de rejeição. O valor de p e a corresponde estatística de teste sempre fornecerão a mesma conclusão de teste de hipóteses. Quando a região de rejeição está na cauda inferior da distribuição de amostragem, o valor p é a área sob a curva menor ou igual à estatística. Quando a região de rejeição está na cauda superior da distribuição normal , o valor p é a área sob a curva maior ou igual a estatística. Resumindo: Exercício 1) Considere o seguinte teste de hipóteses: Ho: 15 H1: 15 Uma amostra de 40 fornece uma média de amostra de 16,5 e um desvio padrão de 7. Com = 0,05, qual é o valor crítico para z e qual é a regra de rejeição Calcule o valor da estatística de teste z. Qual é a sua conclusão? 2) considere o seguinte teste de hipóteses. Ho: 25 H1: 25 Uma amostra de 100 é utilizada e o desvio padrão da população é 12. Forneça o valor da estatística de teste z e sua conclusão para cada um dos seguintes resultados da amostra. Use = 0,05 a) x = 22,0 b) x = 24,0 c) x = 23,5 d) x = 22,8 3) Os brasileiros que deram entrada na declaração do imposto de renda de 2001 antes de 30 abril de 2002 tem uma restituição de R$ 1.056,00. Considere a população de entregadores de "última hora" que despacharam suas declarações durante os últimos cinco dias do período de entrega do imposto de renda (praticamente 25 a 30 de abril). 4) Um pesquisador sugere que uma das razões para que os indivíduos esperem até os últimos cinco dias para entregar suas declarações é que em média eles têm uma restituição mais baixa do que os primeiro entregadores. Desenvolva hipóteses apropriadas tais que a rejeição de Ho confirme a alegação do pesquisador. Para uma amostra de 400 indivíduos que entregaram a declaração ente 25 e 30 de abril, a restituição média da amostra foi de R$ 910,00 e o desvio padrão da amostra foi de R$ 1.600. Com = 0,05, qual é sua conclusão? 5) Novos pneus fabricados por uma empresa em Findlay, Ohio, são projetados para fornecer uma média de pelos menos 28.000 quilômetros. Testes com 30 pneus aleatoriamente selecionados mostrou uma média de amostra de 27.500 quilômetros e um desvio padrão da amostra de 1.000 quilometros. Usando um nível de significância de 0,05, teste se há evidência suficiente para rejeitar a reivindicação de uma média de pelo menos 28.000 quilômetros. Testes bicaudais da media da população Os testes bicaudais diferem dos testes unicaudais, uma vez que a região de rejeição está colocada tanto na cauda inferior como na cauda superior da distribuição Teste de hipótese de grande amostra (n 30) da média da população para um teste unicaudal da forma Ho: = o H1: o Estatística do teste: conhecido Z = x - o / n Estatística do teste: desconhecido Z = x - o s / n normal. Vamos introduzir um exemplo para mostrar como e porque os testes bicaudaissão realizados. Imagine que uma empresa desenvolve um novo processo de fabricação de bolas de golfe tendo uma distância média de alcance e de rolagem de 280 metros. A empresa sabe que se o novo processo sair do ajuste pode produzir bolas para as quais a distância média seja menor ou maior do que 280 m. Como parte do controle de qualidade, um inspetor seleciona uma amostra de golfe da linha de produção e as submete a testes que são equivalentes àqueles realizados pela associação de golfe. Não tendo razões para duvidar de que o processo de fabricação esteja funcionando corretamente, estabelecemos as seguintes hipóteses nula e alternativa. Ho: = 280 kg H1: 280 kg Como sempre, partimos da hipóteses tentativa de que a hipótese nula seja verdadeira. Uma região de rejeição precisa ser estabelecida para a estatística do teste Z. Queremos rejeitar a afirmação de que = 280 quando o valor de Z indica que a média da população é menor ou maior que 280 m. Assim Ho deve ser rejeitada para valores da estatística de teste tanto na cauda inferior como na cauda superior da distribuição amostral. Como resultado, o teste é chamado de teste de hipótese bicaudal. Com teste de hipóteses bicaudais, sempre determinaremos a região de rejeição colocando uma área ou probabilidade de /2 em cada uma das caudas da distribuição. O valor p para um teste bicaudal é simplesmente dobrar a área encontrada na extremidade da distribuição, a regra prévia para rejeitar Ho se o valor p pode ser usada para todos os testes de hipóteses. Exercício 1) Considere o seguinte teste de hipóteses. Ho: = 10 kg H1: 10 kg Uma amostra de 36 fornece uma média da amostra de 11 e desvio padrão da amostra de 2,5. Com = 0,05 qual é a regra de rejeição? Calcule o valor da estatística do teste Z. Qual é a sua conclusão? 2) Considere o seguinte teste de hipóteses. Ho: = 15 kg H1: 15 kg Uma amostra de 50 fornece uma média da amostra de 14,2 e desvio padrão da amostra de 5. a) com =0,02, qual é a regra de rejeição? b) Calcule o valor da estatística do teste Z. c) Qual é a sua conclusão? 3) O Departamento de Análise Econômica no Departamento de Comércio dos Estados Unidos relatou que a renda anual de um residente da Carolina do Norte é de US$ 18.688. Um pesquisador do estado da Carolina do Sul quer testar Ho = 18.688; onde é a renda anual de residente da Carolina do Sul.Qual é a conclusão apropriada se uma amostra de 400 residentes da Carolina do Sul apresenta uma renda média anula de US$ 16.860 e um desvio padrão da amostra de U$$ 14.624? Use um nível de significância de 0,05 Regra de rejeição a um nível de significância de Rejeitar Ho se z - z/2 ou se z z/2 n O caso da pequena amostra Considere que o tamanho da amostra seja pequeno (n 30) e que o desvio padrão da amostra s seja usado para estimar o desvio padrão da população . Se é também razoável considerar que a população tem uma distribuição normal de probabilidade, a distribuição t pode ser usada para fazer inferência sobre o valor da média da população. Nesse caso, a estatística do teste é: t = x - o s / Essa distribuição do teste tem uma distribuição t com n-1 graus de liberdade. A regra usual se aplica: se o valor p é menor do que o nível de significância , a hipótese nula pode ser rejeitada. Infelizmente, o formato da tabela de distribuição t fornecida na maioria dos livros de estatística não apresenta detalhes suficientes para determinar o valor exato do valor p para o teste. Resumindo Ho: o H1: o dará origem a um teste unicaudal à esquerda Ho: o H1: o dará origem a um teste unicaudal à direita Ho: = o H1: o dará origem a um teste bicaudal Exercício 1) Considere o seguinte teste de hipóteses. Ho: 5 H1: 5 Uma amostra de 26 fornece uma média de amostra de 11 e o desvio padrão da amostra de 3. a) com = 0,05 qual é a regra de rejeição? b) Calcule o valor da estatística do teste t. Qual é a sua conclusão? 2) Considere o seguinte teste de hipóteses. Ho: = 20 kg H1: 20 kg Os dados de uma amostra de seis itens são 18, 20, 16, 19, 17, 18 a) calcule a média da amostra b) calcule o desvio padrão da amostra c) com = 0,05 qual é a regra de rejeição? d) Calcule o valor da estatística do teste t. Qual é a sua conclusão? 3) Em fevereiro de 1995, o custo médio para um vôo doméstico com passagens de ida e volta com desconto foi de R$ 258,00. Uma amostra aleatória dos preços de 15 passagens de ida e volta com desconto durante o mês de março forneceu os seguintes dados. 10 60 55 00 10 30 50 65 80 90 40 85 50 60 65 a) qual é o preço médio da passagem de ida e volta com desconto em março? b) Qual é o desvio padrão? d) Usando com = 0,05 teste se o preço da passagem de ida e volta com desconto aumentou em março. Qual é a sua conclusão? 4) A família média alta brasileira gasta R$ 90 por dia. Considere que uma amostra de 25 famílias em Fortalezal, Ce. mostrou um gasto médio diário da amostra de R$ 84,50 com um desvio padrão da amostra de R$ 14,50 a) teste Ho: = 90 e H1: 90 para ver se a média da população em Fortaleza difere da média do Brasil. Use um nível de significância de 0,05. b) Qual é a sua conclusão? Testes de uma proporção da população Com p denotando a proporção da população e po denotando um valor hipotético específico para a proporção da população, as três formas para um teste de uma proporção da população são como segue: Ho: p po Ho: p po Ho: p = po H1: p po H1:p po Ho: p po As duas primeiras formas são testes unicaudais, enquanto a terceira forma é um teste bicaudal. A forma específica usada depende da aplicação. Os testes de hipóteses da proporção da população são baseados na diferença entre a proporção da amostra p e a hipotética proporção da população po. O método usado para conduzir os testes é análogo ao procedimento usado para os testes de hipóteses de uma média da população. A única diferença é que usamos a proporção da amostra p e seu desvio padrão p no desenvolvimento da estatística do teste. Exercício 1) considere o seguinte teste de hipóteses; Ho: p 0,50 H1: p 0,50 Uma amostra de 200 forneceu uma proporção da amostra de p = 0,57 a) com = 0,05 qual é a regra de rejeição b) calcule o valor da estatística do teste z. qual é a sua conclusão? 2) Considere o seguinte teste de hipóteses. Ho p= 0,20 H1 p 0,20 Uma amostra de 400 forneceu uma proporção da amostra de p = 0,175 a) com = 0,05 qual é a regra de rejeição b) calcule o valor da estatística do teste z. qual é a sua conclusão? 3) Um estudo realizado pelo Sebrae mostrou que 64% dos clientes de supermercados acreditam que as marcas do supermercados são tão boas quanto as marcas locais em termos de qualidade de produto. Para investigar se este resultado se aplica ao seu próprio produto, o fabricante de um ketchup de marca local perguntou a 100 clientes de supermercados se eles acreditavam que a marca do supermercado era tão boa quanto a marca local. Use o quanto de que 52 dos clientes na amostra indicaram que a marca do supermercado era tão boa quanto a marca local para testar Ho: p 0,64 e H1: p 0,64. Use um nível de significância de 0,05. Qual é sua conclusão? 4) O Departamento de Águas de Honolulu sugeriu a adoção de uma regra por solicitação dos restaurantes da Ilha de Oahu para economizar água. Um gerente do restaurante estabeleceu que 30% dos clientes não bebem água. Por isso, a conservação da água viria não somente de água não usada em cada copo, mas também da água economizada na lavagem dos copos. Teste: p = 0,30 versus p 0,30. Considere que uma amostra de 480 clientes mostrouque 128 não bebem água. Teste a reivindicação do gerente com um nível de significância de 0,05. Qual é o valor p e qual é a sua conclusão? 5) Em um estudo da contaminação de peixes nos rios e lagos da nação, a Agência de Proteção ambiental concluiu que 91% dos locais em que se realizaram testes da qualidade da água mostraram a presença de PCB, um agente cancerígeno. Suponha que um estudo de acompanhamento de 200 rios e lagos em 1998 mostrou a presença de PCB em 160 casos. A evidência estatística confirma a conclusão de que a partir dos programas de limpeza das águas de 1998 se tenha reduzido a proporção de locais com PCB? Use um nível de significância de 0,05. Apostila elaborada tendo como referência os livros: ANDERSON, Denni J. WILLIAMS, Thomas A WILLIAMS, Thomas A. Estatística Aplicada à Administração e Economia. 2ª ed. São Paulo : Pioneira, 2002. LEVIN, Jack. Estatística aplicada a ciências sociais. 2ª ed. São Paulo : Harbra Ltda, 1987. STEVENSON, W. J. Estatística aplicada à administração. 2ª ed. São Paulo : Ed. Harper & Row do Brasil, 1981 BARBETTA, PEDRO Alberto. Estatística aplicada às Ciências Sociais. 3ª ed. rev. Florianópolis : UFSC, 1998. SPIEGEL, Murray Ralph. Probabilidade e estatística. São Paulo : McGraww-Hill, 1982.
Compartilhar