Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 UNIDADE II - Inferência Estatística 2.1 Introdução Inferência Estatística: Conjunto de métodos de análise estatística que permite tirar conclusões sobre a população com base em somente uma parte dela (amostra). Os métodos de inferência podem ser agrupados em duas técnicas: Estimação: Pontual e Intervalar Testes de Hipóteses 2.2 Estimação de Parâmetros 2.2.1 Conceitos Fundamentais É de fundamental importância a compreensão e o domínio de alguns termos que serão usados com bastante frequência nos tópicos que seguem. Veremos, a seguir, de conceitos de parâmetro, estimador e estimativa. Os parâmetros são valores (medidas) calculados diretamente da população e servem para caracterizá-la. Os parâmetros geralmente são desconhecidos, sempre são constantes, e são representados, genericamente, pela letra grega teta (θ). São exemplos de parâmetros: a média da população (µ) e o desvio padrão da população (σ). Os estimadores são valores (medidas) calculados em uma amostra com objetivo de obter informações sobre os parâmetros e sobre a própria população. Todos os estimadores são estatísticas, uma vez que são valores amostrais. Os estimadores são representados, genericamente, pela letra grega teta com um acento circunflexo ( ̂), onde se lê teta chapéu. Dentro dos exemplos de estimadores podemos citar a média amostral ( ̅) e o desvio padrão amostral (S). Estimativa é um particular valor numérico assumido por um estimador. 2.1.2 Processos de Estimação A estimação é o processo que consiste no uso de dados da amostra (dados amostrais) para estimar valores de parâmetros populacionais desconhecidos, tais como média, desvio padrões e proporções. 2 Um parâmetro pode ser estimado de duas formas: por ponto e por intervalo. Estimação por ponto É o processo através do qual obtemos um único ponto, ou seja, um único valor para estimar o parâmetro. Estimação Intervalar É um processo que permite obter um intervalo onde, com uma determinada probabilidade (nível de confiança), podemos esperar encontrar o verdadeiro valor do parâmetro. LI: Limite inferior LS: Limite Superior Confiança X Risco Sempre que se faz uma estimação de uma variável aleatória, existe uma probabilidade de se errar essa estimação quando comparamos o valor estimado com o valor que realmente foi observado. À probabilidade de se errar a estimação dá-se o nome de “RISCO”. O “RISCO” é o complemento da “CONFIANÇA”. A “CONFIANÇA” vem a ser, então, a probabilidade de se acertar a estimação. Então, resumindo: Confiança (1 - ) = Probabilidade de acerto na estimação; Risco () = Probabilidade de erro na estimação. Estimação Intervalar X Estimação Pontual Estimação pontual Estimação intervalar Maior precisão, mas menor confiança. A média amostral é um estimador pontual, não tendencioso, da média populacional. Menor precisão, mas maior confiança. A estimação intervalar é obtida através a construção de intervalos de confiança. 3 A variância amostral é um estimador pontual, não tendencioso, da variância populacional. O mesmo acontece com o desvio padrão amostral em relação ao desvio padrão populacional. ESTIMATIVAS PONTUAIS: A amplitude do intervalo de confiança depende da: 1. Confiança desejada: Quanto maior a confiança, maior o intervalo. Uma confiança de 0% nos leva a um ponto. Uma confiança de 100% nos leva a um intervalo de a . 2. Variabilidade do processo: Quanto mais variável o processo aleatório do qual está se fazendo a estimação, maior o intervalo de estimação, para uma mesma confiança. 3. Quantidade de informação (tamanho da amostra): Quantidade de informação: Quanto maior a amostra, mais informação teremos a respeito do processo aleatório em estudo. Dessa forma, para uma mesma confiança, quanto maior a amostra, menor será o intervalo de estimação necessário (maior precisão). 2.1.2.1 Estimação Intervalar da Média Um intervalo de confiança para a média populacional é, construído em torno da média amostral, e a sua amplitude será determinada pela quantidade de desvios padrão e conforme a confiança desejada. A quantidade de desvios padrão a ser usada é representada pela variável “Z” (valor da distribuição normal padrão) ou “t” (valor da tabela t-Student). amostralmédia n x x i amostralpadrãodesvio n xx s 1 2 amostraliância n xx sx var 1 2 2 4 A quantidade de desvios padrão somada/subtraída da média amostral é chamada de erro de estimação. 1. Desvio padrão da população conhecido Quando a população é aproximadamente normal e o seu desvio padrão da população é conhecido usa-se da distribuição normal para determinação do intervalo de confiança independente do tamanho da amostra: n Zx x ou Na qual “Z” é obtido na tabela da distribuição Normal para /2 e o erro de estimação é: Exemplo: Uma loja realizou um estudo a respeito dos valores das compras realizadas pelos clientes. Sabe-se de levantamentos anteriores que o valor de uma compra realizada por um cliente é uma variável aleatória normalmente distribuída, com um desvio padrão de R$ 42,00. Estime valor de compra com 95% de confiança considerando que foi utilizada uma amostra aleatória de 15 clientes e o valor da média amostral foi de R$ 120,00. Nesse caso, o desvio padrão da população é conhecido e é igual a $ 42,00. Por outro lado, também se garante que a variável “valor da compra” é normalmente distribuída. Então o intervalo será: n Zx n Zx xx 15 42 96,1120 26,21120 26,141a74,98 n Z x 5 Sendo que o valor de Z é encontrado da seguinte forma: Como a confiança requerida é de 95%, então /2=2,5%, ou 0,025. Entrando no miolo da Tabela da distribuição Normal com 0,475 (0,475 = 0,5 – 0,025), obtém-se Z = 1,96. A representação gráfica do intervalo de confiança determinado é a seguinte: Interpretação do IC: Selecionamos 100 amostras de mesmo tamanho n. Obtemos 100 estimativas de ̅, com os quais construímos 100 IC para µ. Se α = 5%, podemos esperar que 95 dos IC contenham o verdadeiro valor de µ e 5 não contenham o valor de µ. Temos uma confiança de 95% de que o IC determinado contenha o verdadeiro valor de µ. No exemplo acima podemos interpretar o IC da seguinte maneira: Temos 95% de confiança de que o intervalo de 98,74 a 141,26 R$ contém a verdadeira média populacional. 2. Desvio padrão da população desconhecido 2.1 Amostra Grande, n 30 ou n s Zx x n s Zx n s Zx xx 6 Na qual “Z” é obtido na tabela da distribuição Normal para /2. O erro de estimação é: Exemplo: O administrador de uma empresa ambiental está estudando o ganho com a venda de óleo lubrificante usado e para tal tomou o preço ofertado por 40 empresas escolhidas aleatoriamente. O resultado obtido foi uma média de $ 165,00 por quinhentos litros e um desvio padrão de $ 45,00. Estime, com 90% de confiança, o ganho médio com a venda do óleo usado. Como a amostra é de tamanho igual a 40, poderá ser usada a Distribuição Normal como distribuição das médias amostrais. Como a confiança requerida é de 90%, então /2=5%, ou 0,05. Entrando no miolo da Tabela da distribuição Normal com 0,45 (0,45 = 0,5 – 0,05), obtém-se Z = 1,645. Então, a estimação intervalar para o ganho médio será: 153,30 a 176,70 A representação gráfica do intervalo de confiança é a seguinte: 2.2 Amostra Pequena, n < 30 No caso de uma população normal ou aproximadamente normal, mas com desvio padrão populacional desconhecido, será usada a Distribuição de Student para a determinação do coeficiente de confiança, que neste caso passa a ser “t”: n s Z x 7 n s tx x ou n s tx n s tx xx na qual “t” é obtido na tabela da Student para /2 e n-1 graus de liberdade. Características da Distribuição de Student: É “parecida” com a distribuição Normal; É mais achatada (maior dispersão) do que a normal; Varia com os graus de liberdade, isto é, com o tamanho da amostra. Abaixo é apresentada uma parte da Tabela da Distribuição de Student (ou distribuição “t”) existente no ANEXO. Exemplo: Uma loja realizou um estudo a respeito dos valores das compras realizadas pelos clientes. Estime valor de compra com 95% de confiança considerando que foi utilizada uma amostra aleatória de 15 clientes, o valor da média amostral foi de R$ 120,00 e desvio padrão de R$ 42,00. Nesse caso, como a amostra é pequena, a população é normalmente distribuída, mas não se conhece o desvio padrão da população; será usada a distribuição de Student para a distribuição das médias amostrais. Como a confiança requerida é de 95%, entraremos na tabela da Student com /2 = 0,025. 8 Como o tamanho da amostra é igual a 15, entraremos na tabela da Student com 15 – 1 = 14 graus de liberdade. O valor para “t” encontrado foi de 2,145. Então a estimação é: Erro de estimação = 23,26. A representação gráfica do intervalo de confiança construído será a seguinte: 3. Correção para População Finita A correção do desvio padrão é feita através da multiplicação do seu valor pela seguinte expressão: Na qual “N” é o tamanho da população e “n” é o tamanho da amostra. Exemplo: Uma empresa filantrópica possui 1200 animais e a sua administração coleta dados diários sobre custo para manter os animais. Foi tomada uma amostra de 199 animais, obtendo-se uma média de $ 32,00 e um desvio padrão de $ 8,00. Estime com 95% de confiança o custo médio para manter os animais. 15 42 145,2120 26,23120 26,143 a 74,96 1 N nN 9 2.1.2.2 Estimação Intervalar Proporção Considerando “P” a proporção populacional e a proporção amostral, então a estimação da proporção populacional é obtida da seguinte maneira: n pp Zp )ˆ1(ˆ ˆ ou n pp ZpP n pp Zp )ˆ1(ˆ ˆ )ˆ1(ˆ ˆ Exemplo: O departamento de marketing de uma empresa que produz cosméticos naturais promoveu uma pesquisa para conhecer a aceitação pelo público feminino do seu novo creme para as mãos. O resultado da pesquisa foi o seguinte: Gostaram e comprariam o produto: 2870 Não gostaram e não comprariam o produto: 628 Estime com 99% de confiança a proporção de aceitação do novo produto. A proporção amostral pˆ é igual a: 82,0 3498 2870 ˆ p O valor de “Z” para /2 = 0,005 é 2,575 Então, a estimação intervalar de P é igual a: 3498 82,0182,0 575,282,0 O intervalo será igual, então a: 11200 1991200 199 8 96,132 02,132 02,33 a 98,30 017,082,0 837,0 P 803,0 10 2.1.3 Cálculo do Tamanho da Amostra para Amostragem Aleatória Simples O cálculo do tamanho da amostra para a estimação da média será: 2 . E z n Exemplo: A quantidade de chumbo em certo tipo de solo, medida por um método padrão, acusa em um desvio padrão de 10 ppm. Qual o tamanho da amostra necessário para se estimar a média de chumbo no solo com um erro de 0,5 ppm e um nível de confiança de 95%? 153764,1536 5,0 10.96,1 2 n O cálculo do tamanho da amostra para a estimação da proporção será: Observe que para calcular o tamanho da amostra teremos que conhecer o valor estimado da proporção populacional pˆ . Isso, na prática, pode ser conseguido através uma amostragem piloto. No entanto, essa prática pode custar mais tempo e mais dinheiro. Caso não seja possível uma amostragem piloto, deve-se usar: pˆ = 0,5 que é o valor que fornece os maiores intervalos de confiança. Exemplo: Suponha que um editor deseja fazer uma pesquisa a respeito da aceitação de uma determinada revista sobre meio ambiente. Determine o tamanho da amostra a ser utilizada nessa pesquisa, considerando que a confiança desejada seja de 97% e o erro máximo suportado seja de 1%. O valor de “Z” para /2 = 0,015 é igual a 2,17 Como não se tem a estimação de pˆ , usaremos 0,5 pp E z n ˆ1ˆ 2 25,0 2 E z n 11 Então, o tamanho da amostra necessário será igual a: SEGUNDA LISTA DE EXERCÍCIOS 1. Considere que uma empresa queira utilizar escória de aciaria, produzida em uma usina siderúrgica, para pavimentação. Será necessário realizar um procedimento de amostragem para caracterização física da escória, onde serão analisados parâmetros físicos como umidade ótima. Suponha que tenha sido realizada uma amostragem piloto onde o desvio padrão foi de 2,1 para umidade ótima. Qual o tamanho de amostra aleatória para estimar a média com um erro de 0,5 e com uma confiança de 95%? 2. Para uma amostra de 100 empresas no setor de mármore e granito, o número médio de empregados é 600 com um desvio padrão de 50. Considere que no ES há um total de 1800 empresas neste setor. Determinar o intervalo de confiança de 90% para estimar o número médio de trabalhadores por empresa no ES. 3. Em certa cidade, o peso do lixo produzido por semana em residências de classe social C foi obtido através de uma amostra de 15 residências, obtendo- se 20 kg como média e 5,5 kg como desvio padrão. Estimar o peso médio produzido por famílias de classe C desta cidade, usando um intervalo de confiança de 95%. 4. Para uma amostra de 25 lâmpadas fluorescentes, obteve-se uma vida média útil de 6000 horas com um desvio padrão de 700 horas. Construir um intervalo de confiança de 99% para a média da população. 5. Uma empresa de pesquisa de mercado faz contato com uma amostra de 300 empresas de uma comunidade e verifica que uma proporção de 0,60 na 1177325,1177225,0 01,0 17,2 2 n 12 amostra prefere usar biodiesel em vez de qualquer outro combustível. Construa um intervalo de 95% para a proporção de todas as empresas que preferem usar biodiesel nesta comunidade. 6. Pneus de uma determinada marca foram colocados aleatoriamente nas rodas traseiras de 10 carros com os seguintes resultados. Percurso médio amostral até o desgaste total = 45.300 km Desvio padrão amostral = 6.150 km a) Obtenha um intervalo de confiança de 99% para vida média µ dos pneus dessa marca; b) Qual deveria ser o tamanho de uma nova amostra para que, com base nela,pudéssemos também construir um intervalo de confiança a 99% para µ, porém 4 vezes menos em termos de amplitude? 7. Examinadas 500 peças de uma produção, encontra-se 260 defeituosas. Construir um intervalo de confiança de 90% para a verdadeira proporção de peças defeituosas. 8. Para estimar a porcentagem de alunos de um curso favoráveis à implantação de um novo currículo escolar, tomou-se uma amostra de 1000 alunos, dos quais 300 foram favoráveis. a) Fazer um intervalo de confiança para a proporção de todos os alunos do curso favoráveis à modificação com uma confiança de 97%. b) Qual o erro de estimação cometido em a? c) Sabendo-se que a faculdade possui 4000 alunos, quantos alunos deveriam ser selecionados considerando um erro amostral de no máximo 2,5% e confiança de 95% e considerando como estimativa a priori a estimação pontual utilizado na letra (a). 2.3.Teste de hipótese 13 Em estatística uma hipótese é uma alegação, ou afirmação, sobre uma propriedade de uma população. O objetivo do teste de hipótese é decidir se determinada afirmação sobre um parâmetro populacional é verdadeira. Testes de hipóteses são largamente utilizados para reportar os resultados de pesquisas em muitos campos da ciência aplicada e da indústria, por exemplo, produtos farmacêuticos exigem evidências significativas de eficácia e segurança. Os comerciantes desejam saber se uma nova campanha de publicidade supera significativamente a anterior. Em meio ambiente é importante saber se a concentração de contaminantes atmosféricos é diferente em ambientes fechados. 2.3.1 As Hipóteses Nula e Alternativa O primeiro passo em teste de hipótese consiste em formular duas hipóteses sobre a afirmação: A hipótese nula, H0, é uma afirmação sobre o valor de um parâmetro populacional, ou seja, é uma afirmação que diz que o parâmetro populacional é tal como especificado. Deve conter a condição de igualdade. Para o caso de teste para uma média tem-se: valorumaH lg:0 O complemento da Hipótese Nula é a Hipótese Alternativa (H1). É uma afirmação alternativa a alegação a qual existe indícios dela ser verdadeira se a hipótese nula é falsa. Para o caso citado anteriormente tem-se: valorumaH lg:1 valorumaH lg:1 valorumaH lg:1 Observação: 1. Mesmo quando é utilizado os símbolos ≤ ou ≥ na hipótese nula o teste é realizado supondo a igualdade. Devemos ter um valor fixo único para μ, de modo que possamos trabalhar com uma única distribuição com média especifica. 14 2. Se o leitor está fazendo uma pesquisa a sua afirmação deve ser formulada de maneira que se torne a hipótese alternativa. Exemplo: A direção de um Banco deve decidir se oferece certo produto em uma determinada cidade. A implantação desse produto na agência dessa cidade somente será viável se a capacidade de poupança dos seus clientes for maior que R$ 500,00 mensais. Para verificar esse fato será realizada uma pesquisa de mercado para testar se esse valor é alcançado. Formule as hipóteses para esse teste: 500:0 igualémédiaAH 500:1 quedomaiorémédiaAH Assim tem-se: 500:0 H 500:1 H 2.3.2 Áreas de Aceitação e de Rejeição À medida que amostras diferentes são tomadas, os valores dos parâmetros amostrais variam entre si e em relação ao valor populacional. Essas variações podem ser devidas à própria aleatoriedade do processo, isto é, são casuais, ou devido ao fato das amostras terem sido tiradas de populações com parâmetros diferentes. Um teste de hipóteses avalia até aonde essas variações são frutos do próprio processo aleatório e a partir de que ponto as variações são reais. Teremos então que determinar os pontos limites até os quais concordaremos com a hipótese de que as variações são casuais e a partir dos quais as variações são reais. Esses pontos são chamados de “pontos críticos”. O intervalo ao longo do qual, as variações são consideradas casuais é chamada de área de aceitação de H0. O complemento da área de aceitação é a área de rejeição de H0. A visualização gráfica de uma área de aceitação é a seguinte: 15 A visualização gráfica de uma Área de Rejeição é a seguinte: 2.3.4 Os testes unilateral e bilateral O interesse em detectar desvios significativos de certo parâmetro pode envolver desvios em ambas as direções ou apenas numa direção. A hipótese alternativa é usada para indicar qual o aspecto da variação que nos interessa. Há três casos possíveis: concentrar em ambas as direções, concentrar os desvios abaixo do valor esperado ou concentrar nos desvios acima do valor esperado, assim os testes podem ser bilaterais ou unilaterais. Teste bilateral é aquele em que a região de rejeição da Hipótese Nula está localizada nas duas caudas da distribuição amostral. Área de Aceitação da Hipótese Nula Valor Populacional Pontos Críticos Área de Rejeição da Hipótese Nula Valor Populacional Pontos Críticos 16 Teste unilateral é aquele em que a região de rejeição da Hipótese Nula está localizada apenas em uma das caudas da distribuição amostral. Um teste bilateral apresenta as seguintes Hipóteses Nula e Alternativa: Exemplo: Uma amostra dos saldos em conta corrente de 100 clientes de uma agência bancária indicou uma média de R$ 986,30 e um desvio padrão de R$ 254,80. Pode-se aceitar, a um risco de 5%, que o saldo médio em conta corrente dos clientes desta agência seja igual a R$ 1000,00? Nesse exemplo, as Hipóteses Nula e Alternativa serão as seguintes: 1000:0 H 1000:1 H A representação gráfica das áreas de aceitação e de rejeição da Hipótese Nula para esse exemplo é a seguinte: Pode-se ter teste unilateral com a região de rejeição da Hipótese Nula na cauda da direita ou na cauda da esquerda. Teste unilateral com a região de rejeição da Hipótese Nula na cauda da esquerda: 00 : H 01 : H Área de Aceitação da Hipótese Nula Área de Rejeição da Hipótese Nula 025,0 2 025,0 2 =1000 Pontos Críticos 95,0)1( 00 : H 01 : H 17 Vamos usar o mesmo exemplo anterior, mas alterando a pergunta para: “Pode- se aceitar a um risco de 5% que o saldo médio em conta corrente dos clientes dessa agência seja menor que R$ 1000,00?” Agora, as Hipóteses Nula e Alternativa são as seguintes: 1000:0 H 1000:1 H A representação gráfica das áreas de aceitação e de rejeição da Hipótese Nula desse exemplo é a seguinte: Teste unilateral com a região de rejeição da Hipótese Nula na cauda da direita: 00 : H 01 : H Continuamos a usar o exemplo anterior, mas alterando a pergunta para: “Pode- se aceitar, a um risco de 5%, que o saldo médio em conta corrente dos clientes dessa agência seja maior que $ 1000,00?” Agora as Hipóteses Nula e Alternativa são as seguintes: 1000:0 H 1000:1 H Área de Aceitação da Hipótese Nula 05,0 95,0)1( =1000 Ponto Crítico Área de Rejeição da Hipótese Nula 18 A representação gráfica das áreas de aceitação e de rejeição da Hipótese Nula deste exemplo será a seguinte: 2.3.5 Os Erros do tipo I e de tipo II Ao realizarmos um teste de hipóteses, estamos sujeitos a cometer erros. Existem dois tipos de erros que podem ser cometidos, “Erro tipo I” e “Erro tipo II”. 1. Erro Tipo I Quando conclui-se sobre uma hipótese, pode-se decidirerroneamente e rejeitar a hipótese nula, mesmo que ela seja verdadeira, porém se ela for verdadeira, queremos que a probabilidade de vir a cometer esse erro (erro do tipo I) seja pequena. Essa probabilidade chama-se nível de significância. Exemplo: Suponha que um consumidor tenha procurado o órgão competente para reclamar que havia comprado um produto em cuja embalagem constava conter 500 gramas, e ao chegar em casa constatou haver menos do que 500 gramas dentro do invólucro. O órgão mandou então recolher, uma amostra para analisar a queixa do consumidor. As hipóteses a serem testadas nesse caso são as seguintes: Área de Aceitação da Hipótese Nula Área de Rejeição da Hipótese Nula =1000 Ponto Crítico 95,0)1( 05,0 19 500:0 H 500:1 H Suponha que a amostra desse produto coletada, por obra do acaso, contenha somente embalagens com menos de 500 gramas, mas que na realidade a máquina empacotadora introduz 500 gramas em cada embalagem. Nesse caso, rejeitaremos a Hipótese Nula, mas na verdade os produtos contêm, em média, 500 gramas. Teremos, assim, cometido um erro tipo I. 2. Erro Tipo II Ocorre quando aceitamos a hipótese nula como verdadeira, sendo ela falsa. Exemplo: Utilizando o mesmo exemplo anterior, suponha que a máquina empacotadora estivesse realmente com problemas e aleatoriamente introduzindo menos de 500 gramas em muitas embalagens. Mas ao tomar a amostra, por obra do acaso, todas as embalagens coletadas possuíam 500 gramas. Desta forma, a Hipótese Nula será aceita e assim, teremos cometido um erro tipo II. Resumidamente tem-se: O verdadeiro estado da natureza H0 é verdadeira H0 é falsa Decisão Decidimos rejeitar a hipótese nula Erro tipo I (): significância Decisão correta (1-β): poder do teste Não rejeitamos a hipótese nula Decisão correta (1-): confiança Erro tipo II (β) 20 Assim, quando cometemos um erro do Tipo I, aceitamos uma diferença que de fato não existe. No erro do Tipo II, aceitamos que grupos são iguais enquanto que a diferença existe, ou seja, significa que existe uma diferença que não foi reconhecida. O erro do tipo I ocorre principalmente quando as amostras são pequenas, Já o erro do tipo II ocorre em função de amostras pequenas e a grande variabilidade, o que pode eliminar as chances matemáticas de aparecer uma significância estatística. 2.3.6 Roteiro para um Teste de Hipóteses A seguir serão apresentados os passos a serem seguidos para a execução de um Teste de Hipóteses, quaisquer que seja o parâmetro a ser testado. 1. Determinar de H0 e H1. 2. Determinar a distribuição a ser usada . 3. Determinar as regiões de aceitação e de rejeição. 4. Calcular a estatística de teste. 5. Para o teste de média e para o de proporções, a estatística de teste será assim calculada: 6. Determinar o valor crítico. Observar que o valor crítico delimita a região de aceitação e, consequentemente, a de rejeição. 7. A decisão consiste em comparar a estatística de teste, calculada a partir da amostra, com o valor crítico, e concluir pela aceitação ou não da hipótese nula. Se a estatística de teste cair dentro da região de aceitação da Hipótese Nula, esta não poderá ser rejeitada. Se cair dentro da região de rejeição, a Hipótese Nula deverá ser rejeitada. padrãodesvio testeemvaloramostralvalor testedeaestatístic padrãodesvio testeemvaloramostralvalor testedeaestatístic 21 2.3.7 Teste Hipótese para Média de uma População com Variância Conhecida No teste de uma Média, onde a variância populacional (ou o desvio padrão populacional) é conhecida, a determinação da estatística de teste é obtida da seguinte maneira: n X Z x 0 Na qual é o valor a ser testado, “n” é o tamanho da amostra, é a média amostral e x é o desvio padrão da população. Determinação do valor crítico usando a Normal: Entrar no miolo da tabela da Normal com o valor de (0,5 - /2) para testes bilaterais, ou com o valor de (0,5 - ) para testes unilaterais, e ler nas bordas da tabela o valor de Z. Suponha que se queira o valor crítico para um teste bilateral para uma confiança de 95% (ou um risco de 5%, ou uma significância de 5%). Entraremos no miolo da tabela da Normal com o valor de 0,475 (0,50 – 0,025) e leremos nas bordas o valor do Z crítico (1,96). Se for para um teste unilateral, entraremos no miolo da tabela com 0,45 (0,50 – 0,05) e leremos nas bordas o valor de 1,65 para Z crítico. 2.3.8 Teste Hipótese para Média de uma População com Variância Desconhecida e Tamanho da Amostra Grande (n ≥ 30) No teste de uma média com a variância conhecida e tamanho de amostra grande, a determinação da estatística de teste é obtida da seguinte maneira: n s X Z 0 0 X 22 Na qual é o valor a ser testado, “n” é o tamanho da amostra, é a média amostral e xs é o desvio padrão da amostra. Exemplo: Uma amostra aleatória de 40 faturamentos semanais de uma determinada loja apresentou uma média amostral de $ 48.400,00 e um desvio padrão amostral de $ 9.870,00. Pode-se considerar que o faturamento semanal dessa loja é uma variável normalmente distribuída. Pode-se aceitar a um risco de 1% que o faturamento semanal médio desta loja seja igual a $ 50.000,00? Nesse exemplo, as hipóteses são as seguintes: A distribuição a ser usada será a Normal, uma vez que a amostra é maior do que 30. Nesse caso, não precisaríamos fazer a suposição de que a variável seja normalmente distribuída, uma vez que a amostra é grande (mais de 30 observações). O valor da estatística de teste será o seguinte: 03,1 40 9870 5000048400 Z Entrando no miolo da tabela da distribuição Normal com o valor de 0,495 (0,5 – 0,005), encontraremos o valor de Z crítico, que é igual a 2,58. Como o valor de Z de teste (1,03) caiu entre os valores - 2,58 e 2,58, não poderemos rejeitar a hipótese nula de que o faturamento semanal médio seja igual a $ 50.000,00 2.3.9 Teste Hipótese para Média de uma População com Variância Desconhecida e Tamanho da Amostra Pequeno (n < 30) No teste de uma média para amostra pequena, a determinação da estatística de teste é obtida da seguinte maneira: n s X t 0 0 X 000.50:0 H 000.50:1 H 000.50:0 H 000.50:1 H 23 Na qual é o valor a ser testado, “n” é o tamanho da amostra, é a média amostral e xs é o desvio padrão da amostra. Determinação do valor crítico usando a distribuição t-Student: Entrar na margem horizontal superior com /2, se o teste for bilateral, ou com , se o teste for unilateral, e na margem vertical à esquerda com o nº. de graus de liberdade (n – 1). Ler no miolo da tabela o valor do t ( t crítico ). Com uma amostra de 20 observações e 5% de significância: Para um teste bilateral, entraremos na borda superior da tabela com /2 = 0,025, e na borda vertical da esquerda com gl (graus de liberdade ) = 20 – 1 = 19. No cruzamento, no miolo da tabela, encontraremos o valor de 2,093 para o valor de t crítico. Para um teste unilateral entraremos com = 0,05 e o mesmo nº de graus de liberdade (19) e, no miolo, no cruzamento, encontramos o valor de t crítico = 1,729. Exemplo: Um engenheiro estuda o tempo médio de vida das lâmpadas elétricas fluorescentes. A indústria afirma que a vida média desse tipo de lâmpada é de 1120 horas. Umaamostra de 8 lâmpadas extraída recentemente apresentou a vida média de 1070 horas, com desvio padrão de 125 horas. Testar a hipótese de que a vida média das lâmpadas não se alterou ao nível de 1%. Resposta: As hipóteses a serem testadas são as seguintes: 1120:0 H 1120:1 H O valor da estatística de teste é dado por: 13,1 8 125 112010700 n s X t 0 X 24 Olhando na tabela de distribuição t-student o valor da estatística do ponto critico é t7,0,005 = 3,4995. Conclusão: Como o valor da estatística de teste pertence à região de aceitação da hipótese, então não rejeita-se Ho considerando um nível de significância de 1%. 2.3.10 Teste de Hipótese para Proporção de uma População No teste para proporções usaremos somente a distribuição Normal. O valor crítico será calculado do mesmo modo que para a média. Determinação da estatística de teste: n PP Pp Z )1.( ˆ 00 0 onde pˆ = proporção amostral e 0P = valor em teste. Exemplo: Um candidato a deputado estadual afirma que terá 60% dos votos dos eleitores de uma cidade. Um instituto de pesquisa colhe uma amostra de 300 eleitores dessa cidade, encontrando 160 que votarão no candidato. Esse resultado mostra que a afirmação do candidato é verdadeira, ao nível de 5%? 2.3.11 Valores-p nos testes de hipóteses A abordagem do valor-p tem sido amplamente utilizada na prática. O valor – p é a probabilidade de que a estatística de teste assuma um valor que é, no mínimo, tão extremo quanto o valor observado da estatística quando a hipótese nula for verdadeira. Assim, o valor-p carrega muita informação sobre o peso da evidencia contra H0. Resumindo: valor-p é a probabilidade da estatística de teste assumir um valor quando a hipótese nula é verdadeira. Interpretação: a decisão sobre a hipótese nula é tomada comparando-se o valor-p com um valor pré-fixado (nível de significância), usualmente 0,05. 25 Quando o valor-p é menor que este ponto de corte, o resultado é estatisticamente significante (rejeita-se Ho) e, caso contrário, ele é dito não significante (não rejeita-se Ho). Não é sempre fácil calcular o valor-p para um teste. No entanto, a maioria dos programas computacionais, já apresenta este valor calculado para que você possa tomar a decisão em relação à hipótese sem que haja a necessidade de olhar na tabela de distribuição de probabilidade. TERCEIRA LISTA DE EXERCÍCIOS 1) O salário dos empregados das indústrias siderúrgicas no ES tem distribuição normal, com média de 4 salários mínimos, com desvio padrão de 0,5 salários mínimos. Uma indústria emprega 25 empregados, com salário médio de 3,8 s.m. Ao nível de 5% podemos afirmar que essa indústria paga salários inferiores à média? 2) Uma máquina automática que empacota o alimento A é programada para colocar 200g de peso. Para verificar a precisão da máquina, uma amostra de 36 pacotes do referido alimento fornece um peso médio de 198g e desvio padrão de 6g. O que se pode concluir ao nível de 5%? 3) Uma fábrica de cerveja distribui um tipo de cerveja sem álcool em garrafas que indicam 300 ml. O instituto de peso e medidas seleciona aleatoriamente 25 garrafas e obtém uma média de 295 ml com o desvio padrão de 9 ml. Ao nível de 0,01 de significância, pode-se concluir que a fábrica coloca menos cerveja nas garrafas? 4) Sabe-se que por experiência que 5% da produção de um determinado artigo é defeituosa. Um novo empregado é contratado. Ele produz 600 peças do artigo com 82 defeituosas. Ao nível de 10%, verificar se o novo empregado produz peças com maior índice de defeitos que o existente. 26 5) Um fabricante de droga medicinal afirma que a eficiência da droga é igual a 90% na cura de uma alergia. Em uma amostra de 200 pacientes, a droga curou 135 pessoas. Testar ao nível de 1% se a pretensão do fabricante é legítima. 6) Na indústria de cerâmica, avalia-se sistematicamente a resistência de amostras de massas cerâmicas, após o processo de queima. Dessas avaliações, sabe-se que certo tipo de massa tem resistência mecânica aproximadamente normal, com média 53 MPa e variância MPa2. Após a troca de alguns fornecedores de matérias-primas, deseja-se verificar se houve alteração na qualidade. Uma amostra de 15 corpos de prova de massa de cerâmica acusou média igual a 50 MPa. Qual é a conclusão ao nível de significância de 5%?
Compartilhar