Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 A IMPORTÂNCIA DA INFERÊNCIA PARA TOMADA DE DECISÕES: Intervalos De Confiança E Testes De Hipóteses Introdução Este capítulo aborda o ramo da estatística conhecido por estatística inferencial. A estatística inferencial compreende as técnicas por meio das quais são tomadas decisões sobre uma população estatística, decisões estas baseadas unicamente na observação de uma amostra ou na elaboração de um juízo. Começaremos nosso estudo com uma situação hipotética. Você é o gerente de marketing da empresa fabricante do sabão em pó Lave Bem e pretende realizar uma pesquisa de opinião na cidade de Araxá, Minas Gerais, com a finalidade de verificar o grau de satisfação dos consumidores com o produto. Especificamente, seu problema é saber a proporção de consumidores do município que preferem a marca Lave Bem. Como dispõe de um tempo muito curto e de um orçamento limitado para executar o projeto, você não poderá entrevistar todos os habitantes de Araxá para obter os dados de que necessita: terá de consegui-los consultando apenas uma parte dos consumidores. Em outras palavras, coletará os dados a partir de uma amostra de consumidores. Assim, com base nos dados da amostra, você fará suas estimativas e testará as hipóteses que deseja verificar. INTERLOCUÇÃO INTERROGATIVA. Como seria obtida uma amostra dos consumidores? Dentre os vários procedimentos possíveis, você poderia usar o seguinte. De acordo com o Instituto Brasileiro de Geografia e Estatística ― IBGE, o número de famílias residentes em Araxá em 2006 é 23832. Admita que exista uma dona de casa em cada família, então o número de donas de casa em Araxá é 23832. Suponha que a amostra selecionada de donas de casa seja de 1000 consumidoras. Você escolheria ao acaso 1000 consumidoras numa praça central da cidade, ou escolheria ao acaso uma quantidade em cada um dos bairros da cidade até completar 1000 entrevistadas. Uma outra maneira de obter uma amostra é associar um número a cada uma das 23832 famílias, colocar todos esses números numa lista e sortear 1000 números. As moradoras correspondentes aos números sorteados formariam a amostra. Suponha que você realize o sorteio dessa forma e o gerente de marketing de uma empresa concorrente, desconhecendo sua iniciativa, repita o mesmo procedimento. Você acha que as amostras sorteadas por você e por seu concorrente serão as mesmas? 2 Se você respondeu que as amostras sorteadas não serão as mesmas, parabéns, você acertou a resposta. Se realizarmos várias vezes a amostragem descrita, provavelmente obteremos amostras compostas por consumidoras diferentes. INSERIR INTERLOCUÇÃO INTERROGATIVA. Apesar de diferentes, podemos ter respostas próximas ou iguais nas diversas amostras? A resposta é afirmativa e estará subjacente às ideias desenvolvidas neste capítulo. Resumindo a discussão, podemos dizer que, devido à natureza aleatória envolvida no procedimento amostral, não temos a certeza de que repetições de amostras produzam sempre resultados idênticos. Ou seja, ao coletarmos uma amostra, não podemos prever antecipadamente seu resultado. Todavia, a amostragem e os resumos estatísticos dos dados de uma amostra, combinados, fornecem as informações essenciais para a condução de uma pesquisa. Naturalmente, o uso de dados amostrais para tirar conclusões a respeito de uma característica da população conduz a um erro. Conforme você estudará adiante, esse erro é previsto e pode ser calculado. Isto posto, neste capítulo você aprenderá os conceitos básicos de estimação; aprenderá a construir intervalos de confiança para média e proporção de uma população e a calcular o tamanho de amostra. Também aprenderá a realizar testes de hipóteses para a média e proporção bem como aprenderá outros critérios de decisão baseados em intervalos de confiança e valor p. Objetivos Esperamos que ao término dos estudos, você seja capaz de: • diferenciar estimação pontual de estimação por intervalo; • definir parâmetro, estimador e estimativa; • enunciar as propriedades de um estimador; • usar a distribuição de probabilidades adequada aos diferentes casos de intervalos de confiança e de testes de hipóteses; • calcular margens de erro fixados os graus de confiança; • construir intervalos de confiança para a média populacional; • construir intervalos de confiança para a proporção de uma população; • interpretar os resultados de intervalos de confiança construídos; • calcular o tamanho da amostra necessário para atender especificações fixadas, tais como margem de erro e grau de confiança. • elaborar as hipóteses para a tomada de decisões em diferentes cenários de testes de hipóteses. • realizar testes de hipóteses para a média e proporção populacionais. • tomar decisões em testes de hipóteses; 3 • aplicar os conhecimentos adquiridos em projetos de pesquisa científica e na solução de problemas de sua área de atuação. 1.1.Conceitos iniciais: parâmetros, estimadores e estimativas Para formalizar as ideias apresentadas neste capítulo, precisamos conceituar parâmetros, estimadores e estimativas. 1.1.1. Parâmetro As características numéricas de uma população, em geral desconhecidas e sobre as quais temos interesse, são denominadas parâmetros e usualmente são representadas por letras gregas tais como θ , µ e σ , entre outras. Para efeito de nossos estudos, os parâmetros populacionais que nos interessam são a média µ e o desvio-padrão σ . 1.1.2 Estimador e estimativa À combinação dos elementos da amostra, construída com a finalidade de representar, ou estimar, um parâmetro de interesse na população, denominamos estimador. Em geral, denotamos os estimadores por símbolos com o acento circunflexo: θˆ , µˆ , σˆ etc. Aos valores numéricos assumidos pelos estimadores denominamos estimativas pontuais ou simplesmente estimativas. Um estimador, digamos θˆ , é uma função das variáveis aleatórias constituintes da amostra. Logo, um estimador também é uma variável aleatória e, como tal, possui uma distribuição de probabilidades. A correspondente distribuição de probabilidade formará a base das argumentações probabilísticas utilizadas na extrapolação da informação da amostra para os parâmetros da população. INSERIR ICONE DE INTERLOCUÇÃO INTERROGATIVA Para que fiquem bem entendidos os conceitos de estimador e estimativa, vamos rever como se faz o cálculo da média e desvio padrão amostrais, que precisaremos para as estimativas? Suponha que uma amostra de tamanho n é retirada da população e apresente os valores pertencentes ao conjunto de variáveis aleatórias ( )nXXX ,,, 21 L . Sejam os parâmetros média, variância e proporção de certa característica na população indicados por µ , σ e p, respectivamente. Os estimadores “naturais” para estes parâmetros são as correspondentes média, variância e proporção calculadas na amostra. Representando-os, respectivamente, por X , σˆ e pˆ , temos: ∑ = = +++ = n i in n X n XXX X 1 21 L ; ( )∑ = −= n i i XX n 1 22 1σˆ ; n amostranaticacaracterisacomitensdenúmerop ˆ = . 4 Note que cada um dos estimadores apresentados depende dos valores pertencentes à amostra aleatória ( )nXXX ,,, 21 L ; essa estimação é denominada estimação pontual. Numerosos têm sido os critérios utilizados por estatísticos matemáticos para escolher os estimadores apropriados para estimar, com base em dados de amostra, os parâmetros populacionais. Uma das características mais importantes de um estimador é que seja não viciado (não tendencioso). 1.1.3 Estimador não viciado Um estimador não viciado é uma estatística amostral cujo valor esperado é igual ao parâmetro que está sendoestimado. Magalhães (2002) mostra que os estimadores X e pˆ têm boas propriedades e, além disso, são não viciados. No entanto, o estimador 2σˆ é viciado, portanto não é adequado para estimação. Para eliminar esse vicio, define-se o seguinte estimador: 2S é um estimador não viciado para estimar 2σ . O estimador 2S recebe o nome de variância amostral e será sempre denotado por 2S para distinguir de outros estimadores denotados genericamente por 2σˆ . O número de faltas, por ano, de funcionários de determinada empresa foi anotado a partir de uma amostra de 25 funcionários escolhidos ao acaso. Deseja-se saber qual é o número médio de faltas por funcionário em um ano. Os dados obtidos são: 2, 2, 3, 1, 4, 5, 3, 4, 5, 6, 5, 3, 4, 3, 4, 2, 4, 3, 5, 2, 1, 6, 2, 3 e 4. Solução A estimativa da média populacional é: 44,3 25 4322 = ++++ = LX faltas Logo o número médio de faltas por funcionário em cada ano é aproximadamente 4. A estimativa da variância amostral é: ( ) ( ) ( ) 006,2 24 44,3444,3244,32 2222 = −++−+− = LS faltas2. ( )2 1 2 1 1 ∑ = − − = n i i XX n S Exemplo 1.1 5 Antes de introduzirmos o conceito de intervalo de confiança, vamos estudar um assunto importante que é o Teorema Central do Limite. 1.1.2 Teorema Central do Limite Suponha uma amostra aleatória simples de tamanho n retirada de uma população com média µ e variância 2σ (note que o modelo de probabilidades da variável aleatória não é especificado). Representando tal amostra por n variáveis aleatórias independentes ( )nXXX ,,, 21 L e, denotando sua média por X , temos que: ( )1,0~ NZ n X n → − ∞→ σ µ Em palavras, o teorema central do limite garante que para n grande a distribuição da média amostral, devidamente padronizada, se comporta segundo uma distribuição Normal de probabilidades com média 0 e variância 1. Pelo teorema central do limite, temos que quanto maior o tamanho da amostra, melhor é a aproximação à distribuição Normal. Estudos envolvendo simulações mostram que em muitos casos valores de n ao redor de 30 fornecem aproximações boas para aplicações práticas. Uma aplicação importante relaciona-se com a distribuição da proporção amostral. Recorde que definimos a proporção amostral ( )pˆ como a fração de indivíduos com uma dada característica em uma amostra de tamanho n. Se construirmos para o i- ésimo indivíduo uma variável aleatória iY tal que = contrário. caso 0, tica;caracterís a apresenta indivíduo o se ,1 iY Podemos escrever a proporção amostral como: A proporção amostral é a média de variáveis aleatórias convenientemente definidas. Assumindo que a proporção de indivíduos com a característica na população é p e que os indivíduos são selecionados aleatoriamente, temos que nYY ,,1 K formam uma sequência de variáveis aleatórias do modelo Bernoulli. Assim, a média e a variância do modelo Bernoulli são dadas por p e ( ) npp −1 , respectivamente. A partir do Teorema Central do Limite temos que: Y n Y n YYY p n i in == +++ = ∑ =1 21 ˆ K ( ) ( )1,0 1 ˆ N npp pp n → − − ∞→ 6 Conhecido o teorema central do limite, estudaremos a seguir os diversos casos de estimação intervalar. 1.2 Estimação da média populacional µ : intervalos de confiança Os estimadores vistos até o momento são pontuais, pois fornecem estimativa numérica para o parâmetro de interesse. O método que veremos agora, denominado de estimação intervalar ou estimação por intervalo, incorpora à estimativa pontual uma margem de erro. Estudaremos os seguintes casos de estimação intervalar : • Intervalo de confiança para a média populacional µ quando a variância populacional 2σ é conhecida; • Intervalo de confiança para a média populacional µ quando a variância populacional 2σ é desconhecida e a amostra é grande ( 30n ≥ elementos); • Intervalo de confiança para a média populacional µ quando a variância populacional 2σ é desconhecida e a amostra é pequena ( 30n < elementos). 1.2.1 Caso 1: variância populacional 2σ é conhecida Quando a variância populacional 2σ é conhecida e supondo uma amostra de tamanho n, temos, pelo teorema central do limite, que a média amostral tem distribuição Normal com a mesma média µ e variância 2 n σ . Para um valor α fixado, tal que 10 << α , podemos obter na tabela da distribuição Normal Z padronizada um valor 2αz tal que: Lembre-se que a distribuição Normal é simétrica, portanto a área α deve ser igualmente distribuída em torno de 0, conforme mostra a figura 1.1 a seguir: ( ) ( ) αααα =<<−=< 222 zZzPzZP 7 Figura 1.1 Gráfico da distribuição normal padronizada Z INTERLOCUÇÃO IMPORTANTE. ( )1 %α− é o coeficiente de confiança e 2αz é o valor de z que fornece uma área de 2α na extremidade superior da distribuição Normal padrão, assim temos o intervalo: Assim o intervalo de confiança para µ , com coeficiente de confiança )%1( α− é dado por: Nessa altura de seus estudos, você deve estar se perguntando: afinal, o que significa coeficiente de confiança? O coeficiente de confiança é interpretado do seguinte modo. Se obtivermos várias amostras de mesmo tamanho e para cada uma calcularmos os correspondentes intervalos de confiança com coeficiente de confiança (1 )%α− , esperamos que a proporção de intervalos que contenham o valor de µ seja igual a (1 )%α− . Assim, se construirmos 100 intervalos para a média µ com 90% de confiança, é de se esperar que 90 desses intervalos contenham a verdadeira média µ . Um conceito importante é o conceito de erro de estimação. Ao estimarmos a média populacional por intervalo, incorporamos à estimativa pontual um erro e esse erro é dado pela expressão: n zX n zXz n X z σµσ σ µ αααα 2222 +<<−⇒< − <− ( ) +−=− n zX n zX σσαµ αα 22 ;1,IC n zE σα 2= 8 INSERIR ÍCONE PARADA REFLEXÃO. A fórmula do erro, também chamada margem de erro, revela que há efetivamente três fatores determinantes do tamanho ou quantidade do erro. Quais são esses fatores? Como eles afetam o erro? Você, que é um observador atento, deve ter notado que os fatores que determinam a margem de erro são: • a confiança desejada, representada pelo valor de 2αz ; • a dispersão (ou desvio-padrão) da população, σ ; • o tamanho da amostra n. Também deve ter inferido que: • quanto maior o coeficiente de confiança ou a dispersão da população, maior o erro; • quanto maior o tamanho da amostra menor o erro. Encontramos o valor de 2αz na tabela Normal padronizada. Vejamos, a seguir, os exemplos sobre a construção de intervalos de confiança. Um consultor toma uma amostra aleatória de tamanho n =16 de um conjunto de contas a pagar. Sabe-se que o desvio padrão das contas a pagar é =σ R$57,00. A partir da amostra, observou-se que a média amostral foi =X R$250,00. Construa um intervalo de 95% para o valor médio das contas. Solução O intervalo de confiança para a média µ é dado pela expressão ( ) +−=− n zX n zX σσαµ αα 22 ;1,IC . Temos 1 0,95α− = , logo 0,05α = . =X R$250,00 0,05 0,025 2 2 Z Z Zα = = . Consultando a Tabela da distribuição Normal padronizada, encontramos 025,0z =1,96, pois ( ) 475,096,10 =≤≤ zP , logo ( ) 025,096,1 =≥zP . =σ R$57,00 n =16 Substituindo os valores na expressão do intervalo de confiança, obtemos Exemplo 1.29 ( ) +−⇒ +−= 16 5796,1250; 16 5796,1250 16 57250; 16 57250%59 ,IC 22 ααµ zz Assim o intervalo de confiança para o valor médio das contas a pagar, com 95% de confiança é [ ]93,277;07,222 . Em outras palavras, com 95% de confiança, o valor médio das contas a pagar situa-se de R$ 222,07 a R$ 277,93. 1.2.2 Caso 2: a variância populacional 2σ é desconhecida e a amostra é grande (n ≥ 30) Na maioria das aplicações a variância populacional 2σ é desconhecida. Quando isso acontece, o estimador não viciado, 2S , pode ser usado para estimar 2σ . Nos casos em que a amostra é grande, 30≥n , o Teorema Central do Limite fornece boa aproximação para a distribuição da média amostral. Assim o intervalo de confiança de ( )α−1 % é expresso da forma: tal que 2SS = . Portanto, a construção do intervalo de confiança é semelhante à que foi feita no 1º caso, a única diferença é que no lugar de σ usa-se o desvio padrão amostral S . Para ilustrar esse caso, consideremos o exemplo de Anderson, Sweeney e Williams (2002), relativo a um estudo de amostragem conduzido pela Statewide Insurance Company. Como parte de uma revisão anual das apólices de seguro de vida, a Statewide selecionou uma amostra aleatória simples de 36 proprietários de apólices de seguro de vida Statewide. As correspondentes apólices de seguro de vida são revistas em termos de garantia de cobertura. Para o estudo, um gerente solicitou uma estimativa do intervalo de confiança de 90% da idade média para a população dos proprietários da apólice de seguro de vida. A idade média da amostra é 5,39=X anos. O desvio padrão da amostra é 77,7=S . O valor de 05,0z é 1,645. Portanto o intervalo de 90% é dado por: [ ]2,1339,5 ;13,25,39 36 77,7645,15,39 ; 36 77,7645,15,39 +−⇒ +− A margem de erro é 2,13 e a estimativa da idade média da população de proprietários de apólices de seguros, com 90% de confiança, é 37,37 a 41,63 anos. 1.2.3 Caso 3: a variância populacional 2σ é desconhecida e a amostra é pequena (n < 30) Exemplo 1.3 ( ) +−=− n S zX n S zX 22 ;1,IC αααµ 10 Se tivermos uma amostra pequena ( )30<n e pretendemos construir um intervalo de confiança, mas não conhecemos 2σ , podemos utilizar a distribuição t-Student, ou simplesmente, distribuição t, para construir o intervalo de confiança. A distribuição t é utilizada na determinação de valores críticos denotados por 2αt .Observe na tabela da distribuição t que nas linhas aparece o número de graus de liberdade, que é dado por 1−n . Os graus de liberdade, ou gl, correspondem ao número de valores que podem variar após terem sido impostas certas restrições a todos os valores. A distribuição t-Student exibe algumas propriedades interessantes. • É diferente conforme o tamanho da amostra, ou seja, ela muda dependendo dos graus de liberdade; • Apresenta a mesma forma geral simétrica (forma de sino) que a distribuição Normal, mas com maior variabilidade, o que é esperado em amostras pequenas, logo ( ) 5,00 =≥tP e ( ) 5,00 =≤tP ; • O desvio padrão da distribuição t varia com o tamanho da amostra, mas é superior a 1; • Na medida em que aumenta o tamanho n da amostra, a distribuição t se aproxima mais e mais da distribuição normal padronizada. Podemos agora determinar os valores para a margem de erro para construir intervalos de confiança: n S tE n 1,2 −= α , tal que 1,2 −ntα é o valor de t que fornece uma área de 2α na extremidade superior da distribuição t com 1−n graus de liberdade. E o intervalo de ( )α−1 % de confiança é dado por: O intervalo de confiança para µ , com coeficiente de confiança ( α−1 )% também pode ser expresso por: n S tX n S tXEXEX nn 1,21,2 −− +<<−⇒+<<− αα µµ ( ) +−=− −− n S tX n S tX nn 1,21,2 ;1,IC αααµ 11 Voltemos ao exemplo 1.1 da seção 1.1.3, referente ao número de faltas de funcionários de determinada empresa por ano, em que os valores estimados de X e 2S foram 3,44 faltas e 2,006 faltas2, respectivamente, sendo 4163,1006,22 === SS faltas. Calculemos um intervalo de 95% de confiança para o número médio de faltas por funcionário. Solução Temos 1 0,95α− = , logo 0,05α = e 0,05 0,025 2 2 α = = 3, 44X = 1,4163S = 25n = , logo 25 1 24gl = − = Para encontrar o valor de 24;025,0t , consultamos a tabela da distribuição t. Como a amostra é de tamanho 25, temos 24 graus de liberdade. Na tabela da distribuição t, o valor crítico que deixa área de 2,5% acima da curva, com 24 graus de liberdade é 24;025,0t = 2,064. Assim o intervalo de 95% de confiança para a média será dado por ( ) [ ] [ ]025,4;855,2585,044,3 25 4163,1064,244,3%95,IC ⇒±⇒ ±=µ , sendo a margem de erro igual a 0,585 faltas. 1.2.4 Determinação do tamanho da amostra Graus de liberdade 0,005 (unilateral) 0,01 (bilateral) 0,01 (unilater al) 0,02 (bilatera l) 0,025 (unilateral ) 0,05 (bilateral) 0,05 (unilateral) 0,10 (bilateral) 21 2,831 2,518 2,080 1,721 22 2,819 2,508 2,074 1,717 23 2,807 2,500 2,069 1,714 24 2,797 2,492 2,064 1,711 25 2,787 2,485 2,060 1,708 Exemplo 1.4 ( ) 95,0064,2064,2 =≤≤− tP 12 Suponha que os dados ainda não foram coletados. Como saber quantos elementos da população devem ser escolhidos? Suponha, por exemplo, que queiramos estimar a renda média de professores da rede pública do 1º grau em Minas Gerais. Quantas rendas devemos incluir em nossa amostra? A determinação do tamanho da amostra é um problema de grande importância, porque amostras desnecessariamente grandes acarretam desperdício de tempo e de dinheiro; e amostras demasiadamente pequenas podem levar a resultados não- confiáveis. Em muitos casos é possível determinar o tamanho mínimo de uma amostra para estimar determinado parâmetro. A fórmula a seguir permite calcular o tamanho da amostra: O tamanho da amostra deve ser um número inteiro, quando o resultado não for inteiro, como regra, deve-se arredondar para o próximo inteiro maior. Com esta fórmula, pode-se determinar o tamanho da amostra necessária para dar resultados precisos, fixados o grau de confiança e a margem de erro. A fórmula deve ser usada quando conhecemos o valor do desvio-padrão populacional σ e queremos determinar o tamanho da amostra necessário para estabelecer, com um nível de confiança de α−1 , o valor de µ com um erro a menos de E± . A existência dessa fórmula implica que o tamanho da amostra não depende do tamanho da população. Um analista de salários deseja estimar a renda média para o primeiro ano de trabalho de engenheiros civis. Quantos valores de renda devem ser tomados, se o analista deseja ter 95% de confiança de que a média amostral esteja a menos de R$300,00 da verdadeira média populacional? Suponha que saibamos, por um estudo prévio, que, para tais rendas, =σ R$2050,00. Solução Queremos determinar n , dado que 05,0=α , 300=E , 2050=σ . Aplicando a fórmula: 2 2 = E z n σα Exemplo 1.5 18038,179 300 2050.96,1 2 ≅= =n 13 Portanto, devemos obter uma amostra de pelo menos 180 rendas de engenheiros civis com um ano de formatura, selecionadas aleatoriamente. Com tal amostra teremos 95% de confiança em que a média amostral X difira em menos de R$300,00 da médiapopulacional µ . 1.3 Estimação da proporção populacional 1.3.1 Expressão do intervalo de confiança Vimos na seção 1.1.3 que o melhor estimador para estimar a proporção p de uma população é pˆ (Triola, 1999). O raciocínio para a construção do intervalo de confiança é semelhante ao da média. O estimador usado para o desvio-padrão da proporção p é dado por: A margem de erro para a proporção populacional e o intervalo de confiança são calculados respectivamente por: Este é um intervalo de confiança de ( )%1 α− . Para encontrar o nível crítico 2/αz consultamos a tabela da distribuição Normal. Com o intuito de melhorar a qualidade dos serviços de um hospital, a administração fez uma pesquisa para avaliar a satisfação dos funcionários. Como o quadro era muito grande e fazer uma entrevista com cada funcionário demandaria tempo e dinheiro, uma amostra de 2 funcionários por setor foi aleatoriamente extraída, totalizando 36 entrevistados. A última pergunta do questionário era saber se o funcionário estava satisfeito com o emprego ou não. Para não prejudicar o funcionário e não ocorrer respostas mentirosas, o sigilo foi mantido de forma que o entrevistado não seria identificado. Dos 36, 23 afirmaram que estavam satisfeitos com o emprego. Dê uma estimativa de 95% de confiança da proporção da satisfação dos funcionários do hospital. Solução A estimativa pontual de p é: 64,06389,0 36 23 ˆ ≈==p ( )pp ˆ1ˆ −=σ) ( ) n pp zE ˆ1ˆ 2/ − = α ; ( ) ( ) − ±=− n pp zpp ˆ1ˆ ˆ)%1( ;ˆIC 2/αα Exemplo 1.6 14 O intervalo de 95% de confiança é dado por: ( ) [ ] [ ]797,0;483,0157,064,0 36 64,0164,096,164,0 ⇒±⇒ −± Com 95% de confiança, podemos dizer que a proporção de funcionários satisfeitos está entre 0,483 e 0,797. Ou, em outras palavras, podemos afirmar que a proporção de funcionários satisfeitos é 64% com margem de erro de 15,7%. 1.3.2 Determinação do tamanho da amostra No caso de proporção populacional, a determinação do tamanho da amostra se procede de forma similar à que foi feita para a média. Resolvendo a equação de erro para n , encontramos: EDITORAÇÃO ÍCONE INTERLOCUÇÃO INTERROGATIVA. Observe que para aplicar a fórmula, podemos fixar a margem de erro E e o grau de confiança ( )%1 α− . Mas qual valor atribuir à proporção pˆ ? Na prática, para atribuir um valor a pˆ você pode adotar um dos seguintes critérios: • Usar a proporção amostral pˆ estimada em um estudo piloto; • Usar 5,0ˆ =p , pois este é o valor que maximiza da variância de p ; • Usar um valor fornecido por especialista da área de estudo; • Usar a proporção da amostra a partir de unidade similar. Quando n não for inteiro, arredonda-se para o inteiro superior. Uma montadora de automóveis deseja saber a proporção de motoristas clientes da sua marca que fazem revisão mecânica em sua autorizada. Ela deseja estimar, com uma margem de erro de três pontos percentuais, a percentagem de motoristas que se dirigem ao seu serviço autorizado quando os automóveis apresentam problemas mecânicos ou desejam outro serviço. Supondo que se pretenda um nível de confiança de 95% nos resultados, quantos motoristas devem ser pesquisados? a) Suponha que tenhamos uma estimativa pˆ com base em estudo anterior, que mostrou que 18% dos motoristas utilizavam o serviço da autorizada. b) Suponha que não tenhamos qualquer informação que possa sugerir um valor de p . Solução: a) 18,0ˆ =p ; ao nível de 95% de confiança, 05,0=α e 96,12/ =αz . A margem de erro é de três pontos percentuais, logo: 03,0=E . ( ) ( ) 2 2 2/ ˆ1ˆ E ppz n − = α Exemplo 1.7 15 ( )( ) 6310224,630 03,0 82,018,096,1 2 2 ≈==n Devemos pesquisar ao menos 631 motoristas selecionados aleatoriamente. b) Assim como na parte (a), utiliza-se 96,12/ =αz e 03,0=E , mas sem qualquer conhecimento prévio de p , temos que utilizar o valor de 5,0ˆ =p que maximiza a variância. ( ) 10681111,1067 03,0 5,096,1 2 22 ≈==n Para termos 95% de confiança de que nossa percentagem amostral está a menos de três pontos percentuais da verdadeira percentagem de todos os motoristas, devemos selecionar aleatoriamente e pesquisar 1068 motoristas. Comparando este resultado com o tamanho amostral de 631 obtido na parte (a), podemos ver que, na ausência de conhecimento de um estudo prévio, é necessária uma amostra maior para obtermos os mesmos resultados que obteríamos se pudéssemos estimar o valor de p . 1.4 Testes de hipótese para média populacional Estudaremos agora os testes de hipóteses (ou afirmações) sobre parâmetros de uma população. Vejamos inicialmente como formular hipóteses, a partir de três exemplos. 1.4.1 Formulação das hipóteses para teste Uma indústria farmacêutica deseja testar um novo medicamento no combate à dor de cabeça. A idéia é verificar se o novo medicamento, Sem dor, é mais rápido para atuação no organismo de uma pessoa do que os analgésicos comuns. Sabe-se que o tempo de alívio de dor dos analgésicos comuns é 15 minutos. Logo a indústria deseja testar se o medicamento Sem dor age no organismo em menos de 15 minutos. Admite-se que o tempo de alivio do medicamento no organismo segue uma distribuição normal. O gerente de um importante hotel estabeleceu que a quantia média gasta por hóspedes em um fim de semana é de R$500,00 ou menos. Um funcionário do setor de contabilidade observou que as despesas totais dos hóspedes têm aumentado nos últimos meses. O contador do hotel irá avaliar se essa afirmativa é verdadeira ou não. Admite-se que o gasto dos hóspedes segue uma distribuição normal. Uma empresa de telefonia fixa afirma que o consumo mensal de ligações à longa distância foi 3 horas e 35 minutos por residência no último ano. Deseja-se avaliar se o Exemplo 1.8 Exemplo 1.9 Exemplo 1.10 16 consumo por residência deste ano é o mesmo. Admite-se que o consumo mensal de ligações à longa distância segue uma distribuição normal. Existem testes de hipóteses para média e para proporção de uma população. Uma suposição que precisa ser feita é que os dados da população provêm de uma distribuição normal com a média ou proporção desconhecidas; a variância pode ser conhecida ou não . Vamos agora definir as componentes de um teste de hipóteses: o Hipótese nula (denotada por H0): é uma afirmação sobre o valor de um parâmetro populacional (como a média ou proporção), deve conter a condição de igualdade e deve escrever-se como =, ≤ ou ≥ . (Ao fazermos efetivamente o teste, trabalhamos com a hipótese de que o parâmetro é igual a um valor especificado.) Para a média, temos as três formas possíveis para a hipótese nula: H0: µ = algum valor H0: ≥µ algum valor H0: ≤µ algum valor o Hipótese alternativa (denotada por Ha): é uma afirmação que deve ser verdadeira se a hipótese alternativa comporta apenas uma das três formas: Ha: ≠µ algum valor Ha: µ < algum valor Ha: µ > algum valor INSERIR ÍCONE IMPORTANTE: Se você está fazendo uma pesquisa e deseja usar um teste de hipótese para apoiar sua afirmação, essa afirmação deve ser formulada de maneira que se torne a hipótese alternativa, não podendo conter a condição de igualdade (Triola, 1999). No exemplo 1.8, as hipóteses a serem testadas são: � Hipótese nula H0: 15≥µ minutos; � Hipótese alternativa Ha: 15<µ minutos. No exemplo 1.9, as hipóteses a serem testadas são: � a hipótese nula é H0: 500≤µ reais; � a alternativa é Ha: 500>µ reais. No exemplo 1.10, as hipóteses a serem testadassão: � a hipótese nula é H0: 215=µ minutos (3 horas e 35 minutos) � a alternativa é Ha: 215≠µ minutos. 1.4.2 Erros em testes de hipóteses Ao testarmos hipóteses podemos tomar duas decisões: rejeitar H0 ou não rejeitá-la. As decisões podem estar corretas ou incorretas, mesmo quando se faz o planejamento do teste corretamente. Na condução de um teste de hipótese, podemos cometer dois erros: o Erro tipo I: consiste em rejeitar a hipótese nula quando ela é verdadeira. – No exemplo 1.8 seria dizer que o tempo de reação do medicamento Sem dor é menor que 15 minutos, quando na verdade é igual ou superior a 15 minutos. 17 – No exemplo 1.9 seria dizer que o consumo dos hóspedes é superior a R$500,00, quando na verdade é igual ou inferior a R$500,00. – No exemplo 1.10 seria dizer que o consumo mensal de ligações por residência é diferente de 3 horas e 35 minutos, quando na verdade esse consumo é igual à 3 horas e 35 minutos. A probabilidade de rejeitar Ho quando ela é verdadeira é chamada de nível de significância (denotada por α ), geralmente é fixada antes de se realizar o teste. o Erro tipo II: consiste em não rejeitar a hipótese nula quando ela é falsa. – No exemplo 1.8 seria dizer que o tempo de reação do novo medicamento é igual ou superior a 15 minutos, quando na verdade é inferior a 15 minutos. – No exemplo 1.9 seria dizer que o consumo dos hóspedes é igual ou inferior a R$500,00, quando na verdade é superior a R$500,00. – No exemplo 1.10 seria dizer que o consumo mensal de ligações por residência é igual à 3 horas e 35 minutos, quando na verdade é diferente de 3 horas e 35 minutos. A probabilidade de não rejeitar Ho quando ela é falsa é representada pelo símbolo β . O Quadro 1.1 resume os erros que podemos cometer quando realizamos um teste de hipótese. Quadro 1.1: Erros em testes de hipóteses Fonte: elaboração do autor Karine Ruiz Colenghi EDITORAÇÃO INSERIR ICONE DE ATENÇÃO Observação: No teste de hipóteses devemos escolher a probabilidade do erro tipo I ( )α , mas não selecionamos a probabilidade do erro tipo II ( )β . O ideal seria se 0== βα , mas como isso não é possível; devemos controlar as probabilidades de erro α e β . Pode-se mostrar matematicamente que α , β e o tamanho da amostra n estão todos inter-relacionados, de forma que, escolhidos quaisquer dois deles, o terceiro está automaticamente determinado. Na prática, o comum é determinar os valores de α e n , de modo que o valor de β fica determinado. EDITORAÇÃO, INSERIR O ICONE PARA SABER MAIS Estude o texto Erros de decisão, de Morettin, especificamente o assunto função poder de um teste ou potência de um teste. Além das definições de erro tipo I e erro tipo II, existem outras componentes que precisam ser definidas: o Estatística de teste: é um valor baseado nos dados amostrais para tomar uma decisão sobre a rejeição da hipótese nula. No caso de teste para média ela será formada pela média amostral e pelo desvio padrão. Veremos mais a frente como se constrói a estatística de teste. H0 é verdadeira H0 é falsa Decisão Rejeitar H0 Erro tipo I Decisão correta Não rejeitar H0 Decisão correta Erro tipo II 18 Região Crítica o Região Critica: é o conjunto de todos os valores da estatística de teste que levam à rejeição da hipótese nula. o Valor Crítico: é o valor, ou valores que separa(m) a região crítica dos valores da estatística de teste que não levam à rejeição da hipótese nula. Os valores críticos dependem da natureza da hipótese nula, da distribuição amostral da estatística de teste de do nível de significância α . Figura 1.2: Região crítica ou de rejeição da hipótese nula 1.4.3 Estatística de teste A estatística de teste, que chamaremos Z calculado e denotaremos Zcalc , utilizada no teste de hipóteses é construída a partir do Teorema Central do Limite. Para a média, a estatística de teste é dada por: 0 /calc X z n µ σ − = , considerando que o valor de 0µ é o valor extremo dado pela hipótese nula. Também podemos definir a estatística de teste para a proporção: 0 0 0 ˆ (1 )calc p p z p p n − = − , sendo 0p é o valor extremo fornecido pela hipótese nula. Mais adiante você entenderá melhor como se faz o teste para proporção. Vamos enfocar primeiramente o teste para a média. 1.4.4 Tipos de testes: bilateral e unilateral As caudas em uma distribuição de probabilidades são as regiões extremas delimitadas por valores críticos. A partir de H0, dá para saber qual é o tipo de teste. A cauda corresponderá à região crítica que contem os valores conflitantes com a H0. As figuras 1.3, 1.4 e 1.5 mostram como se verificam os tipos de testes. Na figura 1.3, o teste é unilateral esquerdo. Na figura 1.4, o teste é unilateral direito. Na figura 1.5, o teste é bilateral. As expressões unilateral e bilateral em alguns livros são denominadas unicaudal e bicaudal. µ 19 Figura 1.3: Região de rejeição para o teste unilateral esquerdo Sinal de Ha: < teste unilateral esquerdo Figura 1.4: Região de rejeição para o teste unilateral direito Sinal de Ha: > teste unilateral direito Figura 1.5: Região de rejeição para o teste bilateral Sinal de Ha: ≠ Teste bilateral IMPORTANTE IMPORTANTE Quando o teste é unilateral definimos as hipóteses assim: • H0: 0µµ ≤ contra Ha: 0µµ > para o teste unilateral direito; ou • H0: 0µµ ≥ contra Ha: 0µµ < para o teste unilateral esquerdo. Contudo, alguns autores usam as mesmas hipóteses definidas de forma diferente: • H0: 0µµ = contra Ha: 0µµ > para o teste unilateral direito; ou • H0: 0µµ = contra Ha: 0µµ < para o teste unilateral esquerdo. A diferença está no sinal de igualdade para a hipótese nula no teste unilateral. Essa diferença de notação não altera a construção do teste. Uma entidade de defesa do consumidor afirma que os consumidores dos postos Compre Barato estão sendo prejudicados em virtude de que quando o marcador indica 1litro, a quantidade média de combustível fornecida é realmente inferior a 1 litro. a) Expresse, de forma simbólica, a afirmação de que os postos Compre Barato estão prejudicando os consumidores. Exemplo 1.11 20 Solução A afirmação de que os consumidores estão sendo prejudicados é equivalente a afirmar que a média é inferior a 1 litro, o que, em forma simbólica, se expressa como 1<µ litro. b) Identifique a hipótese nula H0. Solução A afirmação original 1<µ litro não contém a igualdade conforme exigida pela hipótese nula. A afirmação original é, pois, a hipótese alternativa; a hipótese nula é H0: 1≥µ . c) Identifique a hipótese alternativa Ha. Solução A hipótese alternativa é Ha: 1<µ . d) Identifique este teste como bilateral, unilateral direito ou unilateral esquerdo. Solução Este teste é unilateral esquerdo, porque a hipótese nula é rejeitada se a média amostral é significativamente inferior a 1 (está à esquerda de 1). (Como uma dupla verificação note que a hipótese alternativa 1<µ contém o sinal <, que aponta para a esquerda.) e) Identifique o erro tipo I para este teste. Solução O erro tipo I (rejeição de uma hipótese nula verdadeira) consiste em rejeitar H0: 1≥µ quando a média populacional é realmente igual ou superior a 1. Trata-se de um erro sério, porque os postos Compre Barato serão acusados de prejudicar os consumidores quando, na realidade, não há tal prejuízo. f) Identifique o erro tipo II para este teste. Solução O erro tipo II (não rejeitar a hipótese nula falsa) consisteem não rejeitar H0: 1≥µ litro, quando a média populacional é realmente inferior a 1. Isto é, concluímos que não há evidência suficiente para comprovar o prejuízo, quando esse prejuízo está efetivamente ocorrendo. g) Suponha que a conclusão seria rejeitar a hipótese nula. Enuncie a conclusão em termos não-técnicos; certifique-se de que está abordando a afirmação original. Solução Conclui-se que há evidência suficiente para apoiar a afirmação de que a quantidade média de combustível fornecida é inferior a 1 litro. h) Suponha que a conclusão seja não rejeitar a hipótese nula. Enuncie a conclusão em termos não-técnicos; certifique-se de que está abordando a afirmação original. Solução Concluir que não há evidência suficiente para apoiar a afirmação de que a quantidade média de combustível fornecida é inferior a 1 litro. 21 IMPORTANTE IMPORTANTE. Para realizar os testes, temos que levar em consideração o tipo de teste (bilateral ou unilateral) e se a variância dos dados é conhecida ou não. Se esta for desconhecida, devemos observar se a amostra é grande ( )30>n ou não. Isto é importante, pois a partir dessa análise é que as estatísticas de teste e a região crítica são construídas. Vamos estudar todos os quatro casos. 1.4.4.1 Caso 1: teste unilateral quando a variância populacional 2σ é conhecida ou a amostra é grande ( )30>n Quando se realiza um teste unilateral a hipótese alternativa é Ha: µ < 0µ no caso do teste unilateral esquerdo ou Ha: µ > 0µ no caso de um teste unilateral direito. A partir de uma amostra dos dados calcula-se a média amostral X . No caso em que a variância populacional 2σ é conhecida a estatística de teste será: No caso em que a variância 2σ é desconhecida, mas a amostra é grande ( )30>n utiliza-se o valor do desvio-padrão S dos dados da amostra como uma estimativa de σ . Portanto a estatística de teste será: Assim, é construída a regra de rejeição, conforme ilustram as figuras 1.6 e 1.7. Figura 1.6 Região de rejeição da hipótese nula no teste unilateral esquerdo 0 /calc X z n µ σ − = 0 /calc X z S n µ− = Valor de zcalc 22 Figura 1.7 Região de rejeição da hipótese nula no teste unilateral direito Quando se observa o valor da estatística calcZ (estatística de teste) na região crítica, deve-se rejeitar H0. Caso contrário não se deve rejeitar H0. Denotando RC de região crítica, podemos escrever: • { }, tal que RC z z zα= ∈ℜ < − para teste unilateral esquerdo; • { }αzzzRC >ℜ∈= . que tal, para teste unilateral direito. Retomemos o exemplo 1.8, visto na seção 1.4.1. Suponha se tenha uma amostra dos tempos que os pacientes acusaram para o alívio de dor de cabeça do medicamento Sem Dor. A média dos tempos de atuação para os 40 pacientes foi 2,14=X minutos, o desvio padrão calculado a partir das observações foi 73,2=S minutos. Vamos testar a hipótese de que o tempo de reação do medicamento é menor que 15 minutos usando um nível de significância 05,0=α . Hipóteses: H0: 15≥µ minutos contra Ha: 15<µ minutos Região Crítica: { }64,1 que tal, −<ℜ∈= zzRC Valor de zcalc Exemplo 1.12 23 Estatística de Teste: Pelas observações coletadas temos: 14, 2 15 0,8 1,85 0, 432,73 / 40calc z − − = = = − Decisão: Como -1,85 está na RC, rejeita-se H0 a 5% de significância. Conclusão: Há evidência suficiente para apoiar a afirmação de que o novo medicamento alivia a dor de cabeça em menos de 15 minutos. 1.4.4.2 Caso 2: teste bilateral quando a variância populacional 2σ é conhecida ou a amostra é grande ( )30>n Quando se realiza um teste bilateral a hipótese alternativa é Ha: 0µµ ≠ ( 0µ é o valor especificado por H0). A partir de uma amostra dos dados calcula-se a média amostral X . Assim, quando a variância é conhecida a estatística de teste será: Quando a variância é desconhecida, mas a amostra é grande ( )30>n utiliza-se o valor de S dos dados como uma estimativa de σ , igual ao caso unilateral. Portanto a estatística de teste será: Assim, é construída a regra de rejeição, conforme mostra a Figura 1.8. ( )1,64 0,05P z < − = 0 /calc X z n µ σ − = 0 /calc X z S n µ− = 24 Figura 1.8: Região de rejeição da hipótese nula no teste bilateral Quando se observa o valor da estatística calcZ na região crítica, deve-se rejeitar H0. Caso contrário não se deve rejeitar H0. Podemos escrever a região crítica da forma: O dono de um grande supermercado afirma que o consumo mensal de energia elétrica de seu estabelecimento é 40000 kWh. Um engenheiro contratado pelo supermercado deseja avaliar se essa afirmação é verdadeira. Após coletar 36 dados de consumo dos meses anteriores, o engenheiro observa: 42000=X kWh e 3500=S kWh. O teste será realizado considerando a probabilidade do erro tipo I ser igual a 0,05. Suponha que o consumo de energia do supermercado siga uma distribuição normal. Solução Hipóteses: H0: 40000=µ e Ha: 40000≠µ Estatística de Teste: Pelas observações temos: 42000 40000 3,43 3500 / 36calc z − = = Região Crítica: Valor de zcalc { }2/2/ ou que tal, αα zzzzzRC >−<ℜ∈= Exemplo 1.13 25 { }96,1ou 96,1 que tal, >−<ℜ∈= zzzRC Decisão: Como RC 43,3 ∈ , decide-se pela rejeição de H0, a 5% de significância. Conclusão: Há evidências de que o consumo de energia desse supermercado não é 40000 kWh. 1.4.4.3 Caso 3: teste unilateral quando a variância populacional 2σ é desconhecida e a amostra é pequena ( )30<n Nos casos vistos até o momento, a amostra era grande e, portanto, era possível utilizar o Teorema Central do Limite e usar a aproximação normal para a estatística de teste. Contudo não podemos utilizar esse teorema para amostras pequenas. Para realizar testes com pequenas amostras vamos seguir o mesmo raciocínio que foi utilizado na estimação intervalar. Ao invés de utilizar a aproximação normal iremos recorrer à distribuição t de Student. A estatística de teste, que chamaremos t calculado e denotaremos tcalc, neste caso é: A região crítica é construída utilizando a distribuição t com 1−n graus de liberdade. No caso em que a hipótese é unilateral temos: Figura 1.9: Região de rejeição em testes t bilaterais F Valor de tcalc Valor de tcalc 0 /calc X t S n µ− = 26 Quando se observa o valor da estatística calct na região crítica, deve-se rejeitar H0. Caso contrário não se deve rejeitar H0. Podemos escrever: • { }1 , que tal, −−<ℜ∈= ntttRC α para teste unilateral esquerdo e • { }1 ,. que tal, −>ℜ∈= ntttRC α para teste unilateral direito. O valor crítico 1 , −ntα é o valor de t da tabela t de Student que fornece uma área de α na extremidade superior da distribuição t com 1−n graus de liberdade, conforme se vê no gráfico da Figura 1.10. Figura 1.10: Área α da distribuição t de Student Voltemos ao exemplo 1.9, da seção 1.4.1, em que o contador do hotel pretende avaliar se a média de gastos de hóspedes no fim de semana é superior a R$500,00. Para isso ele selecionou aleatoriamente gastos de 22 hóspedes que estiveram no hotel em fins de semana de determinado mês. Os dados observados em reais foram: 475, 612, 382, 520, 600, 580,490, 615, 475, 530, 470, 700, 385, 580, 645, 430, 450, 555, 527, 410, 585, 620. O teste será realizado considerando 01,0=α . Hipóteses H0: 500≤µ reais contra Ha: 500>µ reais. Estatística de Teste: Primeiramente calculam-se os estimadores da média e do desvio-padrão populacionais: 9,528 22 620585612475 ≈ ++++ = LX ( ) ( ) 0,88 21 9,5286209,528475 22 = −++− = LS A estatística de teste será: α área Exemplo 1.14 27 528,9 500 1,54 88 / 22calc t − = = Região Crítica: Pela tabela da distribuição t, o valor crítico é 518,221;01,0 =t . A região crítica do teste é { }158,2. que tal, >ℜ∈= ttRC Decisão: Como 1,54 < 2,158, decide-se pela não rejeição de H0: 500≤µ reais. Portanto, a 1% de significância não há evidências de que o gasto dos hóspedes seja superior a R$500,00. 1.4.4.4 Caso 4: teste bilateral quando a variância populacional 2σ é desconhecida e a amostra é pequena ( )30<n Seguindo o mesmo raciocínio do Caso 3, o teste bilateral também segue à distribuição t de Student. A estatística de teste será: A região crítica é construída utilizando a distribuição t com 1−n graus de liberdade. No caso em que a hipótese é bilateral temos: Figura 1.10: Região de rejeição do teste bilateral com a distribuição t de Student t com 21 gl. 2/α 2/α Valor de tcalc 0 /calc X t S n µ− = 28 Quando se observa o valor da estatística calct na região crítica, deve-se rejeitar H0. Caso contrário não se deve rejeitar H0. Podemos escrever a região crítica no teste bilateral { }1 ,2/1 ,2/ ou que tal, −− >−<ℜ∈= nn tttttRC αα . O valor crítico 1 ,2/ −ntα é o valor de t da tabela t de Student que fornece uma área de 2/α na extremidade superior da distribuição t com 1−n graus de liberdade. Um consultor de marketing deseja avaliar o preço de um produto comestível no mercado. Para tanto, ele seleciona aleatoriamente os preços do produto em 16 lojas e acha o valor médio 50,7 $R=X com um desvio padrão de 1,00 $R=S . Supõe-se que os preços do produto sejam normalmente distribuídos. Deseja-se testar a hipótese nula H0: 8,00 $R=µ usando um nível de significância de 10%. Solução Observe que a hipótese alternativa nesse caso é Ha: 8,00 $R≠µ . Como o desvio foi estimado a partir dos dados e a amostra é pequena devemos utilizar a estatística t: 7,50 8,00 2 1,00 / 16calc t − = = − Região Crítica: Pela tabela da distribuição t o valor crítico é 753,115;05,0 =t . Este é o valor de t da tabela t de Student que fornece uma área de 0,05 na extremidade superior da distribuição t com 15 graus de liberdade. A região crítica do teste é { }753,1ou 1,753 que tal, >−<ℜ∈= tttRC . Decisão: Como 2calct = − < 753,1=críticot decidimos pela rejeição de H0: 8,00 $=µ à 10% de significância. Portanto, há evidências de que o valor do produto não é $ 8,00. 1.4.5 Valor p (nível descritivo) Ao realizarmos um teste de hipóteses, partimos de um dado valor de α pré-fixado, para construir a regra de decisão. Uma alternativa é deixar a cargo de quem vai utilizar as conclusões do teste a escolha do valor para a probabilidade α , que não precisará ser fixado a priori (antes de realizar o teste). A idéia consiste em calcular, supondo que a hipótese nula seja verdadeira, a probabilidade (usando a distribuição t ou a normal Exemplo 1.15 29 padronizada) de se obter estimativas mais desfavoráveis ou extremas do que está sendo fornecida pela amostra (pelas estatísticas calct ou calcz ). Uma outra maneira é o valor p, denotado por *α . Ele funciona em todos os 4 casos vistos anteriormente. Valores pequenos de *α evidenciam que a hipótese nula é falsa. Sendo a amostra nossa ferramenta de inferência sobre a população, ela fornece uma estimativa que teria probabilidade muito pequena de acontecer, se H0 fosse verdadeira. O conceito do que é “pequeno” fica a cargo do responsável pelo teste, que, assim, decide qual α usar para comparar com o valor obtido *α . Quando não é definido o valor de α para se fazer a comparação recomenda-se usar o nível 0,05. 1.4.5.1 Caso unilateral Para amostras grandes ou variância populacional conhecida o valor p será: • 0* ( | H verdadeira)calcP z zα = < para H0: 0µµ ≥ e Ha: 0µµ < • 0* ( | H verdadeira)calcP z zα = > para H0: 0µµ ≤ e Ha: 0µµ > No caso de amostras pequenas o valor p será : • 0* ( | H verdadeira)calcP t tα = < para H0: 0µµ ≥ e Ha: 0µµ < • 0* ( | H verdadeira)calcP t tα = > para H0: 0µµ ≤ e Ha: 0µµ > IMPORTANTE Alguns valores de nível descritivo não estão acessíveis nas tabelas das distribuições normal padronizada e t. Quando não há um software disponível para fazer o cálculo, mas somente as tabelas, você pode fazer uma aproximação para o valor p, dizendo entre quais valores ele se situa. No Excel 2003, você obtém o valor p na função DIST.NORMP, para a normal padronizada e DISTT para a distribuição t. Veja na ajuda do Excel que a função disponibiliza a distribuição acumulada até o ponto calcz ou calct . Voltando ao exemplo do medicamento Sem Dor, visto na seção 1.4.1, a estatística de teste foi calcz = -1,85. O valor p é: ==−<= )15|85,1(* µα zP 0,0322 Isso significa que a probabilidade de se dizer que o tempo de reação do medicamento é 15<µ minutos, quando na verdade é 15≥µ é 0,0322, que é bem pequena. O erro Exemplo 1.16 P(z<-1,85)=0,0322 P(z<1,64)=0,05 30 que estaria cometido seria pequeno. Por isso é que se decide pela rejeição de H0: 15≥µ . No exemplo 2, da seção 4.1, o valor p é dado por 07,0)500|54,1(* =≤>= µα tP . Se o nível de significância adotado fosse 0,05 decidiríamos por não rejeitar H0 e se fosse 0,1 decide-se por rejeitar H0. A decisão final será de acordo com a vontade de quem realiza o teste. Ele irá avaliar se o erro é grande e decidirá pela não rejeição de H0 ou se é tolerável, podendo rejeitar H0. 1.4.5.2 Caso bilateral Ao calcularmos o nível descritivo (valor p), precisamos considerar que forma da região crítica envolve os valores de calcz e calct que se distanciam muito (para mais ou para menos) daquele previsto pela hipótese nula. Dessa forma, o procedimento usual é multiplicar por dois a probabilidade obtida em uma das caudas, de modo a preservar a idéia de afastamento bilateral. Assim, ao testarmos H0: 0µµ = contra Ha: 0µµ ≠ , a definição do valor p depende a relação entre X e 0µ que é o mesmo que avaliar se calcz e calct são maiores do que zero: 1) Se 0calcz < para o caso de amostra grande ou variância conhecida, ou 0calct < para o caso de amostra pequena e variância desconhecida, • 0* 2 ( | H verdadeira)calcP z zα = × < • 0* 2 ( | H verdadeira)calcP t tα = × < respectivamente. 2) Se 0calcz > para o caso de amostra grande ou variância conhecida, ou 0calct > para o caso de amostra pequena e variância desconhecida, • 0* 2 ( | H verdadeira)calcP z zα = × > • 0* 2 ( | H verdadeira)calcP t tα = × > respectivamente. Vejamos na Figura 1.10 como é encontrado o valor p no caso em que 0calcz > e 0calct > são maiores do que zero. Figura 1.10: Região de rejeição dado *α em testes bilaterais t com 21 gl. 31 Voltando ao exemplo 1.13, da seção 1.4.4.2, relativo ao consumo de energia em um supermercado, tínhamos as hipóteses H0: 40000=µ kWh contra Ha: 40000≠µ kWh. Se formos tomar a decisão a partir do valor p, temos que calcular: • 0* 2 ( | H verdadeira)calcP z zα = × > , porque 0calcz > . • 0,01)40000|43,3 (2* <=>×= µα zP Como neste caso o valor pé muito pequeno decide-se pela rejeição de H0, levando à mesma conclusão que no procedimento de teste de hipóteses. (Magalhães, 2002) Uma fábrica de chocolates desconfia que embalagens de 450 gramas de certo tipo de chocolate em barra, estão abaixo do peso. Para verificar tal afirmação, foram coletadas ao acaso 80 barras em vários lotes de produção, obtendo-se uma média de peso de 447 gramas. Admitindo-se que o peso das barras de chocolate segue o modelo Normal com desvio padrão de 10 gramas, que conclusão pode ser tirada através do nível descritivo? • H0: 450=µ (peso médio conforme previsto na embalagem); • Ha: 450<µ (peso médio abaixo do previsto na embalagem); Exemplo 1,18 Exemplo 1.17 32 O valor observado na amostra foi 447=X e as suposições feitas sobre a normalidade da variável peso implicam que ( )nNX /,~ 2σµ , ou seja, ( )80/100,~ µNX , fazendo a padronização encontramos a estatística: 447 450 2,68 / 10 / 80calc X z n µ σ − − = = = − 0,0037450)|68,2(* ==−<= µα zP Portanto o valor p é de 0,37%, indicando a probabilidade de que encontremos valores da estimativa mais desfavoráveis à hipótese nula. Note que o valor do nível descritivo se relaciona diretamente com o nível de significância. Neste exemplo, se tivéssemos fixado o nível de significância em qualquer valor igual ou superior a 0,37% a conclusão seria pela rejeição de H0, ao passo que valores inferiores a 0,37% conduziriam à não rejeição da hipótese nula. 1.5 Teste para proporção Vamos agora mostrar como podemos testar uma afirmação sobre uma proporção, probabilidade ou porcentagem. O raciocínio é semelhante ao que foi desenvolvido no teste para a média. Todavia, trabalhando com a proporção, as observações se originam de um modelo Binomial, e, de acordo com Triola (1999), a distribuição amostral das proporções amostrais pode ser aproximada por uma distribuição normal. As hipóteses no teste para proporção são: H0: 0pp = H0: 0pp ≤ H0: 0pp ≥ Ha: 0pp ≠ Ha: 0pp > Ha: 0pp < E a estatística de teste é: 0 0 0 ˆ (1 )calc p p z p p n − = − 33 tal que pˆ é a proporção observada na amostra e n é o número de observações da amostra. Observe que o desvio utilizado no teste é ( )0 01p p n σ − = fornecido pela hipótese nula, ele não é estimado pelos dados. Por isso a aproximação da estatística de teste é feita pela distribuição normal padronizada. A Figura 1.11 mostra a região crítica nos casos de testes unilaterais esquerdo e direito. Figura 1.11: Região de rejeição para o teste da proporção p nos casos unilaterais 1.5.1 Caso unilateral Quando se observa o valor da estatística calcz na região crítica, deve-se rejeitar H0. Caso contrário não se deve rejeitar H0. Podemos escrever: • { }αzzzRC −<ℜ∈= que tal, para teste unilateral esquerdo; • { }αzzzRC >ℜ∈= . que tal, para teste unilateral direito. 1.5.2 Caso bilateral A região de rejeição no caso de um teste bilateral é ilustrada na Figura 1.12. Figura 1.12: Região de rejeição para o teste da proporção p nos caso bilateral ( ) αα => zzP ( ) αα =−< zzP Valor de zcalc Valor de zcalc 34 Quando se observa o valor da estatística calcz na região crítica, deve-se rejeitar H0. Caso contrário não se deve rejeitar H0. Podemos escrever a região crítica da forma: { }2/2/ ou que tal, αα zzzzzRC >−<ℜ∈= 1.5.3 Critério do valor p no teste de proporção Seguindo o mesmo raciocínio que foi mostrado para o valor p para o teste para média, temos • 0* ( | H verdadeira)calcP z zα = < para H0: 0pp ≥ e Ha: 0pp < • 0* ( | H verdadeira)calcP z zα = > para H0: 0pp ≤ e Ha: 0pp > Ao testarmos H0: 0pp = contra Ha: 0pp ≠ , a definição do valor p depende a relação entre pˆ e 0p , que é o mesmo que avaliar se calcz é maior ou menor do que zero: • Se 0calcz < , 0* 2 ( | H verdadeira)calcP z zα = × < • Se 0calcz > , 0* 2 ( | H verdadeira)calcP z zα = × > O departamento de recursos humanos de uma grande multinacional, preocupado com a qualidade de vida de seus funcionários, deseja saber se a proporção de fumantes em sua empresa é superior a 30%. Para tanto, o administrador responsável pelo estudo selecionou aleatoriamente 40 funcionários, e verificou que 9 fumavam. Qual foi a conclusão do administrador a um nível de significância de 5%? Solução A proporção de fumantes estimada é: 2,0 40 8 ˆ ==p Hipóteses: H0: 3,0≤p contra Ha: 3,0>p Região Crítica: Valor de zcalc Exemplo 1.19 35 Como o teste é unilateral direito a região crítica é dada por: { }64,1 que tal, >ℜ∈= zzRC , sendo que ( ) 05,064,1 =>zP Estatística de teste: ( ) 0,2 0,3 1,38 0,3 0,7 / 40calc z − = = − × Decisão: Como -1,38 não pertence à região crítica decide-se pela não rejeição de H0 com 5% de significância. Logo, há evidências que a proporção de fumantes não é superior a 30%. Critério de decisão pelo valor p O valor p é 916,0)3,0|38,1(* =≤−>= pzPα , comparando-o com o nível 0,05, decide-se também pela não rejeição de H0: 3,0≤p . Uma empresa de telefonia celular deseja saber se a proporção de consumidores que utilizam seu serviço é 50% da população do estado. Para isso ela selecionou aleatoriamente 100 consumidores, dois quais 48 informaram que utilizam seus serviços. Tire conclusões a 5% de significância. Solução A proporção amostral observada é: 48,0 100 48 ˆ ==p Hipóteses: H0: 5,0=p e Ha: 5,0≠p Estatística de Teste: 0,48 0,5 0,40 (0,5 0,5) /100calc z − = = − × Exemplo 1.20 36 Região Crítica: { }96,1ou 96,1 que tal, >−<ℜ∈= zzzRC Como 0, 40calcz = − > -1,96 e < 1,96, decide-se não rejeitar H0, isso significa que não há evidência suficiente para rejeitar a afirmação de que 50% dos consumidores utilizam o serviço da empresa de telefonia celular. Ao tomar a decisão usando o valor p, considerando que o teste é bilateral e 0calcz < , temos: 0,68920,34462)5,0|40,0(2* =×==−<×= pzPα Como o valor p supera o nível de significância de 0,05 não rejeitamos a hipótese nula e novamente concluímos que não há evidência suficiente para rejeitar a afirmação de que 50% dos consumidores utilizam os serviços da operadora de telefone celular. 1.6 Usando intervalos de confiança para tomada de decisões O intervalo de confiança pode ser utilizado para tomada de decisões no caso de teste de hipóteses bilateral. Sendo as hipóteses H0: 0µµ = contra Ha: 0µµ ≠ , a decisão a ser tomada será: Rejeitar H0 se µ não pertencer ao intervalo de confiança; Não se rejeita H0 se µ pertencer ao intervalo de confiança. O nível de confiança ( )1 %α− considerado no intervalo, em termos do teste de hipóteses, será o nível de significância α . A tomada de decisões por meio do intervalo serve para teste de média com variância conhecida e desconhecida (amostra grande e pequena) e para teste de proporção. Para entendermos a mecânica do teste, retomemos os exemplos 1.3 e 1.4, estudados na seção 1.2.2 e 1.2.3, respectivamente. 37 No exemplo 1.3, a Statewide Insurance Company deseja testar se a idade média dos proprietários de apólices de seguro de vida Statewide é 40 anos, com 10% de significância. O teste é H0; 40=µ contra Ha: 40≠µ . O intervalo de 90% construído foi [ ]63,41;37,37 . Como 40=µ pertence ao intervalo não se deve rejeitar H0. Portanto, a 10% de significância, há evidências de que a idade média dos proprietáriosde apólices de seguro de vida Statewide é 40 anos. Para o exemplo 1.4, deseja-se testar se o número médio de faltas dos funcionários por ano é 2,5, com 5% de significância. O teste é H0; 5,2=µ contra Ha: 5,2≠µ . O intervalo de 95% de confiança construído para o número médio de faltas por funcionário foi [ ]025,4;855,2 . Como 5,2=µ não pertence ao intervalo deve-se rejeitar H0. Portanto, a 5% de significância, há evidências de que o número médio de faltas para cada funcionário, por ano, não é 2,5. Atividade 1 (exercício 5 extraído de ANDERSON, SWEENEY e WILLIAMS, 2002, p. 292) Em um esforço para estimar a quantia média gasta por cliente para jantar em um grande restaurante de Atlanta, foram coletados os dados de uma amostra de 49 clientes em um período de três semanas. a) Considere um desvio-padrão da população de US$ 2,50. Qual o erro-padrão da média? b) Qual é a margem de erro para um intervalo de confiança de 95%? c) Se a média da amostra é US$ 22,60, qual é o intervalo de confiança de 95% para a média da população? d) Deseja-se testar se o gasto médio por cliente é US$25,00. Elabore as hipóteses do teste e tome a decisão baseada no intervalo de confiança construído na letra (c). Atividade 2 A prefeitura de uma cidade, preocupada com o meio ambiente, está interessada em saber a proporção de moradores que separam o lixo para reciclagem, levando a locais de coleta seletiva. Assim, a pesquisa foi elaborada de modo que foram selecionadas aleatoriamente 200 pessoas e observou-se que somente 68 separavam o lixo reciclável. Com base nesses dados, resolva as questões, a seguir: a) estime a proporção de habitantes que fazem reciclagem do lixo doméstico. b) construa um intervalo de 95% de confiança para a proporção de habitantes que reciclam o lixo. c) a prefeitura acredita que a proporção de reciclagem é de 40%, ou seja, deseja- se testar H0: 4,0=p contra Ha: 4,0≠p , indique o que você conclui dessa hipótese a 5% de significância. Atividade 3 O faturamento semanal de uma loja é uma variável normalmente distribuída. A partir de uma amostra aleatória de 24=n semanas, observou-se que o faturamento médio amostral observado foi 00,26200$R=X . Com base em pesquisas anteriores assume- 38 se que o desvio padrão seja 00,4800$R=σ . O gerente da loja afirmou que o faturamento semanal da loja é de pelo menos 00,28000$R . a) Teste esta afirmação ao nível de significância de 5%. b) Teste esta afirmação ao nível de significância de 1%. c) Considera-se uma importante discrepância se a média do valor de faturamento semanal for R$500,00 menor do que o valor hipotético. Escreva qual o tamanho da amostra necessário, se faz o teste a um nível de significância de 5%. Atividade 4 (Exercício 38 extraído de ANDERSON, SWEENEY e WILLIAMS, 2002, p. 344) A Floricultura da Joan se especializou em jardinagem com projetos-padrões para as áreas residenciais. O custo de mão-de-obra associado a uma determinada proposta de jardinagem está baseado no número de populações de árvores, arbustos, etc., a serem usados no projeto. Para propósitos de estimativas de custos, os gerentes usam duas horas como tempo de mão-de-obra para se plantar uma árvore de tamanho médio. Os tempos reais de uma amostra de 10 plantações durante o mês passado são apresentados a seguir (tempos em horas). 1,9 1,7 2,8 2,4 2,6 2,5 2,8 3,2 1,6 2,5 Usando um nível de significância de 0,05, teste se o tempo médio de plantação de uma árvore excede duas horas. Qual é a sua conclusão e que recomendação você consideraria fazer ao gerente? Atividade 5 (exercício 52 extraído de ANDERSON, SWEENEY e WILLIAMS, p. 353) Calcula-se que o aluguem mensal de um apartamento de dois quartos em uma determinada cidade é em média de US$ 550. Suponha que queiramos testar H0 : 550µ = versus Ha : 550µ ≠ . Uma amostra de 36 apartamentos de dois quartos é selecionada. A média da amostra é = US$ 562 e o desvio-padrão da amosra é S = US$ 40. a) Conduza esse teste de hipóteses com um nível de significância de 0,05. b) Calcule o valor p. c) Use os resultados da amostra para construir um intervalo de confiança de 95% para a média da população. Que conclusão do teste de hipóteses você tiraria desse resultado do intervalo de confiança? 39 Tabela Distribuição Normal - Valores de ( )00 zzP ≤≤ 0z 0 1 2 3 4 5 6 7 8 9 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4965 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4983 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993 40 3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997 3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 41 Tabela Distribuição t de Student Graus de liberdade 0,005 (unilateral) 0,01 (bilateral) 0,01(unilateral) 0,02 (bilateral) 0,025(unilateral) 0,05(bilateral) 0,05(unilateral)0,10(bilateral) 0,10(unilateral) 0,20(bilateral) 0,25(unilateral) 0,5(bilateral) 1 63,657 31,821 12,706 6,314 3,078 1,000 2 9,925 6,965 4,303 2,920 1,886 0,816 3 5,841 4,541 3,182 2,353 1,638 0,765 4 4,604 3,747 2,776 2,132 1,533 0,741 5 4,032 3,365 2,571 2,015 1,476 0,727 6 3,707 3,143 2,447 1,943 1,440 0,718 7 3,500 2,998 2,365 1,895 1,415 0,711 8 3,355 2,896 2,306 1,860 1,397 0,706 9 3,250 2,821 2,262 1,833 1,383 0,703 10 3,169 2,764 2,228 1,812 1,372 0,700 11 3,106 2,718 2,201 1,796 1,363 0,697 12 3,054 2,681 2,179 1,782 1,356 0,696 13 3,012 2,650 2,160 1,771 1,350 0,694 14 2,977 2,625 2,145 1,761 1,345 0,692 15 2,947 2,602 2,132 1,753 1,341 0,691 16 2,921 2,584 2,120 1,746 1,337 0,690 17 2,898 2,567 2,110 1,740 1,333 0,689 18 2,878 2,552 2,101 1,734 1,330 0,688 19 2,861 2,540 2,093 1,729 1,328 0,688 20 2,845 2,528 2,086 1,725 1,325 0,687 21 2,831 2,518 2,080 1,721 1,323 0,686 22 2,819 2,508 2,074 1,717 1,321 0,686 23 2,807 2,500 2,069 1,714 1,320 0,685 24 2,797 2,492 2,064 1,711 1,318 0,685 25 2,787 2,485 2,060 1,708 1,316 0,684 26 2,779 2,479 2,056 1,706 1,315 0,684 27 2,771 2,473 2,052 1,703 1,314 0,684 28 2,763 2,467 2,048 1,701 1,313 0,683 29 2,756 2,462 2,045 1,699 1,311 0,683 Grande ( z ) 2,575 2,327 1,960 1,645 1,282 0,675 Unilateral Unilateral Bilateral 42 Referências ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatística Aplicada à Administração e Economia. 2. ed. São Paulo: Pioneira Thomson Learning, 2002. MAGALHÃES, M. N.; LIMA, A. C. P. Noções de Probabilidade e Estatística. 4. ed. São Paulo: Edusp, 2002. MORETTIN, Luiz Gonzaga. Estatística básica: probabilidade e inferência, volume único. São Paulo: Pearson Prentice-Hall, 2010. STEVENSON, W. J. Estatística aplicada à administração. São Paulo: Harbra, 2001. TRIOLA, M. F. Introdução à Estatística. 7. ed. Rio de Janeiro: LTC, 1999.
Compartilhar