Baixe o app para aproveitar ainda mais
Prévia do material em texto
Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 1 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 1 APOSTILA DE ESTATÍSTICA – PARTE II - Probabilidade - Distribuição Binomial e Normal - Intervalo de Confiança - Teste de Hipótese Profº Celso Brazil Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 2 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 2 Probabilidade Definições Encontramos na natureza dois tipos de fenômenos (experimentos): determinísticos e aleatórios. Os fenômenos determinísticos são aqueles em que os resultados são sempre os mesmos, qualquer que seja o número de ocorrências verificadas. Experimento aleatório Um experimento que pode fornecer diferentes resultados, muito embora seja repetido toda vez da mesma maneira, é chamado experimento aleatório. Exemplos: a) Lançamento de uma moeda honesta; b) Lançamento de um dado; c) Lançamento de duas moedas; d) Retirada de uma carta de um baralho completo de 52 cartas; e) Determinação da vida útil de um componente eletrônico. Espaço Amostral O conjunto de todos os resultados possíveis de um experimento aleatório é chamado de espaço amostral do experimento. O espaço amostral é denotado por S. Cada um dos elementos de S que corresponde a um resultado recebe o nome de ponto amostral. Eventos Chamamos de evento (E) a qualquer subconjunto do espaço amostral S de um experimento aleatório. Assim, o evento aleatório pode ser um único ponto amostral ou uma reunião deles. Qualquer que seja o evento E, se E S, então E é um evento de S. Se E = S, E é chamado evento certo. Se E S e E é um conjunto unitário, E é chamado evento elementar. Se E = Ø, E é chamado evento impossível. Espaços amostrais discretos e contínuos Um espaço amostral é discreto se ele consiste em um conjunto finito ou infinito contável de resultados. Um espaço amostral é contínuo se ele contém um intervalo de números reais. Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 3 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 3 Interpretações de probabilidade Probabilidade é usada para quantificar a possibilidade ou chance de ocorrência de um resultado de um experimento aleatório. Resultados igualmente prováveis Toda vez que um espaço amostral consistir em N resultados possíveis que forem igualmente prováveis, a probabilidade de cada resultado é 1/N. Definição Clássica de Probabilidade Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S é um conjunto eqüiprovável. Definimos probabilidade de um evento E (E S) ao número real P(E), tal que: )( )( )( Sn En EP n(E): número de elementos no conjunto E. n(S): número de elementos no espaço amostral S. Exemplo: Considerando o lançamento de um dado, pede-se: a) A probabilidade do evento E "obter um número par na face superior".Temos: S = {1; 2; 3; 4; 5; 6} n(S) = 6 E = {2; 4; 6} n(E) = 3: Logo, %505,0 3 6 )( )( )( Sn En EP Probabilidade de um evento Para um espaço amostral discreto, a probabilidade de um evento E, denotada por P(E), é igual à soma das probabilidades dos resultados em E. Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 4 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 4 Exemplo: Um experimento aleatório pode resultar em um dos resultados {a, b , c, d} com probalidades 0,1; 0,3; 0,5 e 0,1 respectivamente. Seja A o evento {a, b}, B o evento {b, c, d} e C o evento {d}. Então, P(A) = 0,1 + 0,3 = 0,4 P(B) = 0,3 + 0,5 + 0,1 = 0,9 P(C) = 0,1 P(A’) = 0,6 P(B’) = 0,1 P(C’) = 0,9 Eventos Complementares Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra (sucesso) e q a probabilidade de que não ocorra (insucesso), para um mesmo evento existe sempre a relação: p + q = 1 q = 1 - p Assim, se a probabilidade de se realizar um evento é p = 1/5, a probabilidade de que ele não ocorra é: q = 1 – p q = 1 – 1/5 = 4/5 Distribuições de Probabilidades Definições Variável aleatória (v.a) Uma v.a é uma função que confere um número real a cada resultado no espaço amostral de um experimento aleatório. Variáveis aleatórias discretas e contínuas Uma v.a discreta é uma variável aleatória com uma faixa finita (ou infinita contável). Geralmente, são resultantes de contagens e só pode assumir valores inteiros. Ex: número de arranhões em uma superfície, quantidade de peças defeituosas em um lote. Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 5 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 5 Uma v.a contínua é uma variável aleatória com um intervalo (finito ou infinito) de números reais. Geralmente, são resultantes de medições e pode assumir qualquer valor em um determinado intervalo. Ex: corrente elétrica, comprimento, pressão, temperatura, tempo, voltagem, peso. Distribuição Binomial Um experimento Aleatório consiste em n tentativas de Bernoulli, de modo que: (1) As tentativas são independentes (2) Cada tentativa resulte em somente dois resultados possíveis, designados como “sucesso” e “falha” (3) A probabilidade de um sucesso em cada tentativa, denotada por p,permanecer constante. A variável aleatória X, que é igual ao número de tentativas que resultam em um sucesso, é uma variável aleatória binomial com parâmetros 0 < p < 1 e n = 1,2,... A função de probabilidade de X é: )!(! ! )( knk n k n qp k n KXP knk Média e variância Se X for uma variável aleatória binomial com parâmetros p e n, )1()()( 2 pnpXVenpXE Exemplo: Cada amostra de ar tem 10% de chance de conter um determinado poluente orgânico. Considere que as amostras sejam independentes com relação à presença do poluente. Encontre a probabilidade de que nas próximas 18 amostras analisadas exatamente 2 contenham o poluente. Seja X = número de amostras de ar que contêm a molécula rara nas próximas 18 amostras analisadas. Então X é a variável aleatória binomial com p= 0,1 e n = 18. Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 6 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 6 153 )!218(!2 !18 2 18 284,0)90,0()10,0(15390,010,0 2 18 )2( 1622182 XP a) Determine a probabilidade de que no mínimo quatro amostras contenham o poluente. b) Determine a probabilidade de que 3 ≤ X < 7. Exercícios: 1) Qual é a probabilidade de obter 3 caras em 5 lançamentos de uma moeda honesta? Qual é a probabilidade de obter menos que 3 caras em 5 lançamentos de uma moeda honesta? 2) Suponha que a probabilidade dos pais terem um filho(a) com cabelos loiros seja ¼. Se houverem 6 crianças na família, qual é a probabilidade de que metade delas terem cabelos loiros? Qual o valor esperado e o desvio padrão? 3) Se a probabilidade de atingir um alvo num único disparo é 0,3, qual é a probabilidade de que em 4 disparos o alvo seja atingido no mínimo 3 vezes? 4) Um inspetor de qualidade extrai uma amostra de 10 tubos aleatoriamente de uma carga muito grande de tubos que se sabe que contém 20% de tubos defeituosos. Qual é a probabilidade de que não mais do que 2 dos tubos extraídos sejam defeituosos? 5) Um engenheiro de inspeção extrai uma amostra de 15 itens aleatoriamente de um processo de fabricação que produz 85% de itensaceitáveis. Qual a probabilidade de que 10 dos itens extraídos sejam aceitáveis? 6) A probabilidade de os doentes não recuperarem de uma determinada doença é 0,6. Escolhidos ao acaso 15 pessoas com a referida doença, determine a probabilidade de sobreviverem: a) exatamente 5 pessoas b) pelo menos 10 pessoas c) entre 3 e 5 pessoas (inclusive) Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 7 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 7 7) Prova: ESAF - 2008 - Prefeitura de Natal - RN - Auditor do Tesouro Municipal - Prova 1 Numa distribuição Binomial, temos que: I. A E[x] = n p q, ou seja, é o produto dos parâmetros n - número de elementos da avaliação, p - probabilidade de ocorrência do evento e q - probabilidade contrária (q = 1 - p). II. O desvio-padrão é dado pela raiz quadrada do produto entre os parâmetros n e p. III. A variância é dada pelo somatório dos quadrados dos valores (Xi) menos o quadrado da média. Apontando os três itens acima como V - Verdadeiro e F - Falso, a opção correta é: (a) F, V, F (b) V, V, F (c) F, F, F (d) V, F, F (e) V, V, V 8) Prova: FEPESE - 2010 - SEFAZ-SC - Auditor Fiscal da Receita Estadual - Parte I Uma variável aleatória X segue uma distribuição binomial com os seguintes parâmetros: número de ensaios = 100; probabilidade de sucesso em cada ensaio = 0,2. De acordo com essas informações, qual é o valor esperado de X? (a) 0,2 (b) 0,8 (c) 20 (d) 80 (e) 100 9) Prova: CESGRANRIO - 2010 - BACEN - Analista do Banco Central - Área 3 Sobre variáveis aleatórias, considere as afirmações a seguir. I - Para toda e qualquer variável aleatória, sua função de densidade de probabilidade fornece a probabilidade de ocorrência de cada valor da variável aleatória considerada, exceto no caso de variáveis aleatórias contínuas, para as quais a probabilidade de ocorrência de um valor específico é zero. II - A esperança matemática (expectância) de uma variável aleatória discreta, ou seja, seu valor esperado, é a média dessa variável aleatória, que é definida como Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 8 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 8 um n-avos do somatório dos valores possíveis dessa variável multiplicados por suas respectivas probabilidades. III - A distribuição binomial é uma extensão direta da Distribuição de Bernoulli, uma vez que o experimento aleatório que caracteriza a binomial nada mais é do que um Experimento de Bernoulli repetido n vezes. É correto APENAS o que se afirma em (a) II. (b) III. (c) I e II. (d) I e III. (e) II e III. 10) (APO-SEPLAG RJ 2010/CEPERJ) Suponha que X tenha distribuição binomial com média igual a 24 e desvio-padrão igual a 4. Os parâmetros n e p dessa distribuição serão respectivamente: a) n= 48; p = 1/6 b) n = 36; p = 2/3 c) n = 72 ; p =2/3 d) n = 48 ; p = 1/3 e) n = 72; p = 1/3 11) Uma amostra aleatória de 15 pessoas é obtida de uma população em que 40% têm uma determinada posição política. Qual é a probabilidade de exatamente 6 indivíduos na amostra ter essa determinada posição política? 12) A probabilidade de uma máquina produzir um item defeituoso é 0,20. Se uma amostra aleatória de 6 itens é obtida desta máquina, qual é a probabilidade de haver 5 ou mais em itens defeituosos na amostra? Distribuição Normal Definição Dizemos que uma v.a: X possui uma distribuição Normal (ou Gaussiana) com média e variância 2 ( < < e 2 > 0) se X possuir uma distribuição contínua com função de densidade de probabilidade dada por: 2 2 1 2 1 )( x exf para ( < x < ) Distribuição Normal padrão Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 9 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 9 A distribuição normal com média zero ( = 0) e variância um ( 2 = 1) é denominada distribuição normal padrão N (0; 1). X Z Propriedades da distribuição normal 1ª - A variável aleatória X pode assumir todo e qualquer valor real. 2ª - A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica em torno da média, que recebe o nome de curva normal ou de Gauss. 3ª - A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área corresponde à probabilidade de a variável aleatória X assumir qualquer valor real. 4ª - A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcançá-lo. 5ª - Como a curva é simétrica em torno da média, a probabilidade de ocorrer valor maior que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais a 0,5 ou 50%. Cada metade da curva representa 50% de probabilidade. Distribuição Normal como aproximação para a distribuição Binomial 50% 50% Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 10 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 10 Se uma distribuição binomial satisfaz as exigências de np5 e nq5, então a distribuição de probabilidade binomial pode ser aproximada por uma distribuição normal com média np e desvio padrão npq e com números inteiros discretos x ajustados pela correção de continuidade, de modo que x é representado pelo intervalo x - 0,5 a x + 0,5. Exemplo: Uma pesquisa recente mpstrou que, entre 2013 adultos selecionados aleatoriamente, 1358 (ou 67,5%) afirmaram ser usuários da Internet. Se a proporção de todos os adultos que usam a Internet for realmente 2/3, ache a probabilidade de que uma amostra aleatória de 2013 adultos resulte em exatamente 1358 usuários da Internet. Seja p = 2/3, logo q = 1 - p = 1/3. Passo 1: verificar se a aproximação da binomial pela normal é adequada? np = 2013 . 2/3 = 1342 np5 nq = 2013 . 1/3 = 671 nq5 Passo 2: encontrar os valores de np e desvio padrão npq necessários para a distribuição normal. 1342 3 2 2013 np 150256,21 3 1 3 2 2013 npq Passo 3: usando a correção de continuidade, representamos x = 1358 pela região entre 1357,5 e 1358,5. Passo 4: encontrar a diferença entre as duas áreas. Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 11 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 11 78,0 150256,21 13425,1358 z z = 0,78 corresponde à probabilidade de 0,7823 que é a área total à esquerda de 1358,5. 73,0 150256,21 13425,1357 z z = 0,73 corresponde à probabilidade de 0,7673 que é a área total à esquerda de 1357,5. Logo, a área entre entre 1357,5 e 1358,5 é 0,7823 – 0,7673 = 0,0150. Exercícios 1) Prova: FGV - 2010 - SEAD-AP - Auditor da Receita do Estado - Prova 1 Em relação à distribuição normal, assinale a afirmativa incorreta. (a) a função de densidade de probabilidade é simétrica em relação à média. (b) se X tem distribuição normal com média e variância 2 então a variável 2 X Z tem distribuição normal padrão. (c) a probabilidade de que uma variável Z que tenha distribuição normal padrão seja maior do que 5 é aproximadamente igual a 0. (d) a média de uma variável aleatória que tenha distribuição normal pode ser negativa. (e) o valor da mediana é igual ao valor da média. 2) Prova: CESGRANRIO - 2010 - BACEN - Analista do Banco Central - Área 4 Estima-se que os retornos de um determinado mercado tenham distribuição normal, com média 20% e desvio padrão 10%. A probabilidadede perdas financeiras é de, aproximadamente, (a) 1% (b) 2,5% (c) 5% (d) 10% (e) 20% 3) Prova: CESGRANRIO - 2010 - IBGE - Analista de Sistemas - Desenvolvimento de Aplicações Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 12 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 12 Seja H a variável aleatória que representa as alturas dos cidadãos de certo país. Sabe-se que H tem distribuição normal com média 1,70 m e desvio padrão 0,04 m. A probabilidade de que um cidadão desse país tenha mais do que 1,75 m de altura é, aproximadamente, (a) 9,9% (b) 10,6% (c) 22,2% (d) 39,4% (e) 40,6% 4) Prova: CESGRANRIO - 2007 - TCE Estatístico – RO O gasto médio dos clientes de um posto de gasolina é uma variável aleatória normal com média R$ 100,00 e desvio padrão R$ 25,00. Os 10% dos que mais consomem recebem um tratamento VIP, incluindo lavagem de carroceria, calibragem nos pneus e verificação do óleo e da água. Quanto você precisa gastar nesse posto de gasolina, em reais, para obter tratamento VIP? (a) 158,00 (b) 149,00 (c) 141,00 (d) 132,00 (e) 128,00 Prova: FGV - 2006 - Fiscal de ICMS do Mato Grosso do Sul 5) Se X tem distribuição normal com média 4 e variância 9, a probabilidade de X > 6 vale, aproximadamente: (a) 0,25 (b) 0,28 (c) 0,33 (d) 0,37 (e) 0,46 6) Prova: FCC - 2010 - SEFAZ-SP - Analista em Planejamento, Orçamento e Finanças Públicas - Prova 1 / Estatística Os salários dos empregados de uma determinada categoria profissional apresentam uma distribuição normal com média igual a R$ 1.200,00 e desvio padrão igual a R$ 160,00. A proporção dos empregados com salários superiores a R$ 1.000,00 e inferiores a R$ 1.520,00 é (a) 98% (b) 96% (c) 92% (d) 89% (e) 87% 7) (APO-SEPLAG RJ 2010/CEPERJ) Uma pesquisa revelou que, no último concurso da SEPLAG, a distribuição dos tempos gastos pelos candidatos para concluírem a prova foi normalmente distribuído, com uma média de 136 minutos e uma variância de 64 minutos². Sabendo que que Z é a variável correspondente à distribuição normal padronizada, com média zero e desvio padrão unitário, e ainda que P(z<-2) = 0,0228 e que P(Z<-0,5) = 0,3085, a probabilidade de que um candidato qualquer, escolhido aleatoriamente, tenha concluído a prova num tempo entre 2 horas e 2,2 horas, é, aproximadamente, igual a: (a) 33,13% (b) 28,57% (c) 47,72% (d) 19,15% (e) 21,43% 8) Prova: CESGRANRIO - 2010 - IBGE – Estatístico Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 13 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 13 Suponha que as notas dos candidatos de um concurso público, em uma certa prova, sigam distribuição normal com média 7 e desvio padrão 1. A relação candidato/vaga é de 40 para 1. A nota mínima necessária para aprovação nessa prova é: (a) 8,65 (b) 8,96 (c) 9,37 (d) 9,58 (e) 9,75 9) Prova: CESGRANRIO - 2008 – PETROBRAS - Engenheiro de Petróleo Júnior Em um concurso público serão chamados para contratação imediata 20% dos candidatos com as maiores notas. As notas obtidas seguem uma distribuição normal com média 5,5 e desvio padrão 3. A nota mínima para que o candidato seja chamado para contratação imediata é,aproximadamente, (a) 7,0 (b) 7,5 (c) 8,0 (d) 8,5 (e) 9,0 10) Prova: CESGRANRIO – 2004 – Estatístico - Pref. Manaus/AM Se X tem distribuição normal com média 4 e variância 9, a probabilidade de que X>5, aproximadamente vale: (a) 0,25 (b) 0,28 (c) 0,33 (d) 0,37 (e) 0,46 11) Prova: CESGRANRIO – 2005 – Estatístico - MPE/RO Se X tem distribuição normal com média 10 e variância 4, a probabilidade de que X > 11, aproximadamente, vale: (a) 0,25 (b) 0,28 (c) 0,33 (d) 0,31 (e) 0,46 12) Prova: CESGRANRIO – 2005 – Estatístico Júnior - PETROBRAS Se X tem distribuição normal com média 4 e variância 4, a probabilidade de que X > 6 vale, aproximadamente (a) 0,16 (b) 0,28 (c) 0,33 (d) 0,37 (e) 0,46 13) Prova: CESGRANRIO – 2010 – Químico do Petróleo As medidas de volume de enchimento de uma máquina de envase de óleo lubrificante apresentam distribuição normal, com média de 500 ml e variância de 4 ml2. A especificação estabelece um volume de (500 +/- 5) ml. Qual a probabilidade de o volume envasado ficar fora da especificação? (a) 0,62% (b) 1,24% (c) 10,56% (d) 21,12% (e) 78,87% Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 14 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 14 14) A resistência à compressão de uma amostra de cimento pode ser modelada por uma distribuição normal com uma média de 6.000 quilogramas por centímetro quadrado e um desvio padrão de 100 quilogramas por centímetro quadrado. Qual o valor da resistência máxima, em Kg/cm2 , que é excedida por 97,5% das amostras? (a) 6.196 (b) 6.165 (c) 5.835 (d) 5.804 (e) 5.700 ESTIMAÇÃO Conceitos: Parâmetros: são as medidas estatísticas calculadas para a população, como por exemplo: média aritmética (), desvio padrão (), variância absoluta (²), proporção (), etc . Estatísticas amostrais: são as medidas estatísticas calculadas para a amostra, como por exemplo: média aritmética ( x ),desvio padrão (s), variância absoluta (s²), proporção (p), etc . Estimação: é o processo que consiste em utilizar dados amostrais para obter valores de parâmetros populacionais desconhecidos. Estimador: é toda a estatística amostral que tem um correspondente parâmetro na população. Por exemplo: x é um estimador de ; s é um estimador de ; e assim por diante. Estimador não tendencioso: Se é um parâmetro, e seu estimador , dizemos que é um estimador não tendencioso de se E( ) = . Estimativa: é o valor numérico do estimador. ESTIMATIVAS As estatísticas amostrais são usadas como estimadores de parâmetros populacionais. As estimativas obtidas podem ser pontuais ou intervalares: Estimativa pontual: O parâmetro é estimado unicamente pelo valor do estimador. É um único valor usado para aproximar um parâmetro populacional. Ex: um carro popular faz 15 Km por litro de combustível Intervalo de Confiança (IC) ou Estimativa intervalar: O parâmetro é estimado através de um intervalo de valores, onde o estimador é o seu valor central. É uma faixa Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 15 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 15 ou intervalo de valores usada para se estimar o verdadeiro valor de um parâmetro populacional. Ex: um carro popular faz de 12 a 18 Km por litro de combustível O Nível de confiança é a probabilidade (1 - ) é a proporção de vezes que o intervalo de confiança realmente contém o parâmetro populacional, supondo que o processo de estimação seja repetido um grande numero de vezes. O nível de confiança é também chamado grau de confiança ou coeficiente de confiança. – complemento do nível de confiança. As escolhas mais comuns para o nível de confiança são 90% ( = 0,10), 95% ( = 0,05) e 99% ( = 0,01). A Distribuição normal pode ser utilizada, nesse caso, sempre que tivermos uma das seguintes situações: 1ª - se n 30, conforme o Teorema do Limite Central. 2ª - se n < 30, sendo a população estudada normalmente distribuída e o desvio padrão populacional conhecido. Definimos Zc como coeficiente de confiança, que é o valor obtido através da distribuição normal com o nível de confiança especificado. A tabela seguinte apresenta os valores mais usados do nível de confiança e seu respectivo coeficiente de confiança: Intervalo de Confiança Nível de confiança (1 - ) Zc 0,90 1,65 0,95 1,96 0,99 2,58 Probabilidade / Teste de Hipótese / Intervalo de Confiança– Profº Celso Brazil 16 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 16 Interpretação correta: estamos 95% confiantes de que o intervalo x-E a x+E contém o verdadeiro valor do parâmetro populacional Intervalo de confiança para a proporção populacional p n qp zEondeEppEp ^^ 2 ^^ O intervalo de confiança é, em geral, escrito nos seguintes formatos equivalentes: ),( ^^^ EpEpouEp Tamanho amostral para estimar a proporção p Quando uma estimativa ^ p é conhecida: 2 ^^ 2 2 ][ E qpz n Quando não se conhece qualquer estimativa ^ p : p = q = 0,50 2 2 2 25,0.][ E z n * se o tamanho amostral não for um número inteiro deverá ser arredondado para o inteiro maior mais próximo. Ex: n calculado = 39,1 arredondar para 40. Exercícios 1) Prova: FGV - 2009 - SEFAZ-RJ - Fiscal de Rendas - Prova 1 Para examinar a opinião de uma população sobre uma proposta, foi montada uma pesquisa de opinião em que foram ouvidas 1680 pessoas, das quais 51,3% se declararam favoráveis à proposta. Os analistas responsáveis determinaram que a margem de erro desse resultado, em um determinado nível de confiança, era de 2 pontos percentuais, para mais ou para menos. Considerando que fosse desejada uma margem de erro de 1 ponto percentual, para mais ou para menos, no mesmo nível de Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 17 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 17 confiança, assinale a alternativa que indique o número de pessoas que deveriam ser ouvidas. (a) 840 (b) 2520 (c) 3360 (d) 5040 (e) 6720 2) Prova: CESGRANRIO – 2004 – Estatístico – Pref. Manaus O tamanho mínimo que deve ter uma amostra aleatória simples para estimar, com 90% de confiança e erro de 2 pontos percentuais, a proporção de estudantes com problemas de visão e que não usam lentes corretoras, aproximadamente, vale: (a) 912 (b) 1200 (c) 1692 (d) 4500 (e) 9898 3) Prova: CESGRANRIO – 2005 – Estatístico – MPE/RO Uma amostra aleatória de 400 eleitores revelou 64% de preferências pelo candidato X. O intervalo de 95% de confiança para a proporção de eleitores que preferem X é: (a) 0,64 ± 0,047 (b) 0,64 ± 0,052 (c) 0,64 ± 0,056 (d) 0,64 ± 0,064 (e) 0,64 ± 0,085 4) Prova: CESGRANRIO – 2005 – Estatístico Jr - Petrobrás Qual é o tamanho mínimo que deve ter uma amostra aleatória simples para estimar, com 95% de confiança e erro máximo de 2 pontos porcentuais, a proporção de eleitores que pretendem votar no candidato X? (a) 2 500 (b) 2 401 (c) 1 692 (d) 1 200 (e) 912 5) Prova: CESGRANRIO – 2009 – Estatístico - FUNASA Numa região afetada por um surto epidêmico, selecionou-se uma amostra de 2.500 indivíduos, tendo-se encontrado 500 contaminados. O intervalo de confiança de 95% para a verdadeira e desconhecida proporção populacional é, aproximadamente: (a) 20% ± 1% (b) 20% ± 2% (c) 20% ± 3% (d) 20% ± 4% (e) 20% ± 5% 5.1) Usando o nível de confiança de 95%, o tamanho mínimo de amostra, necessário para estimar a proporção da população contaminada, com um erro de 5%, é: (a) 125 (b) 173 (c) 246 (d) 256 (e) 500 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 18 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 18 6) Prova: CESGRANRIO – 2005 – Estatístico – SEAD/AM Amostra aleatória de 900 consumidores de detergentes revelou 36% de preferência pela marca X. O intervalo de 95% de confiança para a preferência, na população, pela marca X é: (a) 36% ± 1% (b) 36% ± 2% (c) 36% ± 3% (d) 36% ± 4% (e) 36% ± 5% 7) Prova: CESGRANRIO – 2007 – Estatístico – TCE/RO Recente pesquisa para avaliar o percentual de eleitores favoráveis a um candidato a senador foi realizada de acordo com um plano de amostragem aleatória simples, sendo a amostra extraída de uma população infinita. O resultado apontou uma intenção de votos no candidato na ordem de 45%.Considerando que a margem de erro foi de 2 pontos percentuais, para mais ou para menos, quantos eleitores foram ouvidos, se o nível de confiança utilizado foi de 95%? (a) 1247 (b) 1684 (c) 1820 (d) 2377 (e) 2642 8.1) Caso uma amostra de 100 eleitores fosse utilizada, o intervalo aproximado de 95% de confiança para a preferência dos eleitores nesse candidato seria: (a) 45% ± 6% (b) 45% ± 8% (c) 45% ± 10% (d) 45% ± 12% (e) 45% ± 14% Estimação da média populacional: conhecido ),( 2 ExExou Exou n zEondeExEx Tamanho amostral para estimar a média µ Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 19 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 19 desejadaerrodeemmE alpopulacionpadrãodesvio desejadoconfiançadenívelnobasecomcríticozescorez onde E z n arg , 2 2 2 * se o tamanho amostral não for um número inteiro deverá ser arredondado para o inteiro maior mais próximo. Exercícios: 1) Prova: CESGRANRIO – 2010 – Estatístico – IBGE Considere uma amostragem aleatória simples, sem reposição, de uma população de tamanho muito grande. Qual o tamanho aproximado de amostra que permite estimar a média de uma variável y, cujo desvio padrão populacional é igual a 5, com margem de erro 0,1, a um nível de confiança 95%? (a) 98 (b) 400 (c) 1.000 (d) 4.952 (e) 9.604 2) Prova: FGV - 2011 - Secretaria de Estado de Fazenda - Rio de Janeiro - Auditor Fiscal da Receita Estadual - Prova Objetiva 1 Um processo X segue uma distribuição normal com média populacional desconhecida, mas com desvio-padrão conhecido e igual a 4. Uma amostra com 64 observações dessa população é feita, com média amostral 45. Dada essa média amostral, a estimativa da média populacional, a um intervalo de confiança de 95%, é: (a) (41;49). (b) (37;54). (c) (44,875;45,125). (d) (42,5;46,5). (e) (44;46). 3) Prova: FGV - 2010 - Secretaria de Estado da Administração - Amapá - Fiscal da Receita Estadual Uma amostra aleatória simples de tamanho 400 de uma variável populacional normalmente distribuída com média desconhecida e variância igual a 25 foi observada e indicou uma média amostral igual a 12,52. O intervalo de 95% de confiança para é dado por: (a) (12,03 , 13,01) (b) (11,65 , 13,39) (c) (10,99 , 15,05) (d) (10,44 , 15,60) Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 20 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 20 (e) (9,99 , 16,05) 4) Um pesquisador está estudando a resistência de um certo material sob determinadas condições. Ele sabe que essa variável é Normalmente distribuída com variância igual a 4. Foi extraída uma amostra aleatória de tamanho 10 obtendo-se os seguintes valores: 7,9 6,8 5,4 7,5 7,9 6,4 8,0 6,3 4,4 5,9 (a) Calcule a estimativa pontual da média populacional, com base nesta amostra. (b) Determine o intervalo de confiança para a resistência média com um coeficiente de confiança de 90%. (c) Qual o tamanho da amostra necessário para que o erro cometido, ao estimarmos a resistência média, não seja superior a 0,3 unidades com probabilidade 0,90? E se quiséssemos um erro máximo de 0,1 unidades com a mesma probabilidade? 5) Suponha que X represente a duração da vida de uma peça de equipamento. Admita- se que 100 peças sejam ensaiadas, fornecendo uma duração de vida média de 501,2 horas. Suponha-se que o desvio padrão populacional seja conhecido e igual a 4 horas, e que se deseje obter um intervalo de confianças de 95 por cento para a média. 6) O secretário de habitação de um governo estadual deseja estudar várias características correspondentes a domicílios unifamiliaresna cidade. Uma amostra aleatória de 70 casas revela o seguinte: - Área aquecida da casa (em metros quadrados): média=1759; desvio padrão=380 (a) desenvolva uma estimativa, com intervalo de confiança de 95%, da população correspondente á área aquecida média da casa. (b) desenvolva uma estimativa, com intervalo de confiança de 99%, da população correspondente á área aquecida média da casa. 7) Determine o tamanho da amostra necessário para se estimar a média de uma população normal com σ = 4, 2 para que, com confiança de 95%, o erro máximo de estimação seja ±0, 05. 8) Um provedor de acesso É internet deseja implantar um plano sem limite de horas. Para isso, verificou numa amostra de n = 35 usuários os tempos de utilização mensal, obtendo: média amostral 26,8 horas. Sabendo que a variância populacional é de 6,25 horas² a) Encontre um intervalo de confiança 90% para a média. b) De quanto deve ser aumentado o tamanho da amostra para que, mantidas as demais medidas, o comprimento do intervalo caia pela metade? Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 21 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 21 Estimação da média populacional: desconhecido studentdetãodistribuiçt liberdadedegrausntemt ExExou Exou n s tEondeExEx .1 ),( 2 2 Exercícios: 1) Prova: CESGRANRIO – 2004 – Estatístico – Pref. Manaus Uma amostra aleatória simples de tamanho 16 foi selecionada para estimar a média desconhecida de uma população normal. A média amostral encontrada foi 5,2 e a variância foi 1,44. O intervalo de 95% de confiança para a média populacional é: (a) 5,2 0,59 (b) 5,2 0,64 (c) 5,2 0,71 (d) 5,2 0,75 (e) 5,2 0,81 2) Prova: CESGRANRIO – 2005 – Estatístico – MPE/RO Uma amostra aleatória simples de tamanho 25 foi selecionada para estimar a média e a variância desconhecidas de uma população normal. A média amostral encontrada foi 5,2 e a variância amostral foi 1,44. O intervalo de 95% de confiança para a média populacional é: Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 22 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 22 (a) 5,2 ± 0,32 (b) 5,2 ± 0,41 (c) 5,2 ± 0,47 (d) 5,2 ± 0,50 (e) 5,2 ± 0,75 3) Prova: CESGRANRIO – 2005 – Estatístico – SEAD/AM Uma amostra aleatória simples de tamanho 16 foi selecionada para estimar a média desconhecida de uma população normal. A média amostral encontrada foi 4,8 e a variância amostral foi 1,96. O intervalo de 95% de confiança para a média populacional é: (a) 4,8 0,59 (b) 4,8 0,64 (c) 4,8 0,71 (d) 4,8 0,75 (e) 4,8 0,81 4) 10 corpos de provas foram submetidos a um teste de corrosão onde foram submersos em água salgada durante 60 segundos/dia. A corrosão foi medida pela perda de peso em miligramas/decâmetro quadrado/dia (MDD). Os dados obtidos foram: 130,1; 124,2; 122,0; 110,8; 113,1; 103,9; 101,5; 92,3; 91,4; 83,7. a) Encontre estimativas para a média e variância para a perda de peso em MDD. b) Construa um intervalo de 95% de confiança para a média. 5) Os salários dos funcionários de uma obra têm uma distribuição aproximadamente normal. Para estimar o salário médio desta população, foram observados os salários de 20 funcionários, obtendo-se média igual a 1.850 reais e s = 120 reais. Determine: a) Um intervalo de confiança de 95% para a média populacional. b) Um intervalo de confiança de 99% para a média populacional. TESTES DE HIPÓTESES Hipótese estatística: uma hipótese estatística é uma afirmação sobre os parâmetros de uma ou mais populações. Um teste de hipótese (ou teste de significância) é um procedimento padrão para se testar uma afirmativa sobre uma propriedade da população. Hipótese nula (H0) é uma afirmativa de que o valor de um parâmetro populacional é igual a algum valor específico. Ex: Ex: H0: p = 0,5 H0: = 98,6 H0: = 15 Hipótese alternativa (H1) é a afirmativa de que o parâmetro tem um valor que difere da hipótese nula. Ex: Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 23 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 23 H1: p > 0,5 H1: p < 0,5 H1: p 0,5 H1: > 98,6 H1: < 98,6 H1: 98,6 H1: > 15 H1: < 15 H1: 15 Erro Tipo I: A rejeição da hipótese nula H0 quando ela for verdadeira é definida como um do erro Tipo I. Erro Tipo II: A falha em rejeitar a hipótese nula H0 quando ela for falsa é definida como um erro do Tipo II. Decisões no Teste de Hipóteses Decisão H0 é verdadeira H0 é falsa Falha em rejeitar H0 Nenhum erro Erro Tipo II Rejeita H0 Erro Tipo I Nenhum erro Probabilidade Erro Tipo I α = P (erro tipo I) = P(rejeitar H0 quando H0 é verdadeira ) Algumas vezes, a probabilidade do erro tipo I é chamada de nível de significância ou erro α ou tamanho do teste. Probabilidade Erro Tipo II β = P (erro tipo II) = P(falha em rejeitar H0 quando H0 for falsa ) Estatística de Teste é um valor usado para se tomar a decisão sobre a hipótese nula. Estatística de Teste para a proporção n pq pp Z ^ Estatística de Teste para a média n X Z 0 ou n s X t 0 Estatística de Teste para o desvio padrão 2 2)1( sn Z Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 24 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 24 Região crítica (região de rejeição) é o conjunto de todos os valores da estatística de teste que nos faz rejeitar a hipótese nula. Bilateral, Unilateral à Esquerda, Unilateral à Direita Teste bilateral: a região critica está nas duas regiões extremas sob a curva. Teste unilateral à esquerda: a região critica está na região extrema esquerda sob a curva. Teste unilateral à direita: a região critica está na região extrema direita sob a curva. Exemplo: H0 : µ = 50 centímetros H1 : µ≠ 50 centímetros Suponha que uma amostra de n = 10 seja selecionada e que a média da amostra X seja observada. Suponha que, se 5,515,48 x , não rejeitaremos a hipótese nula H0 : µ = 50, e se 5,48x ou 5,51x , rejeitaremos a hipótese nula em favor da hipótese alternativa H1 : µ≠ 50. região de aceitação: 5,515,48 x região crítica: 5,48x ou 5,51x valores críticos: 48,5 e 51,5. Suponha que o desvio padrão seja = 2,5. Os valores de z que correspondem aos valores críticos 48,5 e 51,5 são: 90,1 10 5,2 505,48 1 Z 90,1 10 5,2 505,51 2 Z Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 25 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 25 α = P (z < -1,90) + P (z > 1,90) = 0,0287 + 0,0287 = 0,0574 = 5,74% Para calcular β temos que ter uma hipótese alternativa específica, ou seja, temos de ter um valor particular de µ. Suponha que rejeitaremos a hipótese nula µ = 50 toda vez que µ for maior do que 52 ou menor do que 48. Potência ou poder do teste (1 – β): a potência de um teste estatístico é a probabilidade de rejeitar a hipótese nula H0 quando a hipótese alternativa for verdadeira. Exercícios 1) A resistência à tração do aço inoxidável produzido numa certa usina permanecia estável, com uma resistência média de 72 kg/mm² e um desvio-padrão de 2,0 kg/mm² com distribuição normal. Recentemente a máquina foi ajustada. A fim de determinar o efeito do ajuste, 10 amostras foram testadas. Os testes apresentaram resistência média de 75 kg/mm2. Considere que o desvio-padrão não mudou. Com base nesses dados responda: a. Com um nível de significância de 5% é possível afirmar que ovalor médio não mudou? (Passos: defina as hipóteses, faça o teste, tome a decisão). 2) Uma empresa comercializa um produto e alega ser eficiente pelo prazo de 400 horas no mínimo. Uma análise de nove itens escolhidos aleatoriamente acusou uma média de eficiência de 380 horas. a. Teste a afirmação da empresa, contra a alternativa que a duração é inferior a 400 horas, ao nível de significância de 1%, se o desvio-padrão amostral é de 60 horas (considere distribuição normal). (Passos: defina as hipóteses, faça o teste, tome a decisão) 3) Um comprador, ao receber de um fornecedor um grande lote de peças, decidiu inspecionar 200 delas. Decidiu, também, que o lote será rejeitado se ficar convencido, ao nível de 5% de significância, de que a proporção de peças µ=5048,5 51,5 α/2=0,0287 α/2=0,0287 µ=5048,5 51,5 α/2=0,0287 α/2=0,0287 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 26 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 26 defeituosas no lote é superior a 4%. Qual será sua decisão (aceitar ou rejeitar o lote) se na amostra foram encontradas onze peças defeituosas?(Passos: defina as hipóteses, faça o teste, tome a decisão). 4) Um revendedor de lâmpadas recebeu um grande carregamento de um fabricante, que afirma que as lâmpadas têm uma vida média de 1120 horas. Uma amostra com 8 lâmpadas extraída deste carregamento apresentou média amostral de 1070 horas e s= 125 horas. Os dados indicam que a vida média das lâmpadas recebidas é menor do que 1120 horas anunciadas? Realize o teste com 5% de nível de significância 5) Uma empresa produz itens em embalagens de 500g. Para verificar se a máquina de empacotar está trabalhando corretamente o controle de qualidade tomou uma amostra de 50 embalagens, que apresentou uma média amostral de 475g e desvio padrão amostral de 30g. Os dados obtidos proporcionam evidências suficientes para concluir que a máquina de empacotar não está trabalhando adequadamente (ou seja, a máquina empacota com pesos diferentes do proposto)? Realize o teste com α = 0,01. 6) Um revendedor de baterias recebeu um grande carregamento de um fabricante, que afirma que as baterias têm uma vida média de 1200 horas. Uma amostra com 10 baterias extraída deste carregamento apresentou média amostral de 1280 horas e s= 120 horas. Os dados indicam que a vida média das baterias recebidas é maior do que 1200 horas anunciados? Realize o teste com 1% de nível de significância. 7) Um processo deveria produzir mesas com 0,85 m de altura. O engenheiro desconfia que as mesas que estão sendo produzidas são diferentes que o especificado. Uma amostra de 8 mesas foi coletada e indicou média igual a 0,84 m. Sabendo que o desvio padrão é de 0,010m, teste a hipótese do engenheiro usando um nível de significância de 0,05. 8) Um fabricante afirma que no máximo 10% dos seus produtos são defeituosos. Um órgão de defesa do consumidor testa uma amostra de 81 desses itens, detectando 13,8% de defeituosos. Encontre a região crítica para um nível de significância de 5%. Calcule o p_Valor. 9) Em uma pesquisa com 800 estudantes universitários, 385 afirmaram possuir computador. Teste a hipótese de que pelo menos 50% dos estudantes universitários possuem computador. Use α = 0, 10. 10) Uma pesquisa entre 700 trabalhadores revela que 158 obtiveram seus empregos por meio de indicações de amigos ou parentes. Teste a hipótese de que mais de 20% dos trabalhadores conseguem seus empregos por indicação de amigos ou parentes, utilizando 5% como nível de significância. Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 27 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 27 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 28 Probabilidade / Teste de Hipótese / Intervalo de Confiança – Profº Celso Brazil 28
Compartilhar