Baixe o app para aproveitar ainda mais
Prévia do material em texto
AULA 03 Estimação de Parâmetros usando Intervalo de confiança SUMÁRIO 1 - INTRODUÇÃO ............................................................................................................................................. 3 2 - INTERVALO DE CONFIANÇA .................................................................................................................... 5 2.1 Intervalo de confiança a para proporção populacional ................................................................... 5 2.2 Intervalo de confiança a para média populacional ........................................................................ 10 5 - ANEXOS .................................................................................................................................................... 17 6 - EXERCÍCIOS RESOLVIDOS ..................................................................................................................... 21 6 - EXERCÍCIOS PROPOSTOS ..................................................................................................................... 28 Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 3 − 1 - Introdução Na estatística é muito comum utilizar os resultados de amostras visando tirar conclusões sobre as características da população. Para garantir que estas conclusões sejam válidas é necessário trabalhar com uma amostra que seja representativa, ou seja, que apresente um alto grau de similaridade com a população em estudo. Esta representatividade é obtida utilizando-se métodos de seleção aleatória que garantem imparcialidade na hora de escolher os elementos que irão compor a amostra. Tendo em mãos uma amostra representativa, o pesquisador irá usar alguns procedimentos estatísticos para fazer inferências a respeito de parâmetros da população. Por exemplo, suponha que um pesquisador esteja interessado em traçar o perfil das pessoas que moram em uma região. Como população alvo, ele definiu que seriam todas as pessoas entre 14 e 75 anos que residem nesta região. Uma das características de interesse para o pesquisador é o tempo médio que as pessoas ficam navegando na Internet por semana e a proporção de pessoas que consideram a Internet como o meio de entretenimento mais importante que a TV. Esta média e esta proporção seriam os parâmetros da população que são de interesse do pesquisador. Parâmetro – É a medida numérica que descreve uma característica da população. Tal medida poderia ser uma média, mediana, variância ou proporção que seriam calculados usando todos os elementos da população. Estatística – É a medida numérica que descreve uma característica da amostra. A diferença em relação ao parâmetro, é que na estatística usamos apenas os elementos que estão na amostra. Para obter as respostas desejadas, o pesquisador poderia realizar um censo, ou seja, poderia fazer um estudo com todas as pessoas que fazem parte desta população-alvo. Assim, ele obteria o valor “real” do tempo médio navegando na Internet e o valor “real” da proporção de pessoas que preferem a Internet. Esta solução seria a ideal, mas é demorada e cara. Outra solução mais barata e rápida seria trabalhar com uma pequena parcela da população-alvo. A média e a proporção desejadas seriam calculadas para esta amostra e, por fim, os resultados seriam projetados para o todo. É evidente que os resultados da amostra são apenas estimativas aproximadas dos parâmetros de interesse e se alguém achar que estas estimativas seriam exatamente iguais aos parâmetros, vai me desculpar, mas é querer demais, né! Na Figura 1 abaixo, ilustramos os conceitos vistos até o momento. Na figura, vemos que a população tem N = 200 mil pessoas e que uma amostra de n = 1200 pessoas foi selecionada. Os parâmetros de interesses são Tempo médio que as pessoas na população ficam navegando na Internet (µ) e a proporção de pessoas na população que preferem a Internet do que TV (p). Com base na amostra foram obtidas as estatísticas x = 21 horas (média da amostra) e pˆ = 80% (proporção de pessoas na amostra que preferem a Internet). Figura 1 – Ilustração dos conceitos básicos Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 4 − Estimativa Pontual e Intervalar As estatísticas mostradas na Figura 1 são consideradas “boas” estimativas dos parâmetros de interesse. Estas estimativas são chamadas de estimativas pontuais, pois são apresentadas através de um ponto ou valor único. Outra forma é usar um intervalo de valores para estimar o parâmetro. No caso da média do tempo navegando na Internet, poderíamos estimá-lo usando o intervalo de 18 a 22 horas, por exemplo. O quadro abaixo mostra a diferença entre a estimativa pontual e intervalar. Parâmetro populacional Estimativa pontual* Estimativa Intervalar* Média populacional (µ) µ = “Renda média per capita dos habitantes de uma cidade” µ é estimado em $ 2.500,00 µ está no intervalo de [$ 3.000 ; $ 3.500] Proporção populacional (p) p = “Proporção de peças com defeito em uma linha de produção” p é estimado em 8% p está no intervalo [6% ; 10%] Desvio-padrão populacional (σ) σ = “Desvio-padrão do tempo útil de vida da lâmpada de marca X” σ é estimado em 500 horas σ está no intervalo [300 ; 800] horas * Os valores aqui apresentados são hipotéticos Levando em consideração a distribuição de probabilidade da estatística, podemos associar à estimativa intervalar um nível de confiança que descreve o quanto acreditamos que o intervalo irá cobrir o verdadeiro valor do parâmetro da população. Este intervalo associado com um nível de confiança é denominado de Intervalo de Confiança para o parâmetro. Por exemplo, se o intervalo [19; 23] horas é um intervalo de 95% de confiança para a média da população, então podemos dizer que estamos 95% confiantes de que a média da população está entre 19 horas e 23 horas. Nas seções seguintes serão mostradas as formas de construir intervalos de confianças e como devemos calcular o tamanho da amostra necessário para estimação dos parâmetros. Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 5 − 2 - Intervalo de confiança 2.1 Intervalo de confiança para a proporção populacional A proporção populacional p é o nosso parâmetro de interesse e gostaríamos de estimá-lo com base em uma amostra de n elementos x1, x2, ..., xn. A proporção populacional é a o número de elementos com a característica de interesse na população dividida pelo tamanho da população (N). O número de elementos com a característica de interesse é normalmente denominado de número de sucessos, portanto podemos expressar a proporção populacional p como N população na SUCESSOSde número =p A proporção amostral, denotado de pˆ , é a proporção de sucesso na amostra selecionada. n amostra na SUCESSOSde número =pˆ O intervalo de confiança para a proporção populacional é obtido como proporção populacional = [estimativa pontual ± margem de erro] Ou seja, pˆ - E ≤ proporção populacional ≤ pˆ + E O intervalo de confiança é obtido usando a fórmula abaixo. Intervalo de 100(1- α)% de confiança para a proporção populacional p ( ) n qpp ˆˆ z pˆIC 2α±= ou n qp n qp ˆˆ zpˆ p ˆˆ zpˆ 22 αα +≤≤− ............ (1) O intervalo só será válido se as condições para aproximação normal forem válidas: # Sucessos na amostra= 5pˆn ≥ e # Fracassos na amostra = 5qˆn ≥ Amostra de n elementos Média amostral: n Sucessos#pˆ = População de N elementos p = proporção populacional Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 6 − Onde, • N e n são o tamanho da população e da amostra, respectivamente. • zα/2 é o valor crítico que depende do nível de confiança desejado para o intervalo. Ele é um o valor que deixa uma área de α/2 na cauda direita da distribuição normal padrão. • Nível de confiança 100(1 - α)% reflete o quanto nós acreditamos no intervalo de confiança obtido. Por exemplo, se o nível de confiança for de 95%, podemos dizer que estamos 95% confiantes de que o valor real do parâmetro está dentro do intervalo obtido. • O valor n qp ˆˆ z E 2α= é o maior erro cometido ao estimar a verdadeira proporção p e é denominada de margem de erro. Observação (1) Obter o valor crítico zαααα/2 Por definição, zα/2 é o valor que deixa uma área de α/2 na cauda direita da distribuição normal padrão. Como exemplo, suponha que queremos o valor de zα/2 para um nível de confiança de 96% (ou seja, 0,96). Na tabela normal padrão, o valor de zα/2 para uma área de 0,02 na cauda superior (e, consequentemente, 0,98 abaixo dele) é +2,05. Alguns valores comuns de zα/2 Nível de confiança (1- α) α/2 Valor crítico zα/2 90% 0,10 1,65 95% 0,05 1,96 99% 0,01 2,58 (2) Usar o fator de correção para população finita Caso a amostra seja feita sem reposição e seu valor seja maior que 5% da população (ou seja, n > 0,05N) devemos usar o fator de correção para população finita no cálculo da margem de erro. nN N n qp − − = 1ˆˆ z E 2α 0 z 0,00 0,01 ... 0,04 0,05 0,06 ... ... ... ... ... ... ... 1,9 0,971284 0,971933 ... 0,973810 0,974412 0,975002 2,0 0,977250 0,977784 ... 0,979325 0,979818 0,980301 2,1 0,982136 0,982571 ... 0,983823 0,984222 0,984614 2,2 0,986097 0,986447 ... 0,987455 0,987776 0,988089 Fator de correção -zα/2 0 +zα/2 0 0,02 0,02 α/2 α/2 0.96 1 - α Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 7 − Estimativa pontual x Intervalo de confiança Qual é o problema em usar somente a estimativa pontual? A estimativa pontual é uma boa aproximação do parâmetro de interesse (desde, é claro, que a amostra seja bem selecionada), mas apresenta um pequeno “problema”. Ela não nos dá ideia da precisão na nossa estimativa, ou seja, não tem como saber o quanto estamos errados na nossa estimativa. Na figura 1, a estimativa pontual da proporção de pessoas que preferem a Internet é 80%. Ao dizer que a estimativa de p é 80%, alguém pode estar interessado em saber se o erro nesta estimativa é grande ou não, e somente com a estimativa pontual não temos condições de saber o tamanho desse erro. Para “melhorar” as estimativas, podemos calcular o maior erro que estamos cometendo, com certa probabilidade, em nossas estimativas. Esse maior erro de estimação é denominado de margem de erro. maior margem de erro → menor precisão nas estimativas menor margem de erro → maior precisão nas estimativas Com a estimativa pontual e a margem de erro construímos um intervalo denominado de intervalo de confiança. O intervalo nos dá ideia de precisão nas estimativas. Quanto maior for a amplitude do intervalo, menor será a precisão das estimativas e quando menor for o intervalo, maior será a precisão das estimativas. maior margem de erro → maior IC → menor precisão nas estimativas menor margem de erro → menor IC → maior precisão nas estimativas Qual dos dois intervalos é mais preciso? IC(p): 20% ≤ p ≤ 90% onde p = proporção de eleitores que votarão em XY IC(p): 53% ≤ p ≤ 57% O que é desejável em um intervalo de confiança? → Uma amplitude menor, pois teríamos maior precisão nas estimativas; → Um grande nível de confiança. EXEMPLO 01 - Um pesquisador está interessado em estimar a “verdadeira” proporção de famílias que assistem ao programa XY em um bairro com N famílias. De pesquisa feita com uma amostra de 200 famílias, 155 delas disseram que assistem ao programa. Com base nestas informações, responda: a) Qual a estimativa pontual da “verdadeira” proporção (p) das famílias no bairro que assistem ao programa XY? Considerando um nível de 95% de confiança, qual o maior erro cometido (ou seja, a margem de erro) nesta estimação? b) Construa e interprete um intervalo de 95% de confiança para a “verdadeira” proporção p. Há evidências de que ¾ da população assistem ao programa? Justifique sua resposta. c) Construa e interprete um intervalo de 98% de confiança para a “verdadeira” proporção p. Compare a amplitude dos intervalos. Qual dos dois intervalos tem maior amplitude? d) Supondo que o bairro tem um total de 3000 famílias, construa um intervalo de 95% de confiança para a “verdadeira” proporção p. Resp: a) p ≈ 0,775 b) E = 0,058 zα/2 = 1,96 c) 0,717 ≤ p ≤ 0,833 Estamos 95% confiantes de que a proporção de famílias que assistem ao programa XY no bairro está dentro do intervalo de 71,7% a 83,3% com uma margem de erro de 5,8% para mais ou para menos. d) zz’ = 2,33 IC(p): 70,6% ≤ p ≤ 84,4% e) 70,9% ≤ p ≤ 84,1% Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 8 − EXEMPLO 02 - Para estimar a proporção de faturas emitidas com endereço incorreto, uma empresa retirou de seus arquivos uma amostra de 100 faturas e constatou que oito delas estavam com endereço incorreto. Com base nestas informações, responda: a) Qual a estimativa pontual da “verdadeira” proporção de faturas emitidas com endereço incorreto? b) Construa e interprete um intervalo de 95% de confiança para a “verdadeira” proporção. c) Responda ‘b’ supondo que a empresa tinha somente 100 faturas (N = 100 faturas). EXEMPLO 03 - Um pesquisador está interessado na proporção de pessoas em uma cidade do país UK que preferem a Internet do que TV como fonte de entretenimento. De uma amostra de 60 pessoas retirada desta cidade, 48 pessoas indicaram a Internet. Com base nestas informações, responda: a) Construa (e interprete) um intervalo de confiança de 95% para a verdadeira proporção de pessoas que preferem a Internet do que a TV. Qual foi a margem de erro na pesquisa? b) Segundo uma notícia veiculada em um jornal, ¾ das pessoas no país UK preferem a Internet. Com base no intervalo que você obteve em “a”, há evidências para acreditar na afirmação do jornal? Justifique sua resposta. Resp: IC(p): 69,9% ≤ p ≤ 90,1% E=10,1% Usando o Minitab Vamos considerar o exemplo 2b. •••• No menu, escolha Stat > Basic Statistics > 1 Proportion. •••• Selecione “Summarized data”, depois digite 8 em “Number of events” e 100 em “Number of trials”. •••• Clique em “Options”, digite o nível de confiança de 95% em “Confidence level”. O restante deve sempre estar em “not equal” em “Alternative” e “Use teste and interval based on normal distribution” Saída do Minitab Sample X N Sample p 95% CI 1 8 100 0,080000 (0,026828; 0,133172) Using the normal approximation. Intervalo de 95% de confiança 2,68% ≤ p ≤ 13,3% Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 9 − Cálculo do tamanho da amostra para estimar a proporção da população com uma margem de erro fixada em E0� qp E ˆˆ z n 2 0 2 ⋅⋅ = α se N desconhecido ou infinito � 2 2 2 0 2 2 )(ˆˆ )1( )(ˆˆN n α α zqpEN zqp ⋅⋅+⋅− ⋅⋅⋅ = se N é conhecido Observação Nas fórmulas acima precisamos de uma estimativa preliminar razoável para a proporção p. Esta estimativa poderá ser obtida de uma pesquisa anterior ou através de um estudo piloto. Na falta de uma estimativa preliminar, use o valor p = 0,50, valor que maximiza o produto p⋅⋅⋅⋅q. EXEMPLO 04 - Se o pesquisador do EXEMPLO 1 deseja estimar a proporção p das famílias no bairro que assistem ao programa XY, qual deveria ser o tamanho da amostra necessário para garantir um erro máximo de estimação igual a 4% para mais ou para menos. Use um nível de 95% de confiança. a) Como estimativa de p use a proporção amostral obtida no EXEMPLO 1. b) Suponha que você não tenha nenhuma estimativa a respeito da proporção p. famílias. Resp: a) n = 391 famílias deveriam ser selecionadas para assegurar, com 95% de certeza, que as estimativas obtidas, não se afastem mais de 4% dos seus verdadeiros valores b) n = 547 famílias EXEMPLO 05 - Um repórter deseja fazer uma pesquisa para estimar a “verdadeira” proporção dos universitários que têm computador em casa e quer ter 95% de confiança de que sua estimativa tenha uma margem de erro de 5% para mais ou para menos. Qual o tamanho da amostra (n), ou seja, quantos universitários deveriam ser pesquisados? a) Supondo que, de um estudo anterior, 27% dos estudantes têm computador em casa. b) Supondo que você não tem nenhuma informação sobre a proporção p. c) Repetir a letra ‘a’, supondo que na região de interesse do repórter haja um total de N = 25.000 universitários. Resp: a) n = 303 b) n = 385 c) n = 300 estudantes. Comparando o tamanho da amostra (n) em função do N e E 0 200 400 600 800 1000 50 2550 5050 7550 10050 12550 População (N) A m o st ra (n ) 3% 4% 5% 6% E Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 10 − 2.2 Intervalo de confiança a para média populacional A média populacional µµµµ é agora o nosso parâmetro de interesse e gostaríamos de estimá-la com base nos valores de uma amostra de n elementos x1, x2, ..., xn. O intervalo de confiança para a média populacional é obtido como média populacional = [estimativa pontual ± margem de erro] Ou seja, x - E ≤ média populacional ≤ x + E A margem de erro (E) é de duas maneiras diferentes, dependo do que você sabe sobre o valor do σ (desvio- padrão na população). Situação I: Supõe-se que o desvio-padrão populacional (σ) é conhecido Situação II: Supõe-se que o desvio-padrão populacional (σ) é desconhecido Situação I: Desvio-padrão populacional (σσσσ) é conhecido ( ) n σ z xIC 2αµ ±= ou n σ zxµ n σ zx 22 αα +≤≤− .......... (2) Situação II: Desvio-padrão populacional (σσσσ) é desconhecido ( ) n s t xIC 2αµ ±= ou n s txµ n s tx 22 αα +≤≤− ............ (3) Onde, • N e n é o tamanho da população e da amostra, respectivamente. • zα/2 é o valor crítico obtido da tabela normal padrão e que depende do nível de confiança desejado. • tα/2 é o valor crítico obtido da tabela t de student e que depende do nível de confiança desejado (veremos esta tabela mais adiante) Amostra de n elementos Média amostral: n x i∑ =x Desvio-padrão amostral: ( ) 1-n x 2 i∑ − = x s População de N elementos µµµµ = média σσσσ = desvio-padrão Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 11 − Algumas observações (1) Se o tamanho da população (N) for finita e conhecida e a amostra for maior que 5% da população (n ≥ 0,05·N) é aconselhável incluir um fator de correção para população finita. Neste caso, a margem de erro seria calculada (dependendo da situação) como: 12 − − = N nN n zE σα ou 12 − − = N nN n s tE α (2) No caso de grandes amostras (n ≥ 30), se o desvio-padrão populacional σσσσ for desconhecido é comum substituí-lo pelo desvio-padrão amostral s e ainda continuar usando a fórmula (2). Isto é possível, pois esperamos que ambos (s e σ) sejam próximos a medida que aumentamos o tamanho da amostra. EXEMPLO 06 - Um pesquisador está interessado em estimar o “verdadeiro” tempo médio µµµµ que as famílias do bairro gastam vendo TV. Com base em dados históricos, o pesquisador sabe que o desvio- padrão populacional do tempo vendo TV é igual a 1,5 hora. De um estudo feito com uma amostra de 200 famílias foi obtido uma média amostral de 5,4 horas. Use os resultados desta pesquisa para responder as questões abaixo: a) Qual é a estimativa pontual da média populacional µ? Considerando um nível de 95% de confiança, qual é o maior erro cometido (ou seja, a margem de erro) nesta estimação? b) Construa e interprete um intervalo de 95% de confiança para a média da população. c) Alguns pesquisadores acreditam que as famílias no bairro gastam em média 6 horas vendo TV. Os dados mostram evidências para acreditar nestes pesquisadores? Justifique sua resposta. a) µ ≈ 5,4 horas b) E = 0,21 horas c) 5,19 ≤ µ ≤ 5,61 horas Estamos 95% confiantes de que o tempo médio vendo TV pelas famílias do bairro está no intervalo de 5,19 hs e 5,61 hs . EXEMPLO 07 - O fabricante Light deseja estimar o valor do tempo médio de vida útil das lâmpadas que ele fabrica. Por questão de tempo, ele amostrou apenas 25 lâmpadas e registrou o tempo de vida de cada uma, obtendo uma média amostra foi de 1200 horas e um desvio-padrão amostral de 80 horas. Assumindo que o tempo de vida das lâmpadas tem aproximadamente distribuição normal, construa (e interprete) um intervalo de confiança de 95% para o verdadeiro tempo médio de vida das lâmpadas. Qual foi a margem de erro na pesquisa? Resp: tα/2 = 2,064 E = 33,02 horas c) 1166,98 ≤ µ ≤ 1233,02 horas EXEMPLO 08 - Um pesquisador está interessado no tempo que as pessoas em uma cidade do país UK gastam navegando na Internet. Com base em dados históricos, o tempo segue a distribuição normal com desvio-padrão populacional igual a 6 horas. Uma amostra de 60 pessoas retirada desta cidade apresentou uma média amostral igual a 19,5 horas por semana. Com base nestas informações, responda: a) Construa (e interprete) um intervalo de confiança de 98% para o verdadeiro tempo médio de navegação na Internet. Qual foi a margem de erro na pesquisa? b) Segundo uma notícia veiculada na Internet, o tempo médio no pais UK é de 20 horas. Com base no intervalo que você obteve em “a”, há evidências o tempo médio na cidade é igual ao do país? Justifique sua resposta. Resp: 17,70 ≤ µ ≤ 21,30 horas/semana. Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 12 − EXEMPLO 09 - O responsável pelo laboratório de informática de uma escola deseja estimar o tempo médio µ que os alunos gastam usando o laboratório. Inicialmente ele selecionou aleatoriamente uma amostra de 12 alunos e registrou o tempo gasto por cada um deles. Os dados estão logo abaixo. Assuma que o tempo de uso do laboratório segue uma distribuição aproximadamente normal. 37 36 31 25 29 32 24 30 21 42 30 41 Construa e interprete um intervalo de confiança de 95% para o “verdadeiro” tempo médio de uso do laboratório. Qual foi a margem de erro? Resp; x =31,5 s = 6,54 tα/2 = 2,201 E = 4,155 min27,3 ≤ µ ≤ 35,7 min. EXEMPLO 10 - A empresa Consolidated Package Delivery Service (CPDS) está estudando a proposta de transferir o seu pátio de armazenagem. Para ajudá-la a tomar uma decisão, 12 caminhões de entrega foram selecionados e registrado o percurso diário de cada um, obtendo uma média amostral de 320 quilômetros e um desvio-padrão amostral de 65 quilômetros. Supondo que o percurso tenha distribuição aproximadamente normal, construa um intervalo de 95% de confiança para o percurso médio dos caminhões na população. Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 13 − Distribuição t de Student A distribuição t de Student foi criada por W. S. Gosset, funcionário de uma cervejaria irlandesa no início do século XX. A distribuição de Student recebeu este nome em função do pseudônimo que Gosset empregava para assinar seus trabalhos acadêmicos. Segundo se sabe a empresa não permitia que os funcionários publicassem trabalhos em seu próprio nome. A distribuição t-student tem a forma parecida com a distribuição normal padrão. Ela é simétrica em torno da média zero, mas é um pouco mais dispersa que a normal (a sua cauda demora um pouco mais para cair). Essa dispersão é maior para pequenas amostras (n < 30), sendo que para grandes amostras (n ≥ 30) a distribuição t de student é bem próxima da normal. A tabela t de student mostra as áreas na cauda superior para um determinado1 grau de liberdade (gl = n - 1). A tabela t de Student mostra as áreas na cauda superior (ou seja, à direita do valor crítico) para um determinado grau de liberdade, que é o tamanho da amostra menos 1, ou seja, n-1. Como olhar a tabela da distribuição t de Student? Considerando um nível de confiança de 95% e n = 15, determine o valor crítico tα/2? Se NC = 100(1-α)% = 95%, então α = 0,05 e α/2 = 0,025. Na linha 14 e coluna 0,025 temos tαααα/2= 2,145. Se o nível de confiança é 99% e n = 20, qual o valor crítico tα/2? 1 Como vocês notaram a tabela t de Student não é completa. Ela só trabalha com as probabilidades mais usuais em inferência estatística. x f( x ) 43210-1-2-3-4-5 0.4 0.3 0.2 0.1 0.0 Variable Normal t-Student n = 2 x f( x ) 43210-1-2-3-4-5 0.4 0.3 0.2 0.1 0.0 Variable Normal t-Student n = 15 Comparação entre a curva normal padrão e a distribuição t de Student para n = 2 e n = 15 Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 14 − Cálculo do tamanho da amostra para estimar a média da população com uma margem de erro fixada em E0 2 0 2z n ⋅ = E σα se N desconhecido ou infinito 2 2 22 0 2 2 2 )( )1( )(N n α α σ σ zEN z ⋅+⋅− ⋅⋅ = se N for finita e conhecido Observação Uma estimativa preliminar do desvio-padrão σ poderá ser baseada no desvio-padrão amostral (s) de uma pesquisa feita anteriormente e similar à sua pesquisa ou no desvio-padrão amostral (s) de um estudo piloto. O valor crítico zα/2 é obtido da tabela normal padrão EXEMPLO 11 - Suponha que o responsável pelo laboratório de informática no exemplo 9 julgou a estimativa pouco precisa. Qual deveria ser o tamanho da amostra para estimar a média populacional de forma a garantir uma margem de erro de 2 minutos para mais ou para menos com uma confiança de 95% nos resultados? Como estimativa de σ use o desvio-padrão da amostra usada no exemplo 9. Resp: n = 42 alunos Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 15 − Usando o Minitab - σσσσ conhecido Voltando ao exemplo 6b •••• No menu, escolha Stat > Basic Statistics > 1-Sample z. •••• Em “Summarized data”, digite o tamanho da amostra (n) em “Sample size” e a média amostral em “Mean”. Ou entre com uma variável com os dados em “Samples in columns”. •••• Clique em “Options”, digite o nível de confiança de 95% em “Confidence level” selecione (sempre) “not equal” em “Alternative”. Saída do Minitab The assumed standard deviation = 1,5 N Mean SE Mean 95% CI 200 5,400 0,106 (5,192; 5,608) Intervalo de 95% de confiança 5,192 ≤ µµµµ ≤ 5,608 Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 16 − Usando o Minitab - σσσσ desconhecido Voltando ao exemplo 9 •••• Digite os dados na coluna C1 •••• No menu, escolha Stat > Basic Statistics > 1-Sample t. •••• Selecione a variável teste em “Samples in columns”, ou entre com os dados sumarizados em “Summarized data”, caso você já tenha a média amostral, o desvio-padrão amostral (s) e o tamanho da amostra (n) •••• Clique em “Options”, digite o nível de confiança de 95% em “Confidence level” selecione (sempre) “not equal” em “Alternative”. Saída do Minitab Variable N Mean StDev SE Mean 95% CI tempo 12 31,50 6,54 1,89 (27,34; 35,66) Intervalo de 95% de confiança 27,34 ≤ µµµµ ≤ 35,66 Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 17 − 5 - Anexos ANEXO 1 – Um pouco sobre os estimadores As estatísticas usadas para estimar os parâmetros são denominadas de estimadores, então: O melhor estimador da média populacional µµµµ é a média amostral nxx i∑= O melhor estimador da proporção populacional p é a proporção amostral nxp =ˆ O melhor estimador da variância populacional σσσσ2 é a variância amostral 1 )( 22 − − = ∑ n xx s i Para cada parâmetro podemos ter vários estimadores. Por exemplo, para estimar a média populacional µµµµ, poderíamos pensar em usar a média simples, a mediana, a moda ou qualquer outra medida de posição central. Como sabemos que x , pˆ e s2 são os melhores estimadores de µ, p e σ2, respectivamente? Porque estes estimadores satisfazem algumas características importantes dentro da estatística. Eles são estimadores não-tendenciosos (ou seja, em média o estimador é igual ao valor do parâmetro) e mais precisos (ou seja, apresentam menor variabilidade em torno dos parâmetros). Analogia dos estimadores com os rifles RIFLE A Os tiros tendem a ficar em torno do centro alvo; Grande dispersão em torno do centro ** O rifle não é viciado e tem pouca precisão. Analogia com os estimadores • Estimador é não-tendencioso e com grande variabilidade em suas estimativas RIFLE B Os tiros tendem a ficar em torno de um centro, mas não é do alvo. Pequena dispersão em torno do centro dos tiros. ** O rifle é viciadoe tem grande precisão. Analogia com os estimadores • Estimador é tendencioso e com pequena variabilidade em suas estimativas RIFLE C Os tiros tendem a ficar em torno de um centro, mas não é do alvo. Grande dispersão em torno do centro dos tiros. ** O rifle é viciado e tem pouca precisão. Analogia com os estimadores • Estimador é tendencioso e com grande variabilidade em suas estimativas RIFLE D Os tiros tendem a ficar em torno do centro do alvo. Pequena dispersão em torno do centro do alvo. ** O rifle não é viciado e tem grande precisão. Analogia com os estimadores • Estimador é não-tendencioso e com pequena variabilidade em suas estimativas Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 18 − ANEXO 2 - Esquema para demonstrar as idéias envolvidas no intervalo de confiança (usando um nível de confiança de 95%) Gráfico dos intervalos de confiança construídos com 50 amostras simuladas. Dos 50 intervalos, três deles não contém a “verdadeira” média populacional (µ = 18), o que corresponde a 94%. 95 % In te rv a lo de Co n fia n ça 21 20 19 18 17 16 15 Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 19 − ANEXO 3 - Usando a distribuição da média amostral x e da proporção amostral pˆ para obter o intervalo de confiança. Intervalo de confiança para a média µµµµ erro de estimação = µ−= Xe E = maior erro de estimação � Pelo Teorema Central do Limite, sabemos que )n ;( σµNormalX ≈ P(“erro de estimação ser menor que o valor E”) = 95,0)( =≤− EXP µ 95,0)( =≤− EXP µ = 95,0)( =+≤≤− EXEP µµ = 95,0= −+ ≤≤ −− n EZ n EP σ µµ σ µµ = 95,0= ≤≤− σσ nEZnEP = 95,0)( =+≤≤− cc zZzP onde σ nE zc = Pela tabela normal padrão, obtemos 96,1zc = 96,1== σ nE zc → ... (após algumas manipulações algébricas) ... → n E σ⋅= 96,1 Intervalo de 95% de confiança para a média µµµµ: ExEx +≤µ≤− onde n 96,1E σ⋅= De uma forma geral Intervalo de 100(1 - α)% de confiança para a média µµµµ: ExEx +≤≤− µ onde n zE σα ⋅= 2 Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 20 − Intervalo de confiança para a média µµµµ erro de estimação = µ−= pe ˆ E = maior erro de estimação � Pelo Teorema Central do Limite, sabemos que )npq ;(ˆ pNormalp ≈ P(“erro de estimação ser menor que o valor E”) = 95,0)ˆ( =≤− EppP 95,0)ˆ( =≤− EppP = 95,0)ˆ( =+≤≤− EppEpP = 95,0= −+ ≤≤ −− npq pEp Z npq pEp P = 95,0= −+ ≤≤ −− npq pEp Z npq pEp P = 95,0)( =+≤≤− cc zZzP onde npq E zc = Pela tabela normal padrão, obtemos 96,1zc = npq E zc = → ... (após algumas manipulações algébricas) ... → n qpE ˆˆ 96,1 ⋅= Intervalo de 95% de confiança para a média µµµµ: ExEx +≤≤− µ onde n pqE ⋅= 96,1 De uma forma geral Intervalo de 100(1 - α)% de confiança para a proporção p: EpEp +≤≤− ˆ ˆ µ onde n pq zE ⋅= 2α Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 21 − ANEXO 4 - Obtendo o valor crítico zαααα/2 O valor crítico zαααα/2 é o escore z que separa uma área de α/2 na cauda direita da distribuição normal padronizada. Ou seja, é o valor zαααα/2 tal que 2)( 2 αα => zZP . α = denota a probabilidade do erro de estimação ser maior que a Margem de erro. α−1 = denota a probabilidade do erro de estimação ser menor ou igual a Margem de erro. 100(1 - α)% = forma geral de nos referirmos ao Nível de Confiança (NC) do intervalo de confiança. Determine o valor crítico zαααα/2 para um nível de confianças igual a 97%. 100(1 - α)% = 97% →→→→ 1 - α = 0,97 →→→→ α = 0,03 →→→→ α/2 = 0,015 015,0)( 2 => czZP α →→→→ zαααα/2 = ?? →→→→ Pela tabela Normal padronizada zαααα/2 = 2,17 0,07 ↑ 2,1 ← ≈ 0,985 Tabela normal padrão (Z) 20 0 zαααα/2 = ? 0,015 0,985 Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 22 − 6 - Exercícios resolvidos EXERCÍCIO 1 - Uma empresa deseja saber qual o tempo médio (em dias) de vida útil das lâmpadas que fabrica. De estudos anteriores, a empresa assumiu que o desvio-padrão do tempo de vida das lâmpadas seja σ = 100 horas. Foi selecionada uma amostra aleatória de n = 400 lâmpadas e registrado o tempo de vida de cada lâmpada. O tempo médio de vida da amostra foi de x = 1200 horas. a) Qual a estimativa pontual do “verdadeiro” tempo médio de vida (µµµµ) das lâmpadas? b) Construa e interprete um intervalo de 95% de confiança para µµµµ? Solução a) µµµµ = “verdadeiro” tempo médio de vida das [todas] lâmpadas. µµµµ ≈ x =1200 horas (a estimativa pontual de µµµµ é 1200 horas) b) O que queremos: Intervalo de 95% de confiança para µ: IC(µ) = ? O que temos: n = 400 lâmpadas; x =1200 horas; s = ?; σ = 100 horas; N = ? Para um nível de confiança de 95% (NC = 95%), temos que 2zα = 1,96 (valor tabelado) IC(µ) = 8,91200 400 10096,112002 ±=⋅±=⋅± n zx σ α Resposta: IC(µ) = 8,91200 ± horas ou [1190,2; 1209,8] horas ou 1190,2 horas ≤ µ ≤ 1209,8 horas Interpretação Estamos 95% confiantes de que o “verdadeiro” tempo médio de vida das lâmpadas está dentro do intervalo de 1190,2 a 1209,8 horas. ou A estimativa do tempo médio de vidas das lâmpadas (µ) é de 1200 horas com uma margem de erro de ±9,8 horas e 95% de confiança nos resultados. ou O tempo médio de vidas das lâmpadas (µ) é de 1190,2 horas até 1209,8 horas com 95% de confiança. Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 23 − Intervalo de confiança para média populacional (µµµµ) – Para σσσσ desconhecido EXERCÍCIO 2 – Um fabricante deseja saber qual o tempo médio (em horas) de vida útil das lâmpadas que fabrica. Por questão de tempo, ele amostrou apenas n = 25 lâmpadas e registrou o tempo de vida de cada uma. O tempo médio amostral foi de x = 1200 horas e o desvio-padrão amostral foi de s = 80 horas. Assuma que o tempo de vida das lâmpadas tem distribuição Normal. a) Qual a estimativa pontual do “verdadeiro” tempo médio de vida (µ) das lâmpadas? b) Construa e interprete um intervalo de 95% de confiança para µ? Solução a) µµµµ = “verdadeiro” tempo médio de vida das [todas] lâmpadas. µµµµ ≈ x =1200 horas (a estimativa pontual de µµµµ é 1200 horas) b) O que queremos: Intervalo de 95% de confiança para µ: IC(µ) = ? O que temos: n = 25 lâmpadas; x =1200 horas; s = 80; σ = ?; N = ? Para NC = 95% e 24 graus de liberdade temos que 2t α = 2,064 (olhando a tabela t-Student) g.l (n-1) ... 0,025 ... ... ↓ 24 → 2,064 ... IC(µ) = 0,331200 25 80064,212002 ±=⋅±=⋅± n s tx α Resposta: IC(µ) = 0,331200 ± horas ou IC(µ) = [1167,0; 1233,0] horas ou 1167,0 horas ≤ µ ≤ 1233,0 horas Interpretação Estamos 95% confiantes de que o “verdadeiro” tempo médio de vida das lâmpadas µ está dentro do intervalo de 1167,0 a 1233,0 horas. ou A estimativa do tempo médio de vidas das lâmpadas (µ) é de 1200 horas com uma margem de erro de ±33,0 horas e 95% de confiança nos resultados. ou O tempo médio de vidas das lâmpadas (µ)é de 1167,0 horas até 1233,0 horas com 95% de confiança. Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 24 − EXERCÍCIO 3 – Em um estudo do tempo necessário para o serviço de entrega no apartamento de um hotel recentemente aberto, uma amostra de 20 entregas acusou uma média de 24,2 minutos, com desvio-padrão de 8,7 minutos. Os dados amostrais parecem ter distribuição normal. Construa e interprete um intervalo de 99% de confiança para o “verdadeiro” tempo médio (µ) de todas as entregas. Solução O que queremos: Intervalo de 99% de confiança para µ: IC(µ) = ? O que temos: n = 20 entregas; x =24,2 min; s = 8,7 min; σ = ?; N = ? Para NC = 99% e 19 graus de liberdade temos que 2t α = 2,861 (olhando a tabela t-Student) g.l (n-1) ... 0,005 ... ... ↓ 19 → 2,861 ... IC(µ) = 57,52,24 20 7,8861,22,242 ±=⋅±=⋅± n s tx α Resposta: IC(µ) = 57,52,24 ± minutos ou IC(µ) = [18,63; 29,77] horas ou 18,63 horas ≤ µ ≤ 29,77 horas Interpretação Estamos 99% confiantes de que o “verdadeiro” tempo médio de entrega das encomendas µ está dentro do intervalo de 18,63 a 29,77 minutos. ou A estimativa do tempo médio de entrega das encomendas (µ) é de 24,2 minutos com uma margem de erro de ±5,57 minutos e 99% de confiança nos resultados. ou O tempo médio de entrega das encomendas (µ) é de 18,63 minutos até 29,77 minutos com 99% de confiança. Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 25 − Cálculo do tamanho da amostra (n) para estimar a média populacional (µµµµ) EXERCÍCIO 4 - A Nielsen Media Research deseja estimar o tempo médio (em horas) que os estudantes de tempo integral de uma universidade passam vendo televisão em cada dia da semana. Determine o tamanho da amostra (n) necessário para estimar essa média com uma margem de erro de 0,25 hora, com 90% de confiança. Suponha que um estudo piloto tenha indicado que o desvio-padrão é estimado em 1,87 horas. Solução: µ = Tempo médio vendo TV por dia O que queremos: Tamanho da amostra (n = ?) para estimar µ O que temos: σ = 1,87 horas; E = 0,25 hora; N = ? σ = desvio-padrão populacional; E = Margem de erro; N = tamanho da população Para NC = 90% temos que 2zα = 1,65 (valor tabelado) 22 2 25,0 87,165,1z n ⋅ = ⋅ = E σα = 151,4 → 152 universitários Resposta: Seriam necessários amostrar 152 universitários (n = 152) para estimar o tempo médio que eles gastam vendo TV por dia (µ) com um margem de erro de ±0,25 hora e 90% de confiança nos resultados. EXERCÍCIO 5 – Continuando com o exemplo 4. Assuma que exista um total de 2000 estudantes na universidade (N = 2000). Determine o tamanho da amostra (n) necessário para estimar essa média com uma margem de erro de 0,25 hora e 90% de confiança nos resultados. Suponha que um estudo piloto tenha indicado que o desvio-padrão é estimado em 1,87 horas. Solução: µ = Tempo médio vendo TV por dia O que queremos: Tamanho da amostra (n = ?) para estimar µ O que temos: σ = 1,87 horas; E = 0,25 hora; N = 2000 σ = desvio-padrão populacional; E = Margem de erro; N = tamanho da população Para NC = 90% temos que 2zα = 1,645 (valor tabelado) Temos dois caminhos: � 2 2 22 2 2 2 z )1( zN n α α σ σ ⋅+⋅− ⋅⋅ = EN = 222 22 1,65,871 25,0)12000( 1,6587,10002 ⋅+⋅− ⋅⋅ =140,8 → n = 141 Resposta: Seriam necessários amostrar 142 universitários (n = 142) para estimar o tempo médio que eles gastam vendo TV por dia (µ) com um margem de erro de ±0,25 hora e 90% de confiança nos resultados. Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 26 − Intervalo de confiança para proporção populacional (p) EXERCÍCIO 6 - Para conhecer o valor da proporção de faturas emitidas com endereço incorreto, uma empresa retirou de seus arquivos uma amostra de 100 faturas (n = 100). Desta amostra, 8 faturas apresentaram endereço incorreto. a) Qual a estimativa pontual da “verdadeira” proporção de faturas emitidas com endereço incorreto (p)? b) Construa e interprete um intervalo de 90% de confiança para p? Solução a) p = “verdadeira” proporção de faturas com endereço incorreto (proporção populacional) pˆ = proporção de faturas amostradas com endereço incorreto (proporção amostral) 08,0 100 8 ˆ ==p (8%) p ≈ pˆ = 8% (a estimativa pontual de p é de 8%) b) O que queremos: Intervalo de 90% de confiança para p: IC(95%; p) = ? O que temos: n = 100 faturas; pˆ = 8%; N = ? Para um nível de confiança de 90% (NC = 90%), temos que 2zα = 1,65 (valor tabelado) Verificando as condições: 5 808,0100ˆ ≥=⋅=⋅ pn ok 5 92)08,01(100ˆ ≥=−⋅=⋅ pn ok IC(p) = n pp zp )ˆ1(ˆˆ 2 −⋅ ⋅± α = 100 )08,01(08,065,108,0 −⋅⋅± = 0,08 ± 0,0446 Resposta: IC(p) = %46,4%8 ± minutos ou ICp) = [3,54%; 12,46%] ou 3,54% ≤ p ≤ 12,46% Interpretação Estamos 90% confiantes de que a “verdadeira” proporção de faturas com endereço incorreto p está dentro do intervalo de 3,54% a 12,46%. ou A estimativa da proporção de faturas com endereço incorreto (p) é de 8% com uma margem de erro de ±4,46% e 90% de confiança nos resultados. ou A proporção de faturas com endereço incorreto (p) é de 3,54% até 12,46% com 90% de confiança. Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 27 − Cálculo do tamanho da amostra (n) para estimar a proporção populacional (p) EXERCÍCIO 7 – Um repórter deseja fazer uma pesquisa para estimar a “verdadeira” proporção dos universitários que têm computador em casa e quer ter 95% de confiança de que sua estimativa tenha uma margem de erro de 4%. Qual o tamanho da amostra (n), ou seja, quantos universitários deveriam ser pesquisados? a) Suponha que, de um estudo anterior, sabemos que 27% dos estudantes têm computador em casa. Desta forma, você pode assumir que 27,0ˆ =p . b) Assuma que você não tem nenhuma informação sobre pˆ . c) Repetir ‘a’ sabendo que na região de interesse do repórter haja um total de 25.000 universitários. Solução a) p = “verdadeira” proporção dos universitários que têm computador em casa O que queremos: Tamanho da amostra (n = ?) para estimar a proporção p O que temos: %)27( 27,0ˆ =p ; E = 0,04 (4%); N = ? E = Margem de erro; N = tamanho da população. Para NC = 95% temos que 2zα = 1,96 (valor tabelado) 2 2 2 )ˆ1(ˆz E pp n −⋅⋅ = α = 2 2 04,0 )27,01(27,096,1 −⋅⋅ = 473,2 → 474 universitários Resposta: Seria necessário amostrar 474 universitários (n = 474) para estimar “verdadeira” proporção dos universitários que têm computador em casa (p) com uma margem de erro de ±4% e 95% de confiança nos resultados. b) p = “verdadeira” proporção dos universitários que têm computador em casa O que queremos: Tamanho da amostra (n) para estimar p → n = ? O que temos: ?pˆ = ; E = 0,04 (4%); N = ? (obs: Usar pˆ = 0,5, já que não temos o valor de pˆ ) E = Margem de erro; N = tamanho da população Para NC = 95% temos que 2zα = 1,96 (valor tabelado) 2 2 2 )ˆ1(ˆz E pp n −⋅⋅ = α = 2 2 04,0 )5,01(5,096,1 −⋅⋅ = 600,25 → 601 universitários Resposta: Seria necessário amostrar 601 universitários (n = 601) para estimar “verdadeira” proporção dos universitários que têm computador em casa (p) com uma margem de erro de ±4% e 95% de confiança nos resultados. c) 2 2 2 2 2 ˆˆ1 ˆˆ α α zqp E)(NzqpN n ⋅⋅+⋅− ⋅⋅⋅ = = 22 2 96,10,27)-(127,0 04,0)125000( 96,10,27)-(127,050002 ⋅⋅+⋅− ⋅⋅⋅ ≈ 465 universitários Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 28 − 6 - Exercícios Propostos [Inferência estatística – Estimação de parâmetros] 1) Defina os termos abaixo: a) Inferência estatística b) População e Amostra c) Parâmetro e Estatística d) Estimador e) Estimativa pontual f) Erro de estimação g) Margem de erro h) Nível de confiança i) Intervalo de Confiança 2) Qual o problema de usar somente a estimativa pontual ao estimar um parâmetro populacional? 3) Caso você tenha feito um recenseamento, ou seja, você tem os dados de toda a população de seu interesse, há sentido falar em estimação de parâmetros, margem de erro e intervalo de confiança? Justifique. 4) Se uma pessoa leiga em estatística lhe perguntar o que vem a ser intervalo de confiança e margem de erro, qual a explicação que você daria a esta pessoa (lembre-se, ela é leiga e sua explicação em termos técnicos de nada adiantaria)? 5) “Sempre teremos boas estimativas (menor erro de estimação) quando trabalhamos com grande amostra”. Concorda? Justifique. [Estimação da proporção populacional (p)] 6) Considere: a) p = Proporção de residências que não atingiram a meta Amostra de n = 80 residências: x = 10 não atingiram a meta e pˆ = ?. b) p = Proporção de funcionários que recebem menos de 2 SM N = 200 funcionários Amostra de n = 200 funcionários: x = 25 funcionários recebem menos de 2 SM e pˆ = ?. Para cada uma das questões acima, responda: • Qual a estimativa pontual da proporção populacional (p)? • Qual é a margem de erro (erro máximo de estimação) com 95% de confiança? • Calcule e interprete o intervalo de 95% de confiança para a proporção populacional (p)? Resp: a) E = 0,07247 (7,25%) 5,25% ≤ p ≤ 19,75% b) E = 0 p = 12,5% 7) Um instituto de pesquisa de mercado realiza levantamentos telefônicos e deseja estimar a taxa de resposta, ou seja, a proporção p pessoas que aceitam participar da pesquisa por telefone. Em uma amostra de 200 pessoas, apenas 90 pessoas aceitaram participar da pesquisa por telefone. a) Calcule o valor de pˆ = proporção de pessoas amostradas que aceitaram participar da pesquisa por telefone? b) Qual a estimativa pontual para p e qual seria o erro máximo (margem de erro) cometido nesta estimativa com 95% de confiança? c) Construa e interprete um intervalo de 95% de confiança para p. Resp: a) p ≈ 45% E = 6,89% b) 38,11% ≤ p ≤ 51,89% 8) A empresa GOL, um dos fabricantes de bolas, selecionou uma amostra de 81 bolas e verificou que 8 delas pesam mais de 455 gramas. Construa e interprete um intervalo de 95% de confiança para p = “verdadeira” proporção de bolas que pesam mais de 455 gramas. A empresa afirma que 10% das bolas fabricadas por ela pesam mais de 455 gramas, você acredita na afirmação da empresa? Justifique. Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 29 − 9) As companhias de seguro estão ficando preocupadas com o fato do número crescente de telefones celulares resulte em maior número de colisões de carros e, por isso, estão pensando em cobrar prêmios mais elevados para os motoristas que utilizam celulares. Uma pesquisa preliminar feita com uma amostra de 50 motoristas revelou que 9 motoristas falam ao celular enquanto estão dirigindo. Construa um intervalo de 99% de confiança para a porcentagem dos [todos] motoristas que falam ao celular enquanto estão dirigindo. Interprete o intervalo de confiança obtido. Resp: 4,0% < p < 32,0% 10) Se Li e Ls são, respectivamente, os limites inferior e superior do Intervalo de Confiança (IC). Mostre que: pˆ 2 Ls Li = + (proporção amostral) e erro) de (margem E 2 Li Ls = − ]ˆˆ[);( EpE; ppNCIC +−= -- IC para proporção populacional (p) 11) Um médico coletou uma amostra de seus pacientes para questioná-los sobre a satisfação com o atendimento. Calculando a porcentagem de clientes amostrados satisfeitos com o atendimento, o médico pôde construir o intervalo de confiança para a porcentagem dos [todos] clientes satisfeitos com seu atendimento (p). O intervalo de 95% de confiança obtido foi igual a (76% ; 84%). Responda as questões abaixo. a) Interprete o intervalo de confiança obtido. b) Calcule pˆ = proporção amostral de clientes satisfeitos. (calcule o ponto médio do IC) c) Calcule o erro máximo de estimação associado ao IC. d) O médico acreditava que 90% dos seus clientes estavam satisfeitos com seu atendimento. Com base no intervalo de confiança obtido com a pesquisa realizada, o médico tinha razão? Resp: c) E = 4% 12) Um repórter da revista Byte fez uma pesquisa com 120 universitários e descobriu que 29% dos universitários amostrados têm computador em casa. a) Construa e interprete um intervalo de 95% de confiança para p = “verdadeira” porcentagem dos universitários que têm computador em casa. b) Com base no intervalo de confiança construído em ‘a’ e supondo que exista um total de 60.000 universitários (valor hipotético) na região, construa o intervalo de 95% de confiança para o número de universitários que têm computador em casa. Resp: E = 8,12% 20,88% ≤ p ≤ 37,12%) b) (20,88% de 60000) ≤ Nº ≤ (37,12% de 60000) 13) O funcionário José da empresa FOX selecionou uma amostra de 50 encomendas e anotou o tempo (em minutos) que foi gasto para embalar cada uma delas e despachá-la. Os dados estão na tabela abaixo: Tempo de preparo de encomendas Tempo de preparo Quantidade de encomendas (fi) 5 |-- 10 14 10 |-- 15 20 15 |-- 20 11 20 |-- 25 5 Total n = 50 a) Calcule a proporção de encomendas amostradas ( pˆ ) que gastaram menos de 15 minutos para ser preparadas. b) Construa e interprete um intervalo de 99% de confiança para o valor de p = “verdadeira” proporção de encomendas que gastam menos de 15 minutos para ser preparadas. c) Supondo que a empresa FOX determinou que 75% encomendas deveriam ser embaladas e despachadas em menos de 15 minutos. Você acredita que há motivos de preocupação para o funcionário. Resp: a) pˆ = 68% b) E = 17% 51,0% ≤ p ≤ 85% Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 30 − 14) Pegue uma moeda e jogue-a para cima 100 vezes e anote o número de vezes que saiu cara. Calcule pˆ = proporção de lançamentos que saiu cara, depois construa e interprete um intervalo de 95% de confiança para o valor de p = proporção de sair cara ao lançar a moeda. Você acredita que a sua moeda seja “viciada”, ou seja, você acredita que p ≠ 50%%? 15) Uma pesquisa encomendada pela Confederação Nacional do Transporte tratou (em Agosto/2001) da posição dos presidenciáveis na corrida de 2002. O instituto responsável pela pesquisa foi a KYZ que pesquisou 2000 eleitores com uma margem de erro igual a 3 pontos percentuais para mais ou para menos (com 95% de confiança). Os resultados estão mostrados no gráfico abaixo. Com os resultados desta pesquisa, um repórter da revista OLHO informou a seguinte classificação: Ranking Presidenciáveis 1º Lula 2º Itamar 3º Garotinho 4º Ciro Gomes 5º José Serra a) Para cada candidato, construa o IC de 95% para a “verdadeira” porcentagem de eleitores a seu favor. b) Desenhe estes intervalos no gráfico acima (semelhante ao exercício seguinte). c) Qual é o erro grosseiro na classificação informada por alguns repórteres. d) Se necessário, refaça a classificação dos presidenciáveis.16) Supõe que o médico do exercício 11, após algumas medidas visando melhorar ainda mais o nível de atendimento, desejasse repetir a pesquisa novamente. Quantos pacientes ele deveria amostrar para estimar a proporção p de clientes satisfeitos com o atendimento com um erro máximo de estimação igual a 6% e 95% de confiança nos resultados. Você irá precisar de uma estimativa da proporção p para calcular o tamanho da amostra, nesse caso use a proporção amostral pˆ obtida na pesquisa que esse médico fez no exercício 11. Resp: n = 171 pacientes 17) Suponha que as companhias de seguro desejam realizar uma pesquisa com os motoristas com a intenção de estimar o valor de p = “porcentagem de motoristas que falam ao celular enquanto estão dirigindo” com uma margem de erro de 3%. Suponha que o desejo é ter um nível de confiança de 95% nos resultados, qual o tamanho da amostra necessário nas duas situações abaixo: a) Suponha que, de pesquisas anteriores, podemos estimar p em 18%. b) Suponha que não temos nenhuma informação a respeito de p. Resp: a) 631 motoristas b) 1068 motoristas 7.1% 11.8% 13.4% 13.8% 34.2% 0.0% 4.0% 8.0% 12.0% 16.0% 20.0% 24.0% 28.0% 32.0% 36.0% 40.0% José Serra Ciro Gomes Garotinho Itamar Lula Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 31 − 18) Um Instituto de pesquisa de mercado realiza levantamentos telefônicos e deseja estimar a p = “taxa de respostas, ou seja, o percentual de pessoas que aceitam participar da pesquisa por telefone”. Quantas pessoas o Instituto deveria amostrar para estimar p com uma margem de erro de 5% e uma confiança de 95% nos resultados. (assuma que você não nenhuma informação a respeito de p). Resp: n = 385 19) LEIA a seguinte notícia: Pesquisa Ibope confirma Serra em 2º lugar "A pesquisa Ibope divulgada hoje mostrou que ... O pré-candidato do PT, Luiz Inácio Lula da Silva, continua na liderança com 35%, seguido por José Serra (PSDB-SP) com 18%, Anthony Garotinho (PSB) que tem 16% da preferência do eleitorado e Ciro Gomes (PPS), com 11%. ... O instituto ouviu 2 mil pessoas. A margem de erro é de 2.2 pontos percentuais para mais ou para menos." OBS: EMPATE TÉCNICO ocorre quando a diferença as porcentagens é menor que duas vezes a margem de erro ( E.2 ) do levantamento Onde está o erro nesta notícia? Houve algum empate técnico? [Estimação da média populacional µ com σ conhecido] 20) Considere: a) µ = Consumo médio de água em residências de certo bairro. Suponha que σ = 2,2 m3 De uma amostra de n = 60 residências, temos que a média de consumo foi x = 15,5 m3 b) µ = Salário médio (em salários-mínimos) dos empregados de uma empresa N = 200 funcionários. Suponha que σ = 1,2 SM. De uma amostra de 200 funcionários, temos uma média amostral dos salários foi 6,7 SM Para cada uma das questões acima, responda: • Qual a estimativa pontual da média populacional (µ)? • Qual é a margem de erro (erro máximo de estimação) com 95% de confiança? • Calcule e interprete o intervalo de 95% de confiança para a média populacional (µ)? Resp: a) µ ≈ 15,5 E = 0,5567 14,943 ≤ µ ≤ 16.057 b) µ = 6.7 SM E = 0 21) A empresa GOL, um dos fabricantes de bolas, selecionou uma amostra de 70 bolas e pesou cada uma delas obtendo um peso médio amostral de 449 gramas. De informações passadas, sabe-se que o desvio-padrão dos pesos das bolas é aproximadamente σ = 5 gramas. Construa e interprete um intervalo de 95% de confiança para o “verdadeiro” peso médio das bolas fabricadas pela GOL. Você acredita que a empresa esteja fabricando bolas com peso médio de 450 gramas? Resp: 447,83 ≤ µ ≤ 450,17 gramas 22) Se Li e Ls são, respectivamente, os limites inferior e superior do Intervalo de Confiança (IC). Mostre que: a) x 2 Ls Li = + (média amostral) e erro) de (margem E 2 Li Ls = − ][);( ExE; xNCIC +−=µ -- IC para média populacional (µ) Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 32 − 23) Um médico coletou uma amostra de 50 pacientes e anotou o tempo em minutos que gastou para atender cada um deles, obtendo a média amostral x . Com essa média amostral e assumindo que o desvio-padrão do tempo de atendimento dos clientes seja σ, o médico construiu um intervalo de confiança de 95% para o “verdadeiro” tempo médio de atendimento µ. Responda as questões abaixo. Intervalo construído → 27,0 ≤ µ ≤ 32,0 minutos. a) Interprete o intervalo de confiança construído. b) Calcule média do tempo de atendimento da amostra coletada ( x ) (Dica: use o ponto médio do IC) c) Calcule o erro máximo de estimação associado ao intervalo.. d) Calcule o valor do σ = desvio-padrão do tempo de atendimento. Resp: d) σ = 9,02 min) 24) Uma amostra de 100 baterias de certa marca foi testada quanto à sua vida útil. O teste simula a utilização da bateria, acelerando seu desgaste de modo a criar uma réplica da situação real. Os resultados da durabilidade (em meses) são apresentados a seguir: Durabilidade (em meses) Quantidade de baterias (fi) 0 |-- 3 2 3 |-- 6 5 6 |-- 9 15 9 |-- 12 25 12 |-- 15 30 15 |-- 18 23 Total 100 25) Durante algum tempo, foram anotados os tempos de espera para ser atendido em um conhecido restaurante fast food. É razoável assumir que o desvio-padrão do tempo de atendimento é σ = 50 segundos. Abaixo está um histograma mostrando a distribuição desses tempos. a) Calcule a média e o desvio-padrão da durabilidade das baterias amostradas. b) Considerando que µ é a “verdadeira” durabilidade média das baterias, qual a estimativa pontual para µ e qual a margem de erro nessa estimativa com 96% de confiança? c) Construa e interprete um intervalo de 96% de confiança para a “verdadeira” durabilidade média (µ) das baterias. d) Como o desvio-padrão σσσσ não era conhecido, você teve que utilizar em ‘b’ a distribuição t-Student. Um outro aluno usou a distribuição normal para resolver a letra ‘b’, ele estaria errado ou não? Justifique sua resposta. Resp: média = 11,85 meses s = 3,75 meses a) Podemos assumir que os tempos de espera têm uma distribuição aproximadamente normal? b) Em um dia típico, 90 clientes foram escolhidos aleatoriamente e registrado o tempos de espera para ser atendido. O tempo médio dessa amostra foi de x = 65 segundos. Construa um intervalo de 99% de confiança para o “verdadeiro” tempo médio µ de espera. c) Com o que você aprendeu até o momento, construa um intervalo de 99% de confiança para µ = “verdadeiro” tempo médio de espera, se os tempos foram registrados para uma amostra de apenas 10 clientes. O tempo médio dessa amostra também foi de x = 65 segundos. Resp: 51,43 ≤ µ ≤ 78,56 seg b) Não há como, pois ... Tempo de espera (x) 240180120600 Histograma dos tempos Pe rc en tu al (% ) Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 33 − 26) Um economista deseja estimar a média do primeiro salário dos recém formados de uma faculdade (µ). Quantos ex-alunos recém ingressados no mercado de trabalho deveriam ser amostrados para que tenhamos um erro máximo de estimação de R$50,00 com 95% de confiança nos resultados. Para o cálculo do tamanho da amostra, necessitamos de um valor aproximado do desvio-padrão σ, suponha que de um estudo anterior sabemos que σ = R$150,00. Resp: n = 35 recém-formados 27) A Nielsen Media Research deseja estimar o tempo médio (em horas) que os estudantesuniversitários de tempo integral passam vendo televisão em cada dia da semana. Determine o tamanho da amostra necessário para estimar essa média com uma margem de erro de 0,25h. Suponha também que se exija um grau de 90% de confiança. Um estudo piloto indicou que o desvio-padrão pode ser estimado em σ = 112 minutos. Resp: n = 151 estudantes universitários 28) Deseja-se estimar o preço médio de venda de um livro-texto para uma faculdade. Quantos exemplares devem ser selecionados de forma que o erro máximo de estimação seja R$5,00 com um certeza de 95% nos resultados. Suponha que saibamos que os preços dos livros variam de R$25,00 a R$225,00. Obs: Tendo apenas o valor máximo e mínimo, podemos obter uma estimativa de σ é usando o desvio- padrão amostral dado por: 4 mínimomáximo s − ≈ Resp: n = 385 livros Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 34 − [Estimação da média populacional µµµµ com σσσσ desconhecido] 29) A empresa GOL, um dos fabricantes de bolas, selecionou uma amostra de 9 bolas e pesou cada uma delas obtendo os pesos (em gramas) abaixo: 450; 456; 444; 445; 454; 453; 455; 458; 454 Sabendo que os pesos seguem uma distribuição normal, construa e interprete um intervalo de 95% de confiança para µµµµ = “verdadeiro” peso médio das bolas fabricadas pela GOL, nas duas situações abaixo: a) Assuma que a empresa sabe que os pesos têm um desvio-padrão σσσσ = 5 gramas (valor obtido de experiências passadas). b) Assuma que a empresa não tem nenhuma informação a respeito de σ. Neste caso, vocês terão que usar o desvio-padrão s da amostra. Resp: 448,84 ≤ µ ≤ 455,38 gramas (usando zα/2 = 1,96) b) 448,40 ≤ µ ≤ 455,82 gramas (usando tα/2 = 2,306) 30) O histograma abaixo mostra a distribuição do tempo semanal que os alunos de uma faculdade utilizam o laboratório de computação. Foram coletados os tempos de uso para uma amostra de 15 alunos obtendo um tempo médio amostral de 5,5 horas e um desvio-padrão amostral de 60 minutos. 31) Um pesquisador deseja estimar µ = tempo médio de permanência dos engenheiros recém-formados no primeiro emprego. Para uma amostra de 15 engenheiros, o tempo médio amostral foi x = 2,7 anos e o desvio-padrão amostral foi s = 1,4 ano. Construa e interprete o intervalo de 99% de confiança para a média µ. Com o intervalo de confiança construído, podemos acreditar que o tempo médio seja µ = 2 anos? 32) O funcionário José da empresa FOX selecionou uma amostra de 51 encomendas e anotou o tempo (em minutos) que foi gasto para embalar cada uma delas e despachá-la. Os dados estão na tabela abaixo. Tempo de preparo de encomendas Tempo de preparo Quantidade de encomendas (fi) 5 |-- 10 14 10 |-- 15 20 15 |-- 20 12 20 |-- 25 5 Total n = 51 Pe rc en tu al de al u n o s (% ) Tempo de uso do laboratório 98765432 a) Podemos assumir que os tempos de uso do laboratório têm uma distribuição aproximadamente normal? b) Construa e interprete um intervalo de 90% de confiança para µµµµ = “verdadeiro” tempo médio de uso dos alunos da faculdade. Resp: 5,05 ≤ µ ≤ 5,95 horas (usando tα/2 = 1,761) a) Calcule a média e o desvio-padrão do tempo de preparo das encomendas amostradas. b) Considerando que µµµµ é o “verdadeiro” tempo médio de preparo das encomendas, qual a estimativa pontual para µµµµ e qual a margem de erro nessa estimativa com 95% de confiança? c) Construa e interprete um intervalo de 95% de confiança para µµµµ. Resp: a) média = 13,28 min e s = 4,73 min c) 11,95 ≤ µ ≤ 14,61 minutos tα/2 = 2,009 Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 35 − 33) Se IC(µ, 95%) = (430 ; 470) minutos é um intervalo de 95% de confiança para o tempo médio de vidas das pilhas Kodak AA. Suponha que este resultado se baseie em uma amostra de tamanho 101 pilhas Kodak AA. a) Qual é o valor da média e o desvio-padrão do tempo de vida da amostra de pilhas? b) Construa um novo intervalo, só que agora com 99% de confiança. Resp: 423,53 ≤ µ ≤ 476,47 min 34) (Triola, 9a edição pag 266) Abaixo temos a largura máxima de amostras de crânios de homens egípcios de 4000 a.C e 150 d.C (com base em dados de Ancient Races of the Thebaid de Thomson e Randall- Maciver). 4000 a.C 131 119 138 125 129 126 131 132 126 128 128 131 1n = 1x = 1s = 150 a.C 136 130 126 126 139 141 137 138 133 131 134 129 2n = 2x = 2s = a) Mudanças nos tamanhos das cabeças ao longo do tempo sugerem o cruzamento com pessoas de outras regiões. Construa um intervalos de confiança para a largura média dos crânios dos homens egípcios de 4000 a.C e um outro intervalo para largura média dos crânios dos homens egípcios de 150 d.C. Use esses intervalos para avaliar a princípio se houve mudanças nos tamanhos das cabeças de 4000 a.C para 150 a.C. b) Para uma conclusão mais definitiva, devemos nos basear em intervalos de confiança para duas populações. Analise os gráficos Boxplot abaixo e use a fórmula a seguir para construir um intervalo de confiança para a diferença entre as médias µ1 - µ2. Onde µµµµ1 = “largura média homens egípcios de 4000 a.C” µµµµ2 = “largura média homens egípcios de 150 a.C” Regra: Caso o valor 0 (zero) esteja contido no intervalo construído, então é razoável admitir que NÃO há diferenças significativas entre as médias µ1 e µ2 (ou seja, podemos assumir que µ1 = µ2). Caso contrário podemos assumir que µ1 ≠ µ2. Com base no intervalo que você construiu, houve mudanças nos tamanhos das cabeças dos homens egípcios de 4000 a.C e 150 d.c? ExxExx +−≤−≤−− )()( 212121 µµ onde 2 2 2 1 2 1 2 n s n s tE += α L a rg u ra d o s c râ n io s 150 a.C4000 a.C 140 135 130 125 120 Boxplot da largura dos crânios homens egípicios de 4000 a.C e 150 a.C Graus de liberdade (g.l.) da t-Student: g.l = mínimo(n1-1; n2-1) Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 36 − 35) Em cada situação abaixo, calcule os intervalos de confiança e os desenhe na figura conforme os exemplos. Descreva quais os efeitos causados pela variação do NC, n, s e N em cada situação Situação 1 Efeito do Nível de confiança (NC) Situação 2 Efeito do tamanho da amostra (n) Situação 3 Efeito do desvio- padrão (s) Situação 4 Efeito do tamanho da população (N) N = 3000 faturas n = 65 faturas s = 3,8 dias média = 17.8 dias N = 3000 faturas NC = 95% s = 3,8 dias média = 17.8 dias N = 3000 faturas n = 65 faturas NC = 95% média = 17.8 dias NC = 95% n = 65 faturas s = 3,8 dias média = 17.8 dias NC Intervalo de confiança n Intervalo de confiança s Intervalo de confiança N Intervalo de confiança 68% (17,3; 18,3) 30 (16,4; 19,2) 2,0 (17,3; 18,3) 500 (16,9; 18,7) 90% 60 4,0 2000 95% 90 6,0 8000 99% 120 8,0 15000 In te rv a lo de Co n fia n ça 21.0 20.5 20.0 19.5 19.0 18.5 18.0 17.5 17.0 16.5 16.0 15.5 15.0 situação 1 situação 2 situação 3 situação 4 Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 37 − 36) O Sr. João é dono de uma loja de artigos para animais e gostaria de estudaras características dos clientes de sua loja. Em particular, ele decidiu coletar algumas informações de uma amostra de 36 clientes que entraram em sua loja durante uma semana. As informações coletadas foram: 1. Sexo: ___Masculino ___Feminino 2. Quantia gasta com artigos para o animal? _______ dólares 3. Animais ? Na família tem: 1. Somente um cachorro 2. Somente um gato 3. Mais de um cachorro e/ou gato 4. Não quis responder Os dados obtidos estão logo abaixo. O Sr. João é seu grande amigo e, quando soube que você havia feito a disciplina de Estatística e tinha sido aprovado(a) com louvor, pediu a sua ajuda para resolver alguns “problemas” estatísticos. (OBS: Sugiro vocês digitarem os dados abaixo no Minitab e usá-lo para responder as questões a seguir) FONTE: Dados hipotéticos a) Calcule para o Sr. João a média ( x ) e o desvio-padrão (s) dos gastos com artigos para animais. b) Construa para o Sr. João a tabela de frequência para a variável “Animais”. Tabela – Na família tem: Animais Quantidade de clientes % Somente um cachorro Somente um gato Mais de um cachorro e/ou gato Não quis responder c) O Sr. João deseja estimar o gasto médio de seus clientes com artigos para animais. Construa e interprete um intervalo de 95% de confiança para µµµµ = gasto médio dos clientes da loja com artigos para animais. Na construção do intervalo, houve necessidades de assumir a distribuição normal para os gastos? Justifique sua resposta. d) O Sr. João deseja estimar a proporção de clientes que tem somente um cachorro. Construa e interprete um intervalo de 95% de confiança para p = proporção de clientes com somente um cachorro em casa. OBS: Não se esqueça de verificar se as condições são satisfeitas, antes de sair construindo o intervalo de confiança. e) O Sr. João deseja refazer novamente a pesquisa e ele precisa saber qual o tamanho da amostra necessário para estimar a média µµµµ com uma margem de erro de E = US$ 2,00. Determine o tamanho da amostra para o Sr. João. OB OBS: Assuma que o desvio-padrão seja o mesmo que você achou na letra ‘a’. f) O Sr. João deseja refazer novamente a pesquisa e ele precisa saber qual o tamanho da amostra necessário para estimar a proporção p com uma margem de erro de E = 8%. Determine o tamanho da amostra para o Sr. João. OBS: Use a tabela que você construiu em ‘b’ para obter uma estimativa da proporção p. g) Com base em suas respostas em ‘e’ e ‘f’, que tamanho da amostra deveria ser adotado? Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 38 − Distribuição tt ddee SSttuuddeenntt Grau de liberdade Área á direita do valor crítico tc n - 1 0,250 0,100 0,050 0,030 0,025 0,020 0,010 0,005 0,003 0,001 1 1,000 3,078 6,314 10,579 12,706 15,895 31,821 63,657 127,321 636,619 2 0,816 1,886 2,920 3,896 4,303 4,849 6,965 9,925 14,089 31,599 3 0,765 1,638 2,353 2,951 3,182 3,482 4,541 5,841 7,453 12,924 4 0,741 1,533 2,132 2,601 2,776 2,999 3,747 4,604 5,598 8,610 5 0,727 1,476 2,015 2,422 2,571 2,757 3,365 4,032 4,773 6,869 6 0,718 1,440 1,943 2,313 2,447 2,612 3,143 3,707 4,317 5,959 7 0,711 1,415 1,895 2,241 2,365 2,517 2,998 3,499 4,029 5,408 8 0,706 1,397 1,860 2,189 2,306 2,449 2,896 3,355 3,833 5,041 9 0,703 1,383 1,833 2,150 2,262 2,398 2,821 3,250 3,690 4,781 10 0,700 1,372 1,812 2,120 2,228 2,359 2,764 3,169 3,581 4,587 11 0,697 1,363 1,796 2,096 2,201 2,328 2,718 3,106 3,497 4,437 12 0,695 1,356 1,782 2,076 2,179 2,303 2,681 3,055 3,428 4,318 13 0,694 1,350 1,771 2,060 2,160 2,282 2,650 3,012 3,372 4,221 14 0,692 1,345 1,761 2,046 2,145 2,264 2,624 2,977 3,326 4,140 15 0,691 1,341 1,753 2,034 2,131 2,249 2,602 2,947 3,286 4,073 16 0,690 1,337 1,746 2,024 2,120 2,235 2,583 2,921 3,252 4,015 17 0,689 1,333 1,740 2,015 2,110 2,224 2,567 2,898 3,222 3,965 18 0,688 1,330 1,734 2,007 2,101 2,214 2,552 2,878 3,197 3,922 19 0,688 1,328 1,729 2,000 2,093 2,205 2,539 2,861 3,174 3,883 20 0,687 1,325 1,725 1,994 2,086 2,197 2,528 2,845 3,153 3,850 21 0,686 1,323 1,721 1,988 2,080 2,189 2,518 2,831 3,135 3,819 22 0,686 1,321 1,717 1,983 2,074 2,183 2,508 2,819 3,119 3,792 23 0,685 1,319 1,714 1,978 2,069 2,177 2,500 2,807 3,104 3,768 24 0,685 1,318 1,711 1,974 2,064 2,172 2,492 2,797 3,091 3,745 25 0,684 1,316 1,708 1,970 2,060 2,167 2,485 2,787 3,078 3,725 26 0,684 1,315 1,706 1,967 2,056 2,162 2,479 2,779 3,067 3,707 27 0,684 1,314 1,703 1,963 2,052 2,158 2,473 2,771 3,057 3,690 28 0,683 1,313 1,701 1,960 2,048 2,154 2,467 2,763 3,047 3,674 29 0,683 1,311 1,699 1,957 2,045 2,150 2,462 2,756 3,038 3,659 30 0,683 1,310 1,697 1,955 2,042 2,147 2,457 2,750 3,030 3,646 31 0,682 1,309 1,696 1,952 2,040 2,144 2,453 2,744 3,022 3,633 32 0,682 1,309 1,694 1,950 2,037 2,141 2,449 2,738 3,015 3,622 33 0,682 1,308 1,692 1,948 2,035 2,138 2,445 2,733 3,008 3,611 34 0,682 1,307 1,691 1,946 2,032 2,136 2,441 2,728 3,002 3,601 35 0,682 1,306 1,690 1,944 2,030 2,133 2,438 2,724 2,996 3,591 36 0,681 1,306 1,688 1,942 2,028 2,131 2,434 2,719 2,990 3,582 37 0,681 1,305 1,687 1,940 2,026 2,129 2,431 2,715 2,985 3,574 38 0,681 1,304 1,686 1,939 2,024 2,127 2,429 2,712 2,980 3,566 39 0,681 1,304 1,685 1,937 2,023 2,125 2,426 2,708 2,976 3,558 40 0,681 1,303 1,684 1,936 2,021 2,123 2,423 2,704 2,971 3,551 50 0,679 1,299 1,676 1,924 2,009 2,109 2,403 2,678 2,937 3,496 100 0,677 1,290 1,660 1,902 1,984 2,081 2,364 2,626 2,871 3,390 500 0,675 1,283 1,648 1,885 1,965 2,059 2,334 2,586 2,820 3,310 > 500 0,675 1,282 1,645 1,881 1,960 2,054 2,327 2,576 2,807 3,291 g.l 0,025 10 2,228 Exemplo: Se n = 11 (g.l. = 10) e tc = 2,228 então P(T ≥ 2,228) = 0,025 0 tc P(T ≥≥≥≥ tc) Aula 3 – Estimação de Parâmetros PUC Minas prof. José Aguinaldo − 39 − Distribuição QQuuii--qquuaaddrraaddoo Graus de liberdade Área à direita do valor crítico χχχχc n-1 0,995 0,990 0,975 0,950 0,900 0,500 0,100 0,050 0,025 0,010 0,005 1 0,000 0,000 0,001 0,004 0,016 0,455 2,706 3,841 5,024 6,635 7,879 2 0,010 0,020 0,051 0,103 0,211 1,386 4,605 5,991 7,378 9,210 10,597 3 0,072 0,115 0,216 0,352 0,584 2,366 6,251 7,815 9,348 11,345 12,838 4 0,207 0,297 0,484 0,711 1,064 3,357 7,779 9,488 11,143 13,277 14,860 5 0,412 0,554 0,831 1,145 1,610 4,351 9,236 11,070 12,832 15,086 16,750 6 0,676 0,872 1,237 1,635 2,204 5,348 10,645 12,592 14,449 16,812 18,548 7 0,989 1,239 1,690 2,167 2,833 6,346 12,017 14,067 16,013 18,475 20,278 8 1,344 1,647 2,180 2,733 3,490 7,344 13,362 15,507 17,535 20,090 21,955 9 1,735 2,088 2,700 3,325 4,168 8,343 14,684 16,919 19,023 21,666 23,589 10 2,156 2,558 3,247 3,940 4,865 9,342 15,987 18,307 20,483 23,209 25,188 11 2,603 3,053 3,816 4,575 5,578 10,341 17,275 19,675 21,920 24,725 26,757 12 3,074 3,571 4,404 5,226 6,304 11,340 18,549 21,026 23,337 26,217 28,300 13 3,565 4,107 5,009 5,892 7,041 12,340 19,812 22,362 24,736 27,688 29,819 14 4,075 4,660 5,629 6,571 7,790 13,339 21,064 23,685 26,119 29,141 31,319 15 4,601 5,229 6,262 7,261 8,547 14,339 22,307 24,996 27,488 30,578 32,801 16 5,142 5,812 6,908 7,962 9,312 15,338 23,542 26,296 28,845 32,000 34,267 17 5,697 6,408 7,564 8,672 10,085 16,338 24,769 27,587 30,191 33,409 35,718 18 6,265 7,015 8,231 9,390 10,865 17,338 25,989 28,869 31,526 34,805 37,156 19 6,844 7,633 8,907 10,117 11,651 18,338 27,204 30,144 32,852 36,191 38,582 20 7,434 8,260 9,591 10,851 12,443 19,337 28,412 31,410 34,170 37,566 39,997 21 8,034 8,897 10,283 11,591 13,240 20,337 29,615 32,671 35,479 38,932 41,401 22 8,643 9,542 10,982 12,338 14,041 21,337 30,813 33,924 36,781
Compartilhar