Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística – Prof. Ricardo Luís Rocha Estimação e Inferência Unidade 7 Estatística – Prof. Ricardo Luís Rocha Ementa 7.1 – Estimativa pontual para a média; 7.2 – Intervalo de Confiança para a média; 7.3 – Estimativa pontual para a proporção; 7.4 – Intervalo de Confiança para a proporção; 7.5 – Tamanho da amostra. Unidade 7 Estatística – Prof. Ricardo Luís Rocha Unidade 7 – Estimação e Inferência 7.1 – Estimativa Pontual para a Média O que é estimador e estimativa? • Um estimador é uma estatística amostral utilizada para obter uma aproximação de um parâmetro populacional. Mesmo que não se encontre exatamente o valor verdadeiro, este será aproximado. • Uma estimativa é um valor específico, ou um intervalo de valores, usado para aproximar um parâmetro populacional. Estatística – Prof. Ricardo Luís Rocha Unidade 7 – Estimação e Inferência Estimadores Estimativa pontual Estimativa intervalar É um valor único (número) usado para aproximar um parâmetro populacional Intervalo que tem uma probabilidade de conter o verdadeiro valor da população. Estatística – Prof. Ricardo Luís Rocha Utilizamos a média amostral x como a melhor estimativa da média populacional μ. Como a média amostral x é um valor único que corresponde a um ponto na escala numérica, ela é chamada de estimativa pontual. Há duas razões importantes que explicam por que uma média amostral é um melhor estimador de uma média populacional μ do que quaisquer outros estimadores, como a mediana ou a moda. Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha 1) Para muitas populações, a distribuição de médias amostrais x tende a ser mais consistente (apresentar menor variação) do que as distribuições de outras estatísticas amostrais. 2) Para todas as populações, dizemos que a média amostral x é um estimador não tendencioso para a média populacional μ. Portanto, a média amostral x é a melhor estimativa pontual para a média populacional μ. Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha Exemplo: A temperatura do corpo humano é realmente 37,2º C? Com os dados de 106 adultos saudáveis, vamos verificar a média amostral x. 37,0 37,0 36,7 36,7 37,2 36,9 36,9 36,9 36,9 37,0 37,0 37,1 37,0 36,1 36,1 37,1 36,4 36,5 37,1 36,7 36,7 36,8 36,9 36,3 37,1 36,3 37,2 37,0 37,5 36,4 36,3 36,4 36,8 37,6 37,1 37,4 36,8 36,7 37,0 37,0 36,2 36,9 37,0 36,8 36,7 36,6 36,7 36,9 37,0 37,0 36,6 37,2 35,8 36,4 36,7 36,1 36,4 36,2 36,6 36,9 36,3 36,7 36,4 36,4 36,8 36,9 37,1 37,1 36,6 36,7 36,2 36,3 37,4 36,9 37,0 36,9 36,9 37,0 36,8 37,1 37,1 37,3 37,0 36,6 37,1 36,7 37,1 36,9 37,2 36,9 37,0 36,2 36,6 37,1 37,1 36,4 36,8 37,3 36,6 36,7 36,9 36,6 36,9 36,3 36,7 36,1 Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha Pelos dados fornecidos, chegamos às seguintes informações: n = 106 elementos; x = 36,8º C; s = 0,3461º C. Com os dados fornecidos, a melhor estimativa para a média populacional μ seria 36,8º C. Mas e se só tivéssemos os 10 primeiros elementos? Neste caso, a média seria de 36,9º C. Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha 7.2 – Intervalo de confiança para a média • No primeiro exemplo, a média de 36,8º C era a nossa melhor estimativa pontual para a média populacional, mas não tínhamos qualquer indicação sobre a qualidade dessa estimativa. • No segundo exemplo, a melhor estimativa para a média populacional seria 36,9º C, mas ela não seria tão boa quanto a primeira, pois se baseia em somente 10 temperaturas. •Assim, foi desenvolvida uma estimativa que indica a qualidade de uma estimativa pontual. Essa estimativa é chamada de intervalo de confiança ou estimativa intervalar. Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha O intervalo de confiança é uma faixa de possíveis valores em torno da média amostral, e a probabilidade de que esta faixa realmente contenha o valor real da média da população O Intervalo de confiança terá uma certa probabilidade chamada de nível de confiança (simbolizada por 1 – ) de conter a média da população. x 1 – α /2 /2 Intervalo de confiança 1 – α = nível de confiança α = nível de significância (probabilidade de erro) Há uma probabilidade de 1 – da média estar contida no intervalo definido Há uma probabilidade de a média amostral estar fora do intervalo definido (área hachurada) Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha z2z1 intervalo errox errox 1)( exexP α /2 α /2 = desvio padrão da população 1 - α = grau de confiança Distribuição das médias amostrais x 1 – α n zeErro . Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha Se o desvio padrão da população é conhecido: A estimativa intervalar da média populacional se baseia na hipótese de que a distribuição amostral das médias amostrais é normal. Para grandes amostras isto não apresenta dificuldade especial, pois se aplica o teorema do limite central. Todavia, para amostras de 30 ou menos observações, é importante saber se a população tem distribuição normal ou aproximada. X zX .: n X Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha Se o desvio padrão da população é desconhecido: Quando o desvio padrão da população não é conhecido (o que geralmente é o caso), usa-se o desvio padrão da amostra como estimativa, substituindo-se por s nas equações. Isto não acarreta maiores dificuldades, pois o desvio padrão amostral dá uma aproximação bastante razoável do verdadeiro valor. Além disso, pelo teorema do limite central, sabemos que, quando a amostra é maior que 30, a distribuição das médias amostrais é aproximadamente normal. Para amostras menores que 30, a aproximação normal não é adequada. Devemos então usar a distribuição t. A forma da distribuição t é bem parecida com a normal. n s s x XszX .: Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha exouexex Quando tem n > 30 e é conhecido Quando tem n > 30 e σ é desconhecido n x xzx .: n ze . n s ze . n s sx xszx .: Resumo: Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha X50403020 807060Amostra 1 2 3 ... 45 46 47 ... 98 99 100 =50 Se em um estudo, forem retiradas várias amostras aleatórias de tamanho n da população e que, para cada amostra, seja construído um intervalo de (1-) de confiança para a variável desejada. Os intervalos obtidos serão diferentes, mas (1-)% destes intervalos conterão entre os seus intervalos o valor real do parâmetro. •Ao nível de 95% de confiança espera-se que em 100 intervalos para as amostras, 95 deles contenham a média μ. Interpretação: Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha E quando o tamanho da amostra é menor que 30 (n < 30) e o desvio padrão da população () é desconhecido? Neste caso não podemos usar a distribuição normal (a distribuição das médias não é garantidamente normal). Devemos usar a distribuição t de student. A distribuição t é similar à distribuição normal, mas tem maior variação nas caudas (nas pontas da curva). Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha E quando o tamanho da amostra é significativamente grande comparado ao tamanho da população? Quando o tamanho da amostra n é maior que 5%do tamanho da população N, devemos utilizar o fator de correção finita para o desvio padrão. 0,05.Nn para , 1 . N nN n X Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha Distribuição t de student com n = 3 Distribuição t de student com n = 12 Distribuição normal padronizada A curva t nos dá a probabilidade de ocorrer um evento a t desvios padrão da média (para mais ou para menos) Os valores de t (valores correspondentes à área sob a curva nas caudas) são tabelados e dependem de dois fatores: n-1 = graus de liberdade grau de confiança desejado (1- α) Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha exouexex n s te n .1,2/ n s te crítico. n s te . Quando tem n < 30 e σ é desconhecido Substituir o desvio padrão da população pelo desvio padrão da amostra s. Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha Início n > 30? população tem distr. normal? é conhecido? Usar distribuição t usar métodos não-paramétricos ou de reamostragem sim sim sim não não não Usar a distribuição normal (use s se não for conhecido) n ze 2/ usar a distribuição normal n ze 2/ n s te n 2/,1 RESUMO: Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha 1) Determine o valor crítico z/2 que corresponde ao grau de confiança indicado: a) 99% b) 94% c) 92% d) 90% Exercícios: Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha Resolução: Unidade 7 – Estimação e Inferência Grau de Confiança (1-α) α α/2 Procurar na tabela z Zα/2 99% 0,01 0,0050 0,4950 2,58 94% 0,06 0,0300 0,4700 1,88 92% 0,08 0,0400 0,4600 1,75 90% 0,10 0,0500 0,4500 1,65 Estatística – Prof. Ricardo Luís Rocha 2) Um dos principais produtos de uma indústria siderúrgica é a folha de flandres. Havia uma preocupação com a possibilidade de haver um número de folhas fora da faixa de especificação de dureza (LIE = 58,0 HR e LSE = 64,0 HR). A partir desta informação a empresa decidiu estimar a dureza média das folhas de flandres () coletando uma amostra aleatória de 49 folhas.61,0 60,2 60,3 60,3 60,0 61,0 60,3 60,0 60,0 60,9 61,0 61,2 59,2 60,9 60,0 60,5 59,8 59,3 61,0 59,6 59,8 59,6 60,1 58,0 59,8 58,9 57,6 58,0 60,5 60,1 61,6 61,1 59,7 58,3 61,6 59,5 59,0 60,3 58,7 59,6 54,2 60,3 61,0 59,7 59,9 59,9 60,0 58,6 59,9 Medidas de dureza (HR) das folhas-de-flandres fabricadas pela siderúrgica 61,0 21,60 s X Para um grau de confiança de 95%, determine a margem de erro (e) e o intervalo de confiança para média populacional (). Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha 49 61,0 21,60 n s X n s ze 2 Margem de erro: 17,01708,0 49 61,0 .96,1 e Dados: Grau de confiança de 95% implica em: 1 – = 95%, logo α = 5% = 0,05 e α/2 = 0,025. Z α/2 = Z0,025 = 1,96 -Z/2 Z/2 1 - α 0 /2 /2 Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha exex Intervalo de confiança: 17,021,6017,021,60 [60,04 ; 60,38]HR Interpretação: Se fôssemos selecionar muitas amostras de 49 elementos da produção de folhas e construíssemos um intervalo de 95% de confiança para cada amostra, 95% desses intervalos conteriam a média populacional . 38,6004,60 Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha 3) Uma máquina automática de suco industrial é regulada de modo que a quantidade suprida de cada vez, tenha distribuição aproximadamente normal com desvio-padrão de 35ml. Determine um intervalo de 96% de confiança para a quantidade média de toda produção, sabendo que uma amostra de 30 embalagens teve um conteúdo médio de 290 ml. mls mlX 35 290 n = 30 n s ze . 2 10,13 30 35 .05,2 e Grau de confiança de 96% implica em: 1 - = 96% = 4% = 0,04 05,202,0 2 ZZ exex 10,1329010,13290 [276,90 ; 303,10] ml Dados: -Z/2 Z/2 96% 0 2% 2% 10,30390,276 Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha 4) A Polícia Rodoviária faz mensalmente uma pesquisa para avaliar a velocidade desenvolvida nas rodovias durante o período de 2 às 4 horas da madrugada. Num período de observação e em um trecho específico, 100 carros passaram por um aparelho de radar a uma velocidade média de 115 Km/h, com desvio padrão de 10 Km/h. a) Estime a verdadeira média (estimativa pontual) da população; b) Construa um intervalo de 98% de confiança para a média da população; 115 Km/h 33,2 100 10 .33,2. 2 n s Ze Margem de erro: Grau de confiança de 98% implica em: 1 - = 98% = 2% = 0,02 33,201,0 2 ZZ exex Intervalo de confiança: 33,211533,2115 [112,67 ;117,33]Km/h Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha Uma amostra aleatória de 40 contas não-comerciais na filial de um banco acusou saldo médio de R$140,00 com desvio-padrão de R$30,00. a) Construa um intervalo de 95% confiança para a verdadeira média. b) Construa um intervalo de 99% confiança para a verdadeira média. c) A que conclusão podemos chegar com os resultados das letras anteriores? 30,9 40 30 .96,1. 2 n s ze Margem de erro: 96,1025,0 2 ZZ Intervalo de confiança 30,914030,9140 R$[130,70 ; 149,30] 24,12 40 30 .58,2. 2 n s ze Margem de erro: 58,2005,0 2 ZZ Intervalo de confiança 24,1214024,12140 R$ [127,76 ; 152,24] R$ 140,00+9,30 R$ 140,00+12,24 Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha 7.3 – Estimativa Pontual para a Proporção •A estimativa de proporções populacionais é muito semelhante à de médias populacionais; Estimadores Estimativa pontual de uma proporção Estimativa intervalar de uma proporção • 21% das peças são defeituosas; •45% dos eleitores votariam novamente no Presidente Lula • Entre 18 e 23% das peças são defeituosas; • A proporção de votos para eleição do Presidente está entre 15 e 25%. • A média de uma distribuição amostral de proporções amostrais é sempre igual a verdadeira proporção da população. Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha O que é proporção? Num lote de 1.000 peças foram encontradas 150 peças defeituosas, logo Proporção de peças defeituosas é = (150/1000)*100 = 15% Existem 15% de peças defeituosas no lote. O que podemos falar sobre esta proporção na população? Nos outros lotes a proporção é a mesma? Possivelmente serão diferentes. Precisamos estimar Intervalo de confiança pˆ Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha 7.4 – Intervalo de confiança para a proporção Sendo: p = proporção da população = proporção média das proporções amostrais (x/n) n qp ze ˆ.ˆ 2/ eppep epp ˆˆ ˆ Erro: Intervalo de confiança: 1- α = grau de confiança α = nível de significância (probabilidade de erro) Desvio padrão da distribuição das médias das proporções n qp p ˆ.ˆ pˆ pq ˆ1ˆ Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha Estimativa pontual Estimativa intervalar n X p ˆ O estimador da proporção amostral: Sendo X o número de elementos da amostra que apresentaa característica de estudo; O desvio padrão da estimativa: n qp p ˆ.ˆ pq ˆ1ˆ Sendo: epp ˆ • Intervalo de (1-)% de confiança; • Supondo amostras grandes (n > 30); • Se população for finita e n > 5% de N: 1 . ˆ.ˆ .ˆ 2 N nN n qp Zpp A proporção populacional é igual à proporção amostral! • Se população for finita e n > 5% de N: 1 . ˆ.ˆ N nN n qp p n qp ze ˆ.ˆ 2/ O erro-padrão da estimativa: pq ˆ1ˆ Sendo: Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha Exercícios: 1) Uma amostra de 200 observações acusou 20 baterias defeituosas numa remessa. Usando uma confiança de 99%, determine o erro de estimação máximo provável. 10,0 200 20 ˆ n X p 90,010,01ˆ1ˆ pq %47,50547,0 200 )90,0).(10,0( 58,2 ˆ.ˆ . 2 n qp Ze Grau de confiança de 99% implica em: 1 - = 99% = 1% = 0,010 58,2005,0 2 ZZ Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha 2) Um grupo de pesquisa de mercado constatou que 25% dos 200 fregueses recentemente entrevistados num grande shopping center de Belo Horizonte residem a mais de 5 Km deste local. a) Construa um intervalo de 95% de confiança para a percentagem efetiva de fregueses que moram a mais de 5 km do Shopping Center; b) Qual é o erro provável máximo associado ao intervalo? 25,0ˆ n X p 0600,0 200 )75,0).(25,0( .96,1 ˆ.ˆ 2 n qp Ze 310,0190,0 0600,0250,00600,0250,0 ˆˆ p p eppepIntervalo de confiança 75,025,01ˆ1ˆ pq Erro máximo 6%. Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha 7.5 – Tamanho da Amostra •O conceito de nível de confiança pode ser utilizado para o cálculo do tamanho da amostra, necessário para fazermos inferências confiáveis. Para tanto, basta reescrevermos a equação do erro em função de n: 2 2/ . e sz n n s ze .2/ Para uma média amostral: Para uma proporção amostral: n qp ze ˆ.ˆ 2/ 2 2 2/ ˆ.ˆ .)( e qp zn Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha • Se a amostra empregada for muito pequena, a margem de erro será grande, o que impossibilita ou inviabiliza a tomada de decisão. • Por outro lado, se a amostra for muito grande, o intervalo obtido pode ser mais estreito do que o necessário (gastos desnecessários); Como o tamanho da amostra afeta o erro de amostragem? Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha 500 1000 1500 2000 2500 3000 Tamanho da amostra M a rg em d e er ro ( e) 0,5 1,0 1,5 2,0 2,5 Tamanho de amostra e margens de erro mantendo fixos (s=10 e 95% de confiança) • Os ganhos em precisão conseguidos com aumentos fixos dos tamanhos das amostras não são constantes; • Tamanho de amostra 3.000 podem ser um perda de tempo e dinheiro porque elas fornecem pouca precisão adicional; Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha Exercícios: 1) Em um estudo para a determinação do perfil dos alunos da Faculdade Pitágoras, a característica de maior interesse tem s = 0,3. Qual deve ser o tamanho da amostra para que tenhamos 95% de confiança em que o erro da estimativa da correspondente a esta característica não supere 0,05? 2 2/ . e sz n 139 05,0 )3,0).(96,1(. 22 2/ e sz n Dados: e = 0,05 s = 0,3 =0,05 Refaça o cálculo supondo que se deseja ter 98% de confiança. Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha 2) Um fabricante de cintos de segurança deseja estimar a probabilidade dos cintos resistirem a um esforço. Como o teste é destrutível, ele deseja manter o tamanho da amostra o menor possível. Determine o número de observações que devem ser feitas para estimar a probabilidade a menos de 0,04 com 95% de confiança, se ele crê (baseando-se em experimentos anteriores) que a percentagem de defeituosos não supere a 6%. 1364,135 04,0 )94,0.(06,0 .96,1 ˆ.ˆ 2 2 2 2 e qp zn Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha 3) Qual o tamanho da amostra necessária para estimar o tempo médio que um vendedor de uma loja de móveis gasta com cada cliente, a menos de 2 minutos do verdadeiro valor, para obter um nível de confiança de 99% de confiança? Suponha o desvio da população igual a 12 minutos (obs.: sempre arredondamos a resposta para o próximo número inteiro superior.) 24063,239 2 )12).(58,2(. 22 2/ e z n e = 2 minutos = 12 minutos Grau de confiança de 99% implica em: 1 - = 99% = 1% = 0,01 58,20050,0 2 ZZ Unidade 7 – Estimação e Inferência Estatística – Prof. Ricardo Luís Rocha 4) A Biblioteca da faculdade deseja estimar a percentagem de livros de seu acervo que são publicados até 1995. Qual deve ser o tamanho da amostra aleatória para se ter 90% de confiança de ficar menos de 5% da verdadeira proporção? 27325,272 05,0 )5,01.(5,0 .65,1 ˆ.ˆ 2 2 2 2 2 e qp zn Grau de confiança de 90% implica em: 1 - = 90% = 10% = 0,10 65,105,0 2 ZZ Quando, o enunciado do problema não contém informação sobre o tamanho possível da proporção populacional, os cálculos devem basear-se no intervalo mais amplo possível, o que ocorre quando o valor amostral da proporção é igual à: 50,0ˆ p A proporção de uma amostra piloto seria uma 2ª opção Unidade 7 – Estimação e Inferência
Compartilhar