Baixe o app para aproveitar ainda mais
Prévia do material em texto
MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DE CAMPINA GRANDE UNIDADE ACADÊMICA DE AGRONOMIA E TECNOLOGIA DE ALIMENTOS DISCIPLINA: ESTATÍSTICA BÁSICA Teoria da decisão estatística Profª Railene Hérica Carlos Rocha Teoria da amostragem Distribuições amostrais Teoria da amostragem 1. INTRODUÇÃO . AMOSTRAGEM . CENSO Com reposição: > 5% tamanho da população 2. VANTAGENS a) Da amostragem - A população pode ser infinita, então o censo se tornaria impossível; - Uma amostra pode ser mais atualizada do que um censo (tempo – informação rápida); - Testes destrutivos - O custo de um censo pode ser proibitivo em populações grandes (amostragem tem custo menor); - A precisão pode sofrer no caso de um censo de uma grande população (amostragem envolve menor número de observações). b) Do Censo -A população pode ser tão pequena que o custo e o tempo de um censo sejam pouco maiores do que uma amostra; -Se o tamanho da amostra é grande comparado ao da população, o esforço adicional requerido por um censo pode ser pequeno; -Se exige precisão completa (pequenas populações), o censo é o único método aceitável. Ex.: Sala de aula com 20 alunos Ex.: Grande variabilidade entre os itens de uma população Ex.: Banco: não realizaria a amostragem dos seus guichês, mas sim a contagem do R$ em todos eles. 3. CONCEITOS FUNDAMENTAIS a) População: conjunto de indivíduos que apresentam em comum determinadas características definidas para o estudo. Finita: quando apresenta um número definido de elementos (N0 de operário de uma fábrica). Infinita: apresenta um número infinito de elementos (microrganismos no solo) utilização de amostras Real: população que existe de fato no instante em que estar sendo estudada (alunos registrados na disciplina de estatística neste semestre). Hipotética: aquela que não é real no sentido de não existir no momento em que estar sendo estudada, mas que poderá existir no futuro (novo tratamento de AIDS). b) Amostra: É um subconjunto da população. Tem que ter representatividade na população. Amostragem com reposição: é quando se faz um sorteio e devolvem-se os elementos retirados para população, podendo estes ser sorteado novamente. EX: amostras de aves de uma reserva. Amostragem sem reposição: é quando se faz um sorteio e não há devolução dos elementos retirados da população, havendo uma única chance dos elementos serem sorteados. EX: Sorteio de um animal e este tem que ser abatido. 4. TÉCNICAS DE AMOSTRAGEM São critérios segundo os quais os elementos da população serão selecionados para a amostra a) Amostragem probabilística: Quando todos os indivíduos da população têm probabilidade conhecida e não nula de pertencer à amostra b) Amostragem não probabilística: Quando alguns indivíduos da população têm probabilidade desconhecida ou nula de pertencer à amostra. 4.1. Amostragem probabilística 4.1.1. Amostragem aleatória simples: Aplicada em populações homogêneas e de tamanho conhecido. Suponha: População N --- amostra de tamanho “n” Amostras simples de tamanho “n” Enumeram-se todos os indivíduos da população e sorteia-se os indivíduos que comporão a amostra; Neste tipo de amostragem podem ser retiradas N amostras diferentes com reposição ou amostras diferentes sem reposição Exemplo: Suponha um hospital que trata de 5 tipos de doenças A, B, C, D e E. Deseja-se fazer um estudo em 3 dessas doenças. De quantas maneiras podemos escolher esses 3 tipos? a) Solução matemática: b) Solução prática: Tabela de números aleatórios: - 10 algarismos (0 a 9) são distribuídos ao acaso - Podem ser lidos isoladamente ou em grupos - Podem ser lidos em qualquer ordem - A probabilidade de qualquer algarismo ou combinação de algarismos é igual ao outro Exemplo: Uma loja queria selecionar aleatoriamente 20 clientes de uma lista de 830. Finalidade estimar a freqüência de compras dos clientes. 1 - Numera a população de 1 a 830 (número tomados 3 algarismos). 2 – Escolhe-se um digito qualquer na tabela a partir do qual iremos considerar os grupos de 3 algarismos. 3 - Qualquer seqüência de 3 algarismos lido na tabela servirá. 4 - Lendo os 3 primeiros algarismos da última coluna da tabela 6.1 percorrendo a coluna de cima para baixo. (473, 828, 920, 923, 380, 272, 750 ... 982) 5 - Números sorteados superar o tamanho da população N ou for repetido (abandona-se o número sorteado). 4.1.2. Amostragem estratificada: Utilizada quando a população a ser estudada é heterogênea 0 0 Divide-se a população em estratos (sub-populações) que sejam homogêneos dentro de si, e heterogêneos entre si; Aplicam-se uma das outras técnicas de amostragem para retirar a amostra dos estratos (representativa). Estimativas obtidas com amostragem estratificada são mais precisas que as estimativas calculadas com base em amostragem aleatória simples; Grupos homogêneos apresentam menor variabilidade. Classificação quanto ao tamanho das sub-amostras ni: Proporcional: quando o tamanho da amostra retirado em cada estrato ni é proporcional ao tamanho do estrato. Uniforme: quando de k estratos retiram amostras de tamanho n, independentemente do tamanho do estrato. Exemplo: Consideremos um estudo realizado em propriedades rurais de um município composto por 1000 propriedades rurais distribuídas quanto a sua área, e que neste município sejam amostradas 50 propriedades, conforme a tabela abaixo: 4.1.3. Amostragem sistemática É uma simplificação da amostragem aleatória simples; Ocorre quando a seleção dos elementos que constituirão a amostra é feita por um sistema imposto pelo pesquisador; Apenas o primeiro elemento da amostra será sorteado, e os demais serão retirados em uma progressão aritmética, com razão k, em que: k = N/n, onde: N = tamanho da população. n = tamanho da amostra. Exemplo: A escolha de 3 elementos, em uma população com 5 elementos A, B, C, D e E poderá ser feita supondo a escolha: 4.1.4. Amostragem por conglomerados É a amostragem por área A população apresenta uma subdivisão natural em grupos menores (conglomerados) sorteia-se um número suficiente desses grupos e todos os elementos destes terão que compor a amostra. Divide-se a área ocupada pela população em partes de estudo. Exemplo: Para uma cidade, cada unidade amostral pode ser um bairro, uma rua, um quarteirão, um condomínio, etc. 4.2. Amostragem não probabilística Característica: impossibilidade da aplicação de fórmulas estatísticas para calcular erros de amostra. Erro de amostra: É a diferença que poderá ocorrer quando analisamos os resultados de uma amostra, e o que obteríamos se examinássemos toda a população. A amostragem não probabilística é usada nas seguintes situações: 1 – Pré-teste de questionários 2 – Quando se trata de uma população homogênea 3 – Quando o fator facilidade operacional é requerido Amostras não probabilísticas não garantem a representatividade da população 4.2.1. Amostragem intencional Pesquisador Está interessado na opinião de determinados elementos da população; Não se dirige a massa de pessoas da população, e sim a alguém representante da mesma; Escolhe deliberadamente certoselementos da população para formar a amostra, baseado em um pré-julgamento. Utilidade: Quando é necessário incluir um pequeno número de unidades na amostra Exemplo: Pesquisa de mercado para lançar uma nova marca de leite longa vida tipo A. O pesquisador selecionará indivíduos com poder aquisitivo médio/alto, que são os principais consumidores deste produto (público alvo), embora toda a população independentemente do poder aquisitivo possa ser consumidora deste produto. 4.2.2. Amostragem por quotas Forma mais usual de amostragem não probabilística Utilizada em levantamentos de mercado e sondagem de opinião pública É feita pela fixação do tamanho da amostra e posteriormente a estratificação É fácil a posteriori verificar o erro amostral sofrido pelo tamanho da amostra. Fases: • Classificação da população em termos das propriedades relevantes para o estudo • Determinação da proporção (%) da população para cada característica relevante ao estudo • Fixação de cotas para cada observador a quem cabe a responsabilidade de selecionar os entrevistados 4.2.3. Amostragem acidental Empregada quando se deseja obter informações de maneira rápida e barata. Exemplo: • Solicitar às pessoas que voluntariamente testem um produto e que em seguida respondam a uma entrevista; • Parar pessoas no supermercado e colher suas opiniões • Colocar linhas de telefone adaptadas para que durante um programa de televisão os telespectadores possam dar suas opiniões 4.2.4. Amostragem a esmo O pesquisador, para simplificar o processo, busca ser aleatório, sem realizar o sorteio buscando um dispositivo aleatório qualquer. - Ex: retirada de 100 parafusos de uma caixa contendo 10000. (retirada a esmo). Em populações homogêneas: os resultados são equivalentes aos da amostragem probabilística. 4.2.5. Amostragem por tipicidade Utiliza-se um subgrupo que seja típico, em relação à população como um todo. Exemplo: Informações sobre saúde no esporte: Escolhem-se atletas de determinada modalidade esportiva para obter informações e generalizá-las. 5. PROCEDIMENTOS PARA REALIZAR A AMOSTRAGEM ALEATÓRIA SIMPLES: Sejam: N = tamanho da população n = tamanho da amostra n0 = primeira aproximação para o tamanho da amostra. E0 = erro amostral tolerável. - Conhecendo o tamanho N da população podemos corrigir o cálculo anterior. Exemplo: Suponha que a universidade deseja investigar o nível de satisfação dos alunos quanto ao seu serviço. Realizou-se uma pesquisa entre os alunos. Para minimizar as despesas uma amostra deve ser extraída da população de 3000 alunos. Supondo um erro amostral de 5 %, qual deve ser o tamanho da amostra? N = 3000 E0 = 5 % n = ? 6. PROCEDIMENTOS PARA REALIZAR A AMOSTRAGEM ESTRATIFICADA Estratificar uma população é dividi-la em “L” sub- populações denominadas estratos, tais que: n1 + n2 +n3 + n4 +...+ nL = n Onde os estratos são mutuamente exclusivos Após a determinação dos estratos, seleciona-se uma amostra aleatória de cada sub-população; Se as diversas sub-amostras tiverem tamanhos proporcionais ao respectivo número de elementos nos estratos, teremos a estratificação proporcional. Exemplo: Com o objetivo de levantar o estilo de liderança preferido por uma escola, vamos realizar um levantamento por amostragem. Suponha: Preferência quanto ao estilo de liderança homogêneo dentro de cada categoria A realização de uma amostragem aleatória estratificada proporcional por categoria Obter uma amostra global de tamanho n=10. Total da população: 50 7. PROCEDIMENTOS PARA REALIZAR A AMOSTRAGEM SISTEMÁTICA Seja N a população e n a amostra. Calcula-se o intervalo de amostragem (N/n) ou o inteiro mais próximo “k”. Sorteia-se utilizando a tabela de números aleatórios um número x entre 1 e k. Exemplo: Seja N = 500 e n = 50. Então: k = N/n = 500/50 = 10, ou seja, k = 10. Sorteia-se um número de 1 a 10. Seja (x =3) o número sorteado, logo os elementos sorteados por: 3, 13, 23, 33, ... serão os componentes da amostra 8. PROCEDIMENTO PARA REALIZAR A AMOSTRAGEM POR CONGLOMERADOS Dividir a população em conglomerados; Selecionar aleatoriamente os conglomerados; Pesquisar todos os indivíduos dos conglomerados selecionados. Exercícios: 1. Em que circunstância é a amostragem preferível a um censo completo? 2. Defina “amostra aleatória”. 3. Descreva os métodos de obtenção de uma amostra aleatória. 4. Explique as características: a) Da amostragem por conglomerados; b) Da amostragem estratificada; c) Da amostragem sistemática. 5. O que é amostragem probabilística e quando deve ser usada? 6. Os empregados de uma firma têm etiquetas de identificação numeradas consecutivamente de 101 a 873. Deve-se escolher um comitê de segurança de 10 pessoas, selecionadas aleatoriamente. Use a tabela de números aleatórios para escolher os números das etiquetas. Comece na segunda coluna e leia de cima para baixo. DISTRIBUIÇÕES AMOSTRAIS 1. INTRODUÇÃO Finalidade da amostragem Variações nas amostras aleatórias Distribuições de probabilidade --- Normal --- Binomial Distribuições amostrais Qual a aproximação da estatística amostral do verdadeiro valor do parâmetro populacional? Fatores a serem considerados: 1 – Estatística considerada: Variabilidade de diferentes estatísticas amostrais Diferentes distribuições de probabilidades 2 – Tamanho da amostra: 3 – Variabilidade na própria população Distribuição amostral é uma distribuição de probabilidade que indica até que ponto uma estatística amostral (média, desvio padrão, proporção) tende a variar devido a variações casuais na amostragem aleatória (grau de incerteza associada a cada inferência). 2. Conceitos * Estimador ou estatística: Dada a amostra aleatória (X1, X2,..., Xn), estimador ou estatística é qualquer variável aleatória em função dos elementos amostrais µ σ2 * Estimativa: O valor numérico de um estimador é chamado estimativa de seu respectivo parâmetro. Exemplos: Uma amostra aleatória de retornos de 100 ações apontou média de 2,5% e desvio padrão de 1,7%. A estimativa do retorno médio dessas ações é de 2,5%, e a estimativa do desvio padrão é de 1,7%. Estimativas Vistas diariamente . Valores médios dos preços de veículos; . Retornos de investimentos de diversas aplicações: . Preços médios de imóveis . Índices de cotação de ações. 3. Efeito do tamanho da amostra sobre uma distribuição amostral 4. Distribuições de médias amostrais Escaniar a figura da pg. 179 W. St. É função da média e do desvio padrão da população e do tamanho da amostra A média de uma distribuição amostral é sempre exatamente igual à média populacional Exemplo Suponhamos três itens numa população: X1, X2, X3 Provar que a média populacional é igual a média da distribuição amostral, considerando todas as amostras de 2 itens. Quadro: W.St. 180 O desvio padrão tende a decrescer quando o tamanho da amostra aumenta. A média, ou valor esperado, da média amostral será igual à média da população Outras características: Amostras maiores tendem a ser mais confiáveis que amostras menores Desvio padrão da distribuição amostral das médias: W.St. 180 µ x µ = Se a população é infinita, ou se a amostragem é com reposição,então o desvio padrão da distribuição amostral das médias é dado por : = ____ √n = desvio padrão da distribuição amostral x = desvio padrão da população n = tamanho da amostra x Em qualquer população, o do tamanho das amostras extraídas resultará em variabilidade entre as possíveis médias amostrais. Média da distribuição amostral das médias: Se a população é finita, ou se a amostragem é sem reposição, então o desvio padrão da distribuição amostral das médias é dada por: = ____ √n x * (N – n/ N – 1) √ Teorema do limite central Forma da distribuição amostral Se uma população tem distribuição normal (para qualquer tamanho de amostra) uma população tem distribuição não-normal (desde que a amostra seja grande) Distribuição das médias amostrais Distribuição normal Distribuição aproximadamente normal N: nº elem pop. n: nº elem amostra A amostra deve consistir de 30 ou mais observações Distribuição normal Regra prática Distribuição Normal (utilização) Médias amostrais Proporções em grandes amostras Escaniar a figura da pg. 182 W. St. Exemplo Uma população muito grande (infinita) tem média 20,0 e desvio padrão 1,4. Extrai-se uma amostra de 49 observações. a) Qual a média da distribuição amostral? b) Qual o desvio padrão da distribuição amostral? c) Qual a percentagem de médias amostrais que diferem para mais ou para menos de 0,2 da média populacional? W.St. 183 Quadro: 20,2 – 20,0 /0,2 = 1σ proporção: (0,5 – 0,3413 = 0,1587) 19,8 -20 /0,2 = -1 σ proporção: (0,5 – 0,3413 = 0,1587) total = 0,3174 5. Distribuições de proporções amostrais Indica a probabilidade de determinado conjunto de proporções amostrais, dados o tamanho da amostra e a proporção populacional. Tamanho da amostra ≤ 20 Tabela de probabilidades binomiais > 20 Aproximação da Normal com a Binomial Converter o número de sucessos em porcentagens População (componentes eletrônicos produzidos por uma empresa). Consideremos: Probabilidade de um c.e defeituoso: dada por p. Todas as amostras possíveis de tamanho n extraídas desta população Para cada amostra estatística p da proporção de componentes defeituosos. Obtemos: uma distribuição amostral de proporções com média µP e desvio padrão σP. Exemplo: p = p p = proporção populacional p = média da distribuição amostral das proporções Média da distribuição amostral das proporções: Desvio padrão da distribuição amostral das proporções: σp = √pq/n (amostras com reposição). σp = √pq/n * √N – n / N – 1 (Amostras sem reposição) N: nº elem. população n: nº elem. amostra Exemplo: W.St. 186 Um varejista compra copos diretamente da fábrica em grandes lotes. Os copos vêm embrulhados individualmente. Periodicamente o varejista inspeciona os lotes para determinar a proporção dos quebrados. Se um grande lote contém 10% de quebrados, qual a probabilidade de o varejista obter uma amostra de 100 copos com 17% ou mais defeituosos? σp = √pq/n σp = √0,10 .0,90/100 σp = √ 0,3/10 = 0,03 Podemos usar esse resultado para determinar a variação relativa: 17% - 10% / 3% = 7% / 3% = 2,33 = z 6. Distribuição amostral do número de ocorrência Semelhante a distribuição amostral das proporções Contagem de dados e não, mensurações. Uso de tabelas binomiais (n < 20) Aproximação pela normal Distribuição amostral de proporções --- Valores --- (%) Distribuição amostral do n. de ocorrência --- Valores --- (Contagem) Ambas Exemplo: Suponha que uma pesquisa recente tenha revelado que 60% de uma população de adultos do sexo masculino consta de não fumantes. Tomada uma amostra de 600, calcule a média e o desvio padrão da distribuição amostral. média = np = 600(0,60) = 360 Desvio padrão = √600(0,60)(0,40) σp = √np (1 – p) = √144 = 12 Temos n = 600, p = 0,60 1- p = 0,40 Exercícios: 1. A média de uma distribuição amostral de médias é 50,0 e seu desvio padrão é 10,0. Suponha normal a distribuição amostral. a. Que percentagem de médias amostrais estará entre 45,0 e 55,0 ? b. Que percentagem de médias amostrais estará entre 42,5 e 57,5 ? c. Que percentagem de médias amostrais será menor que a média populacional? 2. Determine a média da distribuição de médias amostrais, dada cada uma das seguintes médias populacionais: a. 5,01 b. 18,41 c. 199,5 d. 0,008 3. Calcule o desvio padrão da distribuição amostral de médias para cada um dos casos seguintes: a. σx = 5, n = 6 b. σx = 1, n = 36 c. σx = 2, n = 40 d. σx = 6,2, n = 100 4. Determine a média da distribuição de proporções amostrais, quando a proporção na população é: a. 30% b. 43% c. 50% d. 72,3% 5. Determine o desvio padrão da distribuição amostral de proporções para n =100 e uma proporção populacional de: a. 10% b. 20% c. 40% d. 50% 6. Explique por que, ao trabalhar com proporções, a distribuição normal é usada para 20 ou mais observações, quando a binomial seria teoricamente correta. Quando é a binomial preferível à normal? Teoria da Estimação MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DE CAMPINA GRANDE UNIDADE ACADÊMICA DE AGRONOMIA E TECNOLOGIA DE ALIMENTOS DISCIPLINA: ESTATÍSTICA BÁSICA Profª Railene Hérica Carlos Rocha Processo que consiste em utilizar dados amostrais para estimar os valores de parâmetros populacionais desconhecidos. Qualquer característica de uma população pode ser estimada a partir de uma amostra aleatória 1. Introdução 2. Estimador e estimativa Estimador Estatística Estimativa Cada valor assumido por um estimador Notação: = parâmetro a ser estimado T = um estimador de t = uma dada estimativa 2. 1 Qualidades de um bom estimador Justeza ou não-tendenciosidade: Um estimador T é justo (ou não-tendencioso, não-viciado ou não-viesado), se sua média for o próprio parâmetro que se pretende estimar. θ μ (T) = Consistência: Ou seja, Sendo um estimador consistente, com amostras grandes é possível tornar o erro de estimação tão pequeno quanto se queira. Se o estimador for justo, a condição de consistência equivale a dizer que sua variância tende a zero quando o tamanho da amostra tende a infinito. Eficiência: Dados dois estimadores T1 e T2, definimos eficiência de um parâmetro em relação a outro, para um mesmo tamanho de amostra por: E = var (T1 /T2) Se a eficiência E < 1 T1 é menos eficiente do que T2 Se a eficiência E > 1 T1 é mais eficiente do que T2 Suficiência: Um estimador é suficiente se contém o máximo possível de informação com referência ao parâmetro por ele estimado. Estimador ideal justo, consistente, eficiente e suficiente. Tipos de estimativas Estimativa pontual (Estimativa única de um parâmetro populacional) Estimativa intervalar (Dá um intervalo de valores possíveis, no qual se admite que esteja o parâmetro populacional) Pontual 1. O americano médio consome 40lb de carne por ano. 2. Um carro típico de 6 cilindros faz 15 milhas por galão. 1.Vinte e dois por cento da população se opõe a um aumento do limite de velo cidade.2. A proporção de estudantes fumantes é 43%. 1. O desvio padrão da quilometragem de um pneu radial é de 2.000 milhas. 2. O desvio padrão da temperatura numa piscina não aquecida é da ordem de 5°F. Intervalar 1. O consumo médio de carne no país está entre 30 e 50lb por pessoa por ano. 2. Um carro típico de 6 cilindros faz entre 12 e 18 milhas por galão. 1. Entre 18% e 26% da população há oposição a um aumento do limite da velocidade. 2. A proporção de estudantes fumantes está entre 37% e 49%. 1. O desvio padrão da quilometragem de um pneu radial está entre 1.500 e 2.500 milhas. 2. O desvio padrão da temperatura numa piscina não aquecida está entre 2°F e 8°F. Exemplos Tipos de estimativas Parâmetro populacional Média Proporção Desvio padrão a) Estimativa pontual O valor da média ( ) é uma estimativa por ponto da média populacional (µ). N = 20.000 alunos; n = 200 alunos; = 7,2. Exemplo: Logo: = 7,2 é uma estimativa pontual da verdadeira nota média dos 20.000 alunos. Em geral: é insuficiente (não possui uma medida do possível erro cometido na estimação). Quando a estatística amostral origina uma única estimativa (valor) do parâmetro populacional que se quer estimar. Estimativa por ponto da variância da população: 1º Caso: Quando se conhece a média µ da população. 2º Caso: Quando a média µ da população é desconhecida. estimativa . Estimativa por ponto da proporção da população Proporção p: o estimador será a proporção p’. p’ é estimador justo de p → µ (p’) = p. b) Estimativa intervalar Quando a partir da estatística amostral construímos um intervalo de valores possíveis no qual se admite que esteja contido o parâmetro populacional com dado nível de confiança ou probabilidade (1 – α %). (intervalo de confiança). f(x) f(z) Exemplo: W.St 196 Suponha uma amostra de alunos graduados, com idade média de 24,2 anos. Sabemos que: Este é um dos valores da distribuição amostral Qual a aproximação está a 24,2 da média populacional? Exemplo: O intervalo [1,60 m; 1,64 m] contém a altura média dos moradores do município X, com intervalo de confiança de 95 %. Risco de erro (5 %) → 95 % desse intervalo conter o verdadeiro parâmetro populacional. Interpretação: Limites de confiança Determinam um intervalo de confiança no qual deverá estar o verdadeiro valor do parâmetro A estimação por intervalo consiste na fixação de dois valores tais que (1 - α) seja a probabilidade de que o intervalo, por eles determinado, contenha o verdadeiro valor do parâmetro. Fatores que influenciam na amplitude de um intervalo de confiança: : É a probabilidade de erro na estimação por intervalo. α e = a) Intervalo de confiança da média populacional quando o desvio padrão (σ) é conhecido: P (- Zα/2 ≤ Zi ≤ + Zα/2) = 1- α. Substituindo o valor de Zi: Populações infinitas: Populações finitas: PROCEDIMENTO: 1. Fixa-se o valor de 1 – α 2. Tabela de distribuição normal padrão: valor das abscissas que deixam α/2 em cada uma das caudas 3 . (média amostral); σ (desvio padrão da população); n (tamanho da amostra) → constrói-se o intervalo. A duração de vida de uma peça é tal que σ = 5 h. Foram amostradas aleatoriamente 100 peças, obtendo média de 500 h. Construa um IC para a verdadeira duração média da peça com nível de 95 % de confiança. Exemplo 1: quadro Interpretação: Exemplo 2: Considere os dados do exercício anterior para uma população N=1000 peças Interpretação: B - Intervalo de confiança da média populacional quando o desvio padrão σ é desconhecido: Amostra pequena e não se conhece o valor do desvio padrão populacional σ → substitui-se por S (desvio padrão amostral) quadro A amostra (9, 8, 12, 7, 9, 6, 11, 6, 10, 9) foi extraída de uma população normal. Construa um IC para média ao nível de 95 % de probabilidade. Exemplo 3: quadro 9; α/2 = Substituindo os valores na fórmula: Interpretação: C - Intervalo de confiança para soma ou diferença entre médias populacionais µ1 e µ2 1 – Desvios padrões σ1 e σ2 conhecidos: Interpretação: 2 – Desvios padrões σ1 e σ2 desconhecidos e supostamente iguais: α quadro Interpretação: 3 – Desvios padrões σ1 e σ2 desconhecidos e supostamente diferentes α Interpretação: quadro D - Intervalo de confiança da proporção da população: Se as amostras são grandes (n ≥ 30), a distribuição amostral de proporções que tem distribuição binomial, poderá ser aproximada de uma distribuição normal de mesma média e variância. (n ≥ 30; p = 0,5). Interpretação: E - Intervalo de confiança para soma e diferença de duas proporções populacionais p1 e p2: Interpretação: quadro F – Intervalo de confiança da variância da população σ2 O estimador de σ2 é S2 S2 tem distribuição Qui - Quadrado admitindo que a população tenha distribuição normal σ2 P (X2 inf ≤ X2 n -1 ≤ X 2 sup) Substituindo o valor de X2 n – 1 e resolvendo as duas inequações para σ 2, obtemos o intervalo: Ex: Admita distribuição normal com n = 10, S2 = 4 e que se deseja construir um intervalo de confiança para a variância populacional ao nível de 90 %. G – Intervalo de confiança para o desvio padrão da população σ Ex.: Com os dados do exemplo anterior, construa o IC para o desvio padrão populacional. Exercícios (Teoria da Estimação) Para a média populacional: 1. Foram retiradas 25 peças da produção diária de uma máquina, encontrando- se para uma medida uma média de 5,2 mm. Sabendo que as médias têm distribuição normal com desvio padrão populacional de 1,2 mm, construa intervalos de confiança para a média aos níveis de 90%, 95% e 99%. 2. De uma distribuição normal de σ2 = 1,96, obteve-se a seguinte amostra: 25,2; 26,0; 26,4; 27,1; 28,2; 28,4. Determine o intervalo de confiança para a média da população, sendo α = 0,05 e α = 0,10. 3. Suponha que as alturas dos alunos de nossa faculdade tenham distribuição normal com σ = 15 cm. Foi retirada uma amostra aleatória de 100 alunos, obtendo-se x = 175 cm. Construa, ao nível de 95%, o intervalo para a verdadeira altura média dos alunos. 4. Uma amostra proveniente de população normal é composta pelos seguintes elementos: 7, 7, 8, 9, 9, 9, 10, 11, 11, 11, 12, 13, 13, 14, 15, 15. Construa os intervalos de confiança para a média aos níveis de confiança de 97,5% e de 75%. Compare os resultados e comente as diferenças de amplitudes. 5 6 Para a variância populacional: 1. Suponha que uma amostra aleatória de 10 observações, aponte S2 = 2,25. Quais os limites de confiança, a 80%, para a verdadeira variância? Qual foi a hipótese admitida para a distribuição de probabilidade da população? 2. Sendo X uma população tal que X= N( μ, σ2 ), em que μ e σ2 são desconhecidos. Uma amostra de tamanho 15 forneceu os valores ∑Xi = 8,7 e ∑Xi2 = 27,3. Determine um intervalo de confiança de 95% para . 3. Qual é o intervalo de confiança que conterá com 90% a verdadeira variância de uma população normal que resultou ∑Xi = 700,8 e ∑Xi2 = 23.436,80, de uma amostra de 30 elementos? σ2 Para a proporção populacional: 1. Uma centena de componentes foi ensaiada, e 39 deles funcionaram mais de 1.000 horas. Determine um intervalode confiança de 95% para a proporção de componentes que funcionam mais de 1.000 horas. 2. Uma amostra aleatória de 400 domicílios mostra-nos que 25% deles são casas de aluguel. Qual é o intervalo de confiança da proporção de casas de aluguel? Admita um erro de 2%. 3. Uma amostra aleatória de 300 habitantes de uma cidade mostrou que 180 desejavam a água fluorada. Encontre os limites de confiança de 90% e 95% para a proporção da população favorável à fluoração. 4 Dimensionamento de amostras Objetivo: Calcular qual o tamanho mínimo que devemos coletar, de modo que, o erro ao estimarmos o parâmetro θ seja menor do que um valor pré-estabelecido. A – Amostragem aleatória simples com reposição e σ conhecido: Zα/2 = valor da tabela correspondente a área sob a distribuição normal padrão, fixando um nível de confiança de 1 – α. σ = desvio padrão da população. e = erro amostrai absoluto permissível n = tamanho da amostra aleatória simples. B – Amostra aleatória simples sem reposição e σ conhecido: Zα/2 = valor da tabela correspondente a área sob a distribuição normal padrão, fixando um nível de confiança de 1 – α. σ = desvio padrão da população. e = erro amostral absoluto permissível n = tamanho da amostra aleatória simples. N = tamanho da população. EX: Qual o tamanho da amostra que devemos retira de uma população com 5000 observações cujo desvio padrão é igual a 5, com 95 % de confiança e precisão de 0,4. . C – Amostragem aleatória simples com reposição e σ desconhecido tα/2 = valor da tabela correspondente a área sob a distribuição t (Student) com n – 1 graus de liberdade para determinado nível de confiança 1 – α. S = desvio padrão da amostra. e = erro amostral absoluto permissível n = tamanho da amostra aleatória simples. D – Amostra aleatória simples sem reposição e σ desconhecido tα/2 = valor da tabela correspondente à área sob a distribuição t (Student) com n – 1 graus de liberdade para determinado nível de confiança 1 – α. S = desvio padrão da amostra. e = erro amostral absoluto permissível n = tamanho da amostra aleatória simples (população). E - Amostragem das proporções com reposição F - Amostragem das proporções sem reposição Exercícios (Dimensionamento de amostras) 1 2 4 5 6 3
Compartilhar