Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA E PROBABILIDADE Amostragem Tipos de amostragem Inferência Estatística Estimação e Intervalo de Confiança para média populacional Exercícios Amostragem • Conceitos Preliminares: • População: Conjunto dos elementos a serem estudados. • Amostra: Subconjunto da população. • Amostragem: Processos de obtenção de uma amostra a partir de uma população. • Em geral não se tem acesso a toda a população em que desejamos estudar o fenômeno, com isso recorremos a uma amostra da nossa população de interesse. Tipos de Amostragem • A amostragem será probabilística se todos os elementos da população tiverem probabilidade conhecida, e diferente de zero, de pertencer à amostra. Caso contrário, a amostragem será não-probabilística. • Amostragem Probabilística pode ser classificada em: • Amostragem Aleatória Simples; • Amostragem Sistemática; • Amostragem Estratificada; • Amostragem por Conglomerados. • A grande vantagem deste método é que os resultados obtidos na pesquisa podem ser projetados para a população total. Tipos de Amostragem • Amostragem Aleatória Simples • É o processo mais elementar e muito frequentemente utilizado; • Todos os elementos da população têm a mesma probabilidade de ser selecionado; • Dado um conjunto, enumeramos seus elementos e realizamos um sorteio, os elementos sorteados constituirão nossa amostra; • Podem ser com ou sem repetição dos elementos. Tipos de Amostragem • Amostragem Sistemática • Dado um conjunto de elementos ordenados retiramos periodicamente um elemento para a amostra. (Não recomendada para eventos sazonais); • A população deve ser ordenada de forma que os elementos sejam identificados pela posição. Tipos de Amostragem • Amostragem Sistemática • Para encontrarmos os pontos onde faremos as coletas sistemáticas das amostras, podemos seguir os seguintes passos: 1) Calcular o intervalo de amostragem K= N/n onde N é o tamanho da população e n é o tamanho da amostra. 2) Sortear um número de 01 a K. 3) Obter a amostra: número sorteado, número sorteado + K, número sorteado + 2K, número sorteado + 3K, ... • Exemplo: N=100 e n=10 K=100/10=10 Número sorteado = 8 Amostra: 8, 18, 28, 38, 48, 58, 68, 78, 88 e 98. Tipos de Amostragem • Amostragem Estratificada • Quando uma população pode ser dividida em subgrupos (estratos) que são mais ou menos homogêneos. Após a determinação dos estratos, seleciona-se uma amostra aleatória simples de cada estrato. • A definição dos estratos pode ser de acordo com sexo, idade, renda, grau de instrução, etc.; Tipos de Amostragem • Amostragem Estratificada 1. Amostragem Estratificada Proporcional: A proporcionalidade do tamanho de cada estrato da população é mantida na amostra. 2. Amostragem Estratificada Uniforme: Selecionamos o mesmo número de elementos em cada estrato. É o processo usual quando se deseja comparar os diversos estratos. Tipos de Amostragem • Amostragem por Conglomerados • A população é dividida em conglomerados, onde cada conglomerado é representativo da população. Selecionamos aleatoriamente um conjunto de conglomerados e a amostra é constituída por todos os elementos dos conglomerados selecionados. • Este esquema amostral é utilizado quando há uma subdivisão da população em grupos que sejam bastante semelhantes entre si, mas com fortes discrepâncias dentro dos grupos, de modo que cada um possa ser uma pequena representação da população de interesse específico. • A amostragem é realizada em cima dos conglomerados, e não mais sobre os indivíduos da população. Tipos de Amostragem • Amostragem por Conglomerados • Exemplo: Suponha que se pretende estudar o nível de satisfação dos trabalhadores têxteis, das empresas do Norte do País. Método AAS nos conglomerados. Elementos Conglomerados Eleitores Domicílios Trabalhadores Empresas Alunos Escolas Tipos de Amostragem • Amostragem por Conglomerados vs Estratificada • A principal diferença entre a amostragem por conglomerados e a amostragem estratificada é a unidade de amostragem. • Conglomerados: Todos os conglomerados existentes. (Todas as cidades, empresas, etc) • Uma amostragem por conglomerado é indicada quando: Não se possui uma lista contendo todos os nomes dos elementos da população; Existe grande heterogeneidade entre os elementos da população. • Estratificada: Os elementos da população. • Uma amostragem estratificada é indicada quando: É fácil o acesso à uma lista contendo todos os nomes dos elementos da população; As informações sobre a população estão disponíveis e embora ela seja heterogênea posso identificar grupos homogêneos dentro dessa mesma população e assim dividi-la em diferentes estratos para depois obter uma amostra. Inferência Estatística • Por inúmeros motivos (tempo, custo, logística, etc...) trabalhamos com uma (ou mais) amostra(s) retirada(s) da população. • A partir da teoria da Inferência Estatística, os resultados amostrais são inferidos como resultados válidos para a população estudada. População é o conjunto de todos os elementos (unidades experimentais) ou resultados sob investigação. Amostra é um subconjunto de uma população por meio da qual se estabelecem ou estimam as propriedades e características de interesse da população. Inferência Estatística População µ …. X1 X2 X4 Xn X3 Amostras x1 x2 x4 xn x3 Variação amostral 𝜇 ≅ 𝑋 ± 𝑒𝑟𝑟𝑜 Inferência Estatística • Exemplo: Precisamos avaliar a resistência à compressão de todas as peças produzidas por uma máquina (população de peças) e faremos isso por meio da média. Então a variável que desejamos avaliar é a resistência à compressão das peças (em Mpa): Intervalo de Confiança bilateral para a média 𝜇 • O estimador de 𝜇 é a média amostral 𝑋 • Então, o IC(𝜇) vai ser da forma 𝑋 ± 𝑒 • CASO 1: a variância populacional 𝜎2 é CONHECIDA 𝑋~𝑁 𝜇, 𝜎2 𝑛 𝑍 = 𝑋−𝜇 𝜎2 𝑛 𝐼𝐶1−𝛼 𝜇 = 𝑋 ± 𝑒 𝐼𝐶1−𝛼 𝜇 = 𝑋 ± 𝑧𝛼 2 𝜎 𝑛 erro da estimação (ou a semi-amplitude do intervalo) Intervalo de Confiança bilateral para a média 𝜇 • Margem de erro = 𝑒 = (valor critico=z)(desvio padrão) • Ou seja: 𝑋 ± 𝑧𝛼 2 𝜎 𝑥 Há uma probabilidade de 1 − 𝛼 da média estar contida no intervalo definido. 1 − 𝛼 = nível de confiança 𝛼 = nível de significância (probabilidade de erro) O valor 𝑧 𝛼 2 é o escore z que elimina uma área 𝛼 2 na cauda à direita e −𝑧 𝛼 2 elimina uma área 𝛼 2 na cauda à esquerda Intervalo de Confiança bilateral para a média 𝜇 • Exemplo: Deseja-se estimar a largura média de um tipo de peça. Para isso considera-se uma amostra de 25 peças da qual obtemos uma largura média igual a 5,20 cm. Pelo histórico da produção dessa peça, sabe-se que variabilidade da largura das peças tem desvio padrão de 0,5 mm, construa o IC com 95% de confiança desejado. Do enunciado, temos: 𝑋 = 5,20 𝑐𝑚 𝜎 = 0,05 𝑐𝑚 𝑛 = 25 1 − 𝛼 = 0,95 Da tabela da N(0,1), obtemos que: 𝑧𝛼 2 = 1,96 𝐼𝐶95% 𝜇 = 5,2 ± 1,96 0,05 25 𝐼𝐶95% 𝜇 = 5,2 ± 0,0196 𝐼𝐶95% 𝜇 = 5,1804; 5,2196 Intervalo de Confiança bilateral para a média 𝜇 • CASO 2: a variância populacional 𝜎2 é DESCONHECIDA Nesse caso, não vale 𝑋~𝑁 𝜇, 𝜎2 𝑛 𝑍 = 𝑋−𝜇 𝜎2 𝑛 • Nesse caso substituímos a variância desconhecida ( 𝜎2 ) pela estimativa da amostra (𝑠2). • Assim, temos o seguinte resultado: 𝑡 = 𝑋−𝜇 𝑠2 𝑛 Intervalo de Confiança bilateral para a média 𝜇 • CASO 2: a variância populacional 𝜎2 é DESCONHECIDA • Em muitos casos da vida real o desviopadrão populacional é desconhecido, portanto para uma v.a. que é normalmente distribuída, a variável média amostral comporta-se como o modelo de distribuição t. • A distribuição t é uma família de curvas, cada uma determinada por um parâmetro chamado de graus de liberdade (g.l.). Os graus de liberdade são o número de escolhas livres deixadas depois que uma estatística amostral tal como 𝑋 é calculada. • Quando usamos uma distribuição t para estimar uma média populacional, os g.l. são iguais ao tamanho da amostra menos um. • Conforme os graus de liberdade aumentam, a distribuição t se aproxima da distribuição normal. Intervalo de Confiança bilateral para a média 𝜇 • CASO 2: a variância populacional 𝜎2 é DESCONHECIDA 𝑡 = 𝑋−𝜇 𝑠2 𝑛 𝐼𝐶1−𝛼 𝜇 = 𝑋 ± 𝑒 𝐼𝐶1−𝛼 𝜇 = 𝑋 ± 𝑡 𝛼 2 𝑠 𝑛 tn-1 Intervalo de Confiança bilateral para a média 𝜇 • Exemplo: Deseja-se estimar a nota média de um exame aplicado em um vestibular. Para isso foi considerada uma amostra de 16 candidatos submetidos a esse vestibular e, dela, obteve-se uma nota média de 7,3 e um desvio padrão de 0,4. Construa o IC desejado com 95%. Do enunciado, temos: 𝑋 = 7,3 𝑠 = 0,4 𝑛 = 16 1 − 𝛼 = 0,95 Da tabela 𝑡15 obtemos que: 𝑡𝛼 2 = 2,131 𝐼𝐶95% 𝜇 = 7,3 ± 2,131 0,4 16 𝐼𝐶95% 𝜇 = 7,3 ± 0,213 𝐼𝐶95% 𝜇 = 7,087; 7,513 T 0 95% 2 t 2 αt 2,5%2,5% t15 Graus de liberdade Exercícios 1) Para estimar a renda média familiar (em reais) em uma cidade do interior de SP, uma amostra de 100 famílias foi avaliada de onde obtivemos uma renda média igual a R$ 850,00. Usando a informação mais recente do censo, sabe-se que o desvio padrão da renda familiar nesse município é igual a R$ 90,00. Estime a renda média familiar na cidade através de um intervalo de 95% de confiança. 2) Um pesquisador quer saber qual é o tempo médio gasto para executar um teste de laboratório. Para isso, observou o tempo de 25 execuções do teste e obteve uma média de 52 minutos e um desvio padrão de 4 minutos. Obtenha o intervalo com 95% de confiança para o verdadeiro tempo médio de execução do teste. R: 𝐼𝐶 𝜇 = 832,36; 867,64 R: 𝐼𝐶 𝜇 = 50,349; 53,651 Exercícios 3) Com uma amostra de 16 dias do último mês estimou-se a temperatura média e o desvio padrão das temperaturas e, obtendo-se, respectivamente: 12,1°C e 3,0°C. Obtenha, com 99% de confiança, a estimativa para a temperatura média das temperaturas do último mês. 4) O peso de um produto é uma variável aleatória cujo desvio padrão é conhecido pelo processo de fabricação. Para estimar o peso médio de um lote desse produto, colheu-se uma amostra de 25 unidades do produto e construiu-se o intervalo com 95% de confiança para o peso médio que resultou em (152,0 ± 19,6) gramas. Qual é o valor do desvio padrão? R: 𝐼𝐶 𝜇 = 9,889; 14,310 R: 50 gramas Exercícios 5) Para estimar a renda média familiar (em reais) numa cidade, colheu-se uma amostra de famílias dessa cidade e, sabendo-se que o desvio padrão é conhecido, foi construído o intervalo de 90% de confiança para a média desejada, sendo obtido o intervalo de (850 ± 82) reais. Se o nível de confiança for alterado para 95%, qual será o novo intervalo? 6) O diretor de admissões de uma faculdade deseja estimar a idade média de todos os estudantes atualmente matriculados. Em uma amostra aleatória de 20 estudantes, a idade média encontrada é de 22,9 anos. De estudos anteriores, o desvio padrão conhecido é 1,5 ano, e a população é normalmente distribuída. Construa um intervalo de confiança de 90% da idade média da população. R: 𝐼𝐶 𝜇 = 752; 948 R: 𝐼𝐶 𝜇 = 22,3; 23,5 Exercícios 7) O desvio padrão do consumo diário de gás em uma fábrica é conhecido. Deseja-se estimar o consumo médio de gás dos últimos meses. Para isso, colheu-se uma amostra de alguns dias e, com os consumos observados em cada dia, foi construído o intervalo de 95% de confiança para a média desejada, obtendo-se: [2,2m3 ; 3,4m3]. a. Qual é a margem de erro dessa estimação? b. Se o nível de confiança for alterado para 98%, qual será o novo intervalo? R: 𝐼𝐶 𝜇 = 2,087; 3,513 R: e = 0,6 𝑚3 Exercícios 8) Você seleciona aleatoriamente 36 carros do mesmo modelo que foram vendidos em uma concessionária, e determina o número de dias que cada um permaneceu no pátio da concessionária antes de ser vendido. A média amostral é de 9,75 dias, com um desvio padrão amostral de 2,39 dias. Construa um intervalo de confiança de 99% para o número médio populacional de dias que um carro permanece no pátio da concessionária. 9) Uma máquina automática de suco industrial é regulada de modo que a quantidade suprida de cada vez, tenha distribuição aproximadamente normal com desvio-padrão de 35ml. Determine um intervalo de 96% de confiança para a quantidade média de toda produção, sabendo que uma amostra de 30 embalagens teve um conteúdo médio de 290 ml. R: 𝐼𝐶 𝜇 = 8,66; 10,84 R: 𝐼𝐶 𝜇 = 276,90; 303,10 Exercícios 10) Um modelo de transferência de calor a partir de um cilindro imerso em um líquido prevê que o coeficiente de transferência de calor para o cilindro torna-se constante em taxas de fluxo muito baixa do fluido. Uma amostra de 10 medições é obtida. Os resultados, em W/m2K, são: Determine um intervalo de confiança de 95% para o coeficiente de transferência de calor. R: 𝐼𝐶 𝜇 = 12,318; 13,762 13,7 12,0 13,1 14,1 13,1 14,1 14,4 12,2 11,9 11,8
Compartilhar