Baixe o app para aproveitar ainda mais
Prévia do material em texto
Aulas 12 a 20 – Profa. Liane MAT02219 8. Distribuição de Probabilidade As distribuições de probabilidade são funções que representam os resultados de variáveis aleatórias, podem ser classificadas como: discretas (v.a.d). e contínuas (v.a.c.). 8.1 Distribuições de probabilidade discretas 8.1.1. Distribuição de Probabilidade Binomial Usa-se o termo binomial para designar situações em que os resultados de uma v.a. podem ser agrupados em duas categorias, "sucesso" e "fracasso" que são mutuamente exclusivas. A distribuição binomial é útil para determinar a probabilidade de certo número de sucessos num conjunto de observações. *CARACTERÍSTICAS: • O experimento consiste em n tentativas em iguais condições. • Cada tentativa tem um resultado, entre dois possíveis: sucesso ou fracasso. • As probabilidades de sucesso p e de fracasso q = (1-p) permanecem constantes em todas as tentativas. • Os resultados são independentes uns dos outros. *CÁLCULO: Para calcular uma probabilidade binomial, é necessário especificar: n : número de tentativas p : probabilidade de sucesso em cada tentativa e observa-se: x : número de sucessos (em n tentativas) Exemplo: Um novo hardware foi desenvolvido e tem 40% de chance de funcionar. Cinco protótipos foram construídos. Qual a chance de que dentre os cinco protótipos 3 funcionem? Funcionar – F Não funcionar – N Combinações: 1o 2o 3o 4o 5o F F F N N F F N F N F N F F N N F F F N F F N N F F N F N F N F F N F F N N F F N F N F F N N F F F Aulas 12 a 20 – Profa. Liane MAT02219 Quantas situações ocorrem? 10 = C53 = 5! / 2!.3! => Cnx = n!/ (n-x)!x! Qual a probabilidade de ocorrência da primeira combinação? FFFNN P(FFFNN) = P(F). P(F) . P(F) . P(N). P(N) = 0,4.0,4.0,4.0,6.0,6 = = 0,43.0,62 = 0,02304 => px .(1-p) n-x Qual a probabilidade de ocorrência de qualquer uma destas combinações/situações? 0,02304 Então : P(X=3) = 10*0,02304 = C53 0,4 3.0,62 = 0,2304 Generalizando: P(X=x) = Cxp . p x .(1-p) n-x Em n tentativas, tem-se x sucessos com probabilidade p e n-x fracassos com probabilidade q. Como nessas n tentativas, não tem relevância a ordem de ocorrência dos x sucessos e n-x fracassos. Essa combinação é dada por: C n x n n x x = − ! ( )! ! De modo que: P(X=x) = x n C )1(. pp xnx − − *EXEMPLO: Seja p=0,1 a probabilidade de encontrar um item defeituoso. Em 15 peças que tomamos aleatoriamente de uma linha produtiva, temos que a probabilidade de obter x = 1 é dada por: P(X=1) = 141151 9,0.1,0. !1)!115( !15 )1,01(1,01 15 − =− − C = 0,3432 Para cada valor de X em {0,1,2, ..., 15} temos uma probabilidade, a figura abaixo mostra essas probabilidades graficamente. Aulas 12 a 20 – Profa. Liane MAT02219 distribuição binomial 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 x prob Como a probabilidade de ocorrer um defeituoso é baixa (p=0,1) é de se esperar que em um conjunto de 15 peças encontra-se probabilidades altas para valores pequenos de x. *PARÂMETRO DA DISTRIBUIÇÃO: A distribuição a binomial tem por parâmetro p (a probabilidade de sucesso). Seja X é o número de sucessos, então em função deste parâmetro podemos calcular: E[X] = n p e VAR[X] = n p ( 1 - p ) No exemplo: E[X] = n p = 0,10 x 15 = 1,5 , logo temos em média 1,5 itens defeituosos nesta linha produtiva. VAR[X] = n p ( 1 - p ) = 0,1 x 15 x (1 - 0,1) = 1,35 8.1.2. Distribuição de Probabilidade Poisson: É uma distribuição discreta que é útil para descrever a probabilidade do número de ocorrências num campo ou intervalo. Exemplos de variáveis que podem ter como modelo a distribuição de Poisson: • defeitos por centímetro quadrado • chamadas de celular por hora Note que a unidade de medida é contínua, mas a variável aleatória é discreta. *CARACTERÍSTICAS: • A probabilidade de uma ocorrência é a mesma em todo o campo de observação. • A probabilidade de mais de uma ocorrência num único ponto é aproximadamente zero. • O número de ocorrências em qualquer intervalo é independente do número de ocorrência em outros intervalos. Aulas 12 a 20 – Profa. Liane MAT02219 *CÁLCULO: ! )( x e xXP xλλ− == x = 0, 1,.... onde: x é o número de ocorrências λ é o número médio de ocorrência no intervalo/espaço. *EXEMPLO: Um processo mecânico produz tecido para tapetes com média de dois defeitos por metro quadrado. Qual a probabilidade de em um metro quadrado se encontre apenas um defeito? (admitindo que esse processo possa ser bem aproximado por uma distribuição de Poisson). P x e ( ) ! , , = = = − 1 2 1 0 270 2 1 x P(x) 0 0,135 1 0,270 2 0,270 3 0,180 4 0,090 5 0,036 6 0,012 Distribuição de Poisson com λ = 2 *PARÂMETRO DA DISTRIBUIÇÃO: A distribuição Poisson tem por parâmetro λ (número médio de ocorrências), o valor esperado e a variância são iguais a esse parâmetro. E[X] = λ e VAR[X] = λ A distribuição de Poisson pode ser usada para calcular probabilidade da distribuição Binomial, quando n p→ ∞ → e 0 , mas mantendo o quociente np = λ . Aulas 12 a 20 – Profa. Liane MAT02219 8.1.3.Exercícios de distribuições de probabilidade discretas 1) Uma empresa explorada de petróleo acha que 5% dos poços de petróleo que perfura acusam depósito de gás natural . Se ela perfurar 6 poços, determine a probabilidade de ao menos um dar resultado positivo? 2) Dos estudantes de uma universidade, 75% mudam de curso uma vez durante o primeiro ano, de acordo com os registros. Escolhido ao acaso 11 estudantes calouros, determine a probabilidade de: a) todos mudarem de curso ao menos uma vez . b) ao menos 9 mudarem de curso. c) Mais da metade mudar de curso. 3) Entre 2000 famílias, com 4 crianças cada uma, provavelmente, quantas terão: a) pelo menos 1 menino. b) nenhuma menina 4) O número de DVD´s vendidos por dia por uma loja tem distribuição aproximadamente poisson com média 1,5. Qual a probabilidade da loja vender ao menos 4 DVD´s: a) num período de dois dias b) num período de três dias 5) Os defeitos em rolos de tecidos ocorrem a razão de 0,1 defeito/rolo, e a distribuição dos defeitos é Poisson. Qual a probabilidade de um rolo particular conter um ou mais defeitos? 6) Um certo tipo de pneu para automóveis de passeio tem média um defeito a cada 15000 km de trajeto percorrido. Assumido que as ocorrências têm distribuição de Poisson, qual é a probabilidade de não observamos nenhum defeito em 15000 km? E nenhum defeito em 20000 km? Aulas 12 a 20 – Profa. Liane MAT02219 8.2. Distribuição de Probabilidade Contínua 8.2.1. Distribuição de Probabilidade Normal: A curva normal é conhecida também por curva de Gauss, pois foi ele quem contribuiu para a sua teorização. A curva normal está associada a histogramas similares ao que vemos na figura abaixo, onde temos uma grande concentração em torno de um valor central e a medida que nos afastamos desse valor (para ambos os lados) a freqüência (ou probabilidade) ocorrência do fenômeno vai diminuindo.*CARACTERÍSTICAS: • A curva normal tem forma de sino. • É simétrica em relação à média. • Prolonga-se de -∞ até +∞. • Cada distribuição normal é especificada por seus parâmetros média (µ) que varia de [-∞,+∞] e o desvio padrão (σ) que varia entre [0, +∞]. Existe uma curva normal distinta para cada combinação de µ,σ. Curvas com médias diferentes (e mesmo desvio padrão): Aulas 12 a 20 – Profa. Liane MAT02219 Curvas com desvios padrões diferentes (e mesma média): - A área total abaixo da curva é considerada como 100%. Isto é, P( -∞ < x < +∞)=1 - Como há um número infinito de valores entre -∞ e +∞, a probabilidade de uma variável aleatória normalmente distribuída assumir exatamente um valor X0 é zero. - A área sob a curva entre dois pontos é a probabilidade de uma variável normalmente distribuída assumir um valor entre dois pontos. Aulas 12 a 20 – Profa. Liane MAT02219 Para calcular P(a ≤ x ≤ b) = a b ∫ f(x) dx, é preciso conhecer f(x) ou f.unção densidade de probabilidade da distribuição normal. * FUNÇÃO DISTRIBUIÇÃO DE PROBABILIDADE: f x xe( ) ( )= − − 1 2 22 2 σ π µ σ -∞ < x < +∞ * FUNÇÃO DISTRIBUIÇÃO ACUMULADA: A distribuição normal acumulada é definida como a probabilidade que a variável normal X é menor ou igual a algum valor "a", ou P( X ≤ a) = F(a) = −∞ ∫ a 1 2 22 2 σ π µ σ− −( )xe Como a distribuição normal varia de local e forma para cada µ e σ, e não é possível encontrar uma solução fechada (para a integral), foi realizada uma padronização. A padronização consiste em transformar qualquer distribuição normal em uma distribuição normal com µ = 0 e σ = 1. A distribuição normal padrão foi então tabulada. Aulas 12 a 20 – Profa. Liane MAT02219 * DISTRIBUIÇÃO NORMAL PADRÃO: As áreas correspondentes as probabilidades da distribuição normal padrão estão tabeladas. A unidade da distribuição normal padrão é chamada escala z que significa o número de desvios a contar da média. As distribuições com µ ≠ 0 e/ou σ ≠ 1, podem ser convertidas para a escala Z usando: z = x − µ σ Como z expressa a localização de unidades relativo a média usando o desvio padrão. Obtemos então: P( X < a) = P ( z < a − µ σ ) = φ µ σ ( ) a − onde φ (.) é a distribuição normal acumulada e está tabelada conforme a tabela anexa. Exemplo: O diâmetro das hastes de metal de um disk drive é normalmente distribuído com µ = 0,2508 polegadas e σ = 0,0005 polegadas. As especificações da haste forma estabelecidas como sendo 0,25 ± 0,0015 polegadas. Desejamos determinar a fração de hastes produzidas conforme as especificações. P( 0,2485 < x < 0,2515) = P(x < 0,2515) - P(x < 0,2485) = φ( , , ) , 0 2515 0 2508 0 0005 − - φ( , , ) , 0 2485 0 2508 0 0005 − = φ( , )1 40 -φ( , )−4 60 = 0,9192 - 0 = 0,9192 Aulas 12 a 20 – Profa. Liane MAT02219 Note que 68,26% dos valores estão entre os limites definidos por µ ± σ ; 95,46% dos valores estão entre os limites definidos por µ ± 2σ ; e 99,73% dos valores estão entre os limites definidos por µ ± 3σ. Aproximação da Binomial pela Normal: Muitas situações podem ser convenientemente descritas pela distribuição binomial. O que ocorre é que muitas vezes temos um grande número de observações (n grande), tornando os cálculos muito trabalhosos. O uso da normal para aproximar a binomial apresenta dificuldade conceitual. A distribuição normal é contínua e, enquanto a binomial é discreta. A transição do caso discreto para o contínuo envolve a consideração de valores não-inteiros associados às variáveis contínuas, mas não a variáveis discretas. O problema se resolve atribuindo intervalos da distribuição contínua para representar valores inteiros comuns as variáveis discretas. Por exemplo: os valores contínuos de 6,5 e 7,5 se associam ao inteiro 7. Assim para determinar a probabilidade binomial de exatamente 7 sucessos, deveríamos usar uma aproximação normal baseada na probabilidade (área abaixo da curva) entre 6,5 e 7,5. Exemplo: Numa linha produtiva a proporção de defeituosos é 0,4, em 20 itens que foram tomados aleatoriamente da produção. A probabilidade de 3 itens defeituosos é: P(X=3) = 3 20 3 20 3 0 4 1 0 4C , ( , ) − − = 0,0124 Como a normal é expressa em função da média e desvio padrão, calcula-se: µ = n.p = 20. 0,4 = 8 e σ = np p( )1− = 20 0 4 0 6. , . , = 2,2 Aulas 12 a 20 – Profa. Liane MAT02219 "exatamente 3" deve ser interpretado como o intervalo de 2,5 a 3,5 na curva normal. P(2,5 < X < 3,5) = P(X<3,5) - P(X<2,5) = P( Z < 3,5 - 8 / 2,2 ) - P ( Z < 2,5 - 8 / 2,2) = P( Z < -2,05) – P(Z < -2,5) = φ ( -2,05) - φ ( -2,5) = 0,0202 – 0,0062 = 0,0140 A normal fornece uma boa aproximação da binomial quando n.p > 5. 8.8.2 Distribuição de Probabilidade Exponencial: O modelo da distribuição Exponencial é o seguinte: f x e xx( ) ;= ≥−λ λ 0 onde : λ > 0 é uma constante. A média e o desvio padrão da distribuição exponencial são: µ λ = 1 σ λ = 1 A distribuição exponencial acumulada vem dada por: 0 1}{)( 0 ≥ −==≤= −−∫ a edxeaXPaF a a x λλλ A distribuição Exponencial é largamente utilizada no campo da confiabilidade, como um modelo para a distribuição dos tempos até a falha de componentes eletrônicos. Nessas aplicações o parâmetro λ representa a taxa de falha para o componente, e 1/λλλλ é o tempo médio até a falha. Exemplo: Suponha que uma máquina falhe em média uma vez a cada dois anos. Qual a probabilidade de que a máquina não falhe durante o próximo ano? Ora: 1/λ = 2 assim λ =0,5. P(t > 1) = 1 - P(t ≤ 1) = [ ]1 1 0 5− − −e , (1) = 0,607 Observação: Na distribuição de Poisson, a variável aleatória é definida como o número de ocorrências em determinado período, sendo a média das ocorrências no período definida como λ. Na distribuição Exponencial a variável aleatória é definida como o tempo entre duas ocorrências, sendo a média de tempo entre ocorrências de 1/λ. Por exemplo, se a média de atendimentos no caixa bancário é de λ = 6/min, então o tempo médio entre atendimentos é 1/λ = 1/6 de minuto ou 10 segundos. Aulas 12 a 20 – Profa. Liane MAT02219 8.2.3.Exercícios de distribuições de probabilidade contínuas 1) Uma peça cromada resiste a um ensaio de corrosão por três dias em media, com desvio padrão de 5 horas. Calcule: a)A probabilidade de uma peça resistir a mais que 3,5 dias. b)A probabilidade de uma peça resistir entre 60 e 70 horas. c) Sabe-se que 71,9% das peças resistem menos que um certo número de horas, qual é esse valor? 2) Uma pessoa tem 20 minutos para chegar ao escritório. Para tal pode escolher entre dois caminhos (X ou Y). Sabe-se que o tempo para percorrer o caminho X é normal com média 18 minutos e desvio-padrão de 5 minutos e que o tempo para percorrer o caminho Y é normal com média 19 minutos e desvio-padrão de 2 minutos. Qual a melhor escolha? 3) A nota média de um exame final foi de 72 com desvio padrão 9. Sabe-se que 10% dos melhores alunos receberam classificação A. Qual a nota mínima que um aluno deve obter para classificar-se com A? 4) Numa fábrica de tintas onde o produto é acondicionado automaticamente em latas com aproximadamente 20 Kg. Verificou-se que 32% das latas estão com peso inferior a 20 Kg. A máquina de enlatar foi regulada, aumentando-se o peso médio das latas em 100g, e então a porcentagem delatas com peso inferior a 20 Kg caiu para 15%. De quanto deve ser novamente aumentado o peso médio, para que esta porcentagem se reduza a 5%? Assuma distribuição normal. 5) No engarrafamento de um refrigerante, a quantidade de líquido colocado na garrafa é uma variável normal com média 292 cm3 e desvio-padrão de 1 cm3. Garrafas com menos de 290 cm3 são devolvidas para completar o enchimento. Calcule: a) qual a porcentagem de garrafas devolvidas. b) considerando que as garrafas em que se completa o enchimento ficam com mais de 292 cm3, qual a probabilidade, em meia dúzia de garrafas, de encontrar-se uma ou mais garrafas com menos de 291 cm3? 6) Suponha que o tempo médio entre o pedido e o atendimento num grande restaurante seja 10 minutos com distribuição exponencial. Calcule a probabilidade de um cliente esperar mais que 10 minutos? Que a espera não seja superior a 3 minutos. 7) O tempo de atendimento numa oficina é bem aproximado por uma distribuição exponencial com média de 4 minutos. Qual a probabilidade de: a) espera superior a 4 min b) espera inferior a 4 min c) exatamente 4 min 8) Sabe-se que lâmpadas elétricas têm distribuição aproximadamente exponencial, com vida média de 1000 horas. Qual a probabilidade de uma lâmpada queimar antes de: a) 500 horas b) 2000 horas 9) Para o exercício 8, após quantas horas ter-se-ão queimado 50% das lâmpadas? Aulas 12 a 20 – Profa. Liane MAT02219 9. AMOSTRAGEM 9.1. Introdução Na prática, raramente se sabe qual distribuição representa a variável. Obter a distribuição exata de alguma variável é muito dispendioso e as vezes impraticável, pois seria necessário ter todos elementos da população. Por exemplo, para saber o tempo de vida (número de horas que duram em média) para certa marca de lâmpada, é preciso testar todas as lâmpadas até queimarem. Assim, a solução é selecionar parte dos elementos (amostra), analisá-los e tirar conclusões para o todo (população). Este é o objetivo da Estatística Inferencial. Logo, Estatística inferencial é o ramo da estatística que se preocupa em obter informações sobre o todo a partir de parte deste todo, ou seja, tomar decisões com base em dados colhidos de uma amostra. Por falta de tempo e recursos econômicos raras vezes estuda-se individualmente todos os sujeitos da população na qual se está interessado. Em lugar disso, o pesquisador estuda uma amostra para generalizar as conclusões para a população. Utilizando uma amostra tem-se uma maior confiabilidade, pois com poucos dados pode-se dar atenção aos casos individuais, além disto, é mais operacional, pois tem-se menos entrevistadores a controlar. Para que as conclusões sejam confiáveis, é necessário que as amostras sejam obtidas de processos adequados que garantam a sua representatividade, ou seja, que a amostra reproduza as mesmas características da população no que diz respeito as variáveis de interesse. Assim uma empresa que fabrica lâmpadas pode selecionar algumas unidades (amostra) e ao testá-las (ver quanto tempo duram até que queimem) e com base nestas unidades verificar o comportamento de toda a produção. 9.2.Técnicas de amostragem *Probabilísticas: São aquelas em que a seleção das unidades é aleatória de tal forma que cada elemento da população tem uma probabilidade de pertencer a amostra. *Não Probabilísticas: São aquelas que não envolvem aleatoriedade na seleção dos elementos. Por exemplo: amostras intencionais, em que o pesquisador escolhe deliberadamente os elementos da amostra ou amostra de voluntários. Aulas 12 a 20 – Profa. Liane MAT02219 Para que se possam utilizar as técnicas de inferência estatística é necessário que o processo de escolha da amostra seja probabilístico, pois somente neste caso é possível avaliar a probabilidade de erro. 9.3. Técnicas de Amostragem Probabilística *Amostragem Aleatória Simples (a.a.s): Também chamada de casual ou randômica. A característica principal é que todos os elementos têm igual probabilidade de pertencer à amostra, então uma população com N elementos esta probabilidade é de 1/N. Esta característica implica que todos os elementos da população devem ser identificados antes da extrair a amostra, exigência preenchida mediante a obtenção (elaboração) de uma lista que contenha todos os elementos da população. Para garantir que a seleção dos elementos seja aleatória é necessário utilizar um mecanismo tal como: a tabela de números aleatórios que é desprovida de qualquer lei de informação (veja a seguir uma parte de uma tabela de números aleatórios) ou então extrair bolas de uma urna. Parte de uma tabela aleatória: C O L U N A 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 L 1 2 3 1 5 7 5 4 8 5 9 0 1 8 3 7 I 2 6 2 4444 9999 7777 0 8 8 6 9 5 2 3 0 3 N 3 0 4 5 5 5 0 4 3 1 0 5 3 7 4 3 H 4 1 1 8 3 7 4 4 1 0 9 6 2 2 1 3 A 5 1 6 0 3 5 0 3 2 4 0 4 3 6 2 2 Por exemplo, em uma empresa com 562 funcionários, deseja-se verificar a satisfação destes com relação ao refeitório local. Os funcionários desta empresa estão cadastrados funcionalmente de 1 a 562, temos então uma listagem (numérica) de todos os funcionários. De posse da listagem, encontra-se o tamanho da amostra n que foi calculada em 10 funcionários (futuramente iremos verificar com procede-se com este cálculo). Passa-se então a utilizar a tabela de números aleatórios escolhendo quais serão os 10 funcionários que irão compor a amostra fazendo então a pesquisa. Aulas 12 a 20 – Profa. Liane MAT02219 Pode-se iniciar a consulta à tabela iniciando em qualquer ponto, movendo-se em qualquer sentido. O início será na coluna 3 e na linha 2, andando para a direita. Como o valor máximo da população em questão é 562, toma-se números com três algarismos, assim a amostra será os funcionários que apresentem os seguintes cadastros: 497 => primeiro elemento da amostra 088 => segundo elemento da amostra 695 => fora do intervalo (entre 1 e 562), este valor deve ser desconsiderado 230 => terceiro elemento da amostra 304 => quarto elemento da amostra 555 => quinto elemento da amostra 043 => sexto elemento da amostra 105 => sétimo elemento da amostra 374 => oitavo elemento da amostra 311 => nono elemento da amostra 837 => fora do intervalo (entre 1 e 562), este valor deve ser desconsiderado 441 => décimo elemento da amostra Obs.: Números repetidos também devem ser desconsiderados. *Amostragrem Aleatória Sistemática: Também requer uma listagem dos elementos da população, mas neste caso escolhe-se cada k-ésimo elemento da lista, onde k é obtido dividindo-se o tamanho da população pelo tamanho da amostra ( k=N/n) . Assim se N=200 e n=10, então k=200/10=20. Isto significa que será escolhido um elemento de 20 em 20 elementos. Pode-se consultar uma tabela de números aleatórios para determinar onde iniciar. Por exemplo, na tabela forneceu o número 09, escolhe-se o 9o elemento, 29o elemento, 49o elemento, 69o elemento, até completar a amostra. É preciso ter cuidado com o caráter periódico, como por exemplo, se na amostra são selecionadas as casas localizadas na esquina. Uma casa na esquina pode ter maior valor, pagar mais imposto, sofrer mais ruído, enquanto que as casas no meio do quarteirão apresentam características bem diferentes. *Amostragem Aleatória Estratificada: Pode ser utilizada quando existem subgrupos dentro da população que são compostos de itens similares (estratos). A lógica do procedimento da amostragem aleatória estratificada é que, dispondo os itens da população em subgrupos homogêneos, que a variabilidade dentro dos estratos é menor que a população global, fazendo com não seja necessário investigar uma grande quantidadede itens dentro de cada estrato, isto é nos leva a um tamanho de amostra menor. Após identificarmos os estratos que devem apresentar certas diferenciações entre eles, realizamos uma amostragem aleatória simples em cada um dos estratos. Aulas 12 a 20 – Profa. Liane MAT02219 Um exemplo de aplicação de amostragem aleatória estratificada seria no estudo do tempo que os funcionários de uma empresa despendem com lazer, os nossos estratos poderiam ser: faxineiras, secretárias, diretores. *Amostragem Aleatória por Conglomerados: Pode ser utilizada quando é possível identificar dentro da população subgrupos que representam uma miniatura da população. Estes subgrupos são chamados de conglomerados, diferenciando-se dos estratos por não haver homogeneidade interna (dentro de cada conglomerado os elementos são tão distintos quanto dentro da população). Os conglomerados são, em geral, grupos de elementos que possuem em estreito contato físico, tal como: casas, quarteirões, bairros. 9.4. Técnicas de Amostragem Não-Probabilística * Amostragem por Quotas: Neste procedimento, diversas características de uma população, tais como: idade, sexo, classe social são amostrados nas mesmas proporções em que figuram na população. * Amostragem por Julgamento: A idéia é de que o senso comum ou um julgamento equilibrado podem ser usados na seleção da amostra. Por exemplo, um médico só poderá realizar um estudo com os pacientes disponíveis ou com os que se dispuserem a colaborar. Aulas 12 a 20 – Profa. Liane MAT02219 9.5 Exercícios de técnicas de amostragem 1) No que consiste a estatística inferencial? 2) Qual a diferença entre população e amostra? 3) Explique por que é mais vantajoso utilizar a amostra no lugar do censo (estudo da população). 4) Cite três exemplos de amostragem. 5) Quais os dois métodos de amostragem (esquemas de amostragem) existentes? 6) Explique qual a vantagem de se utilizar um método de amostragem probabilística? 7) Na sua opinião é seguro fazer inferências utilizando uma amostra não-probabilística? O que pode acontecer se isso for feito? 8) Numere os passos necessários para compor uma a.a.s. (amostra aleatória simples ou amostra casual simples) sem reposição. 9) Os empregados de uma empresa têm números de matrículas em seus crachás consecutivamente de 101 a 873. Deve-se montar um comitê de segurança de 10 pessoas. Descreva o procedimento para obter uma amostra aleatória simples utilizando a tabela de números aleatórios e qual é a amostra. (Inclua também: quantos algarismos devem ser lidos e qual a posição e direção utilizadas na tabela) 10) Cite uma vantagem e uma desvantagem da amostragem aleatória sistemática, exemplificando. 11) Qual a diferenciação existente entre a amostragem aleatória estratificada e a amostragem aleatória por conglomerados. 12) Explique rapidamente cada um dos tipos de amostragem não probabilística. Aulas 12 a 20 – Profa. Liane MAT02219 10. Distribuição Amostral A finalidade da amostragem é obter uma indicação do valor de um ou mais parâmetros de uma população, tais como: média, variância da população ou proporção. Quando extraímos aleatoriamente repetidas amostras de uma mesma população a estatística amostral varia de uma amostra para a outra, chamamos esta variação de variabilidade amostral. O objetivo é saber o quão próximo está a estatística amostral do verdadeiro parâmetro. Para isso três fatores são importantes: • o estudo da distribuição de probabilidade da estatística amostral; • o tamanho da amostra (grandes amostras têm menor variabilidade entre as estatísticas do que em pequenas amostras) e ainda • a variabilidade na população (populações com muita variabilidade produzem estatísticas amostrais com maior variabilidade). A variabilidade amostral pode ser expressa em uma distribuição de probabilidade que associa aos possíveis resultados de uma estatística amostral suas respectivas probabilidades. *PARÂMETROS e ESTATÍSTICAS: *Parâmetros são medidas estatísticas obtidas através do censo para descrever uma característica da população. *Estatísticas são medidas características obtidas através de uma amostra. Medida Parâmetro Estatística Média µ x Desvio padrão σ s Variância σ 2 s2 Proporção Π p 10.1. Distribuição Amostral das Médias Uma distribuição amostral das médias indica a probabilidade de ocorrência de uma média amostral. As médias amostrais tendem a agrupar-se em torno da média populacional. Aulas 12 a 20 – Profa. Liane MAT02219 Distribuição amostral de X - População Normal A média das médias amostrais é igual a verdadeira média populacional. E X[ ] = µ E o desvio padrão da distribuição amostral das médias será dado por: x nσ σ = OBS.: Para a distribuição amostral das médias quando tomamos a amostra sem reposição de uma população finita, o desvio padrão de X necessita de uma correção: fator de correção: N n N − − 1 assim o desvio padrão é dado por: σ X = σ n N n N − − 1 * Teorema do Limite Central: - Se a população sob amostragem tem distribuição normal, a distribuição das médias amostrais também será normal. - Mesmo que a população não seja considerada distribuição normal, a distribuição das médias amostrais será aproximadamente normal para grandes amostras. x N n≅ ( , / )µ σ Logo, Z x n = − µ σ Aulas 12 a 20 – Profa. Liane MAT02219 Exemplo/exercício Suponha que uma população tenha distribuição normal e seja composta por cinco valores: 2; 3; 6; 8; 11. a) Calcule a idade média. (média da população) b) Calcule o desvio padrão da idade. (desvio padrão da população) c) Componha todas as amostras de tamanho 2 com reposição (ou seja, o valor retirado pode participar da amostra novamente, por exemplo, a amostra 2; 2). d) Calcule as médias da amostras obtidas no item c. e) Calcule a média das médias obtidas no item d. f) Compare o valor da média das médias amostrais (item e) com a média da população (item a). g) Calcule o valor do desvio padrão das médias amostrais obtidas no item d. h) Verifique se o valor obtido no item g (desvio padrão das médias amostrais) é igual a razão entre o desvio padrão da população (item b) pela raiz quadrada do tamanho da amostra (neste exercício igual a .......) i) Componha todas as amostras de tamanho 2 sem reposição (ou seja, o valor retirado não pode participar da amostra novamente, por exemplo, a amostra 2;2 não é uma amostra possível no caso sem reposição) j) Calcule as médias da amostras obtidas no item i. k) Calcule a média das médias obtidas no item j. l) Compare o valor da média das médias amostrais (item k) com a média da população (item a). m) Calcule o valor do desvio padrão das médias amostrais obtidas no item j. n) Verifique se o valor obtido no item m (desvio padrão das médias amostrais) é igual a razão entre o desvio padrão da população (item b) pela raiz quadrada do tamanho da amostra (neste exercício igual a .......) multiplicada pelo fator de correção 1− − N nN . o) Conclua sobre as análises realizadas. 10.2. Distribuição Amostral das Médias quando σ é Desconhecido Quando desconhecemos o desvio-padrão populacional utilizamos como estimativa o valor de s. Desta forma, o desvio-padrão das médias (ou erro padrão) será dado por: σ x s n = , onde s = 2 1 1 ( )ix x n i n −∑ − = Para grandes amostras, podemos admitir que a variação dos valoresobservados na amostra apresente variação semelhante a da população. Porém, para pequenas amostras isso pode não ser verdadeiro. Neste caso, a distribuição adequada é a distribuição t-student. Aulas 12 a 20 – Profa. Liane MAT02219 Assim, a estatística: ( )x s n t student − ≈ − µ com n-1 graus de liberdade. Esta distribuição é muito parecida com a distribuição normal, sendo simétrica em torno da média zero, porém tem maior dispersão quando comparada com a normal. A forma da distribuição t-student depende do tamanho da amostra. Quanto menor o tamanho da amostra, menor serão os graus de liberdade e mais dispersa (“achatada") será a curva. 10.3. Distribuição Amostral do Número de Sucessos na amostra e da Proporção da amostra Do cálculo de probabilidades temos que a distribuição amostral do número de sucessos d será uma distribuição binomial de parâmetros n e π e assim: E[d] = nπ e VAR[d] = nπ(1-π) A proporção p, que simplesmente é o quociente de d pelo tamanho da amostra n. Aplicando propriedades algébricas, temos que: E[p] = π e VAR [p] = n )1( ππ − Se a amostra n for suficientemente grande, podemos aproximar as distribuições de d e p por distribuições normais com as respectivas médias e desvios padrões. Em termos práticos, em geral, podemos considerar que a amostra será suficientemente grande, para efeito dessa aproximação, se np ≥ 5 e n(1-p) ≥ 5. Aulas 12 a 20 – Profa. Liane MAT02219 10.4. Exercícios de distribuição amostral 1) Uma variável aleatória X tem distribuição normal com média 100 e desvio padrão 10. a) Qual a P(90 < X < 110)? b) Se x é a média de uma amostra de 16 elementos retirados dessa população, calcule P( 90< x< 110). c) Desenhe, num único gráfico, as distribuições de X e x . d) Que tamanho deveria ter a amostra para que P( 90< x< 110) = 95%. 2) Certos amortecedores fabricados por uma empresa têm uma vida média de 800 dias e desvio padrão de 60 dias. Determine a probabilidade de que a média de uma amostra aleatória de 16 amortecedores: a) esteja entre 770 e 830 dias b) seja menor que 785 dias. 3) Os pesos de pacotes recebidos por um depósito têm uma média de 150 Kg e um desvio padrão de 25 Kg. Qual a probabilidade de 25 pacotes, retirados aleatoriamente e carregados em um elevador, não excedem o limite de segurança deste, que é de 4.100 Kg? 4) Calcular os valores de t para os quais a área da extremidade direita da distribuição t de Student é de 5%, quando o número de graus de liberdade for igual a: a) 16 b) 27 c) 200 5) Se a variável X tem distribuição t de Student com 10 gl (graus de liberdade), determinar a constante K de modo que: a) P(X > K) = 0,05 b) P(X > K) = 0,90 6) Uma pesquisa de opinião pública numa comunidade mostrou 46% das pessoas são favoráveis a um projeto de lei. Determinar a probabilidade de que a maioria das pessoas, de um conjunto amostral de 100 pessoas, seja favorável a tal projeto. 7) Um fabricante faz a remessa de 1.000 lotes, de 100 parafusos cada um. Se 5% dos parafusos são defeituosos, em quantos lotes pode-se esperar que existam: a) Menos que 90 parafusos perfeitos. b) 98 ou mais parafusos perfeitos. Aulas 12 a 20 – Profa. Liane MAT02219 11. Estimação O objetivo da inferência estatística é obter conclusões a respeito de populações através de uma amostra extraída dessa população. Uma variável aleatória é caracterizada por sua distribuição de probabilidade. Assim, estamos interessados em fazer inferências a respeito dos parâmetros da distribuição de probabilidade. Como estes parâmetros quase sempre são desconhecidos, iremos estimá-los a partir dos dados de uma amostra. A Estatística Inferencial compreende a Estimação e Teste de hipótese. A estimação é um processo que consiste em utilizar dados amostrais (retirados segundo amostragem probabilística) a fim de obter conclusões sobre os parâmetros da população que são desconhecidos. É através da estatística da amostra representada por um estimador que fornece uma estimativa dos parâmetros populacionais que se realiza o processo de estimação. * DEFINIÇÕES: * Estimar: Através de dados amostrais fornecer um valor para algum parâmetro populacional desconhecido. * Estimador: É uma função matemática obtida a partir de elementos da amostra que será no processo de estimação o parâmetro desejado. * Estimativa: É um valor numérico particular de um estimador, obtido a partir de dados de uma amostra. Exemplo: Numa população de municípios do estado desejamos estimar a média de investimento da receita municipal na área industrial. Se investigássemos todos municípios teríamos a média populacional (µ). Ao retirarmos uma amostra aleatória, estaríamos estimando a média populacional pela média amostral x . Logo, x é um estimador de µ. E uma estimativa seria o valor de x para esta amostra particular. Propriedade dos Estimadores: * NÃO-TENDENCIOSO (não-viciado, justo ou não viesado): Um estimador é não tendencioso se sua média for igual ao parâmetro. Ao se extrair todas as possíveis amostras de mesmo tamanho (n) de uma única população e calcularmos para cada uma delas os respectivos valores da estatística amostral e se a média aritmética destes valores coincidir com o parâmetro, estaremos diante de um estimador não-tendencioso. Exemplo: E(x ) = µ , isso significa dizer que x é um estimador não-tendencioso de µ . Aulas 12 a 20 – Profa. Liane MAT02219 * EFICIENTE: Quando comparamos dois estimadores, dizemos que é eficiente o que apresentar a menor variância. * SUFICIENTE: Um estimador é suficiente se contém o máximo de informações com referência ao parâmetro por ele estimado, ou seja, quando consegue sumarizar, "condensar" a informação em uma amostra a respeito do parâmetro a ser estimado. * CONSISTENTE: Entre dois estimadores para o mesmo parâmetro, será considerado consistente aquele que for não tendencioso e de variância mínima. A estimação pode ser por ponto ou por intervalo. A estimação por ponto é um valor obtido pelos cálculos sobre os valores observados de uma variável que serve como aproximação do parâmetro. A estimação por intervalo fornece um intervalo em torno da estimativa por ponto, de modo que este intervalo tenha uma probabilidade de conter o parâmetro. 11.1. Estimação por Ponto Consiste em fornecer a melhor estimativa possível para o parâmetro que será estimado através de um único valor. Exemplos: 1) A melhor estimador da média populacional µ é x , pois é um estimador não tendencioso, eficiente, suficiente e consistente. 2) Sabendo que a variância da população σ µ 2 2 1= − = ∑ ( )x N i i N , poderíamos estimá- la por: s ix x n i n 2 1 2 = − = ∑ ( ) , utilizando x , pois não conhecemos µ . Porém este estimador é tendencioso para σ 2, pois a média dos valores desta estatística para cada amostra possível de tamanho n é diferente de σ 2 . Para tornar este estimador não tendencioso é necessário multiplicá-lo por n n −1 . Teremos, então: s n n x x n x x n i i n i i n 2 2 1 2 1 1 1 = − − = − − = = ∑ ∑ . ( ) ( ) Aulas 12 a 20 – Profa. Liane MAT02219 Exemplo: Um pesquisador está estudando a resistência de determinado material sob certas condições. Uma amostra aleatoriamente escolhida de 9 elementos forneceu os seguintes valores: 4,9 7,0 8,1 4,5 5,6 6,8 7,2 5,7 6,2. Estime a média e o desvio-padrão da resistência deste material. 11.2. Estimação por intervaloA estimação por intervalo nos fornece um intervalo de valores centrados na estatística amostral, no qual julgamos estar o parâmetro com uma probabilidade conhecida de erro. Vimos que para uma população podemos retirar K amostras diferentes para um determinado tamanho de amostra n. Cada amostra possível tem um valor como estimativa e cada estimativa fornecerá um intervalo diferente para o parâmetro. Assim, temos uma probabilidade (1-α) de que o valor do parâmetro esteja contido no intervalo estimado, chamado nível de confiança. Por esta razão, chamamos de intervalos de confiança. O intervalo de confiança dependerá da distribuição amostral do estimador que foi utilizado para estimar o parâmetro. 11.2.1. Estimação por Intervalo para a Média Populacional Sabemos que as médias se distribuem segundo uma distribuição normal com média µ e desvio-padrão σ n . Quando retiramos uma amostra, a média x é uma das muitas médias possíveis de se obter de uma população. Assim se adotarmos um nível de confiança de 95%, poderemos dizer que 95% das médias amostrais estarão dentro de 1,96 erros padrão. Aulas 12 a 20 – Profa. Liane MAT02219 *Erro Absoluto Máximo de Estimação: O erro absoluto máximo de estimação diz respeito a diferença entre a média amostral e a média populacional. ε µ= −x Sabendo que o intervalo de confiança tem centro na média amostral, é determinado da seguinte maneira: x ± ε onde: ε σ = z n Quando n < 30 e σ desconhecido, usamos a distribuição t-student com n-1 graus de liberdade, sendo ε = t s n . *CASO 1: INTERVALO DE CONFIANÇA PARA MÉDIA COM VARIÂNCIA POPULACIONAL CONHECIDA. Para uma variável aleatória X , com média desconhecida e variância conhecida σ 2, uma amostra aleatória é retirada e calcula-se x . O intervalo de confiança com nível de confiança 1− α é dado por: x Z n x Z n − ≤ ≤ +α α σ µ σ 2 2 . . Exemplo: Uma máquina enche pacotes de café com uma variância igual a 100 g 2 . Ela estava regulada para enchê-los com 500g, em média. Agora ela se desregulou, e queremos saber qual a nova média µ . Uma amostra de 25 pacotes apresentou média igual a 485g. Estime a média por intervalo ao nível de 95% de confiança: Aulas 12 a 20 – Profa. Liane MAT02219 *CASO 2: INTERVALO DE CONFIANÇA PARA MÉDIA DE UMA DISTRIBUIÇÃO NORMAL COM VARIÂNCIA σ 2 DESCONHECIDA. Suponha que X seja uma variável aleatória de uma distribuição normal com média µ desconhecida e variância σ 2 desconhecida, retira-se um amostra aleatória e calcula-se a média amostral x e a variância amostral s2 . Utilizando a distribuição t-student: x t s n x t s nn n − ≤ ≤ +− −α αµ2 1 2 1, , . . OBS: Quando n > 30, se pode utilizar a distribuição normal ou a distribuição t-student. Exemplo: Um pesquisador está estudando a resistência de um determinado material sob determinadas condições. Ele sabe que essa variável é normalmente distribuída. Foi retirado uma amostra de 9 unidades 4,9 ; 7,0 ; 8,1; 4,5 ; 5,6; 6,8 ; 7,2 ; 5,7; 6,2. a) Determine um intervalo de 90% de confiança para a resistência média populacional. b) Determine um intervalo de 95% de confiança para a resistência média populacional. c) Verifique os resultados de (a) e (b), e conclua a respeito do erro de estimação e o nível de confiança? 11.2.2. Estimação por Intervalo para a Proporção Populacional: *Intervalo de confiança para a proporção: A distribuição de proporções amostrais indica o quão provável é determinado conjunto de proporções amostrais. Seja, Π: proporção populacional de determinada característica e p: proporção amostral de dessa característica então o parâmetro Π de uma distribuição binomial, por exemplo, a proporção de peças defeituosas, poderá ter em uma amostra de n elementos tomada, "x" observações são possuidoras de determinada característica, a proporção de defeituosos na amostra estimado por p x n = . Para n<30 utilizaríamos a distribuição Binomial, lembrando que a distribuição amostral das proporções segue uma distribuição binomial. Aulas 12 a 20 – Profa. Liane MAT02219 Quando n>30 e p>0,1, poderemos usar a distribuição normal como aproximação da binomial resultando no intervalo de confiança: p Z p p n p Z p p n − − ≤ ≤ + − α α 2 2 1 1( ) ( ) Π Exemplo: Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobre determinado produto e 60% destas pessoas preferiam a marca A. Estime um intervalo de 95% de confiança para a proporção populacional das pessoas que preferem a marca A. 11.3. Tamanho mínimo da amostra *PARA ESTIMAR MÉDIA POPULACIONAL: Para determinarmos o tamanho da amostra, dependemos dos seguintes fatores: � O nível de confiança a ser utilizado na estimação; � O valor da variância absoluta da variável; � O erro absoluto máximo de estimação: � O custo financeiro de pesquisa Quando conhecemos a variância populacional, podemos usar a seguinte fórmula: n Z = 2 2 2 σ ε Exemplo: Qual o tamanho da amostra necessário para estimar a média de uma população cujo desvio-padrão é aproximadamente 4 mm, com 98% de confiança e precisão de 0,5 mm? Sem conhecimento da variabilidade populacional estimamos a variância populacional através de uma amostra piloto de tamanho arbitrário. Assim: n tn S= − ( ' , . )1 2 2 2 2 α ε Aulas 12 a 20 – Profa. Liane MAT02219 Exemplo: Foram realizadas 20 medidas do tempo gasto (em minutos) para se fabricar um componente industrial como uma amostra piloto, com o objetivo de estimarmos o tempo médio de produção(populacional), obtendo-se: 13 15 12 14 17 15 16 15 14 16 17 14 16 15 15 13 14 15 16 15 Verifique se estes dados são suficientes para estimar a média populacional com 95 % de confiança e precisão de 30 seg. Caso a amostra não seja suficiente, qual é o tamanho de amostra complementar? *PARA ESTIMAR A PROPORÇÃO POPULACIONAL: Analogamente ao caso da média têm-se: n Z = α ε 2 2 2 . p ^ . (1- p ^ ) onde, p ^ é a proporção populacional ou alguma idéia da mesma obtida em estudos anteriores similares. Caso não se saiba o valor de p ^ , podemos estimá-lo através de uma amostra piloto n' ou usar p = 0,5. Exemplo: Numa pesquisa de mercado, 57 das 150 pessoas entrevistadas afirmam que seriam compradoras de certo produto a ser lançado. Essa amostra é suficiente para estimar a proporção real de futuros compradores, com uma precisão de 0,08 e confiança 95%?
Compartilhar