Baixe o app para aproveitar ainda mais
Prévia do material em texto
FACULDADE PITÁGORAS DE SÃO LUÍS CURSO DE Engenharia DE PRODUÇÃO Estatística E PROBABILIDADE MATERIAL PARTE 3 Prof. Oton ribeiro SÃO LUÍS – MA 2014 ESTATÍSTICA E PROBABILIDADE – PROF. OTONILSON RIBEIRO Página 2 DISTRIBUIÇÃO DE PROBABILIDADE 1. Introdução Nessa unidade estudaremos as distribuições de probabilidades discretas e contínuas. 2. Distribuição de probabilidade discreta 2.1 Variável aleatória É uma variável que tem um valor único (determinado aleatoriamente) para cada resultado do experimento. Exemplos de variáveis aleatórias: a) números de alunos com notas abaixo da média; b) diâmetro das peças que saem da linha de produção; c) números de múltiplo de 3 no lançamento de um dados. Uma variável 𝑋 é dita discreta quando assume valores inteiros e finitos e dita contínua quando assume valores num conjunto infinito ou dentro de um intervalo. Os exemplos acima (a) e (c) são exemplos de variável discreta e (b) é exemplo de variável contínua. Quando conhecemos os valores de uma variável aleatória, podemos atribuir uma probabilidade a cada um desses valores. Portanto, conhecendo os valores de uma variável e suas probabilidades, temos uma distribuição de probabilidade. Seja 𝑋 uma variável aleatória que pode assumir os valores x1, x2, x3, ..., xn, a cada valor xi correspondem pontos do espaço amostral. E associando cada valor xi a probabilidade pi de ocorrência dos tais pontos no espaço amostral, isto é, os valores x1, x2, x3, ..., xn, correspondem, respectivamente, a p1, p2, p3, ..., pn. Logo, está definida uma distribuição de probabilidade, onde ∑ 𝑝𝑖 = 1. Considere o experimento aleatório lançamento de duas moedas, onde 𝑋(v.a.) representa a ocorrência de face cara. Exemplo Uma urna contém 10 bolas numeradas de 1 a 10. Seja 𝑋 o número de divisores do número sorteado. Calcule o número médio e o desvio padrão de divisores do número sorteado. ESTATÍSTICA E PROBABILIDADE – PROF. OTONILSON RIBEIRO Página 3 2.2 Esperança e Variância Matemática Existem características numéricas que são muito importantes em uma distribuição de probabilidade de uma variável aleatória discreta. São os parâmetros da distribuição. O primeiro parâmetro é a esperança matemática que é a média de uma variável aleatória e o segundo é a variância que nos dá o grau de dispersão de probabilidade em torno da média da variável aleatória. 2.2.1 Esperança Matemática A esperança matemática é um número real de média aritmética ponderada. Dada por: 𝐸(𝑋) = ∑ 𝑥𝑖 ∙ 𝑝(𝑥𝑖) 𝑛 𝑖=1 = 𝑥1 ∙ 𝑝(𝑥1) + 𝑥2 ∙ 𝑝(𝑥2) + ⋯ + 𝑥𝑛 ∙ 𝑝(𝑥𝑛) Notação: 𝐸(𝑥), 𝜇(𝑥), 𝜇𝑥 , 𝜇 2.2.2 Variância Matemática 𝑉𝑎𝑟(𝑋) = 𝐸(𝑋2) − [𝐸(𝑋)]2 Onde: 𝐸(𝑋2) = ∑ 𝑥𝑖 2 ∙ 𝑝(𝑥𝑖) 𝑛 𝑖=1 = 𝑥1 2 ∙ 𝑝(𝑥1) + 𝑥2 2 ∙ 𝑝(𝑥1) + ⋯ + 𝑥𝑛 2 ∙ 𝑝(𝑥𝑛) Exemplo 1: No lançamento de duas moedas, X representa a ocorrência da face cara. X P(X) X •P(x) X2 •P(x) Obs. A variância é um quadrado, e muita das vezes o resultado torna-se artificial. Por exemplo, a altura média de um grupo de pessoas é 1,70 m, e a variância, 25 cm2. Fica estranho cm2 em altura. Então, para contornarmos esse problema, definimos desvio padrão. Desvio padrão da variável X é raiz quadrada da variância de X, isto é: 𝜎𝑥 = √𝑉𝑎𝑟(𝑋) Nos exemplos { 𝜎𝑥 = √0,25 = 0,5 𝜎𝑦 = √6,8 = 2,61 Exemplos 1) A função de probabilidade da variável 𝑋 é: 𝑃(𝑋) = 1 5 , para 𝑋 = 1, 2, 3, 4, 5. Calcule 𝐸(𝑋)e 𝐸(𝑋2). 2) Um jogador lança um dado. Se aparecerem os números 1, 2 ou 3, recebe R$ 10,00. Se, no entanto, aparecer 4 ou 5, recebe R$ 5,00. Se aparecer 6, ganha R$ 20,00. Qual o ganho médio do jogador e desvio padrão? ESTATÍSTICA E PROBABILIDADE – PROF. OTONILSON RIBEIRO Página 4 2.3 Distribuição binomial Suponhamos n tentativas independentes de um mesmo experimento aleatório. Cada tentativa admite dois resultados: sucesso com probabilidades p e fracasso com probabilidade q, 𝑝 + 𝑞 = 1. As probabilidades de sucesso e fracasso são as mesmas para cada tentativa. Seja X: número de sucessos em n tentativas. Determinaremos a função de probabilidades da variável X, isto é, 𝑃(𝑋 = 𝑘) pela fórmula: 𝑃(𝑋 = 𝑘) = ( 𝑛 𝑘 ) 𝑝𝑘 ∙ 𝑞𝑛−𝑘 Onde: 𝑝 = probabilidade do sucesso 𝑞 = probabilidade do fracasso 𝑛 = número de eventos estudados. 𝑘 = número de sucessos Exemplos 1) A probabilidade de um atirador acertar o alvo é de 75%, fazendo 10 tentativas. Determine a probabilidade de acertar o alvo 4 vezes. 2) No período passado no Curso de Engenharia Civil – 3° período, da Faculdade Pitágoras – São Luís. Calculou-se a probabilidade de um aluno, escolhido ao acaso, ser aprovado na Disciplina Estatística e encontrou-se 20%. Em uma amostra formada por cinco 10 alunos, calcule a probabilidade de: (a) 3 alunos serem aprovados; (c) pelo menos um aluno ser aprovado; (d) 2 alunos serem reprovados. 3) Uma prova de múltipla escolha é composta por oito questões. O aluno deve escolher uma dentre cinco alternativas possíveis. Para ser aprovado, ele deve acertar, no mínimo, cinco questões. A probabilidade de um aluno que nada sabe ser aprovado, é aproximadamente: 2.4 Distribuição de Poisson Considere as situações em que se avalia o número de ocorrências de um tipo de evento por unidade de tempo, de comprimento, de área, ou de volume. Por exemplo: a) número de erros de tipografia em formulário; b) número de pedidos a um servidor num intervalo de tempo; c) defeitos por unidade (m, m2, m3, etc.) por peça fabricada; d) colônias de bactérias numa dada cultura por 0,01 mm2, numa plaqueta de microscópio. Para poder ser aplicada, a distribuição de Poisson requer a validade das seguintes hipóteses: Independência entre as ocorrências do evento considerado; Os eventos ocorrem de forma aleatória, de tal forma que não haja tendência de aumentar ou reduzir as ocorrências do evento, no intervalo considerado. A fórmula para se determinar a probabilidade de ocorrência de um determinado número 𝑋 de sucessos segundo a distribuição de Poisson pode ser apresentada como: 𝑃(𝑋 = 𝑘) = 𝑒−𝜆 ∙ 𝜆𝑘 𝑘! ou 𝑃(𝑋 = 𝑘) = 𝑒−𝜆𝑡 ∙ (𝜆𝑡)𝑘 𝑘! ESTATÍSTICA E PROBABILIDADE – PROF. OTONILSON RIBEIRO Página 5 Onde: е = constante cujo valor aproximado é 2,71828182846; 𝜆 = letra grega “lambda”, que representa o número médio de sucessos em um determinado intervalo de tempo ou espaço; 𝑡 = intervalo de tempo ou espaço contínuo de observações que está analisando; 𝑘 = número de sucessos no intervalo desejado. Exemplos 1) O serviço de atendimento ao cliente de um grande banco verificou que recebe chamadas telefônica à razão de quatro chamadas por hora. Em um intervalo de meia hora, qual a probabilidade de serem atendidas exatamente três chamadas? 2) A central de atendimentos de uma operadora de cartões de crédito recebe denúncias de roubo de cartões à razão de quatro ligações por hora, no período matutino, em dias úteis. Pede-se: (a) quantas chamadas são esperadas num período de 30 minutos? (b) qual a probabilidade de não ocorrer nenhuma chamada num período de 30 minutos; (c) qual a probabilidade de ocorrerem ao menos duas chamadas no mesmo período? 3) Uma empresa fabricante de lonas para piscinas detectou que o número de defeitos na produção diária segue, aproximadamente, uma distribuição de Poisson,com lambda igual a cinco defeitos por peça padrão. Cada peça padrão possui 30 metros quadrados. Em uma lona de dimensões iguais a 6 x 4 m2, calcule a probabilidade de serem encontrados: (a) três defeitos; (b) no máximo dois defeitos; (c) pelo menos quatro defeitos. ESTATÍSTICA E PROBABILIDADE – PROF. OTONILSON RIBEIRO Página 6 4. Distribuição de Probabilidade Contínua 4.1 Variável aleatória contínua Uma variável aleatória X é contínua em ℝ se existir uma função 𝑓(𝑥) contínua, tal que: a) 𝑓(𝑥) ≥ 0. b) ∫ 𝑓(𝑥) 𝑑𝑥 = 1 ∞ −∞ A função 𝑓(𝑥) é chamada função densidade de probabilidade (f.d.p.). Sendo que: 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫ 𝑓(𝑥) 𝑑𝑥 𝑏 𝑎 Como 𝑓(𝑥) é contínua, sua representação gráfica é dada por: 4.2 Distribuição Normal A distribuição normal é, possivelmente, a mais empregada e difundida distribuição teórica de probabilidades, o seu uso é fundamental na compreensão da estatística inferencial e paramétrica. Consiste em uma distribuição contínua de probabilidades, onde a apresentação da distribuição de frequências 𝑓(𝑥) de uma variável quantitativa x apresenta-se em forma de sino e simétrica em relação à média. Estudos revelaram que medições repetidas de uma mesma grandeza, como o diâmetro de uma esfera ou o peso de um determinado objeto, nunca fornecia os mesmos valores. Então, observou que as frequências dessas medidas coletadas sempre resultavam em uma curiosa curva em forma de sino. Das observações surgiu o nome curva “normal” de erros. A curva apresenta algumas características importantes, que podem ser apresentadas como: a) a curva que representa a distribuição de probabilidade é uma curva em forma de sino, simétrica em torno da média x̅ (𝜇), que recebe o nome de curva normal ou curva de Gauss; b) a curva normal é assíntota em relação ao eixo abscissas, isto é, a curva aproxima-se do eixo das abcissas mas não chega a tocá-lo; c) a área total limitada pela curva e pelo eixo das abscissas é igual a 1, e corresponde a proporção 1 ou à porcentagem 100%, pois corresponde a área corresponde à probabilidade de a variável aleatória 𝑋 assumir qualquer valor real; d) como a curva é simétrica em torno da média x̅, a probabilidade de ocorrer valor maior do que a média é igual a probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais a 0,5. Logo: 𝑃(𝑋 > x̅) = 𝑃(𝑋 < x̅) = 0,5. Por exemplo, supondo a altura de um grupo de indivíduos adultos seja normalmente distribuída, com média igual a 1,70m, a distribuição das frequências da variável pode ser feita com base na figura: ESTATÍSTICA E PROBABILIDADE – PROF. OTONILSON RIBEIRO Página 7 Em torna da média, valor central igual a 1,70, existe uma alta concentração de frequências. A probabilidade de encontrar indivíduos com alturas em torno da média, como 1,68m ou 1,71m, é alta. À medida que nos afastamos da média, a probabilidade cai. A probabilidade de encontrar indivíduos com 1,40m ou 2,20m é baixa. A distribuição normal depende dos parâmetros média (𝜇) e desvio padrão (𝜎) ou variância (𝜎2). A depender dos valores da média e do desvio padrão, diferentes serão os formatos das curvas. E seus valores podem ser representados matematicamente em função da média e do desvio padrão da variável analisada. Algebricamente, tem-se que a frequência 𝑓(𝑥) da variável 𝑥 é igual a: 𝑓(𝑥) = 1 √2𝜋𝜎 𝑒− 1 2 ( x − 𝜇 𝜎 ) 2 Onde: x = variável normalmente distribuída 𝜎 = desvio padrão 𝜇 = média O uso dessas informações nos permite calcular as probabilidades associadas à distribuição. A probabilidade sempre será igual à área sob a curva, delimitada pelos limites inferior e superior. E para encontrar a área basta calcular a integral da função para os intervalos desejados. 𝑃(𝐿𝑖 < 𝑥 < 𝐿𝑠) = ∫ 1 √2𝜋𝜎 𝑒− 1 2 ( x − 𝜇 𝜎 ) 2𝐿𝑠 𝐿𝑖 Onde: x = variável normalmente distribuída 𝜎 = desvio padrão 𝜇 = média 𝐿𝑖 = limite inferior 𝐿𝑠 = limite superior O uso dessa fórmula nos resulta cálculos de integrais diferentes, pois cada distribuição normal é caracterizada por uma média e por um desvio padrão diferente, o que resultaria em uma maior dificuldade na obtenção das probabilidades. Porém com o objetivo de facilitar o cálculo das áreas e probabilidades, é apresentada a tabela da curva normal padronizada – área entre a média e o valor de Z. A tabela padronizada apresenta valores para áreas situadas sob a curva. No lugar de trabalhar com médias e desvios padrões distintos, o uso da tabela requer o cálculo de uma variável padronizada 𝑍, na qual apresenta o afastamento em desvios padrões de um valor da variável original em relação a média. O uso de 𝑍 permite calcular probabilidades com auxilio da tabela padronizada, que tornam os cálculos mais simples e dispensa o uso da fórmula acima. Algebricamente, o valor de 𝑍 pode ser apresentado como: 𝑍 = x − 𝜇 𝜎 Onde: x = variável normal de média 𝜇 𝜎 = desvio padrão 𝜇 = média Obs. Se 𝑋 é uma variável com distribuição normal de média 𝜇 e desvio padrão 𝜎, tem distribuição normal reduzida, isto é, tem distribuição normal de média 0 e desvio padrão 1. ESTATÍSTICA E PROBABILIDADE – PROF. OTONILSON RIBEIRO Página 8 Exemplos: 1) Sendo 𝑍 uma variável com distribuição normal reduzida, calcule: a) 𝑃(0 < 𝑍 < 1,16) b) 𝑃(−0,56 < 𝑍 < 0) c) 𝑃(1,42 < 𝑍 < 2,67) d) ) 𝑃(−1,25 < 𝑍 < 2,24) e) 𝑃(𝑍 > 0,72) f) 𝑃(𝑍 > −1,41) g) 𝑃(𝑍 < 1,96) 2) Sabe-se que os pontos obtidos por diferentes candidatos em um concurso público seguem uma distribuição aproximadamente normal, com média igual a 140 e desvio padrão igual a 20 pontos. Caso um pesquisador desejasse obter a probabilidade de um candidato escolhido ao acaso apresentar uma pontuação entre 140 e 165,60 pontos, usaremos os conceitos associados à distribuição normal. 3) Um indústria verificou que as lâmpadas incandescentes que produz apresentam vida útil normalmente distribuídas, com média igual a 750 dias e desvio padrão igual a 40 dias. Calcule a probabilidade de uma lâmpada escolhida ao acaso durar; (a) entre 600 e 900 dias; (b) mais que 700 dias; (c) menos que 650 dias. 4) Os QIs (quocientes de inteligência) de 600 candidatos de certa faculdade são aproximadamente distribuídos segundo a distribuição normal, com média de 115 e desvio padrão 12. Se a faculdade exige um QI de pelo menos 95, quantos desses estudantes serão rejeitados sem ser consideradas outras qualificações? 5) A média dos diâmetros internos de uma amostra de 300 arruelas por máquina para a composição de automóveis é igual a 0,402 polegada e o desvio padrão é igual a 0,03 polegada. A finalidade para o qual essas arruelas são fabricadas permite a tolerância máxima para o diâmetro de 0,305 a 0,408 polegadas. Caso isso não se verifique, as arruelas serão consideradas defeituosas. Determine a porcentagem de arruelas defeituosas produzidas pela máquina, admitindo-se que os diâmetros são distribuídos normalmente. ESTATÍSTICA E PROBABILIDADE – PROF. OTONILSON RIBEIRO Página 9 A Curva Normal Reduzida Curvas normais, com qualquer μ e σ, podem ser transformadas em uma curva normal que tem média igual a 0 (μ = 0) e desvio padrão igual a 1 (σ = 1). Esta curva normal, com média 0 e desvio padrão 1, é conhecida como curva normal reduzida. Suas probabilidades são apresentadas em tabelas de fácil utilização. Como a normal é simétrica, a tabela apresenta somente as probabilidades da metade direita da curva. A probabilidade de um intervalo qualquer da metade esquerda é igual à probabilidade dointervalo equivalente na metade direita.
Compartilhar