Prévia do material em texto
FACULDADE PITÁGORAS DE SÃO LUÍS
CURSO DE Engenharia DE PRODUÇÃO
Estatística E PROBABILIDADE
MATERIAL PARTE 3
Prof. Oton ribeiro
SÃO LUÍS – MA
2014
ESTATÍSTICA E PROBABILIDADE – PROF. OTONILSON RIBEIRO Página 2
DISTRIBUIÇÃO DE PROBABILIDADE
1. Introdução
Nessa unidade estudaremos as distribuições de probabilidades discretas e contínuas.
2. Distribuição de probabilidade discreta
2.1 Variável aleatória
É uma variável que tem um valor único (determinado aleatoriamente) para cada resultado do
experimento.
Exemplos de variáveis aleatórias:
a) números de alunos com notas abaixo da média;
b) diâmetro das peças que saem da linha de produção;
c) números de múltiplo de 3 no lançamento de um dados.
Uma variável 𝑋 é dita discreta quando assume valores inteiros e finitos e dita contínua quando
assume valores num conjunto infinito ou dentro de um intervalo.
Os exemplos acima (a) e (c) são exemplos de variável discreta e (b) é exemplo de variável
contínua.
Quando conhecemos os valores de uma variável aleatória, podemos atribuir uma probabilidade
a cada um desses valores. Portanto, conhecendo os valores de uma variável e suas probabilidades, temos
uma distribuição de probabilidade.
Seja 𝑋 uma variável aleatória que pode assumir os valores x1, x2, x3, ..., xn, a cada valor xi
correspondem pontos do espaço amostral. E associando cada valor xi a probabilidade pi de ocorrência
dos tais pontos no espaço amostral, isto é, os valores x1, x2, x3, ..., xn, correspondem, respectivamente, a
p1, p2, p3, ..., pn. Logo, está definida uma distribuição de probabilidade, onde ∑ 𝑝𝑖 = 1.
Considere o experimento aleatório lançamento de duas moedas, onde 𝑋(v.a.) representa a ocorrência
de face cara.
Exemplo
Uma urna contém 10 bolas numeradas de 1 a 10. Seja 𝑋 o número de divisores do número sorteado.
Calcule o número médio e o desvio padrão de divisores do número sorteado.
ESTATÍSTICA E PROBABILIDADE – PROF. OTONILSON RIBEIRO Página 3
2.2 Esperança e Variância Matemática
Existem características numéricas que são muito importantes em uma distribuição de
probabilidade de uma variável aleatória discreta. São os parâmetros da distribuição. O primeiro
parâmetro é a esperança matemática que é a média de uma variável aleatória e o segundo é a
variância que nos dá o grau de dispersão de probabilidade em torno da média da variável aleatória.
2.2.1 Esperança Matemática
A esperança matemática é um número real de média aritmética ponderada. Dada por:
𝐸(𝑋) = ∑ 𝑥𝑖 ∙ 𝑝(𝑥𝑖)
𝑛
𝑖=1
= 𝑥1 ∙ 𝑝(𝑥1) + 𝑥2 ∙ 𝑝(𝑥2) + ⋯ + 𝑥𝑛 ∙ 𝑝(𝑥𝑛)
Notação: 𝐸(𝑥), 𝜇(𝑥), 𝜇𝑥 , 𝜇
2.2.2 Variância Matemática
𝑉𝑎𝑟(𝑋) = 𝐸(𝑋2) − [𝐸(𝑋)]2
Onde:
𝐸(𝑋2) = ∑ 𝑥𝑖
2 ∙ 𝑝(𝑥𝑖)
𝑛
𝑖=1
= 𝑥1
2 ∙ 𝑝(𝑥1) + 𝑥2
2 ∙ 𝑝(𝑥1) + ⋯ + 𝑥𝑛
2 ∙ 𝑝(𝑥𝑛)
Exemplo 1: No lançamento de duas moedas, X representa a ocorrência da face cara.
X P(X) X •P(x) X2 •P(x)
Obs. A variância é um quadrado, e muita das vezes o resultado torna-se artificial. Por exemplo, a altura
média de um grupo de pessoas é 1,70 m, e a variância, 25 cm2. Fica estranho cm2 em altura. Então, para
contornarmos esse problema, definimos desvio padrão.
Desvio padrão da variável X é raiz quadrada da variância de X, isto é:
𝜎𝑥 = √𝑉𝑎𝑟(𝑋)
Nos exemplos {
𝜎𝑥 = √0,25 = 0,5
𝜎𝑦 = √6,8 = 2,61
Exemplos
1) A função de probabilidade da variável 𝑋 é: 𝑃(𝑋) =
1
5
, para 𝑋 = 1, 2, 3, 4, 5. Calcule 𝐸(𝑋)e 𝐸(𝑋2).
2) Um jogador lança um dado. Se aparecerem os números 1, 2 ou 3, recebe R$ 10,00. Se, no entanto,
aparecer 4 ou 5, recebe R$ 5,00. Se aparecer 6, ganha R$ 20,00. Qual o ganho médio do jogador e desvio
padrão?
ESTATÍSTICA E PROBABILIDADE – PROF. OTONILSON RIBEIRO Página 4
2.3 Distribuição binomial
Suponhamos n tentativas independentes de um mesmo experimento aleatório. Cada tentativa
admite dois resultados: sucesso com probabilidades p e fracasso com probabilidade q, 𝑝 + 𝑞 = 1. As
probabilidades de sucesso e fracasso são as mesmas para cada tentativa.
Seja X: número de sucessos em n tentativas.
Determinaremos a função de probabilidades da variável X, isto é, 𝑃(𝑋 = 𝑘) pela fórmula:
𝑃(𝑋 = 𝑘) = (
𝑛
𝑘
) 𝑝𝑘 ∙ 𝑞𝑛−𝑘
Onde:
𝑝 = probabilidade do sucesso
𝑞 = probabilidade do fracasso
𝑛 = número de eventos estudados.
𝑘 = número de sucessos
Exemplos
1) A probabilidade de um atirador acertar o alvo é de 75%, fazendo 10 tentativas. Determine a
probabilidade de acertar o alvo 4 vezes.
2) No período passado no Curso de Engenharia Civil – 3° período, da Faculdade Pitágoras – São Luís.
Calculou-se a probabilidade de um aluno, escolhido ao acaso, ser aprovado na Disciplina Estatística e
encontrou-se 20%. Em uma amostra formada por cinco 10 alunos, calcule a probabilidade de: (a) 3
alunos serem aprovados; (c) pelo menos um aluno ser aprovado; (d) 2 alunos serem reprovados.
3) Uma prova de múltipla escolha é composta por oito questões. O aluno deve escolher uma dentre cinco
alternativas possíveis. Para ser aprovado, ele deve acertar, no mínimo, cinco questões. A probabilidade
de um aluno que nada sabe ser aprovado, é aproximadamente:
2.4 Distribuição de Poisson
Considere as situações em que se avalia o número de ocorrências de um tipo de evento por
unidade de tempo, de comprimento, de área, ou de volume.
Por exemplo:
a) número de erros de tipografia em formulário;
b) número de pedidos a um servidor num intervalo de tempo;
c) defeitos por unidade (m, m2, m3, etc.) por peça fabricada;
d) colônias de bactérias numa dada cultura por 0,01 mm2, numa plaqueta de microscópio.
Para poder ser aplicada, a distribuição de Poisson requer a validade das seguintes hipóteses:
Independência entre as ocorrências do evento considerado;
Os eventos ocorrem de forma aleatória, de tal forma que não haja tendência de aumentar ou
reduzir as ocorrências do evento, no intervalo considerado.
A fórmula para se determinar a probabilidade de ocorrência de um determinado número 𝑋 de
sucessos segundo a distribuição de Poisson pode ser apresentada como:
𝑃(𝑋 = 𝑘) =
𝑒−𝜆 ∙ 𝜆𝑘
𝑘!
ou 𝑃(𝑋 = 𝑘) =
𝑒−𝜆𝑡 ∙ (𝜆𝑡)𝑘
𝑘!
ESTATÍSTICA E PROBABILIDADE – PROF. OTONILSON RIBEIRO Página 5
Onde:
е = constante cujo valor aproximado é 2,71828182846;
𝜆 = letra grega “lambda”, que representa o número médio de sucessos em um determinado intervalo de
tempo ou espaço;
𝑡 = intervalo de tempo ou espaço contínuo de observações que está analisando;
𝑘 = número de sucessos no intervalo desejado.
Exemplos
1) O serviço de atendimento ao cliente de um grande banco verificou que recebe chamadas telefônica à
razão de quatro chamadas por hora. Em um intervalo de meia hora, qual a probabilidade de serem
atendidas exatamente três chamadas?
2) A central de atendimentos de uma operadora de cartões de crédito recebe denúncias de roubo de
cartões à razão de quatro ligações por hora, no período matutino, em dias úteis. Pede-se: (a) quantas
chamadas são esperadas num período de 30 minutos? (b) qual a probabilidade de não ocorrer nenhuma
chamada num período de 30 minutos; (c) qual a probabilidade de ocorrerem ao menos duas chamadas
no mesmo período?
3) Uma empresa fabricante de lonas para piscinas detectou que o número de defeitos na produção diária
segue, aproximadamente, uma distribuição de Poisson,com lambda igual a cinco defeitos por peça
padrão. Cada peça padrão possui 30 metros quadrados. Em uma lona de dimensões iguais a 6 x 4 m2,
calcule a probabilidade de serem encontrados: (a) três defeitos; (b) no máximo dois defeitos; (c) pelo
menos quatro defeitos.
ESTATÍSTICA E PROBABILIDADE – PROF. OTONILSON RIBEIRO Página 6
4. Distribuição de Probabilidade Contínua
4.1 Variável aleatória contínua
Uma variável aleatória X é contínua em ℝ se existir uma função 𝑓(𝑥) contínua, tal que:
a) 𝑓(𝑥) ≥ 0.
b) ∫ 𝑓(𝑥) 𝑑𝑥 = 1
∞
−∞
A função 𝑓(𝑥) é chamada função densidade de probabilidade (f.d.p.). Sendo que:
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫ 𝑓(𝑥) 𝑑𝑥
𝑏
𝑎
Como 𝑓(𝑥) é contínua, sua representação gráfica é dada por:
4.2 Distribuição Normal
A distribuição normal é, possivelmente, a mais empregada e difundida distribuição teórica de
probabilidades, o seu uso é fundamental na compreensão da estatística inferencial e paramétrica.
Consiste em uma distribuição contínua de probabilidades, onde a apresentação da distribuição de
frequências 𝑓(𝑥) de uma variável quantitativa x apresenta-se em forma de sino e simétrica em relação
à média. Estudos revelaram que medições repetidas de uma mesma grandeza, como o diâmetro de uma
esfera ou o peso de um determinado objeto, nunca fornecia os mesmos valores. Então, observou que as
frequências dessas medidas coletadas sempre resultavam em uma curiosa curva em forma de sino. Das
observações surgiu o nome curva “normal” de erros.
A curva apresenta algumas características importantes, que podem ser apresentadas como:
a) a curva que representa a distribuição de probabilidade é uma curva em forma de sino, simétrica
em torno da média x̅ (𝜇), que recebe o nome de curva normal ou curva de Gauss;
b) a curva normal é assíntota em relação ao eixo abscissas, isto é, a curva aproxima-se do eixo das
abcissas mas não chega a tocá-lo;
c) a área total limitada pela curva e pelo eixo das abscissas é igual a 1, e corresponde a proporção
1 ou à porcentagem 100%, pois corresponde a área corresponde à probabilidade de a variável
aleatória 𝑋 assumir qualquer valor real;
d) como a curva é simétrica em torno da média x̅, a probabilidade de ocorrer valor maior do que a
média é igual a probabilidade de ocorrer valor menor do que a média, isto é, ambas as
probabilidades são iguais a 0,5. Logo: 𝑃(𝑋 > x̅) = 𝑃(𝑋 < x̅) = 0,5.
Por exemplo, supondo a altura de um grupo de indivíduos adultos seja normalmente distribuída,
com média igual a 1,70m, a distribuição das frequências da variável pode ser feita com base na figura:
ESTATÍSTICA E PROBABILIDADE – PROF. OTONILSON RIBEIRO Página 7
Em torna da média, valor central igual a 1,70, existe uma alta concentração de frequências. A
probabilidade de encontrar indivíduos com alturas em torno da média, como 1,68m ou 1,71m, é alta. À
medida que nos afastamos da média, a probabilidade cai. A probabilidade de encontrar indivíduos com
1,40m ou 2,20m é baixa.
A distribuição normal depende dos parâmetros média (𝜇) e desvio padrão (𝜎) ou variância (𝜎2).
A depender dos valores da média e do desvio padrão, diferentes serão os formatos das curvas. E seus
valores podem ser representados matematicamente em função da média e do desvio padrão da variável
analisada. Algebricamente, tem-se que a frequência 𝑓(𝑥) da variável 𝑥 é igual a:
𝑓(𝑥) =
1
√2𝜋𝜎
𝑒−
1
2
(
x − 𝜇
𝜎
)
2
Onde:
x = variável normalmente distribuída
𝜎 = desvio padrão
𝜇 = média
O uso dessas informações nos permite calcular as probabilidades associadas à distribuição. A
probabilidade sempre será igual à área sob a curva, delimitada pelos limites inferior e superior. E para
encontrar a área basta calcular a integral da função para os intervalos desejados.
𝑃(𝐿𝑖 < 𝑥 < 𝐿𝑠) = ∫
1
√2𝜋𝜎
𝑒−
1
2
(
x − 𝜇
𝜎
)
2𝐿𝑠
𝐿𝑖
Onde:
x = variável normalmente distribuída
𝜎 = desvio padrão
𝜇 = média
𝐿𝑖 = limite inferior
𝐿𝑠 = limite superior
O uso dessa fórmula nos resulta cálculos de integrais diferentes, pois cada distribuição normal é
caracterizada por uma média e por um desvio padrão diferente, o que resultaria em uma maior
dificuldade na obtenção das probabilidades. Porém com o objetivo de facilitar o cálculo das áreas e
probabilidades, é apresentada a tabela da curva normal padronizada – área entre a média e o valor
de Z.
A tabela padronizada apresenta valores para áreas situadas sob a curva. No lugar de trabalhar
com médias e desvios padrões distintos, o uso da tabela requer o cálculo de uma variável padronizada
𝑍, na qual apresenta o afastamento em desvios padrões de um valor da variável original em relação a
média. O uso de 𝑍 permite calcular probabilidades com auxilio da tabela padronizada, que tornam os
cálculos mais simples e dispensa o uso da fórmula acima.
Algebricamente, o valor de 𝑍 pode ser apresentado como:
𝑍 =
x − 𝜇
𝜎
Onde:
x = variável normal de média 𝜇
𝜎 = desvio padrão
𝜇 = média
Obs. Se 𝑋 é uma variável com distribuição normal de média 𝜇 e desvio padrão 𝜎, tem distribuição normal
reduzida, isto é, tem distribuição normal de média 0 e desvio padrão 1.
ESTATÍSTICA E PROBABILIDADE – PROF. OTONILSON RIBEIRO Página 8
Exemplos:
1) Sendo 𝑍 uma variável com distribuição normal reduzida, calcule:
a) 𝑃(0 < 𝑍 < 1,16)
b) 𝑃(−0,56 < 𝑍 < 0)
c) 𝑃(1,42 < 𝑍 < 2,67)
d) ) 𝑃(−1,25 < 𝑍 < 2,24)
e) 𝑃(𝑍 > 0,72)
f) 𝑃(𝑍 > −1,41)
g) 𝑃(𝑍 < 1,96)
2) Sabe-se que os pontos obtidos por diferentes candidatos em um concurso público seguem uma
distribuição aproximadamente normal, com média igual a 140 e desvio padrão igual a 20 pontos. Caso
um pesquisador desejasse obter a probabilidade de um candidato escolhido ao acaso apresentar uma
pontuação entre 140 e 165,60 pontos, usaremos os conceitos associados à distribuição normal.
3) Um indústria verificou que as lâmpadas incandescentes que produz apresentam vida útil
normalmente distribuídas, com média igual a 750 dias e desvio padrão igual a 40 dias. Calcule
a probabilidade de uma lâmpada escolhida ao acaso durar; (a) entre 600 e 900 dias; (b) mais
que 700 dias; (c) menos que 650 dias.
4) Os QIs (quocientes de inteligência) de 600 candidatos de certa faculdade são aproximadamente
distribuídos segundo a distribuição normal, com média de 115 e desvio padrão 12. Se a faculdade exige
um QI de pelo menos 95, quantos desses estudantes serão rejeitados sem ser consideradas outras
qualificações?
5) A média dos diâmetros internos de uma amostra de 300 arruelas por máquina para a composição de
automóveis é igual a 0,402 polegada e o desvio padrão é igual a 0,03 polegada. A finalidade para o qual
essas arruelas são fabricadas permite a tolerância máxima para o diâmetro de 0,305 a 0,408 polegadas.
Caso isso não se verifique, as arruelas serão consideradas defeituosas. Determine a porcentagem de
arruelas defeituosas produzidas pela máquina, admitindo-se que os diâmetros são distribuídos
normalmente.
ESTATÍSTICA E PROBABILIDADE – PROF. OTONILSON RIBEIRO Página 9
A Curva Normal Reduzida
Curvas normais, com qualquer μ e σ, podem ser transformadas em uma curva normal que tem
média igual a 0 (μ = 0) e desvio padrão igual a 1 (σ = 1). Esta curva normal, com média 0 e desvio padrão
1, é conhecida como curva normal reduzida. Suas probabilidades são apresentadas em tabelas de fácil
utilização.
Como a normal é simétrica, a tabela apresenta somente as probabilidades da metade direita da
curva. A probabilidade de um intervalo qualquer da metade esquerda é igual à probabilidade dointervalo equivalente na metade direita.