Buscar

aula Variavel Aleatória Est Bas II 13 02 2013

Prévia do material em texto

Curso: Bacharelado em Estatística 
Turma: Estatística Básica II – (2° período) 
Período: 2012/02 Data: 13/02/2013 
Professora: Vania C. Mota, Msc. 
Aluno (a): 
 
 
DISTRIBUIÇÃO DE PROBABILIDADE 
 
As frequências relativas em populações infinitas são chamadas de probabilidades. 
Por exemplo, suponha que se esteja interessado em descrever (prever) a taxa de nascimento de machos ou 
fêmeas em mamíferos. 
 Um possível modelo não- determinístico que explica o fato de um mamífero nascer macho ou fêmea 
é aquele que estabelece que tanto um sexo quanto o outro possuem chances iguais de acontecer. 
Ele procura explicar a frequência relativa de nascimentos de infinitos mamíferos que existiram ou 
virão a existir, e daí se fala em probabilidade de nascimentos de machos ou fêmeas, que segundo esse 
modelo é igual a 0,5. 
 
Conceito: Probabilidade - Frequência relativa associada a uma variável descritora de uma população 
infinita. 
Portanto pode-se denominar a distribuição de frequência relativa em uma população infinita com uma 
distribuição de probabilidade. 
 
Conceito: Distribuição de probabilidade - Distribuição de frequência em uma população infinita. 
As variáveis descritoras de uma população infinita podem ser qualitativa ou quantitativa. 
 
Quando são associados valores de probabilidade às variáveis descritoras, como é o caso em 
populações infinitas, elas também são chamadas de variáveis aleatórias. 
 
Conceito: Variáveis Aleatórias (v.a.) - Variável descritora de populações infinitas, cujos os valores são 
associados probabilidades de ocorrência. 
 
FUNDAÇÃO UNIVERSIDADE FEDERAL DE RONDÔNIA 
CAMPUS de JI - PARANÁ - RO 
Por convenção, as variáveis aleatórias são sempre quantitativas, mesmo se referindo a qualidades. No 
exemplo de nascimento em mamíferos, as categorias ‘fêmea’ e ‘macho’ podem ser associados a 0 e 1, 
respectivamente. 
Conforme já visto, uma distribuição de probabilidade é a distribuição de freqüência em uma 
população infinita. Ela corresponde assim a uma função que associa as realizações de uma variável aleatória 
com suas respectivas probabilidade de ocorrência. 
 As variáveis aleatórias (v.a) são denotadas por letras maiúsculas, e suas realizações por letras 
minúsculas, da mesma maneira como visto para variáveis de um modo geral. 
 
A probabilidade de que uma variável aleatória X assuma determinado valor é denotada por 
 P[ X = x]. As variáveis aleatórias quantitativas podem ser discretas ou continuas, sendo que para 
cada qual podem ser construídos modelos matemáticos não-determinísticos (aleatório) que expressem as 
distribuições de probabilidade correspondentes. 
Além disso, sendo elas quantitativas, faz sentido falar-se em medidas de posição e dispersão. Neste texto, 
serão concentradas as atenções apenas na média e variância de uma variável aleatória quantitativa. 
A média de uma variável aleatória X também é chamada de Esperança da variável aleatória X, e é 
denotada por E(X). 
 
Valor Esperado de uma v.a. 
Se uma v.a. x toma os valores x1, x2, x3, ...,xn, com as probabilidades correspondentes p1, p2, p3,...,pn, então 
o seu valor esperado, E [X], é 
 p1 x1 + p2 x2 + p3 x3 + . . .+ pn xn 
 
Assim: 
 
 
Suponha-se que uma loja tenha compilado os seguintes dados sobre venda de refrigeradores: 
 
 
 
xi nº vendido P(x) Freq. Relativa 
0 0,20 
1 0,30 
2 0,30 
3 0,15 
4 0,05 
 1,00 
 
E(X) = 0,20 (0) + 0,30 (1) + 0,30 (2) + 0,15 (3) + 0,05 (4) = 1,55 
Como a firma não pode vender 1,55 refrigeradores em nenhum dia (porque o número vendido é uma 
variável que consiste em inteiro 0, 1, 2, 3 e 4), a pergunta obvia é: Como interpretar aquele valor? Muito 
simplesmente: O valor esperado é uma média a longo prazo. 
Analogamente se jogamos um dado equilibrado, qual o valor esperado numa jogada? Há seis 
resultados igualmente possíveis, e o valor esperado é: 
1/6 (1) + 1/6 (2) + 1/6 (3) + 1/6 (4) + 1/6 (5) + 1/6 (6) = 3,5 
Aqui novamente, 3,5 é um evento impossível para uma única jogada, mas certamente razoável em 
termos de média calculada para um grande número de jogadas. 
 
Exemplo 1 
Um investidor julga que tem 0,40 de probabilidade de ganhar $ 25000 e 0,60 de probabilidade de 
perder $ 15000 num investimento. Seu ganho esperado é: 
0,40 (25000) + 0,60 (-15000) = $1000 
Note que $15000 leva o sinal menos. 
 
Exemplo 2 
Um empreiteiro faz as seguintes estimativas: 
O prazo esperado para a execução da obra, de acordo com essas estimativas é: 
 
Prazo de execução Probabilidade 
10 dias 0,30 
15 dias 0,20 
22 dias 0,50 
 
0,30 (10) + 0,20 (15) + 0,50 (22) = 17 dias 
Os cálculos de valor esperado podem resolver o número de ocorrências, tais como números de erros, 
números de peças defeituosas, números de acidentes, etc., bem como certas medidas monetárias como 
lucros, perdas, renda de investimento, etc. 
 
 
 
DISTRIBUIÇÃO DISCRETA DE PROBABILIDADE 
Trata-se a distribuição de probabilidade associada a variáveis aleatórias discretas. Por exemplo, a 
função seguinte corresponde a uma distribuição de probabilidade discreta: 
 X 0 1 2 3 4
 P[X=x] 1/10 2/10 5/10 1/10 1/10
 
Observe que: 
P[S] = P [x=0] + P [x=1] + P [x=2] + P [x=3] + P [x=4] 
= 1/10 + 2/10 + 5/10 + 1/10 + 1/10 = 1 
Como era de esperar, ou seja: P[S] = 1. 
Essa característica é valida para toda distribuição discreta, em concordância com o axioma passado 
anteriormente. Ou seja, se a variável aleatória discreta assume k valores então: 
 
 
No exemplo acima tem–se: 
E (X) = 0. (1/10) + 1. (2/10) + 2. (5/10) + 3.(1/10) + 4.(1/10) = 1,9. 
 
O conceito de variância de uma variável aleatória também é semelhante àquela apresentada para 
dados agrupados, trocando-se o fi por P [X = xi]: 
 
No exemplo tem-se: 
Variância= (0-1,9)
2
 * 1/10 + . . . + (4 - 1,9)
 2 
* 1/10 = 10,9. 
 
Existe uma série de distribuições de probabilidade discreta em estatística. Duas delas serão vistas a 
seguir: 
DISTRIBUIÇÃO BINOMIAL 
Uma situação relativamente comum em pesquisas cientifica ou levantamentos é aquela onde apenas 
dois tipos de resultados são possíveis, como por exemplo: 
S={macho,fêmea} 
S={árvore doente, árvore não doente} 
S={grande produtor, pequeno produtor} 
S={talhão irrigado, talhão não irrigado}. 
 
Uma distribuição de probabilidade que lida com tais situações é a chamada distribuição Binomial. 
 
 Em geral existe um interesse maior em um dos 2 resultados possíveis, o qual é denominado de 
sucesso, e o outro de insucesso ou fracasso. 
Para o desenvolvimento de seu modelo, considere o exemplo de uma porca parindo 5 leitões. 
 
Os eventos possíveis são ou o nascimento de machos ou de fêmeas. Considere a variável aleatória 
número de machos, que obviamente é discreta, podendo variar de 0 a 5. A probabilidade de que seja 5 
machos é igual à probabilidade de que o primeiro leitão seja macho, e de que o segundo seja macho, e de 
que o terceiro também seja macho e assim por diante. Pela regra do e , tem-se que: 
P[X=5] = (0,5) . (0,5) . (0,5) . (0,5) . (0,5) = (0,5)
5
 
Considere agora o nascimento de três machos e 2 fêmeas. A probabilidade de uma determinada 
combinação, por exemplo, a de que os 3 primeiros leitões L1, L2, L3, sejam machos, e os dois últimos L4, 
L5 sejam fêmeas, é igual a: 
P[M]) * P[M]) * P[M]) * P[F]) * P[F]) = (0,5)
 5
 
 
No entanto, esta não é a única combinação possível para o nascimento de 3 machos, mas existem 
várias, conforme abaixo: 
 L1 L2 L3 L4 L5 PROBAB.
 M M M F F
 5
 (0,5)
 M M F M F
 5
 (0,5)
 M F M M F
 5
 (0,5)
 F M M M F
 5
 (0,5)
 M M F F M
 5
 (0,5)
 M F M F M
 5
 (0,5)
 F M M F M
 5
 (0,5)
 M F F M M
 5
 (0,5)
 F M F M M
 5
 (0,5)
 F F M M M
 5
 (0,5)
 
Na realidade, ao invés de listar todas as possibilidades, como feito acima, pode-se calcular 
diretamente o número total de combinações possíveisatravés de: 
 
Dessa forma, para calcular a probabilidade de nascimento de 3 machos, sem importar em qual ordem, tem-se 
que somar o valor 
 5 
10 vezes. (0,5)
Portanto: 
P [X=3] = 10 * 
 5 
 = 31,25% (0,5)
 
Considerando agora qualquer número x de machos nascidos, em um total de 5 leitões, tem-se que a 
probabilidade desse evento é: 
 
Este exemplo justamente ilustrou o desenvolvimento da distribuição binomial. O modelo geral 
fornece a probabilidade de ocorrência de x sucessos, na observação de n eventos: 
 
Onde, p é a probabilidade de sucesso (no exemplo, de nascimentos de machos) e q probabilidade de 
insucesso, igual a (1-p). 
 
A distribuição binomial, é definida por dois números, ou parâmetros, que diferenciam as mais 
diferentes situações, sem os quais não calculamos 
P [X=x] : p e n. 
 
Conceito: Parâmetro de Uma Distribuição de Probabilidade - Constante (conhecida ou desconhecida) que 
define uma determinada distribuição de probabilidades. 
 
Assim uma notação comumente empregada para denotar que determinada variável aleatória possui 
distribuição binomial com parâmetros p e n, é: 
 
Pode-se demonstrar que a esperança e a variância de uma variável aleatória que segue uma 
distribuição binomial são dadas por: 
Me (x ) = E (X) = n . p 
 
 
 Ou seja, se avaliássemos todas as possíveis leitegadas de 5 leitões de infinitas porcas, teríamos um 
valor médio de 5.(0,5) = 2,5 machos, com variância entre leitegadas igual a 5. (0,5) . (0,5) = 1,25 
machos ao quadrado. 
 
DISTRIBUIÇÃO DE POISSON 
A distribuição de Poisson refere-se a uma variável também discreta, mas que pode assumir qualquer 
número inteiro positivo, ou seja: X = 0, 1, 2, ... 
 
Essa distribuição é importante para descrever fenômenos de ocorrência rara, como certos fenômenos 
meteorológicos, eclosão de ovos de insetos submetidos a um inseticida, porcentagem de plantas doentes em 
campos de produção de sementes, defeito em explosão de TV, etc. 
 
 A distribuição de probabilidade é dada por: 
 
 onde e = 2,718...(número neperiano), e λ é o parâmetro da distribuição, e que 
corresponde ao valor médio que X assume. 
 Como exemplo, considere o número de chuvas por ano com intensidade acima de 50 mm/h que 
ocorrem em uma região. Essa variável pode ser importante no dimensionamento de drenos ou barragens. A 
população é constituída por todos os anos da região, e é infinita, pois abrange os infinitos anos que ainda 
estão por vir. A variável aleatória é discreta, porque conta o número de chuvas acima de 50 mm/h. 
Suponha que o número médio de chuvas por ano com essa intensidade seja 1,5. Então, se o modelo 
de Poisson for um bom descritor, tem-se que: 
 
= 0,2231 
 
 
 
E assim para outros valores de x: 
A probabilidade de que x seja maior do que 2 pode ser obtida pelo teorema 1 de probabilidades: 
 X 0 1 2 Etc.
 P[X=x] 0,2231 0,3347 0,2510 etc.
 
P [X > 2] = 1 – P [X< =2] 
pois o evento (X < = 2) é o complemento do evento (X > 2). 
Como P [X < = 2] = P [X = 0] + P [ X= 1] + P [X = 2] = 0,8088 
tem-se que: 
P [ X >2] = 1 - 0,8088 = 0,1912 
 A distribuição de Poisson tem a particularidade de que sua média e sua variância são ambas iguais a 
λ: 
 onde λ = n . p 
 
 Assim, no exemplo das chuvas, a variância associada ao número de precipitações com intensidades 
acima de 50 mm/h também é igual a 1,5. 
 
EXERCÍCIOS: 
1) Sabe-se que 5% de um rebanho bovino está com febre aftosa. Qual a probabilidade de que um lote de 
6 animais retirados deste rebanho, tenha-se: 
a) Nenhum animal com febre aftosa: 
b) Dois animais com febre aftosa: 
c) Mais de um animal com febre aftosa. 
 
2) Um jogador de basquete converte 90% dos lances livres. Qual a probabilidade de que este jogador 
converta 4 dos 6 lances livres de uma partida. 
 
 
3)A probabilidade de que um individuo apresente uma reação alérgica após a aplicação de um soro é de 
0,2%. Este mesmo soro foi aplicado a um grupo de 1800 pessoas, qual a probabilidade de que: 
a) Duas pessoas tenham reação alérgica; 
b) No máximo quatro pessoas tenham reação alérgica? 
c) Pelo menos duas pessoas apresentem reação alérgica? 
 
4) Numa lâmina verificou-se que existiam em média 3 bactérias/cm2. A lâmina foi subdividida em 300 
quadrados de 1cm2. 
a) Em quantos destes quadrados você espera encontrar no máximo 1 bactéria? 
b) Qual é a probabilidade de se encontrar mais de 4 bactérias/cm2?

Continue navegando