Buscar

04 NewProbDistrProb

Prévia do material em texto

1
PROBABILIDADE E DISTRIBUIÇÕES DE PROBABILIDADE 
 
O estudo da probabilidade poderá auxiliar no estudo de índices do conceito de 
qualidade de testes diagnósticos. 
 
Fenômenos aleatórios: Situações em que os resultados possíveis são 
conhecidos, mas não se pode saber a priori qual deles ocorrerá. 
 
Especo amostral: Consiste no conjunto de todos os resultados possíveis de um 
experimento aleatório (S). 
 
Evento simples: Quando o espaço amostral é constituído de apenas um 
elemento. 
 
Seja um evento qualquer (A), considerando os casos favoráveis (F) e os 
contrários (C), a probabilidade de ocorrência do evento A é: 
CF
FAP

)( 
 
Numa determinada população, dividida em grupos de pessoas que residem em 
áreas diferentes, ocorre presença de hipertensos em 3 áreas, das 13 totais. 
Qual a probabilidade de ocorrência de hipertensos em uma área qualquer? 
P(A) = 3/13 = 0,2308 = 23,08%. 
 
Regras para combinar probabilidades: 
 
Regra 1: Ocorrência de eventos mutuamente exclusivos. A ocorrência de um 
exclui a ocorrência do outro. 
 
Numa amostra de pessoas examinadas, de cada 52, quatro apresentaram 
ácido úrico alto e quatro são hipertensas. Qual a probabilidade de, escolhendo 
uma pessoa aleatoriamente, ser hipertensa ou apresentar ácido úrico alto? 
P(A) = 
13
2
52
8
52
4
52
4 0,1538 = 15,38%. 
 
Regra 2: Ocorrência de eventos independentes. A ocorrência de um não afeta 
a ocorrência de outros. 
 
Um casal é heterozigoto para o alelo recessivo olho azul. Qual a probabilidade 
de que os dois primeiros filhos tenham olhos azuis? (Aa x Aa)  AA; Aa; Aa e 
aa. No caso de olho azul (aa), P(aa) = 
4
1 para cada filho. Como cada filho é um 
evento independente do outro, então: P(2 filhos) = 
16
1
4
1*
4
1 0,0625 = 6,25%. 
 
Observação: Além das regras supracitadas, deve-se atentar para eventos com 
ou sem reposição, pois implicará diretamente no desenvolvimento das 
operações. 
 
 2
Exemplos envolvendo eventos com e sem reposição: 
 
Num laboratório, um armário contém 5 ampolas da substância A, 4 da 
substância B e 3 da substância C. Retiram-se simultaneamente 3 ampolas. 
Qual a probabilidade de: 
 
a) Nenhuma seja da substância A? 
    %.91,151591,0
44
7
10
5*
11
6*
12
7..  AAAPASNP  
b) Exatamente uma seja da substância A? 
    %.73,474773,0
44
21
44
7*3
10
6*
11
7*
12
5*3....  AAAPASUEP  
c) Todas sejam da mesma substância? 
       
%.8182,6068182,0
44
3
10
1*
11
2*
12
3
10
2*
11
3*
12
4
10
3*
11
4*
12
5....

 CCCPBBBPAAAPSMSTP 
 
Se fosse retirada uma só ampola, ou as ampolas não fossem retiradas aao 
mesmo tempo, uma questão poderia ser, por exemplo: 
 
 Num laboratório, um armário contém 5 ampolas da substância A, 4 da 
substância B e 3 da substância C. Retiram-se 3 ampolas ao acaso, repondo-se 
logo em seguida. Qual a probabilidade de todas sejam da mesma substância? 
       
%.50,121250,0
1728
216
1728
27
1728
64
1728
125
12
3
12
4
12
5....
333
















 CCCPBBBPAAAPSMSTP 
 
 
Verifiquem a forma de resolução, assim como a resposta da letra C da primeira 
questão e a segunda questão. Teoricamente são resolvidas da mesma forma, 
mas ao seguir a linha de raciocínio de cada uma delas, elas diferem 
numericamente! 
 
Probabilidade da reunião de dois eventos. 
 
Conforme os diagramas abaixo, tem-se: 
 
1 – Reunião de dois eventos sem interseção: 
 
 3
 
 
P(A U B) = P(A) + P(B) 
 
2 – Reunião de dois eventos sem interseção: 
 
 
 
P(A U B) = P(A) + P(B) - P(A∩B) 
 
Probabilidade da reunião de três eventos: 
 
 
 
P(A U B U C) = P(A) + P(B) + P(C) - P(A∩B) - P(A∩C) - P(B∩C) + P(A∩B∩C) 
 
Neste caso, pode-se deduzir que, em reunião de mais eventos, considera-se o 
seguinte padrão: Eventos ímpares são sempre somados, ao passo que os 
pares são subtraídos. 
 
Probabilidade do complemento: 
P(A) + P(Ā) = 1  P(Ā) = 1 - P(A) 
 
 4
Probabilidade do conjunto vazio 
P(A) = P(A U ) = P(A) + P() = P(A)  P() = P(A) - P(A)  P() = zero. 
 
Probabilidade condicional: 
 
Neste caso, há restrição do espaço amostral. Sejam A e B são eventos 
associados a um experimento [E]. Representa-se P(B/A) a probabilidade 
condicionada do evento B quando A tiver ocorrido. Assim: 
   
 
   
 AP
BAP
A
BP
BP
BAP
B
AP   e 
Num grupo de diabéticos assistidos existem indivíduos discriminados da 
seguinte forma: 5 de sexo masculino com mais de 21 anos; 5 do sexo 
masculino com menos de 21 anos; 6 do sexo feminino com mais de 21 anos e 
2 do sexo feminino com menos de 21 anos. 
Ao escolher uma pessoa ao acaso, qual a probabilidade de que: 
 
a) Tenha mais de 21 anos? P(a) =   
18
11
18
65 0,6111 = 61,11%. 
 
b) seja do sexo feminino dado que tenha menos de 21 anos? P(♀ / < 21 anos) 
= 
 





52
2
anos) 21 P(
anos) 21 P(Feminino 0,2857 = 28,57%. 
 
Exemplo de aplicação: 
 
Consideremos 250 alunos que cursam o ciclo básico da UESC. Desses, 100 
são homens (H), 150 são mulheres (M), 110 cursam biomedicina e 140 cursam 
biologia. A distribuição dos alunos é a seguinte: 
 
CURSO 
SEXO 
BIOMEDICINA BIOLOGIA TOTAL 
Homem 40 60 100 
Mulher 70 80 150 
Total 110 140 250 
 
Um aluno é sorteado ao acaso. Qual a probabilidade de que esteja cursando 
biologia, dado que é mulher? 
 
 5
   
 
 
   
 
  .0 se ; :Logo
log
150
80
250
150
250
80
log
250
150
250
80log
150
80log












BP
BP
BAP
B
AP
MulherP
MulheriaBioP
Mulher
iaBioP
MulherPiaBioMulherP
Mulher
iaBioP



 
 
Probabilidade Total: 
 
Conforme o diagrama abaixo: 
 
 
O espaço amostral (S) de um experimento [E] foi dividido em três eventos: R1, 
R2 e R3, onde: R1 ∩ R2 = ; R1 ∩ R3 = ; R2 ∩ R3 =  e R1 U R2 U R3 = S. 
 
O evento B está contido no espaço amostral (S) e pode ser representado por: B 
= B ∩ S. Como S = R1 U R2 U R3  B = B ∩ (R1 U R2 U R3) ou B = (B ∩ R1) 
U (B ∩ R2) U (B ∩ R3) e P(B) = P[(B ∩ R1) U (B ∩ R2) U (B ∩ R3)]. Como (B ∩ 
R1), (B ∩ R2), (B ∩ R3) são eventos mutuamente exclusivos, P(B) = P(B ∩ R1) 
+ P(B ∩ R2) + P(B ∩ R3). No caso de probabilidades condicionais, P(A ∩ B) = 
P(A/B)*P(B). Assim, P(B) = P(B/R1)*P(R1) + P(B/R2)*P(R2) + P(B/R3)*P(R3). 
De forma geral, a probabilidade total poderá ser escrita da seguinte forma: 
P(B) = P(B/R1)*P(R1) + ... + P(B/Rn)*P(Rn). 
 
De forma geral:    







n
i
i
i
RPR
BPBP
1
* 
 
Determinada doença pode ser diagnosticada mediante teste em 50% dos que 
tomam determinada substância. Caso não seja ingerida tal substância, sua 
probabilidade de diagnóstico é de 25%. Detectou-se que a probabilidade de 
ingestão da substância ocorreu em 30% dos que se submeteram ao teste. Qual 
a probabilidade da doença ser diagnosticada? 
 
Eventos: Ocor  A doença ocorrer; Ing  Ingestão da substância; Ning  Não 
ingerir a substância. 
 
P(Ocor) = P(Ocor / Ing) * P(Ing) + P(Ocor / Ning) * P(Ning) 
P(Ning) = 1 - 0,3 = 0,7 
 6
P(Ocor) = 0,5 * 0,3 + 0,25 * 0,7 = 0,325 = 32,5%. 
 
Teorema de Bayes 
 
Caso se deseja avaliar a probabilidade de ocorrência de uma das componentes 
dado que a probabilidade total tenha ocorrido, tem-se: P(Ri / B) = P(Ri ∩ B) / 
P(B)  P(Ri ∩ B) * P(Ri). Substituindo-se os valores, tem-se: 
 
 


















n
K
K
K
i
ii
RPR
BP
RPR
BP
B
RP
1
*
*
 
As equipes A e B são responsáveis por 60% e 40%respectivamente, da 
análise de amostras. Os índices de defeitos nas análises das equipes são 3% e 
7% respectivamente. (Estas análises irão ser repetidas) Se uma análise 
defeituosa for selecionada da produção das equipes, qual é a probabilidade de 
que tenha sido produzida pela equipe B? 
 
Eventos: 
A: A análise ter sido produzida pela equipe A; 
B: A análise ter sido produzida pela equipe B; 
d: a análise ser defeituosa (necessitar ser repetida) 
 
      
        
%.87,606087,0
4,0*07,06,0*03,0
4,0*07,0
*/*/
*/





BPBdPAPAdP
BPBdP
d
BP 
 
 
 7
Distribuição de probabilidade: 
 
Fornece a probabilidade de cada valor de uma variável aleatória. 
 
Variável - Consiste em qualquer característica que pode ser medida ou 
categorizada. 
Variável aleatória: Uma variável que tem um valor numérico único (determinado 
aleatoriamente), para cada resultado de um experimento. 
Variável Aleatória discreta: Admite número finito de valores ou quantidade 
enumerável de valores. 
Variável Aleatória Contínua: Admite valores mensuráveis em uma escala 
contínua podendo ser infinitos valores entre 
dois valores, pois depende da escala a ser 
utilizada. 
 
Cada variável aleatória tem uma distribuição correspondente. 
 
Distribuição de probabilidade - Consiste num conjunto de valores de uma 
variável aleatória juntamente com suas 
probabilidades correspondentes. 
 
Famílias de distribuições: Pelo fato das distribuições serem utilizadas para 
modelar populações, lidam-se com famílias ao 
invés de uma única. A família é indexada por um 
ou mais parâmetros, o que permite variar certas 
características da distribuição, ao mesmo tempo 
em que permanece com uma forma funcional. 
 
Distribuições Discretas: Distribuição uniforme discreta; distribuição de 
Bernoulli; distribuição hipergeométrica; 
distribuição binomial; distribuição de Poisson; 
distribuição binomial negativa e distribuição 
geométrica. 
Distribuição Binomial – Consiste numa distribuição que tem como base uma 
variável aleatória discreta dicotômica (que pode 
assumir um de dois possíveis valores, que 
costumam ser denominadas de fracasso ou 
sucesso, representadas, respectivamente, por 0 e 
1). 
 
Distribuição de Poisson – Distribuição discreta de probabilidade que se aplica 
às ocorrências de um evento ao longo de um 
intervalo especificado de tempo, distância, área, 
volume ou outra unidade semelhante. Esta 
distribuição pode ser usada como aproximação da 
distribuição binomial, em casos onde o número de 
eventos é muito grande e a probabilidade de 
ocorrência, muito pequena. Chamadas situações 
limítrofes. 
 
 8
Distribuições Contínuas: Distribuição uniforme; distribuição de Weibull; 
distribuição gama; distribuição normal; 
distribuição beta; distribuição de Cauchy; 
distribuição lognormal e distribuição normal 
dupla. 
Distribuições de Amostragem: Distribuições de probabilidade de estatísticas 
ou de funções de estatísticas, que descrevem 
seu comportamento ao longo de infinitas 
amostras. Distribuição associada à média – 
Distribuição t de Student. Distribuição 
associada à variância – Distribuição qui-
quadrado. Distribuição associada à razão 
entre duas variâncias – Distribuição F de 
Snedecor. 
------------------------------------------- 
 
Na distribuição binomial, a parte referente ao binômio de Newton consiste no 
número de resultados com exatamente X sucessos em N provas. 
 
A parte referente aos valores de “p” e “q” consiste na probabilidade de X 
sucessos em N provas para determinada ordem. 
 
Distribuição Binomial 
 
Fórmula: 


ordem.
adeterminad para provasn em
sucessos x de adeprobabilid
provasn em
sucessos x exatamente com
 resultados de 
*
!)!(
!**)( xnx
Número
xnxn
x qPxxn
nqP
x
n
XP C  




 
 
 
Resolução de um binômio de Newton e suas implicações com a distribuição 
binomial: 
 
 
A parte envolvendo as combinações entre o número de resultados com 
exatamente X sucessos em ‘n’ provas tem como princípio a relação (p + q)n, a 
saber: 
 
 
 
  .7213535217qp
...
1. e 2 1; :são escoeficient Cujos 2
1. e 1 :são soeficiente Cujos 
.1 ecoeficient úinco Cujo )(
7652433425677
222
1
0
qpqqpqpqpqpqpp
qpqpqp
qpqp
qp




 
 
 
Se estivermos diante da seguinte situação: n = 7 e x = 3: 
 9
 
.35 :é deseja se que componente a caso, Neste 35
!37!*3
!7
3
7
3
7 43qpC 






 
 
Uma forma de verificar os coeficientes, conforme o expoente a ser utilizado é 
mediante o triângulo de pascal, a saber: 
 
1 
1 1 
1 2 1 
1 3 3 1 
1 4 6 4 1 
1 5 10 10 5 1 
1 6 15 20 15 6 1 
1 7 21 35 35 21 7 1 
 
 
Parâmetros – características - da distribuição: 
Média: μ = n * p; 
Variância: σ2 = n * p * q; 
Desvio Padrão: σ = (n * p * q)1/2 
Função característica:    niwpeq  
 
Esta distribuição permite o estudo de fenômenos que só contemplam duas 
alternativas: Sucesso ou fracasso. Esses tipos de ensaios são ditos 
independentes. Como esses ensaios foram investigados por James Bernoulli, 
no final do século XVII, são denominados ensaios de Bernoulli. 
 
Aplicação: Os registros dos laboratórios indicam que 30% dos exames são 
pagos mediante planos de saúde. De 10 exames feitos, qual a probabilidade 
de, exatamente três, serem pagos pelos planos? 
 
x = número de exames pagos pelos planos 
n = 10; p = 30% = 0,3; q = 1 - 0,3 = 0,7. 
%.68,262668,0)3()7,0(*)3,0(*
!3)!310(
!10)7,0(*)3,0(*
3
10
)3( 733103 







  pp 
 
Se a probabilidade de ocorrência de procedimento equivocado nas análises 
laboratoriais é de 30%, determinar a média e o desvio padrão da distribuição 
de procedimentos inadequados num total de 800 exames. 
n = 800; p = 0,3; q = 1 - 0,3 = 0,7. 
μ = n * p = 800 * 0,3 = 240 ocorrências de procedimentos inadequados 
σ = (n * p * q)1/2 = (800 * 0,3 * 0,7)1/2  σ  12,96 ocorrências. 
 
Um exemplo com complemento: 
 
Um levantamento efetuado num laboratório indicou que 20% dos exames para 
detectar dengue não apresentam diagnósticos verdadeiros, isto é, se trata de 
outra enfermidade. Se em determinado dia foram feitos 07 exames, determine 
 10
a probabilidade de que, no mínimo, três exames não apresentem diagnósticos 
verdadeiros. 
 
Exame c/ diagnóstico verdadeiro: P(V) = 0,8 
Exame com diagnóstico falso: P(F) = 0,2 
 
P[X 3] = 1 – P[X 2] = 
 
 
%3328,99995328,0004672,01
1*0000125,0*18,0*000064,0*764,0*00032,0*211
8,0*2,0*
0
7
8,0*2,0*
1
7
8,0*2,0*
2
7
1
8,0*2,0*
7
7
8,0*2,0*
6
7
8,0*2,0*
5
7
1
071625
071625




















































ou
 
 
Uma aplicação interessante da distribuição binomial, na prática, foi a seguinte: 
 
Até o ano de 1981 o vestibular da UFBA apresentava provas com questões de 
múltipla escolha com cinco alternativas cada. De A até E. De 1982 em diante, 
foi dotado um novo sistema, em que cada questão apresenta 100 alternativas, 
variando de 00 a 99. Onde entra a distribuição binomial nessa história? 
 
Um candidato faz uma prova com 100 questões. Na primeira situação, ele 
encontrará cinco alternativas em cada questão. Numa segunda situação, ele 
encontrará 100 alternativas em cada questão. Se ele não sabe absolutamente 
nada, qual a média e o desvio padrão de acertos nas provas às quais ele se 
submeteu? 
 
Sistema 1: Alternativas (A; B; C; D e E). 
 
questões. 24 a 16 entre Acertaria 4
5
4*5
1*100**
20
5
1*100*




qpn
pn
 
 
Sistema 2 - Alternativas: 
1 2 3 4 5 6 7 8 9 0 
1 2 3 4 5 6 7 8 9 0 
 
questões. 0,9951 Acertaria 995,0
100
99*
100
1*100**
1
100
1*100*




qpn
pn
 
 
Este sistema se for feito apenas com questões abertas, praticamente elimina o 
chute! 
 11
 
Distribuição de Poisson 
 
Quando o número de provas (n) tende para o infinito e a probabilidade (p) do 
evento de cada prova é próxima de zero, tem-se um caso limítrofe da 
distribuição binomial, sendo a distribuição de Poisson adequada para eventos 
independentes e raros. Assim, 
!
***lim)(
x
eqp
x
n
xp
x
xnx
x
 
 





 
 
onde: 
x = número de ocorrências ou sucessos; 
λ = valor esperado [média]  λ = n * p 
Variância  σ2 = λ 
e = base neperiana ou natural = 2,71828, oriunda da relação: 
.)(lim11)( exf
x
xf x
x





   
 
Principais características: 
   1
2
: 
:
:
:




iweeticaCaracterísFunção
PadrãoDesvio
Variância
Média




 
 
 
Pode-se exemplificar tal situação com um exemplo, como segue: 
Uma alteração ocorre nove vezes a cada 1000 exposições à luz de 
determinada substância. Calcule a probabilidade de que num laboratório onde 
foram feitas: 
a) 200 exposições sejam detectadas oito alterações; 
b) 500 exposições, não haja nenhuma alteração. 
 
Experimento 
Observação de uma alteração 






991,0009,01)(
009,01000
9)(
Np
Ap 
 
No item a, o experimento é repetido independentemente 200 vezes 
Há interesse na ocorrência de oito sucessos ( A = alteração) e 192 fracassos 
independentes da ordem de ocorrência. 
Resposta do item (a): 
.00042,000045,0
!8
)8,1(*
)8(
8,1009,0*200*00042,0)991,0(*)009,0(*
8
200
)8(
88,1
1928








exp
pnxp 
 
 
 12
 
Resposta do item (b): 
0111,0
!0
)5,4(*)0(5,4009,0*500*
05,4

exppn 
 
Distribuição Normal de probabilidade 
 
Representação Gráfica: 
 
 
 
Função matemática: 
2
2
1
*
2
1)(





 

 


x
exf
 
 
 
Média = μ; 
Variância: σ2(x) = σ2. 
Desvio Padrão: σ 
Função característica:  









 2
22


i
ew 
 
Algumas propriedades: 
- A probabilidade de um valor singular é zero; 
- Só há sentido em determinar probabilidade de intervalos. 
- O espaço amostral (S) tem probabilidade demonstrada pela seguinte relação: 
][1)( Sdxxf 


 
Como muitos fenômenos estudados na Agronomia, na Biologia e na Medicina 
Veterinária são normalmente distribuídos ou muito aproximados, torna-se 
indispensável o estudo e o domínio do conhecimento desta distribuição, sendo, 
inclusive, um dos pressupostos da análise de variância, técnica amplamente 
 13
utilizada na pesquisa, seja na Experimentação Agrícola, Ciência Animal e/ou 
Ciências Biológicas. 
 
Para calcular uma probabilidade seria necessário calcular uma integral definida 
entre dois pontos da curva, para se obter a área sob a curva. Para não 
dificultar, adota-se a curva normal padronizada a partir do escore (Z), com 
auxílio de uma tabela, a saber: 
 



xZ 
 
Neste momento torna-se pertinente demonstrar o que ocorre se fizermos três 
intervalos, utilizando a distribuição normal. São eles: ; 2 e 3, a 
saber: 
 
 
 
No caso do intervalo: , tem-se: 
 
 
 
 
    %.26,686826,03413,0*2
3413,000,100,1











PP
ZPZXZ
 
 
Significa que cerca de 68,26% dos valores da distribuição estão contidos neste 
intervalo. 
 
 14
No caso do intervalo: 2, tem-se: 
 
 
 
 
    %.959544,024772,0*22
4772,000,200,22











PP
ZPZXZ
 
 
Significa que cerca de 95% dos valores da distribuição estão contidos neste 
intervalo. 
 
No caso do intervalo: 3, tem-se: 
 
 
 
 
    %.999974,034987,0*23
4987,000,300,33











PP
ZPZXZ
 
 
Significa que cerca de 99% dos valores da distribuição estão contidos neste 
intervalo. 
 
Exemplos: 
 
O tempo que determinada substância leva para reagir na presença de material 
orgânico é de 1,5 horas, com desvio padrão de 0,3 horas. Se tal processo 
apresenta distribuição normal, qual o percentual de material orgânico que terá 
reagido antes de uma hora? 
 
 15
 
 
 
 
  %.75,44525,05,00,1
4525,067,167,1
3,0
15,13,0 ;5,1




XP
ZPZ
 
 
 
A altura dos indivíduos de uma população distribui-se normalmente com média 
μ = 1,5 e desvio padrão  = 0,09m. Qual a percentagem nesta distribuição, de 
indivíduos com altura acima de 1,8m ou mais? 
 
 
 
 
 
  %.04,04996,05,08,1
4996,033,333,3
09,0
5,18,109,0 ;5,1




XP
ZPZ
 
 
Operações com distribuição normal: 
 
O peso de um produto usado na despoluição de reservatórios de água tem 
distribuição normal com média 230g e desvio padrão 3g. Este produto é 
embalado em caixas que contém 20 unidades cada, sem blister. A caixa vazia 
tem peso distribuído normalmente com média 30g e desvio padrão 5g. Calcule 
a probabilidade de uma caixa cheia pesar mais de 4660g. 
 
 
 
 = 30g + 20 * 230g = 4630g 
 16
 
3178,14205)3(*20)5( 22  
 
09,2
3178,14
46304660






XZ 
 
P(Z) = 0,4817  P(X>4660) = 0,5 – 0,4817 = 1,83%; 
 
Relações entre as distribuições: Binomial, de Poisson e a distribuição 
Normal: 
 
Quando n é grande e p e q não estão muito próximos de zero, a distribuição 
binomial se aproxima muito da distribuição normal. Matematicamente, tal 
fenômeno pode ser simbolizado da seguinte forma: 
 
dueb
npq
npXaP
npq
npXZ
b
a
u
n 














 2
2
2
1lim

 
 
Assim, a variável aleatória padronizada 
npq
npX  é considerada assintoticamente 
normal. 
 
A mesma coisa pode-se aplicar à distribuição de Poisson, a saber: 
 
duebXaP
b
a
u
u












2
2
1lim



 
 
Assim, a distribuição de Poisson se aproxima da distribuição normal quando 





Xou é assintoticamente normal. 
 
 
 
 
 
 
 
Distribuição Qui-Quadrado 
 
Representação gráfica: 
 
 17
 
 
Sejam {X1, X2, ..., Xv} v variáveis aleatórias independentes e normalmente 
distribuídas com média zero e variância 1. Considerando-se a variável 
aleatória: 222
2
1
2 ... v  , onde 
2 é chamado qui-quadrado. Então se 
pode demonstrar que p/X0: 
 
 
  .0/0
2
2
1
2
0
2
1
2
2
2







 






xpxP
dueu
v
xP
x uu
v


 
 
Esta distribuição é chamada de qui-quadrado e o número de graus de liberdade 
associado a ela é v. A distribuição qui-quadrado é um caso especial da 
distribuição gama e apresenta as seguintes características principais: 
 
    2
2
21
2
v
i
v
v






 
 
Para v > 30 pode-se demonstrar que 122 2  v se aproxima muito de ser 
normalmente distribuída, com média 0 e variância 1. 
 
A importância da distribuição qui-quadrado, além de ser uma distribuição típica 
apresentada pela da variância, também está no fato de proporcionar estudos 
com variáveis categóricas, estudos não paramétricos, além de verificação de 
associaçãoe/ou independência entre fatores (tabelas de contingência ou de 
 18
dupla entrada), muito comumente estudadas nas áreas de Ciências Biológicas, 
Ciências da saúde, Agronomia e Medicina Veterinária. 
 
Quando se estuda a técnica da análise de variância, de forma geral, pode-se 
perceber que se trata da razão entre duas variâncias, uma devido ao que o 
pesquisador quer estudar, portanto provocada, e outra devido aos fatores 
aleatórios, causados pelos fenômenos naturais. Por se tratar da razão entre 
variâncias, ambas com distribuição qui-quadrado, utiliza-se a distribuição F, 
mediante aplicação do teste F. Este estudo é muito utilizado quando se deseja 
estudar os efeitos de mais de dois tratamentos, num experimento. 
 
Distribuição t de Student 
 
É chamada distribuição t de Student ou ainda distribuição t, com v graus de 
liberdade. O termo Student foi um pseudônimo utilizado pelo Gosset, 
responsável pela elaboração da mesma. 
 
Estatística: 
 
 
2
1
2
1*
2
2
1
;




















 







ttf 
 t 
 
 
Representação gráfica: 
 
 
Algumas características desta distribuição: 
 .2;
2
0
2 



v
v
v

 
 
 19
Considerando-se Y e Z variáveis aleatórias independentes, onde Y é 
normalmente distribuída com média 0 e variância 1, enquanto Z tem 
distribuição qui-quadrado com v graus de liberdade. Então a variável aleatória 
v
Z
YT  tem distribuição t com v graus de liberdade. 
 
Esta distribuição é utilizada com muita freqüência quando se têm pequenas 
amostras n  30 elementos. Quando o número de graus de liberdade é muito 
grande, esta distribuição se aproxima da distribuição normal padrão. 
 
Utiliza-se para construção de intervalos de confiança, testes de hipóteses, 
quando temos dois grupos a serem comparados, sejam resultantes de dados 
pareados, amostras independentes, com variâncias consideradas iguais e/ou 
distintas. Além disso, também é utilizada no dimensionamento de amostras. 
 
Distribuição F – também conhecida como distribuição F de Snedecor. 
 
A denominação F foi uma homenagem ao R.A. Fisher. 
 
Estatística: 
 
 





 



































 

2
2
1
1
2
2
2
1
21
21 21
1
1
*1**
2
*
2
22,1,









 FFFf 
 
Representação Gráfica: 
 
 
 
 
A distribuição F é resultante da razão, ou quociente, entre duas variáveis com 
distribuição qui-quadrado, com n1 e n2 graus de liberdade, respectivamente. 
 
 
 
)12;11(;
12;
11;
2
2
2
1 


nnF
n
n




 
 20
 
Maiores detalhes serão vistos e estudados, com maior riqueza de exemplos e 
aplicações, quando chegarmos à parte de Testes de Hipóteses. 
 
Esta distribuição é de fundamental importância quando se estuda a técnica da 
análise de variância, que é um dos fundamentos da pesquisa agrícola, na área 
de ciência animal, ciências biológicas e da saúde, além da área da engenharia. 
 
Relacionamento entre as distribuições qui-quadrado, t e F 
 
Pode-se demonstrar matematicamente que as distribuições se relacionam da 
seguinte forma: 
v
F
tF
vP
vP
vP
vP
2
,
,,
2
,
2
1
,1,1











 
 
De forma resumida, pode-se afirmar que elas se aproximam ao passo que o 
tamanho do conjunto de observações é muito grande. 
 
Mais alguns aspectos práticos relevantes a respeito das distribuições de 
probabilidade: 
 
Aos que fazem os cursos de Agronomia e Zootecnia, que cursam a disciplina 
Estatística Experimental, ou Biometria, ou disciplinas correlatas, saberão a 
importância destas distribuições estudadas de forma resumida nesta 
oportunidade. As demais áreas terão iniciação nestes assuntos, além da 
grande parte daqueles que foram fazer cursos de pós graduação. Pesquisa 
nas áreas biológicas, animal e agronômica, além dos dados observacionais, 
também utilizam muito a técnica da análise de variância, fortemente embasada 
nestas distribuições. 
 
Portanto, ao recomendar novas técnicas, novas fontes e/ou formas de 
aplicação de fertilizantes, defensivos agrícolas, métodos de controle biológico, 
métodos de irrigação, combinação de diferentes fontes de alimentos para os 
animais, novas variedades e/ou cultivares, além de muitas outras coisas, 
mesmo sem perceber, a maioria dos profissionais estão se baseando em 
resultados de pesquisas cujos fundamentos, cujas técnicas, são baseadas nas 
distribuições de probabilidade. 
 
 
Nas áreas de Engenharia e Informática, pode-se levar em consideração certos 
princípios orientadores que podem ser seguidos na escolha de uma distribuição 
de probabilidade para uma determinada aplicação, assim como para se 
determinar qual distribuição de probabilidade utilizar ao resolver problemas 
e/ou questões. 
 
 21
Alguns exemplos podem ser citados, por distribuição, conforme as 
características apresentadas: 
 
Distribuição de Bernoulli: 
 
- Lançar uma moeda e observar se ocorre cara ou não; 
- Lançar um dado e observar se ocorre seis ou não; 
- Numa linha de reposição, observar se um item, tomado ao acaso, é ou não 
defeituoso; 
- Verificar se um servidor de uma intranet está ou não ativo. 
 
Distribuição Binomial: 
 
- Lançar uma moeda cinco vezes e observar o número de caras; 
- Numa linha de produção, observar dez itens, tomados ao acaso, e verificar 
quantos estão defeituosos; 
- Verificar, num dado instante, o número de processadores ativos, num sistema 
com multiprocessadores; 
- Verificar o número de bits que não estão afetados por ruídos, em um pacote 
com n bits. 
 
Distribuição de Poisson: 
 
- Número de consultas a uma base de dados em um minuto; 
- Número de pedidos a um servidor num intervalo de tempo; 
- Número de erros de tipografia em um formulário; 
- Número de defeitos em um m2 de piso cerâmico; 
- Número de pulsações radioativas em um intervalo de tempo, na 
desintegração dos núcleos de uma substância radioativa. 
 
Na Engenharia, e na Informática, algumas variáveis aleatórias podem ser 
citadas como exemplo de variáveis aleatórias contínuas, a saber: 
 
- Tempo de resposta de um sistema computacional; 
- Rendimento de um processo químico; 
- Tempo de vida de um componente eletrônico; 
- Resistência de um material. 
 
Há, também, outras variáveis de natureza aleatória discreta, que podem ser 
utilizadas como contínuas, dado o grande número de possíveis resultados, a 
saber: 
 
- Número de transações por segundo de uma CPU; 
- Número de defeitos numa amostra de 5 mil itens. 
Distribuição Exponencial: 
- Tempo (em minutos) até a próxima consulta a uma base de dados; 
- Tempo (em segundos) entre pedidos a um servidor; 
- Distância (em metros) entre defeitos de uma fita. 
 
 
 22
A Distribuição Normal é considerada a mais importante, tanto por permitir 
modelar muitos fenômenos naturais quanto por possibilitar aproximações com 
outras distribuições, possibilitando cálculos de probabilidades de muitas 
variáveis aleatórias que seguem, na verdade outras distribuições.

Continue navegando