Resumo de Estatística e Probabilidade

•

PITÁGORAS

Cássio Lucas

08.11.2013

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 21 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 21 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 21 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Probabilidade e Estatística

28.934 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1 
ESTATÍSTICA – Resumo Prof. Ricardo Luís Rocha 
Estatística é uma coleção de métodos para planejar experimentos, obter dados e organizá-los, resumi-los, analisá-los, interpretá-
los e deles extrair conclusões. 
5 etapas: 
1) Definir cuidadosamente o problema 
2) Formular um plano para coleta dos dados 
3) Coligir os dados 
4) Analisar e interpretar os dados 
5) Relatar as conclusões 
 
É dividida em três partes: 
Estatística Descritiva, Probabilidade e Amostragem 
 
1. Definições: 
1. MODELO 
Versão simplificada de algum problema ou situação da vida real destinado a ilustrar certos aspectos. 
 
2. PROBABILIDADES 
A teoria da probabilidade proporciona uma base racional para lidar com situações influenciadas por fatores relacionados ao 
acaso. 
3. AMOSTRAGEM 
Diz respeito à análise e interpretação de dados amostrais. 
A idéia básica é efetuar determinada mensuração sobre uma parcela pequena, mas típica, de determinada “população” e utilizar 
esta informação para fazer inferência sobre a população toda. 
 
4. POPULAÇÃO 
É uma coleção completa de todos elementos (valores, 
pessoas, medidas etc.) a serem estudados. 
 
5. AMOSTRA 
É uma parte extraída dos elementos da população. 
 
6. CENSO 
É uma coleção de dados relativos a todos elementos de uma 
população. 
 
7. PARÂMETRO 
Medida numérica que descreve uma característica da 
população. 
 
8. ESTATÍSTICA 
Medida numérica que descreve uma característica de uma 
amostra. 
 
9. DADOS QUANTITATIVOS 
Constituem-se em números que representam contagens ou medidas. 
 
10. DADOS CONTÍNUOS 
São os dados quantitativos referentes às variáveis contínuas que podem assumir qualquer valor num intervalo contínuo. (Para 
solução de problemas: 1- Determinar intervalo de dados; 2- Determinar o número k de classes; 3- Calcular a amplitude da 
classe; 4- Estabelecer limites de classes; 5- Relacionar os intervalos e fazer a contagem; 6- Construir a tabela.) 
 
11. DADOS DISCRETOS 
São dados quantitativos referentes às variáveis discretas que assumem valores inteiros e são resultantes de uma contagem de 
itens. (Para solução de problemas: 1- Estabelecer as classes; 2- Enquadrar os dados nas classes; 3- Contar o número em cada 
classe; 4- Apresentar os resultados em tabela.) 
 
12. DADOS QUALITATIVOS (ou categóricos ou atributos) 
Podem ser separados em diferentes categorias que se distinguem por uma característica não-numérica. 
NOTAÇÃO
Característica amostra população
 Somatório de um conjunto de valores
Valores individuais dos dados x i x i
Número de valores (tam. do conjunto) n N
Média x 
Desvio padrão s 
 2s 2Variância
Range R -
CV= Sx x100Coef. Variação
Proporção x/n x/N
x
-
 2 
 
13. DADOS NOMINAIS 
Surgem quando se definem categorias e se conta o número de observações pertencentes a cada categoria. São dados qualitativos 
e não podem ser dispostos em um esquema ordenado. 
 
14. DADOS POR POSTOS OU ORDINAIS 
Consistem de valores relativos atribuídos para denotar ordem: primeiro, segundo, terceiro, pequeno, médio, grande, pouco, 
médio, muito etc. São dados qualitativos, referem-se tipicamente a avaliações subjetivas 
 
15. MEDIDAS DE POSIÇÃO (tendência central) 
 Média aritmética de um conjunto de valores 
n
x
xou 
n
x
x 1
i 
 
n
i 
Características: 
- É a mais importante das medidas de tendência central 
- A média de um conjunto de números pode ser sempre calculada 
- Para um dado conjunto de números, a média é única 
- É sensível a (ou afetada) todos os valores do conjunto. Assim se um valor se modifica, a média também se modifica 
- Somando-se ou reduzindo-se uma constante a cada valor do conjunto, a média ficará aumentada ou reduzida dessa 
constante. µ(x ± k) = µ (x) ± k 
- Multiplicando-se ou dividindo-se cada valor do conjunto por uma constante, a média ficará multiplicada ou reduzida 
por essa constante. µ(x .\ k) = µ (x) .\ k 
- µ(x ± y) = µ (x) ± µ (y) e µ (x.\y) = µ (x) .\ µ (y) (só se x e y forem independentes 
- A somas dos desvios dos números de um conjunto a contar da média é zero 
- É conhecida como o centro de gravidade do conjunto de valores 
 
 Média ponderada 



n
i
i
x
x
n
x
1
1
 
 
 Média geométrica 
  nnn ng xxxxxxx
1
2121 ....*....* 
 
 
 Média harmônica 



n
i
i
n
i
iip wxwx
11
 
W – peso de cada elemento X – valor de cada elemento 
natureza dos dados
alunos 2º grau idades, pesos nº da classe menino/menina 2º grau
automóveis velocidade
Km/h
nº defeitos /
carro
 cores grau de
limpeza
vendas de
imóveis
valor Cr$ n º ofertas acima do preço muito
dispendioso
populações
contínuo discreto nominal
por postos
ou ordinal
 3 
 Mediana 
 
Divide um conjunto de dados ordenados em dois grupos iguais. 
 
Conjunto de valores pares ( n = par) 
  
2
122 

nn valorvalor
MD
 
Conjunto de valores impares ( n = par) 
  12  nIntvalorMD
 
 
 
 Moda 
 
É o valor ou classe de maior freqüência num conjunto de dados. 
- pode não existir 
- pode não ser única 
 
 Quartis, decis, percentis 
 
Os 3 quartis dividem conjuntos de dados ordenados (ordem crescente) em 4 partes iguais: 
Q1  25% dos valores serão inferiores ao primeiro quartil (Q1) 
Q2  50% serão inferiores ao segundo quartil (Q2 = mediana) 
Q3  75% serão inferiores ao terceiro quartil (Q3) e 25% serão superiores ao terceiro quartil 
 
Há 9 decis denotados por D1, D2, D3, ......D9, que dividem os dados (ordem crescente) em 10 grupos com cerca de 10% deles 
em cada grupo. 
 
Há 99 percentis que dividem os dados (ordem crescente) em 100 grupos com cerca de 1% em cada grupo. 
 
16. MEDIDAS DE DISPERSÃO 
 Amplitude, range ou intervalo 
É expresso pela diferença entre o maior e o menor número num grupo, ou pela identificação desses dois números. 
Limitação: só leva em conta os dois valores extremos do conjunto, nada informando sobre os outros valores. 
 
 Desvio médio absoluto 
n
xx
DMA
i 

 
 
Conquanto o desvio médio absoluto seja fácil de entender, não é muito usado como medida de dispersão, porque outras 
medidas apresentam propriedades matemáticas mais interessantes. 
O DMA apresenta algumas aplicações no controle de inventários. 
apropriada para dados 
ao nível nominal 
não não pode não existir; 
pode ter mais de 
uma moda 
usada às 
vezes 
valor mais 
freqüente 
moda 
costuma ser boa escolha 
se há valores extremos 
não não existe sempre usada valor 
 médio 
mediana 
muito utilizada em 
estatística 
sim sim existe sempre “média” 
mais familiar 
 média 
vantagens e 
desvantagens 
afetada pelos 
valores 
extremos? 
leva em 
conta todos 
os valores? 
existência quão 
freqüente 
definição medida 
x = 
 x 
n 
 4 
 
 Variância 
   
1
ou 
1
22
2
2
2







n
nxx
S
n
xx
S
ii
x
i
x
 
n – 1 amostra; n população 
 
Características: 
- A variância de uma constante é nula 2(k) = 0 
- Se multiplicarmos todos os valores de uma variável aleatória por uma constante, sua variância fica multiplicada pelo 
quadrado da constante 2(kx) = k2 . 2(x) 
- A variância de uma soma ou diferença de variáveis aleatórias independentes é igual à soma das variâncias dessas variáveis 
2(x ± y) = 2(x) + 2(y) 
- Se somarmos ou subtraímos uma constante aos valores de uma variável aleatória, sua variância permanece inalterada 
2(x ± k) = 2(x) Desvio padrão 
   
1
ou 
1
222







n
nxx
S
n
xx
S
ii
x
i
x
 
- só raiz positiva da variância 
- O desvio padrão é mais comumente usado porque se apresenta na mesma unidade da variável em análise. Assim, se a 
unidade da variável for mm, o desvio padrão também será mm. Isso não acontece com a variância. 
- O desvio padrão é a medida de dispersão mais usada. Quanto maior é o desvio padrão maior é a dispersão dos dados em 
torno da média. 
 
 Coeficiente de variação 
100*
x
S
CV% x
 
 
Nos dá a idéia do tamanho do desvio padrão em relação à média. 
Uma pequena dispersão absoluta pode ser na verdade considerável quando comparada com os valores da variável 
 
 
17. DISTRIBUIÇÕES DE FREQÜÊNCIA 
É um grupamento de dados em classes, exibindo o número ou percentagem de observações em cada classe. Uma distribuição 
pode ser apresentada em forma gráfica ou tabular. 
 
 DISTRIBUIÇÃO DE FREQÜÊNCIA PARA DADOS CONTÍNUOS 
Etapas para construção 
1 - Determinar o intervalo dos dados 
2 - Determinar o número K de classes 
É aconselhável tomar entre 5 a 20 classes 
Regra prática: 
n K 
Ajustá-la se for necessário 
Certifique-se que k vezes a amplitude é maior que o intervalo, pois, de outra forma, os valores extremos não serão 
incluídos 
3 - Calcular a amplitude da classe 
Amplitude = intervalo / nº de classes (k) 
É importante que não ocorra lacunas na fixação das classes (deve haver uma classe para cada valor) 
As classes não devem intercepta-se (um valor deve pertencer a só uma classe 
4 - Estabelecer limites de classes preliminares. Rever os limites, que devem tocar-se mas não intercepta-se 
5 - Relacionar os intervalos e fazer a contagem dos pontos por classe (a contagem total dever ser igual a n) 
6 - Construir uma tabela de freqüência ou histograma de freqüência 
 
 
 
 5 
 Histograma 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 Alternativa ao histograma  POLÍGONO DE FREQÜÊNCIA 
 
Certa quantidade de informação é perdida porque os valores individuais perdem sua identidade quando são grupados em 
classes. 
Para dados discretos isto também pode ocorrer dependendo da natureza dos dados e do objetivo do analista. 
 DISTRIBUIÇÃO DE FREQÜÊNCIA PARA DADOS DISCRETOS 
1. Estabelecer as Classes 
2. Enquadrar os dados nas classes 
3. Contar o nº em cada classe 
4. Apresentar os resultados em tabela 
 
 
0,30 
 
 
 
 
0,20 
 
 
 
 
0,10 
 
 
 
 
0,00 
3 8 13 18 23 28 33 
classes 
fr
eq
ü
ên
ci
a 
re
la
ti
v
a 
o
u
 a
b
so
lu
ta
 
 3 8 13 18 23 28 33 f
r
e
q
ü
ê
n
ci
a
 
classes 
0,30 
 
 
0,20 
 
 
0,10 
 
 
0,00 
safras 
P
er
ce
n
ta
g
em
 d
e 
ár
v
o
re
s 
Gráfico de barras Histograma 
0 1 2 3 4 5 6 7 8 9 
 
4 acidentes por dia 
ocorreram 9 vezes (18%) 
a) sem perda de informação 
20 
 
 
15 
 
 
10 
 
 
5 
fr
eq
ü
ên
ci
a 
d
e 
ac
id
en
te
s 
b) com perda de informação 
20 
 
 
15 
 
 
10 
 
 
5 
0-1 2-3 4-5 6-7 8-9 
fr
eq
ü
ên
ci
a 
d
e 
ac
id
en
te
s 
 6 
fr
eq
ü
ên
ci
a 
fr
eq
ü
ên
ci
a 
Determinação da moda num gráfico 
a) sem perda b) com perda 
moda 
classe modal 
 DISTRIBUIÇÃO DE FREQÜÊNCIA ACUMULADA PARA DADOS DISCRETOS 
A freqüência acumulada tem por objetivo indicar o número ou percentagem de itens menores do que, ou iguais a determinado 
valor. 
 
 
18. MEDIDAS DA DISTRIBUIÇÃO DE FREQÜÊNCIA 
 
 Média 
nfxxnfcx
n
i
ii
n
i
ii 











 
 11
ou 
 
 
n - número de elementos do conjunto de dados 
c i - centro de cada classe de freqüência 
f i - freqüência de cada classe 
 
 Mediana - MD 
 
mf
md
a
i h
f
Fn
LMD 
2 

 
L i - limite inferior da classe que contém a mediana 
n - número de elementos do conjunto de dados 
F a - soma das freqüências das classes anteriores à que contém a mediana 
f md - freqüência da classe que contém a mediana 
h md - amplitude da classe que contém a mediana 
(1. Identificar o intervalo que contém a mediana; 2. determinar a posição; ordenar os valores da classe; 4. identificar a mediana) 
 
 Moda - MO 
h
dd
d
LMO i 
21
1


 
Mo - valor ou valores num conjunto de dados 
L i - limite inferior da classe modal 
d 1 - diferença entre a freqüência da classe modal e da classe 
imediatamente anterior 
d 2 - diferença entre a freqüência da classe modal e da classe 
imediatamente seguinte 
h - amplitude das classes 
DADOS DISCRETOS 
Sem perda de informação 
fr
eq
ü
ên
ci
a 
ac
u
m
u
la
d
a 
1,00 
 
0,80 
 
0,60 
 
0,40 
 
0,20 
 
0,00 
78% dos acidentes 
acorreram 6 vezes 
por dia ou menos 
0 1 2 3 4 5 6 7 8 9 
Com perda de informação 
fr
eq
ü
ên
ci
a 
ac
u
m
u
la
d
a 
1,00 
 
0,80 
 
0,60 
 
0,40 
 
0,20 
 
0,00 
0-1 2-3 4-5 6-7 8-9 
com perda de informação sem perda de informação 
 7 
 Variância 
   
1
ou 
1
22
2
2
2






 
n
nxfxf
s
n
xxf
s
iiiii
 
 
Na utilização da classe de freqüência com perda de informação, x i é o centro da classe de freqüência. 
O desvio padrão é a raiz positiva da variância. 
 
19. MEDIDAS DE FORMAS DAS DISTRIBUIÇÕES DE FREQÜÊNCIA 
 ASSIMETRIA 
 ACHATAMENTO 
O coeficiente de achatamento (Kurtosis) é uma medida de planicidade (flatness) da distribuição. 
 2 = 3 - planicidade de uma curva normal - mesocúrtica 
 2 = 4,5 - curva bastante aguda -leptocúrtica (leptokurtosis) 
 2 = 1 - curva mais achatada – platicúrtica (platykurtosis) 
 
 
20. BOX-AND-WHISKER PLOTS OU DIAGRAMA EM CAIXA 
Os diagramas em caixa são convenientes para revelar tendências centrais, dispersão, distribuição de dados e presença de 
outliers (valores extremos) 
Para a construção são necessários: 
valor mínimo 
primeiro quartil Q1, 
a mediana (ou segundo quartil Q2) 
terceiro quartil Q3 e 
valor máximo 
A mediana revela a tendência central 
Os quartis indicam a dispersão dos dados 
O diagrama em caixa tem a vantagem de não ser tão sensível a valores 
extremos 
Não dão informações tão detalhadas quanto o histograma ou gráfico de 
ramo-e-folhas 
A melhor aplicação do diagrama em caixa é na comparação de dois ou 
mais conjuntos de dados (é necessário usar a mesma escala). 
 
Não há diferenças substanciais nos dois conjunto de dados. Os não fumantes têm mais valores extremos, mas as medianas 
parecem coincidir. A dispersão dos dados são parecidas 
Obs.: os outliers 8 e 15 foram excluídos 
moda 
mediana 
média média 
mediana 
moda moda = mediana = média 
Assimétrica à esquerda: 
média e mediana estão a 
esquerda da moda 
Simétrica: média, moda e 
mediana coincidem 
Assimétrica à direita: 
média e mediana estão à 
direita da moda 
 = 4,5  = 3,0  = 1,0 
platícúrtica mesocúrtica leptocúrtica 
(normal) 
fumantes não fumantes 
p
u
ls
aç
ão
 
80 
90 
70 
40 
60 
50 
100 
 8 
2.PROBABILIDADES 
1. Conceito: 
É a chance que alguma coisa tem para ocorrer. Exprime a chancede ocorrência de determinado evento. 
Empírico: Fazer vários experimentos e anotar resultados 
Subjetivo: Opinião pessoal. 
 
2. Notação: 
P – denota probabilidade 
A, B, C – denotam eventos específicos 
P(A) – denota a probabilidade do evento A ocorrer 
Pode ser expressa em fração decimal (0 a 1) ou percentagem (0 a 100%), sendo: 
- 0 ou 0% a probabilidade de um evento impossível e 
- 1 ou 100% a probabilidade de ocorrência um evento certo 
 
3. Definição de Probabilidade: 
As probabilidades são utilizadas para exprimir a chance de ocorrência de determinado evento. 
A probabilidade de um certo evento A ocorrer é igual à freqüência relativa de vezes que A é observado, quando o 
experimento é repetido um número infinitamente grande de vezes. 
A probabilidade de ocorrência de um evento é dada por um número que varia de 0 a 1. 
 
4. Definição de Eventos: 
São os resultados possíveis de um experimento. 
ex.: Se o experimento fosse o lançamento de uma moeda, os eventos possíveis seriam cara e coroa. 
 
5. Definição de Conjunto: 
Coleção bem definida de objetos ou itens. 
ex.: conjunto A = {João, Maria , José} 
 
6. Definição de Espaço Amostral: 
É o conjunto de todos os resultados possíveis de um experimento. 
 
7. Definição de Complemento: 
Complemento de um evento consiste de todos os outros resultados do espaço amostral que não façam parte do evento. 
 
8. Definição de Eventos Mutuamente Exclusivos: 
São aqueles que não podem ocorrer simultaneamente. 
ex.: Na extração de uma carta, os eventos a carta é de copas e a carta é de ouros são mutuamente excludentes, pois 
uma carta não pode ser simultaneamente de copas e de ouros. 
 
9. Definição de Eventos Coletivamente Exaustivos: 
Quando somente um resultado é possível de ocorrer em um dado experimento. 
ex.: Na extração de uma carta, os eventos carta preta e carta vermelha são coletivamente exaustivos. Ou seja, somente 
um resultado é possível. 
 
10. Definição de Eventos Independentes: 
Dois eventos são independentes quando a ocorrência ou a não-ocorrência de um não influencia a ocorrência do(s) 
outro(s). 
ex.: A se jogar duas moedas, verificar a probabilidade de ambas darem cara. 
 
11. Eventos dependentes 
Um evento influencia a ocorrência do outro. 
 
 
 
 
 
 
 
 
 
 9 
Os eventos são mutuamente exclusivos ? Sim 
P(A e B) = 0, quando ocorrerem dois eventos 
 
P(A ou B) = P(A) + P(B), quando ocorrer ao menos um de dois eventos 
Não 
Os eventos são independentes ? 
 
por ex.: P(A|B)=P(A) ? 
Sim P(A e B) = P(A) x P(B), quando ocorrerem dois eventos 
 
P(A ou B) = P(A) + P(B) - P(A e B), quando ocorrer ao menos um de dois eventos 
Amostras com reposição Amostras sem reposição 
Binomial 
Quando o valor de n é grande e o 
de p é pequeno, usar a Tabela ou 
a Fórmula de Poisson. 
Hipergeométrica 
O eventos são condicionais ? 
(é um evento dependente do outro ?) 
Quando ocorrerem dois eventos e um depender da 
ocorrência do outro. 
P(A e B) = P(A) x P(B|A) 
P(A e B) = P(B) x P(A|B) 
Não 
Sim 
 
 
 
 
 
 
 
 
PROBABILIDADE 
 
 
 
 
Probabilidade do evento E: 
 
n(A)
n(E)
 P(E) seja,ou 
amostral espaço do elementos de nº
E evento do elementos de nº
)(

EP
 
N
n
EP )(
 
 
00,1)(00,0  EP
 
 
1)(  iEP
 
E de ocorrência-não de adeprobabilid a
)'( sendo )(1)'( EPEPEP 
 
 
CHANCE 
E em NÃO resultados de nº
E em SIM resultados de nº
 E de Chance 
 
Exemplo: Uma urna tem 10 bolas, 8 vermelhas e 2 verdes. 
A chance a favor da vermelha é de 8:2 ou 4:1. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
PROBABILIDADE 
DE OCORREREM 
DOIS EVENTOS 
(A e B) 
Eventos independentes -> a ocorrência ou não de um não influencia a 
ocorrência do outro. 
 
Ex.: Jogam-se duas moedas equilibradas. Qual a probabilidade de ambas 
darem cara ? 
Sol.: P(cara) = 1/2 
logo, P(cara e cara) = 1/2 x 1/2 = 1/4. P(B) x P(A) B)P(A
:notação Outra
.
 idem B),|P(A x P(B) B) eP(A 
ou 
 P(B) A)|P(B tesindependen são
eventos os como mas A),|P(B x P(A) B) eP(A 






P(A) x P(B) B) eP(A 
P(B) x P(A) B) eP(A 
 
Eventos dependentes um do outro. 
(Probabilidade Condicional) 
 
Ex.: A urna Y tem 8 fichas vermelhas e 2 brancas. A urna Z tem 5 vermelhas 
e 5 brancas. Escolhendo a urna Y, qual a probabilidade de sair uma ficha 
vermelha ? 
Sol.: P(Urna Y e ficha vermelha) = 8/20 = 0,40, ou seja: 
A = Urna Y B= ficha vermelha 
P(A)= ½ P(B|A)=8/10, logo 
P(A e B) = 1/2 x 8/10 = 8/20 ou 0,40. 
B)|P(A x P(B) B)P(A
A)|P(B x P(A) B)P(A
:notação Outra
B)|P(A x P(B) B) eP(A 
A)|P(B x P(A) B) eP(A 




 
Se A e B são dois eventos, a probabilidade de B ocorrer, 
depois de A ter ocontecido é definida por P(B|A), ou seja, é 
chamada "probabilidade condicional de B". 
 
Eventos mutuamente exclusivos 
quando a realização de um exclui a realização do(s) outro(s). 
0 B)P(A 
:notação Outra
0 B) e(A P

 
 
 
 
 
 
 
PROBABILIDADE 
DE OCORRER AO 
MENOS UM DE 
DOIS EVENTOS 
 (A ou B) 
 
Eventos mutuamente exclusivos (ou seja, que não podem ocorrer 
simultaneamente), a probabilidade de ocorrência de um deles é a soma de 
suas probabilidades individuais. 
ex.: A probabilidade de ocorrer 5 ou 6 numa jogada com um dado é: 
P(cinco) + P(seis) = 1/6 + 1/6 = 2/6 
 
P(B) P(A) B)P(A
:Notação Outra
P(B) P(A) B)ou P(A 

 
 
Eventos não mutuamente exclusivos, ou seja, é possível a ocorrência 
conjunta de ambos. 
ex.: Em um baralho de 52 cartas há 13 cartas de paus, 4 dez e 1 dez de paus. 
A probabilidade de se tirar 1 carta de paus, ou dez ou ambos (dez de paus) é: 
P(paus) = 13/52 P(dez) = 4/52 P(dez de paus) = 1/52 
Logo, 
 
P(paus, ou dez, ou ambos) =P(paus) + P(dez) – P(dez de paus)= 
13/52 + 4/52 – 1/52 = 16/52. 
vêzes.
duas somada seja não intersecão a que para
B),P(Aou B) eP(A têrmoo se-Subtrai
:Nota
B)P(A - P(B) P(A) B)P(A 
:notação Outra
B) eP(A - P(B) P(A) B)ou P(A 



 
Quando se tem mais de dois eventos, por ex., 
P(A  B  C ) = (1-P(A)) x (1-P(B)) x (1-P(C)) 
 
12. FLUXOGRAMA DA PROBABILIDADE 
 
 
 10 
13. REGRAS DE CONTAGEM 
 
 
 
 
 
QUANDO A ORDEM É 
IMPORTANTE 
 
 
 
 
 
 
ARRANJO 
 
Número de grupamentos em que interfere a ordem. 
 
)!(
!
A xn,
xn
n


 
ex.: Tomando 4 cores: V, A, B, L 
Temos A4,3 = 24 
VAB,VBA,AVB,ABV,BAV,...,etc 
 
PERMUTAÇÃO 
 
Uma permutação é um arranjo com a totalidade dos elementos. 
Com repetição n1, n2, ..., nk 
 
)!)...(!2)(!1(
!
P nkn2,...,n1,n
nknn
n

 
 
 
 
 
QUANDO NÃO INTERESSA A 
ORDEM 
 
 
 
 
 
COMBINAÇÃO 
 
Uma combinação é um maior número de grupamentos possíveis. 
O número de combinações é sempre inferior ao número de arranjos. 
 
)!(!
!
C xn,
xnx
n
x
n








 
 
ex.:Tomando 4 cores: V, A, B, L 
Temos C4,3=4 
VAB, VAL, VBL, ABL 
 
 
 
 
 
 
PROBABILIDADE TOTAL 
 
Sejam B1, B2, B3,...,Bk um conjunto de eventos mutuamente 
exclusivos cuja união forma o espaço amostral. 
Seja A outro evento no mesmo espaço amostral, tal que P(A) > 0. 
Logo, 
 
P(A)= P(AB1) + P(AB2) + +P(AB3)+...+P(ABk) 
 
P(A) = P (B1) x P(A|B1) + P(B2) x P(A|B2) +...+P(Bk) x P(A|Bk) 
 
Logo, 
 
Probabilidade Total =  [P(Bi) x P(A|Bi)] 
 
 
14. REGRA DE BAYES: 
 
Thomas Bayes (1702 ~1761) afirmou que as probabilidadesdevem ser revistas, quando conhecemos algo mais sobre os 
eventos. O teorema de Bayes é uma técnica utilizada para revisar estimativas probabilísticas iniciais com base em dados 
amostrais. 
Na solução pelo Teorema de Bayes, temos de definir: 
1- a probabilidade a priori. 
2- a probabilidade do evento em questão. 
 
Fórmulas: 
P(A) =  [P(Bi) x P(A|Bi) 
P(A  Bi) = P(A) x P(Bi|A) => P(Bi|A) = P(ABi) / P(A) 
 
P(Bi|A) = P(Bi) x P(A|Bi) /  [P(Bi) x P(A|Bi)] 
 
15. DISTRIBUIÇÕES DE PROBABILIDADE 
Uma distribuição de probabilidades é uma distribuição de freqüências para os resultados de um espaço amostral. 
Uma distribuição de probabilidade dá a probabilidade de cada valor de uma variável aleatória. 
 Variável aleatória - va 
É uma variável (geralmente representada por x), que tem um valor numérico único (determinado aleatoriamente) para cada 
resultado de um experimento. 
É uma função com valores numéricos, cujo valor é determinado por fatores de chance 
 Variável aleatória discreta 
toma valores que podem ser contados. 
Número final da placa de carros que chegam ao aeroporto de congonhas 
Número de mulheres entre 10 empregados recém-admitidos 
 Variável aleatória contínua 
toma qualquer valor de um determinado intervalo. 
Altura das mulheres que compareceram ao exame médico no ultimo mês 
 11 
 Valor esperado 
O valor esperado de um experimento é uma média e pode ser calculado 
 
  prazo. longo de médio valor um como dointerpretaser Deve PE
1



n
i
iix x
 
 
Para se ter uma distribuição de probabilidades é necessário: 
 P(x) = 1, onde x toma todos valores possíveis 
0  P(x)  1 para todo o x. 
 
 DESCONTÍNUAS OU DISCRETAS 
Envolvem distribuições de probabilidades de variáveis aleatórias relativas a dados que podem ser contados. 
- BINOMIAL 
- BINOMIAL NEGATIVA OU DE PASCAL 
- GEOMÉTRICA 
- POISSON 
- MULTINOMIAL OU POLINOMIAL 
- HIPERGEOMÉTRICA 
 
 PROCESSO DE BERNOULLI 
- O experimento tem n provas 
- Cada prova tem duas possibilidades: sucesso e falha 
- Cada prova é independente da outra 
- A probabilidade de sucesso ou falhas é constante para todas as provas 
- A distribuição binomial é um processo de Bernoulli 
- A distribuição hipergeométrica não é um processo de Bernoulli 
 
 DISTRIBUIÇÃO BINOMIAL 
Designa situações em que os resultados de uma variável aleatória podem ser grupados em duas classes ou categorias (prova de 
Bernoulli) 
 
Exemplos de eventos binomiais 
- Respostas nominais (sucesso ou falha; V ou F; sim ou não; perfeito ou defeituoso; bolas verdes ou não verdes) 
- Deve comportar um número fixo n de provas idênticas 
- As provas devem ser independentes (uma prova não afeta a probabilidade de outra acontecer) 
- Categorias mutuamente excludentes (sucesso e falha) 
- As probabilidades devem permanecer constantes para cada prova 
- Categorias coletivamente exaustivas (soma de todos resultados possíveis igual a 1) 
- Eventos = observações = provas = experimentos = trials 
 
Cálculo das probabilidades binomiais 
1. Fórmula binomial 
2. Tabela de probabilidades binomiais 
tabela individual 
tabela acumulada 
 
NOTAÇÃO 
Se S e F (sucesso e falha) denotam as duas categorias possíveis de todos os resultados; p e q denotam as probabilidades de S e F 
respectivamente, assim: 
P(S) = p e P(F) = 1 – p = q 
n número fixo de provas 
x número específico de sucessos em n provas (nº inteiro entre 0 e n) 
p probabilidade de sucesso em uma das n provas 
q probabilidade de falha em uma das n provas 
P(x) probabilidade de obter exatamente x sucessos em n provas 
 
     xnxnxx qpP 
 
 12 
Para nº de sucessos: 
npq Padrão Desvio np Média   
Para percentagem de sucessos: 
npq Padrão Desvio p Média   
 
 DISTRIBUIÇÃO DE POISSON 
ocorrências típicas do modelo de distribuição de Poisson 
 
3. Dados de tempo ou espaço (def./cm2; acid./dia; cham./h; vaca/acre) 
 
OBSERVAÇÃO 
A unidade de medida é contínua (tempo, área etc.), mas o número de ocorrências (variável aleatória) é discreta 
A distribuição de Poisson é útil para descrever a probabilidade do número de ocorrências num campo ou intervalo contínuo (em 
geral tempo ou espaço) 
 
 CARACTERÍSTICAS 
- A variável aleatória x é o número de ocorrências de um evento num intervalo 
- A probabilidade de uma ocorrência é a mesma em todo o intervalo considerado (ocorrências aleatórias) 
- As ocorrências são distribuídas uniformemente ao longo do intervalo considerado 
- O número de ocorrências em qualquer intervalo é independente do número de ocorrências em outros intervalos 
- A probabilidade de mais de 1 ocorrência no mesmo ponto é praticamente nula 
 
FÓRMULA DE POISSON 
 
   
!! x
e
x
te
P
xxt
x
  

 
 
A média é o parâmetro que caracteriza a distribuição de Poisson µ =  t , logo 
 
P(x) = probabilidade de ocorrer x ocorrências 
 
µ = é a média de ocorrências no intervalo t 
 = taxa média por unidade 
t = é o número de unidades ou intervalo 
x = número de ocorrências 
e = é a base dos logaritmos neperianos = 2,71828 
 Padrão Desvio Variânciat Média 2  
 
 DISTRIBUIÇÃO POISSON COMO APROXIMAÇÃO DA BINOMIAL 
Quando deve-se fazer a aproximação por Poisson? 
- Número n de observações é grande n 100 e np <10 (regra prática) 
- Probabilidade de sucesso “p” está próxima de 0 ou 1 
- Porque fazer a aproximação por Poisson? 
- A distribuição binomial descreve adequadamente muitas situações de interesse 
- A maioria das tabelas está limitada a n  20 
- A fórmula binomial pode exigir esforço substancial para obtenção de uma solução exata 
 13 
 DISTRIBUIÇÃO MULTINOMIAL OU POLINOMIAL 
Utilizada nas situações onde há mais de dois resultados mutuamente excludentes. (tste de múltipla escolha) 
EXIGE-SE: 
- Que as provas sejam independentes 
- Tenham probabilidade de ocorrência constante 
A probabilidade multinomial de que, em n observações, o resultado E1 ocorra n1 vezes, E2 ocorra n2 vezes, ... , e Ek ocorra nk 
vezes é dado pela fórmula: 
 
   nkknnn
K
pppp
nnnn
n
...
!!...!!
!
P 33
2
2
1
1
321
x 
 
 
 DISTRIBUIÇÃO HIPERGEOMÉTRICA 
 
Utiliza-se a distribuição hipergeométrica em situações com dois ou mais resultados, em que a probabilidade de sucessos varia 
de uma prova para outra (extração sem reposição de uma população finita). 
- Observações dependentes 
- Probabilidade variável de prova para prova 
- Amostragem sem reposição 
 
 
  
 Nn
r
x
rN
xn

nr,N,|xP
 
 
N = tamanho da população 
n = tamanho da amostra 
r = nº de sucessos da população 
x = nº de sucessos da amostra 
      VNE x Padrão Desvio 
1-N
n-N
 p-1 np V Variância rp np; Média x   
 
 DISTRIBUIÇÃO GEOMÉTRICA 
Seja o experimento que consiste em se repetir a prova de Bernoulli tantas vezes quantas forem necessárias, até se obter o 
primeiro sucesso. 
 
Se forem provas independentes e de mesma probabilidade de sucesso p, o número de tentativas X terá distribuição geométrica. 
 
    VE x Padrão Desvio p
q
 V Variância ;
p
1 Média
.... 3, 2, 1, k ; pqkxP
2x
1k

 

 
 
 DISTRIBUIÇÃO DE PASCAL OU BINOMIAL NEGATIVA 
Nas condições em que foi definida a distribuição geométrica, se considerarmos X o número de tentativas até se obter o r-ésimo 
sucesso (exemplo: 17º sucesso), teremos uma distribuição de Pascal. 
Sendo r a ordem do sucesso desejado e k o número de tentativas para o obter o sucesso desejado, temos: 
Qual a probabilidade deocorrer k provas até que ocorra r sucessos (ou falhas) 
 
   
    VE
p
x
k
r
 Padrão Desvio 
p
rq
 V Variância ;
p
r Média
.... 3,r 2,r 1,r r, k ; qpkxP
2x
1kr1
1

 

 
 14 
 COMPARAÇÃO ENTRE BINOMIAL E POISSON 
BINOMIAL 
- Afetada pelo tamanho amostral n e pela probabilidade p 
- Valores possíveis da variável aleatória x são 0, 1, 2, 3 .....n 
- Contagem de sucessos e falhas 
 
POISSON 
- Afetada apenas pela média µ 
- Valores possíveis da variável aleatória x são 0, 1, 2, 3 ..... sem limite superior 
- Contagem de sucessos somente 
 
APLICAÇÕES DAS DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE 
Distribuição exemplos Hipóteses 
binomial dois resultados 
 
jogada de uma moeda 
teste V ou F 
defeituoso, não defeituoso 
 
observações independentes 
probabilidades constantes 
de poisson só ocorrências acidentes / ano 
defeitos / jarda 
chamadas / minuto 
 
observações independentes 
probabilidades constantes 
 
hipergeométrica 
 
dois ou mais 
resultados 
 
amostragem sem reposição 
 
observações dependentes 
 
multinomial 
 
mais de dois 
resultados 
 
teste de múltipla escolha 
 
observações independentes 
probabilidades constantes 
 
 
 DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUAS 
- UNIFORME OU RETANGULAR 
- NORMAL 
- EXPONENCIAL 
- LOGNORMAL 
- BETA 
- GAMA 
- WEIBULL 
- F DE SNEDECOR 
- QUI-QUADRADO 2 
- t DE STUDENT 
- ERLANG 
- BIVARIADA NORMAL 
 
Quando se usa as distribuições contínuas? 
- A variável aleatória discreta apresenta um grande número de resultados 
- A variável aleatória em questão é contínua 
 
Os ponteiros de um relógio podem parar em qualquer dos infinitos pontos do círculo 
logo, A probabilidade de parar em um ponto definido é zero 
- Nas distribuições contínuas utilizam-se a probabilidade da ocorrência em um intervalo P(a < x < b). 
- Em uma distribuição contínua, a probabilidade é dada pela área contida no intervalo considerado. 
 
 15 
 P(x) 
f(x) 
 0 a c d b 
 DISTRIBUIÇÃO UNIFORME OU RETANGULAR 
Quando se usa as distribuições uniformes? 
Quando a variável aleatória pode tomar qualquer valor numa escala contínua entre dois pontos (intervalo) e que estes valores 
sejam igualmente prováveis. 
 
 
 
12
a-b
 Variância 
2
ba
 Média 
 
2






ab
cd
P dxc
 
 
 DISTRIBUIÇÃO NORMAL 
 
IMPORTÂNCIA DA DISTRIBUIÇÃO NORMAL 
- Retrata com boa aproximação, as distribuições de freqüência de muitos fenômenos naturais e físicos 
- Serve como aproximação das probabilidades binomiais quando n é grande 
- Representa a distribuição das médias e proporções em grandes amostras, o que tem relevante implicação na amostragem (a 
mais importante) 
 Também é conhecida por “Distribuição Gaussiana”, em função do modelo matemático desenvolvido por Karl F. Gauss 
para este comportamento. 
 
CARACTERÍSTICAS 
- A curva normal tem a forma de sino 
- É simétrica em relação a média 
- Prolonga-se de - a + (apenas em teoria) 
- Fica completamente especificada por sua média e seu desvio padrão; há uma distribuição normal para cada par média e 
desvio padrão 
- A área total sob a curva é considerada 100% ou igual a 1 
- A área sob a curva entre dois pontos é a probabilidade de uma variável normalmente distribuída tomar um valor entre esses 
pontos 
- A probabilidade de uma variável aleatória normalmente distribuída tomar exatamente determinado valor é zero 
(característica da distribuição contínua) 
- A área sob a curva entre a média e um ponto arbitrário é função do número de desvios padrões entre a média e aquele 
ponto 
A probabilidade de uma variável aleatória tomar um valor entre dois pontos quaisquer é igual à área sob a curva normal entre 
aqueles pontos 
 
 
2
2
2
 
2
1 





x
x ef
 
x – ponto considerado da distrib. 
µ - média da distribuição 
 - desvio padrão da distribuição 
 
OBSERVAÇÃO 
x - µ = distância do ponto considerado à média 
Curva normal típica 
Média = µ 
Desvio padrão =  
média   
forma de uma boca de sino 
50% 50% 
área sob a curva = 1 
 16 



x
z
 número de desvios padrões a contar da média. Ex.: 2,5 desvios padrões 
z = valor z ou score z. Pode-se obter valores negativos de z para valores de x inferiores à média 
A distância entre a média e um ponto qualquer é dado em número de desvios padrões (z) 
 
 DISTRIBUIÇÃO BINOMIAL aproximada 
Pela NORMAL quando : np  5 e nq  5 
Por POISSON quando: n 100 e np < 10 
 
 
 GRAUS DE LIBERDADE 
 
“A razão pela qual se recomenda usar n-1 ao invés de n no denominador da expressão de s2 está relacionada com o número de 
grau de liberdade. 
Esta questão é, possivelmente, abstrata; tomemos, por exemplo, as estatísticas µ e o2. Essas estatísticas têm n graus de 
liberdade, ou seja, n valores xi, livres que devem ser considerados para cálculo dos valores das estatísticas. Em outras palavras, 
desconhecendo-se qualquer valor xi, torna-se impossível a determinação do valor da estatística. Já a estatística s2, por usar x ao 
invés de µ, tem um grau de liberdade a menos, porque seu cálculo pressupõe-se que anteriormente já se tenha calculado x 
(usamos já uma vez todos os valores da amostra). No momento de usarmos novamente os valores xi, para cálculo de s2, esses 
valores tem n-1 graus de liberdade, pois, dados quaisquer n-1 deles, o valor restante estará perfeitamente determinado, pelo 
fato de já conhecermos a média, não sendo, portanto, livre”. 
 
 
Normal 
padronizada 
Normal não 
padronizada 
z = 
x - µ 
 
µ x 0 z 
P P 
-3 -2 -1 0 +1 +2 +3 
68% 
95,5% 
99,7% 
n n 
0% 50% 100% 
P(“sucesso”) 
20 
 
 
1 
20 
 
 
1 
use a aproximação normal para n e 
p nesta área 
aprox. de 
Poisson 
aprox. de 
Poisson 
use a tabela ou a fórmula binomial para n e 
p nesta área 
 17 
 
 DISTRIBUIÇÃO t DE STUDENT 
E QUANDO TIVERMOS A VARIÁVEL CONTÍNUA DE UMA POPULAÇÃO COM DESVIO PADRÃO 
DESCONHECIDO E AMOSTRA PEQUENA ? 
- William Gosset (1876 – 1937), Irlandês, químico da Cervejaria Guinness. 
- A distribuição t se assemelha à distribuição normal 
Propriedades importantes 
- A distribuição t de varia conforme o tamanho da amostra (veja figura) 
- A distribuição t tem a mesma forma geral simétrica que a distr. normal, mas reflete a maior variabilidade que é esperada 
nas pequenas amostras 
- A distribuição tem média t = 0 (tal como a distr. normal padronizada com z = 0) 
- para grandes amostras, n > 30, a distribuição t se aproxima muito da distribuição normal. Nestes casos utiliza-se os valores 
de z (curva normal) no lugar de t (curva t). 
RELAÇÃO COM A CURVA NORMAL 
Pode-se observar ainda que a distribuição t é muito semelhante à curva normal. À medida em que aumentam os gl, a 
distribuição t aproxima-se da distribuição normal padronizada (média = 0, desvio-padrão = 1). A curva normal padronizada é 
um caso particular da distribuição t quando gl tende ao infinito. Para os propósitos práticos, os valores da distribuição t 
aproximam-se dos valores da distribuição normal padronizada relativamente depressa, tal que quando gl = 30 esses valores são 
quase idênticos. 
 
A distribuição t é uma distribuição de probabilidade teórica.É simétrica, campaniforme, e semelhante à curva normal standard. 
Difere da curva normal standard, porém, nisso tem um parâmetro adicional, os chamados graus de liberdade que mudam sua 
forma. 
 GRAUS DE LIBERDADE 
Graus de liberdade, normalmente simbolizados por gl, são um parâmetro da distribuição t que pode ser qualquer número real 
maior que zero. Fixando o valor de gl definimos uma situação particular da família de distribuições t. Uma distribuição t com 
um gl menor tem mais área nas caudas da distribuição que uma distribuição com um gl maior. 
O efeito dos gl na distribuição de t está ilustrado nas três distribuições t mostradas na figura. 
Note-se que quanto menor o número de gl, mais aplainada (platocurtica) é a forma da distribuição, resultando em maior área 
nas caudas da distribuição. 
 
t0 
gl =  gl = 6 
gl = 3 
2,45 
-3,18 -1,96 1,96 3,18 
-2,45 
n = 7 
n = 4 
Distribuição t de student com n = 3 
Distribuição t de 
student com n = 12 
Distribuição normal 
padronizada 
 18 
 
 Distribuição normal ou t ? 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
início 
n > 30 
população tem 
distr. normal 
 população 
é conhecido 
usar 
distribuição t 
pelo teorema do limite central podemos usar a distrib. 
normal (use s se  não for conhecido) 
usar métodos não-paramétricos ou de 
 reamostragem 
usar a distribuição normal 
sim 
sim 
sim 
não 
não 
não 
 19 
n = 100 
n = 80 
n = 60 
n = 40 
p= 0,1 p=0,5 
p= 0,9 
 
 AMOSTRAGEM PROBABILÍSTICA 
1. Sistemática – Lista aleatória de itens 
2. Estratificada – Subgrupos homogêneos 
3. Por Conglomerado – Itens fisicamente próximos uns dos outros 
 
 AMOSTRAGEM NÃO PROBABILÍSTICA 
 
 AMOSTRAGEM POR JULGAMENTO 
 
 ERRO AMOSTRAL (ou randon error) 
Sabemos de antemão que no baralho existem 4 ases. A esse desvio na amostra em relação ao valor real é chamado de 
erro amostral. 
- Este tipo de erro não pode ser evitado mas pode ser controlado 
- De uma forma ou de outra ele interfere em nossa decisão 
- Esse erro, entretanto não ocorre de forma descontrolada, desde que a amostra seja retirada aleatoriamente do lote 
- Leis probabilísticas regem os limites de variação desse erro. 
- Ao retirar uma amostra com critério de aceitação definido, existe o risco de: 
- Um lote de má qualidade poder ser aprovado ou 
- Um lote de boa qualidade poder ser reprovado 
 
ERRO AMOSTRAL depende de três fatores 
1 – Estatística que está sendo considerada 
A variabilidade associada a diferentes estatísticas amostrais, são descritas por diferentes distribuições de probabilidades 
2 – Tamanho da amostra 
Há menor variabilidade entre estatísticas de grandes amostras do que entre pequenas amostras 
3 – Variabilidade existente na própria população submetida a amostragem 
Populações com muita variabilidade produzem estatísticas amostrais com maior variabilidade do que populações com 
pequena variação entre os valores populacionais 
 
 Distribuição Amostral 
Uma distribuição amostral é uma distribuição de probabilidades que indica até que ponto uma estatística amostral 
tende a variar devido a variações casuais na amostragem aleatória 
Duas distribuições amostrais mais usadas são a Binomial e a Normal 
 
Quanto a amostra aumenta: 
- A distribuição amostral das proporções tende para a forma da distribuição normal 
- A variabilidade amostral decresce 
- A média da distribuição amostral é sempre igual à proporção da população 
 
Quanto a Probabilidade de cada evento muda: 
 
 
 
 
 
 
 
 DISTRIBUIÇÕES DE MÉDIAS AMOSTRAIS 
É uma distribuição de probabilidade que indica quão prováveis são as diversas médias amostrais. 
É função: - da média da população 
 - do desvio padrão da população 
 - do tamanho da amostra 
Conclusões importantes das distribuições de médias 
- A média da distribuição é sempre igual à média da população 
- desvio padrão (variabilidade) diminui quando aumenta o tamanho da amostra 
Média da distribuição amostral: 
xx
 
 
 
 20 
Desvio padrão da distribuição amostral 
n
x
x

 
 
 
 TEOREMA DO LIMITE CENTRAL (válido para médias amostrais) 
Capacidade de fazer inferência sobre parâmetros populacionais depende do conhecimento da distribuição amostral 
Precisamos conhecer: 
As estatísticas de interesse como média amostral e desvio padrão amostral 
Forma da distribuição amostral 
O teorema do limite central se refere exatamente à forma da distribuições amostrais: 
1 - Se a população sob amostragem tem distribuição normal, a distribuição das médias amostrais também será normal 
para todos tamanhos de amostras. 
2 - Se a população básica é não-normal, a distribuição de médias amostrais será aproximadamente normal para grande 
amostras. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Após a análise do teorema do limite central, concluímos que não é necessário conhecer a forma da distribuição da 
população, bastando que o tamanho da amostra seja grande pois assim a distribuição amostral será normal. 
Uma regra prática muito usada é que a amostra deve consistir de 30 ou mais observações. 
 
População
original
normal uniforme assimétrica
médias amostrais
n = 5
médias amostrais
n = 30
médias amostrais
n =10
 21 
 DISTRIBUIÇÕES AMOSTRAIS DAS PROPORÇÕES E DO NÚMERO DE OCORRÊNCIAS 
As distribuições amostrais de proporções e número de ocorrências são essencialmente as mesmas. Ambas dizem respeito 
à contagem de dados, e não à mensurações. 
  amostra menor que 20  tab. binomial 
cálculo de probabilidade 
  amostra maior que 20  normal 
 
Distribuição Amostral Média Desvio Padrão 
 Pop. infiita Pop. Finita (n/N > 0,05) 
Médias 
x

 
n
x
x

 
 
1


N
nN
n
x
x


 
Proporções 
p
 
 
 
1
n
pp
p


  
1
 
1



N
nN
n
pp
p
 
Nº de Ocorrências 
np
 
  1 pnpnp 
 
 
1
 1



N
nN
pnpnp
 
 
AMOSTRAGEM DE UMA POPULAÇÃO 
Populações grandes ou infinitas 
- Não há necessidade de reposição 
- Probabilidades de cada prova é constante 
 
Populações finitas ou quando amostra é superior a 5% da população ( n/ N > 5%) 
- Deveria se fazer a reposição, mas não se faz 
- A probabilidade de cada prova varia 
- Os desvios padrões das distribuições amostrais devem ser multiplicados pelo fator de correção finita 
 
1

N
nN
 N – população; n - amostra