Buscar

Apostila de estatística

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 117 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 117 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 117 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
ESTATÍSTICA
Professor: Eduardo Campos
• O Que é Estatística?
DADOS INFORMAÇÃO
ESTATÍSTICA:
Estatística é a ciência que permite obter 
informações sobre um fenômeno, a partir 
do registro de observações deste fenômeno.
A estatística divide-se 
em duas áreas:
- Estatística Descritiva
- Inferência Estatística
Estatística Descritiva ou
Análise Exploratória de Dados
A estatística descritiva ocupa-se da 
análise/descrição de um conjunto de 
dados por intermédio de tabelas, gráficos
e/ou medidas-resumo, com o objetivo de 
facilitar sua visualização e compreensão. 
Exemplo:
Cálculo do coeficiente de rendimento 
(c.r.) = média ponderada das notas em 
cada disciplina  medida-resumo do 
desempenho acadêmico de um aluno. 
Inferência Estatística ou
Estatística Inferencial
A inferência estatística consiste de um 
conjunto de técnicas para, a partir de uma 
amostra selecionada de um universo, 
formular conclusões para este universo.
2
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Exemplo:
Pesquisa eleitoral  estimação dos 
percentuais de intenções de voto em todo 
o universo eleitoral, a partir de uma 
amostra de, digamos, 2.000 pessoas.
• Tipos de Dados
Dados = matéria prima da estatística.
A identificação da ferramenta estatística 
adequada para tratá-los depende da 
identificação correta do tipo dos dados.
A seguir são apresentadas as tipologias 
mais importantes para classificar dados.
1 - Dados Primários x Secundários
• Dados primários são aqueles obtidos 
de forma direta, mediante observação, 
pesquisas ou experimentos controlados.
• Dados secundários são aqueles que não 
são obtidos diretamente, e sim mediante 
publicações (como relatórios ou artigos).
2 - Dados em Corte x Séries Temporais 
• Dados em corte (transversal) são aqueles 
referentes ao mesmo instante de tempo.
• Dados de séries temporais são aqueles 
registrados ao longo de um período de 
tempo, com determinada frequência.
Obs - Dados que possuem ambas as 
dimensões (de corte e de tempo) são 
denominados longitudinais ou em painel.
• Dados em painel consistem no registro de 
informações ao longo do tempo para um 
conjunto de unidades em corte transversal.
Também podem ser encarados como 
um conjunto de n séries temporais.
3 - Dados Qualitativos x Quantitativos
• Dados qualitativos são aqueles que 
representam um atributo ou qualidade.
Exemplos: profissão, gênero, raça, estado 
civil, classe social, nível de educação, etc.
• Dados quantitativos são números que 
resultam de uma contagem ou medida.
Exemplos: idade, peso, altura, renda, número 
de filhos, número de banheiros em casa, etc.
3
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
1. ESTATÍSTICA 
DESCRITIVA
Exemplo 1.1 - Faturamento bruto no mês 
passado, em milhões de R$, das 30 filiais 
de uma determinada empresa de varejo:
11,8 3,6 16,6 13,5 4,8 8,3 
8,9 9,1 7,7 2,3 12,1 6.1 
10,2 8,0 11,4 6,8 9,6 19,5 
15,3 12,3 8,5 15,9 18,7 11,7 
6,2 11,2 10,4 7,2 5,5 14,5
Que conclusões você pode tirar?
É disto que trata a
estatística descritiva!
Esses dados estão na chamada forma 
bruta, difícil de analisar diretamente.
Precisamos usar técnicas adequadas para 
resumí-los ou facilitar sua visualização.
A distribuição de frequências é 
uma tabela que agrupa os dados 
em classes (intervalos), indicando o 
número ou a proporção de observações 
que pertencem a cada uma das classes.
Distribuição de Frequências
As classes não precisam 
ter amplitudes iguais.
• Distribuição de Frequências Absolutas
Classe Frequência
2 | 5 3
5 | 8 7
8 | 11 7
11 | 14 7
14 | 17 4
17 | 20 2
Total: 30
A notação | significa que o extremo inferior da classe 
não está incluído, e o extremo superior está incluído!
• Distribuição de Frequências Relativas
Representa a proporção ou o percentual 
de observações que caem em cada classe. 
Classe Frequência Relativa
2 | 5 3/30 = 0,1 = 10%
5 | 8 = 7/30 ou 23,33%
8 | 11 23,33%
11| 14 23,33%
14 | 17 13,33%
17 | 20 6,67%
Total: 1 = 100%
4
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
O histograma é uma representação 
gráfica da distribuição de frequências.
Como obter o histograma?
Colocar as classes no eixo horizontal,
as frequências no eixo vertical,
e traçar um diagrama de barras.
Histograma
Histograma (Frequências Absolutas) - ex. 1.1:
0
2
4
6
8
10
2-|5 5-|8 8-|11 11-|14 14-|17 17-|20
Frequências
Classes
O histograma de frequências relativas tem o 
mesmo formato, com o eixo vertical modificado.
• Gráfico de Barras
Representação gráfica apropriada para 
variáveis que representam contagens.
Consiste de barras verticais centradas 
nos valores assumidos pela variável, 
e com espaços separando as barras.
Exemplo 1.2
Número de reclamações diárias x frequência 
em certo mês, no SAC de uma empresa:
• Gráfico de Pizza ou de Setores
O gráfico de pizza, ou de setores, é um 
diagrama estatístico bastante popular.
É apropriado quando o objetivo 
é identificar partes de um todo.
Exemplo 1.3: 
5
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
• Medidas de Posição
Uma medida de posição é um valor em 
torno do qual os dados estão concentrados.
Sinônimos: medida de localização
ou de tendência central.
Principais medidas de posição:
Média , Mediana e Moda.
É a soma das observações dividida 
pelo número de observações:
Média
.
n
x...xx
n
x
n21
n
1i
i 



i-ésima
observação
no de 
observações
No exemplo 1.1, o faturamento médio 
é  = 307,7/30 = 10,3 milhões.
Nenhum problema!
A média de um conjunto de dados não
precisa ser um dos valores observados.
Note que o valor 10,3 não ocorre. 
Exemplo 1.4:
Salários de economistas recém-formados 
(em R$ 1.000): 2,8; 6,0; 2,6; 3,1; 3,0.
Salário médio (destes 5 economistas): 
 = 3,5 (R$ 3.500,00). 
Este número é representativo
dos salários desses 5 economistas?
R: Não, pois está bem acima 
de 4 dos 5 valores.
Claramente, o valor responsável 
por esta distorção foi o “6,0”.
O “6,0” é um valor atípico ou discrepante, 
tecnicamente denominado outlier. 
Conclusão: 
A média é uma medida de posição 
muito sensível à presença de outliers!
Neste caso, é recomendável utilizar outra 
medida de posição, chamada mediana!
6
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
É o valor Md que divide os dados 
ordenados em duas partes iguais.
Se n for ímpar: Md = observação central.
Se n for par: 
Md = média das duas observações centrais.
Mediana
Exemplo 1.4 (cont.):
Salários ordenados: 
2,6; 2,8; 3,0; 3,1; 6,0.
Md = 3,0.
Nota-se que 3,0 é mais representativo da 
posição ou tendência central dos salários. 
Obs - A mediana é uma medida de posição 
robusta ou resistente. O sentido é que ela resiste
(mantém seu valor) na presença de outliers. 
Em algumas situações, nem a média nem 
a mediana serão medidas apropriadas.
Exemplo 1.5 - O gerente de uma loja de 
calçados está interessado em saber qual 
tamanho de calçado ele deve priorizar na 
hora de planejar seu estoque,a partir dos 
tamanhos dos calçados vendidos no último 
mês. Qual a medida de posição adequada?
A moda é o valor que ocorre com 
maior frequência em um conjunto 
de observações (notação: Mo).
Moda
Exercício 1.1 - As notas de uma turma 
foram: 9, 7, 8, 6, 3, 8, 7 e 8. Obtenha a 
média, a mediana e a moda das notas.
Um conjunto de dados que possua 2 modas 
é chamado bimodal. Se possui mais de 2, 
multimodal. Se não possui moda, amodal.
Embora as três medidas de posição 
apresentadas até aqui sejam as medidas 
de posição mais “populares”, existem 
algumas outras que também são 
importantes, apresentadas a seguir.
7
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Exemplo 1.6 - Em uma pequena empresa, 
os salários dos 12 funcionários estão 
distribuídos da seguinte forma:
5 ganham R$ 2.500,00;
2 ganham R$ 3.000,00;
3 ganham R$ 4.000,00;
2 ganham R$ 4.500,00.
Calcule o salário médio dos 
funcionários desta empresa.
A média ponderada, p, é definida como:
.
... 
x...xx
x
k21
kk2211
k
1j
j
k
1j
jj
p








Média Ponderada
peso do j-ésimo valor distinto de x (no 
exemplo = frequência do j-ésimo salário)
Resposta do exemplo 1.6: R$ 3.291,67.
Obs - Média para Dados Agrupados
Quando os dados estão disponíveis agrupados 
(na forma de uma distribuição de frequências), 
só é possível obter a média por aproximação.
O que se faz é a média dos pontos médios 
das classes, ponderados por suas frequências.
Classe Frequência
40 | 50 Kg 2
50 | 60 Kg 5
60 | 70 Kg 7
70 | 80 Kg 8
80 | 90 Kg 3
Exercício 1.2 - Obtenha o peso médio da 
população cuja distribuição de frequências é: 
Solução:   (2*45 + 5*55 + 
7*65 + 8*75 + 3*85)/25 = 67 Kg. 
A média geométrica g é 
definida da seguinte forma:
Média Geométrica
  .x...xx n
1
n21g

Exemplo 1.7 - Seja um investimento com 
taxas de retorno anuais de 10 e 20% nos 
anos 1 e 2, respectivamente.
A média simples (aritmética) dos retornos 
é 15%. Isto poderia levar à impressão de 
que alguém que invista neste ativo por 2 
anos obteria um retorno de 15% ao ano, 
uma conclusão totalmente equivocada.
8
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Para ilustrar, considere um capital de 
R$ 1000,00 investido no início do ano 1.
Qual o valor capitalizado ao final dos 2 anos?
1.000*(1+R1)*(1+R2) = 1.000*1,1*1,2 = 
R$ 1.320,00.
fator de capitalização 
no ano 1
fator de capitalização 
no ano 2
O retorno médio efetivo ou equivalente
Req é o retorno por período que levaria 
ao mesmo valor final caso os retornos 
de todos os períodos fossem iguais.
O fator de capitalização equivalente 
referente a n períodos é obtido por meio 
da média geométrica dos fatores de 
capitalização referentes à cada período:
(1+Req)
n = (1+R1)(1+R2)...(1+Rn)

(1+Req) = [(1+R1)(1+R2)...(1+Rn)]
1/n
E daí se obtém o Req.
No exemplo 1.7: 
de tal forma que Req = 14,8913%.
Interpretação: para obter o valor final de R$ 
1.320,00 com a mesma taxa de retorno em 
cada ano, esta taxa teria que ser 14,8913%.
,148913,132,1)R1)(R1( )R1(
21eq

• Medidas de Dispersão
Frequentemente, uma medida de posição 
não fornece todas as informações de que 
precisamos para tomar uma certa decisão.
Por exemplo, uma pessoa com metade 
do corpo em um forno, e a outra metade 
em um freezer, “na média” estará bem!
Exemplo 1.8 - Dois fornecedores, A e 
B, apresentaram os seguintes prazos de 
entrega, referentes aos últimos 5 clientes 
(em dias):
Fornecedor A – 18; 10; 17; 3; 2.
Fornecedor B – 9; 10; 10; 9; 12.
Com base nos prazos acima, qual dos 
fornecedores você escolheria: A ou B?
9
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Naturalmente, você escolheria o fornecedor B
(menor risco inerente ao prazo de entrega).
Uma forma mais completa de definir 
uma medida de dispersão é: valor que 
nos informa o quanto os dados variam 
em torno de uma medida de posição.
A medida de dispersão mais simples é a 
amplitude total = máximo - mínimo.
Seja (xi-) o desvio de xi em relação à média. 
Possíveis medidas de dispersão seriam:
.
n
 )x(
 ou )x(
n
1i
in
1i
i

 



Problema:
sempre! ,0)x(
n
1i
i


Solução: 
trabalhar com 
os módulos 
ou quadrados
dos desvios!
Variância (2)
.
n
)x(
n
1i
2
i
2




Exercício 1.2 - Seja um conjunto de 3 dados: 
x1 = 2, x2 = 5 e x3 = 8. Ache a variância. R: 6.
É a média dos quadrados dos desvios:
Forma alternativa para o cálculo de 2:
.
n
x
n
nx
2
n
1i
2
i
2
n
1i
2
i
2 




A variância apresenta um sério problema: ela 
é expressa no quadrado da unidade original, 
em geral uma unidade que sequer faz sentido.
Como consequência, a variância 
não possui interpretação direta.
Por esta razão o desvio padrão, apresentado 
a seguir, é adotado com maior frequência.
Desvio Padrão ()
.2
O desvio padrão preserva a unidade original
dos dados (no exemplo, é expresso em dias). 
Adicionalmente, se os dados são gerados por 
uma distribuição Normal de probabilidade, 
ele possui interpretação direta (capítulo 5).
10
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
• Aplicação em Análise de Investimentos
É usual analisar a média e o desvio padrão dos 
retornos (variações de preço) de um ativo. 
Neste contexto, o desvio padrão é uma medida 
do risco do ativo, chamada volatilidade.
RETORNOS DIÁRIOS DE 2 AÇÕES
-8
-6
-4
-2
0
2
4
6
8
10
12
1 5 9
1
3
1
7
2
1
2
5
2
9
3
3
3
7
4
1
4
5
4
9
DIAS
Ação A
Ação B
Exemplo 1.9:
Em compensação, a flutuação dos retornos da 
ação B é bem maior  maior risco.
A curva mais clara (ação B) oscila em torno de 
um patamar superior àquele em torno do qual 
oscilam os retornos da ação A. 
Quando queremos comparar dados 
expressos em diferentes unidades ou 
magnitudes, o uso do desvio padrão 
leva a conclusões equivocadas, sendo 
necessário utilizar uma outra medida 
chamada coeficiente de variação.
Coeficiente de Variação (CV)
Exemplo 1.10 - Suponha que estejamos 
interessados em estudar a variabilidade de 
salários em diferentes ramos de atividade 
profissional. Como um caso extremo, 
considere a comparação entre salários 
de gerentes e de auxiliares de escritório.
Sabe-se que o salário médio dos 
gerentes é de R$ 5.000,00 e o dos 
auxiliares de escritório é de R$ 500,00. 
O desvio padrão dos salários dos gerentes 
foi igual ao dos salários dos auxiliares 
de escritório, ambos iguais a 100. 
Isto indica variabilidade alta ou baixa?
No caso dos auxiliares de escritório, cujos 
salários estão em torno de R$ 500,00, é alta.
Já para os gerentes, cujos salários estão em 
torno de R$ 5.000,00, é relativamente baixa.
.CV



CV dos salários dos auxiliares de 
escritório: 100/500 = 0,2 ou 20%. 
CV dos salários dos gerentes: 100/5.000 = 
0,02 ou 2%  dispersão relativa menor.
Fórmula do Coeficiente de Variação:
11
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Propriedades do Coeficiente de Variação:
1 - É adimensional, isto é, não é expresso 
em nenhuma unidade de medida.
2 - É uma medida de dispersão relativa. 
3 - CV pequeno = dados homogêneos
e CV grande = dados heterogêneos. 
• Outras Medidas Importantes
Medidas de posição e dispersão são 
importantes, mas não exaustivas para 
representar um conjunto de dados.
Estudaremos a seguir os conceitos 
de assimetria, curtose e percentis.
A assimetria é uma medida do quanto adistribuição dos dados está afastada de um 
aspecto simétrico em relação ao eixo central.
Se a metade esquerda da curva é um “espelho” 
da metade direita, dizemos que os dados são 
simétricos. Caso contrário, que são assimétricos.
Assimetria
esta 
distribuição 
é simétrica
esta distribuição 
apresenta assimetria 
positiva ou à direita
esta distribuição 
apresenta assimetria 
negativa ou à esquerda
A figura a seguir ilustra as três possibilidades, e 
respectivas relações entre as medidas de posição:
A curtose é uma medida do 
“achatamento” da distribuição dos dados. 
aspecto achatado, com 
valores distribuídos de 
modo uniforme
aspecto pontiagudo, com 
valores concentrados em 
um intervalo estreito e 
caudas mais pesadas
referência 
Curtose
O p-ésimo percentil ou percentil p de 
um conjunto de dados é o valor x tal que 
p% dos dados são menores ou iguais a x.
Os percentis 25, 50 e 75 são chamados quartis:
250 Percentil = primeiro quartil (Q1)
500 Percentil = segundo quartil (Q2) = mediana
750 Percentil = terceiro quartil (Q3).
Percentis (ou Quantis)
12
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Quartis
São medidas Q1, Q2 e Q3 que 
dividem os dados em 4 partes iguais.
É uma medida de dispersão dada pela 
diferença entre o terceiro e o primeiro quartis: 
Q = Q3 – Q1.
• Amplitude Interquartílica
Obs - não confundir com amplitude 
total = valor máximo - valor mínimo.
É um diagrama que representa:
- a mediana,
- os quartis Q1 e Q3,
- uma linha que vai de Q3 até a maior 
observação menor ou igual a LS = Q3+1,5Q,
- outra linha que vai de Q1 até a menor 
observação maior ou igual a LI = Q1-1,5Q.
.
Box-Plot Exemplo 1.11 - Seja o seguinte conjunto de 
dados (ordenado): 5, 10, 12, ... , 37, 42, 45. 
Sabendo-se que os quartis são 20, 25 
(mediana) e 28, obtenha o box-plot.
Aplicações do Box-Plot
1. Comparar dispersões (via amplitudes 
interquartílicas) de dois conjuntos de dados.
2. Identificar a presença de assimetria
(e o tipo dela – se é positiva ou negativa).
Como detectar e identificar o tipo de assimetria?
A partir das distâncias da mediana aos quartis.
Se a mediana está mais próxima de Q1, 
os dados apresentam assimetria positiva.
Se a mediana está mais próxima de Q3, 
os dados apresentam assimetria negativa.
Uma distância igual entre a mediana e cada um 
dos quartis é condição necessária para simetria.
13
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Aplicações do Box-Plot (cont.)
3. Detectar a presença de outliers:
Valores acima de LS são outliers (superiores)
Valores abaixo de LI são outliers (inferiores)
Os outliers costumam ser assinalados com *.
Exercício 1.3 - As idades das mulheres 
com 40 anos ou mais, em uma localidade, 
apresentam Q1 = 49, Md = 54 e Q3 = 63. A 
mais velha tem 71 anos. Obtenha o box-plot. 
Solução:
• Análise Bidimensional
É a análise estatística que envolve 2 variáveis. 
Por exemplo:
1) gasto com alimentação e renda
2) nota em uma prova e horas de estudo 
3) vendas e investimento em publicidade
etc.
Um diagrama de dispersão é um 
gráfico de pontos {(xi,yi); i = 1,2,...,n} 
que indica se parece ou não existir 
alguma relação entre 2 variáveis X e Y, 
e identificar qual o tipo desta relação.
Diagrama de Dispersão 
cada ponto desses representa o valor 
de X e de Y para a i-ésima observação
A covariância é uma medida da 
variabilidade conjunta de X e Y.
Fórmula:
Covariância
.
n
yx
n
)y)(x(
YX
n
1i
ii
n
1i
YiXi
XY 




A covariância evidencia o sentido da relação 
entre as variáveis, mas o interesse maior 
costuma ser medir a força desta associação.
No caso de relações lineares (isto é, aquelas 
que são bem representadas por uma reta), o 
coeficiente de correlação resolve o problema.
14
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
O coeficiente de correlação é um 
número entre -1 e 1, que mede a força 
da associação linear entre X e Y.
Fórmula:
Coeficiente de Correlação
.
YX
XY
XY



Interpretação do 
Coeficiente de Correlação:
- Se a relação linear entre X e Y for 
positiva e perfeita, a correlação é igual a 1.
- Se a relação linear entre X e Y for 
negativa e perfeita, a correlação é igual a -1.
- Se não houver relação linear: o valor 
do coeficiente de correlação é zero.
Obs - Correlação x Independência! 
É importante frisar que a correlação mede 
apenas a força de uma associação linear, 
não fornecendo informação acerca de 
relações de dependência não lineares.
Por exemplo, se Y = X2, XY = 0, 
porém as variáveis são dependentes.
Se a relação linear entre X e Y for positiva, 
mas não perfeita, a correlação está entre 0 e 1. 
Neste caso, quanto maior a intensidade da 
associação, mais próximo XY está de 1.
Por exemplo, um coeficiente de correlação 
igual a 0,95 indica uma relação linear
positiva e forte entre X e Y.
Se a relação linear entre X e Y for negativa, 
mas não perfeita, a correlação está entre -1 e 0. 
Neste caso, quanto maior a intensidade da 
associação, mais próximo XY está de -1. 
Por exemplo, um coeficiente de correlação 
igual a -0,1 indica uma relação linear
negativa e fraca entre X e Y.
Resumo das Propriedades do 
Coeficiente de Correlação:
1 - varia entre -1 e 1
2 - é adimensional (não possui unidade) 
3 - representa a força da relação 
linear (apenas) entre 2 variáveis.
Obs - correlação x causalidade. 
15
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
2. 
PROBABILIDADE 
(CONCEITOS E 
LEIS BÁSICAS)
Os 3 conceitos fundamentais da teoria 
da probabilidade são os seguintes:
1 - Experimento Aleatório
2 - Espaço Amostral
3 - Evento.
Cada um deles é apresentado 
e exemplificado a seguir.
Notas de Aula - Professor Eduardo 
Lima Campos.
Um experimento aleatório é uma ação 
cujo resultado não pode ser previsto.
Exemplos:
2.1 - Lançar um dado e observar a 
face que fica voltada para cima.
2.2 - Selecionar uma bolinha de uma urna com 
bolinhas vermelhas e azuis e verificar sua cor.
Experimento Aleatório
Embora o resultado de um experimento 
aleatório não possa ser pré-determinado, 
é possível descrever o conjunto dos 
resultados que podem ocorrer.
Este conjunto é chamado 
espaço amostral.
Notas de Aula - Professor Eduardo 
Lima Campos.
O espaço amostral associado a um 
experimento aleatório é o conjunto 
de todos os seus possíveis resultados.
Notação: S.
No exemplo 2.1 – S = {1,2,3,4,5,6}.
No exemplo 2.2 – S = {´azul`,´vermelha`}.
Espaço Amostral
Um evento é um 
subconjunto do espaço amostral.
No exemplo 2.1, alguns possíveis eventos são: 
A = ´face par` = {2,4,6};
B = ´face>3` = {4,5,6};
C = ´face=2` = {2}.
Evento
Notas de Aula - Professor Eduardo 
Lima Campos.
16
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Um evento ocorre quando o resultado do 
experimento é um ponto que pertence a ele.
Exemplos com os eventos do slide anterior:
Se a face observada foi o 5, 
dizemos que B ocorreu,
Se a face observada foi o 4, 
dizemos que A e B ocorreram,
e assim por diante...
• União e Interseção de Eventos
No exemplo 2.1, considere os eventos:
A: ´Face par` = {2,4,6} 
B: ´Face > 3` = {4,5,6}
Notas de Aula - Professor Eduardo 
Lima Campos.
O evento´A ou B ocorre` é dado pela 
união do evento A com o evento B.
AB = {2,4,5,6}. 
Notas de Aula - Professor Eduardo 
Lima Campos.
O evento ´A e B ocorrem` é dado pela 
interseção do evento A com o evento B.
AB = {4,6}.
Seja A um evento definido em um espaço 
amostral S. A probabilidade de A, denotada 
por P(A), é uma função que satisfaz a 3 
Axiomas, os quais são apresentados a seguir.
Probabilidade – Definição
Propriedades da Probabilidade:
1) 0  P(A)  1, p/ todo A definido em S.
2) P(S) = 1.
3) P(AB) = P(A) + P(B), se AB = .
Axiomas da Probabilidade
quanto mais perto de 1, maior a probabilidade de que A ocorra.
este é um evento 
especial, chamado 
evento certo.
O Axioma 3 pode ser generalizado para mais de 2 eventos. Por exemplo, 
P(ABC) = P(A)+P(B)+P(C), se os 3 pares possíveis têm interseções vazias.
• Eventos Especiais e suas Probabilidades
O espaço amostral S é o evento 
certo, cuja probabilidade é 1 (Axioma 2).
O conjunto  (vazio) é o evento 
impossível, cuja probabilidade é 0.
O evento composto de todos os pontos 
não favoráveis a A é chamado evento 
complementar de A e denotado por Ac. 
Sua probabilidade é: P(Ac) = 1-P(A).
17
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
• Atribuição de Probabilidades
Se os elementos do espaço amostral são 
todos equiprováveis, a probabilidade de 
um evento A é obtida da seguinte forma:
S#
A#
)A(P 
casos favoráveis 
ao evento A
casos possíveis
Exemplo 2.3 - Seja o experimento: lançar 3 
moedas e observar as faces voltadas para cima.
Seja: ´CA` = cara e ´CO` = coroa.
O espaço amostral associado 
a este experimento aleatório é: 
S = {(CA,CA,CA);(CA,CA,CO); 
(CA,CO,CA);(CO,CA,CA);(CA,CO,CO); 
(CO,CA,CO);(CO,CO,CA);(CO,CO,CO)}, 
totalizando #S = 8 casos possíveis.
Seja o evento: A = ´2 caras`. 
Obtenha a probabilidade de A.
Solução:
#A = 3 casos favoráveis.
A = {(CA,CA,CO);(CA,CO,CA);(CO,CA,CA)}
.
8
3
S#
A#
)A(P 
Obs - A abordagem anterior para obter 
probabilidades é chamada clássica.
Existem duas outras abordagens:
Abordagem Frequentista: A probabilidade 
de um evento A é a frequência relativa de 
ocorrência de A, quando o experimento 
aleatório é repetido muitas vezes (n).
Notas de Aula - Professor Eduardo 
Lima Campos.
Abordagem Subjetivista: baseada 
na opinião de especialistas.
Sejam A e B dois eventos, com interseção 
AB. Qual a probabilidade de AB? 
(ou seja, de que A ou B ocorram)
P(AB) = P(A) + P(B) - P(AB)
Lei da Adição 
(Probabilidade do ´OU`)
A Lei da Adição fornece a solução deste 
problema, por meio da seguinte fórmula:
Notas de Aula - Professor Eduardo 
Lima Campos.
Exemplo 2.4 - Um aluno estuda para um 
exame por 2 livros. O primeiro aborda 
30% do programa. O segundo, 28%. 24% 
do programa é abordado pelos dois livros.
Qual a probabilidade de que determinado 
tópico do programa esteja em pelo menos 
um dos dois livros utilizados pelo aluno?
Notas de Aula - Professor Eduardo 
Lima Campos.
18
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Solução: Seja A = ´tópico estar no 
primeiro livro` e B = ´tópico estar no 
segundo livro`. Pede-se P(AB).
São dados no enunciado:
P(A) = 0,30, P(B) = 0,28 
e P(AB) = 0,24.
Aplicando a Lei da Adição: 
P(AB) = 0,30 + 0,28 – 0,24 = 0,34.
Notas de Aula - Professor Eduardo 
Lima Campos.
• Leis de DeMorgan
AcBc = (AB)c
AcBc = (AB)c
Exemplo 2.4 (cont.) - Calcule a 
probabilidade de que o conteúdo não 
esteja em nenhum dos dois livros.
2 eventos A e B são mutuamente 
exclusivos (ou disjuntos) se a ocorrência 
de um impede a ocorrência do outro. Se B 
ocorre, então A não ocorre, e vice-versa.
Em outras palavras, são aqueles que não 
possuem pontos em comum, ou seja: 
AB = , o que implica P(AB) = 0. 
Eventos Mutuamente Exclusivos 
Notas de Aula - Professor Eduardo 
Lima Campos.
Exemplo 2.5 - Distribuição por sexo dos 
funcionários promovidos em uma empresa:
Promovidos Não-Promovidos Total
Masc. 46 184 230
Fem. 8 72 80
Total 54 256 310
Notas de Aula - Professor Eduardo 
Lima Campos.
Responda as perguntas a seguir.
a) Qual a probabilidade de um funcionário ser 
do sexo masculino e ter sido promovido?
Solução: sejam os eventos: A = ´ter sido 
promovido` e B = ´ser do sexo masculino`.
Diretamente da tabela, temos que 46 
indivíduos satisfazem ambas as condições.
Assim: P(AB) = 46/310 = 0,1483.
O que está sendo pedido é a 
probabilidade (condicional) de A 
dado B, denotada por P(A|B).
b) Qual a probabilidade de um funcionário 
do sexo masculino ter sido promovido?
Notas de Aula - Professor Eduardo 
Lima Campos.
Obs - Perceba a diferença entre P(A|B) e 
P(AB). Esta é uma confusão comum!
19
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Promovidos Não-Promovidos Total
Masc. 46 184 230
Fem. 8 72 80
Total 54 256 310
A idéia é que somente os casos favoráveis 
ao evento condicionante (B = ´ser do sexo 
masculino`) passam a ser os casos possíveis.
Notas de Aula - Professor Eduardo 
Lima Campos.
A probabilidade de A dado B 
é, portanto, 46/230 = 0,2. 
Se dividirmos numerador e denominador 
acima pelo total de funcionários (310), 
obtemos P(A|B) em função de P(AB) 
e P(B), conforme apresentado a seguir.
Notas de Aula - Professor Eduardo 
Lima Campos.
Sejam 2 eventos A e B, 
tais que P(B)>0. 
A probabilidade de A dado B é: 
P(A|B) = P(AB)/P(B).
Probabilidade Condicional
Notas de Aula - Professor Eduardo 
Lima Campos.
R: 2/3.
Exemplo 2.6 - Considere novamente 
o exemplo 2.1, e sejam os eventos:
A: ´Face par` e B: ´Face > 3`. 
a) Calcule P(A|B).
2 eventos são independentes se a 
ocorrência de um não interfere na 
probabilidade de ocorrência do outro.
Ou seja, se: 
P(A|B) = P(A).
Eventos Independentes
Notas de Aula - Professor Eduardo 
Lima Campos.
Exemplo 2.6 (cont.) - b) A: ´face par` e 
B: ´face > 3` são eventos independentes? 
R: não, pois P(A|B)  P(A).
Notas de Aula - Professor Eduardo 
Lima Campos.
Obs - Não confunda eventos 
independentes com eventos 
mutuamente exclusivos!
20
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Exemplo 2.7 - Em uma classe, os percentuais 
de aprovados em álgebra e literatura são, 
respectivamente, 75% e 84%. 63% são 
aprovados em ambas as disciplinas.
a) Qual a probabilidade de um aluno ter 
passado em álgebra ou em literatura?
b) Se um aluno passou em literatura, qual a 
probabilidade de ter passado em álgebra? 
c) Ter passado em álgebra e ter passado 
em literatura são eventos independentes? 
Notas de Aula - Professor Eduardo 
Lima Campos.
Solução: 
Sejam A = ´ter passado em álgebra` 
e B = ´ter passado em literatura`.
a) P(AB) = P(A) + P(B) - P(AB) 
= 0,75 + 0,84 – 0,63 = 0,96.
b) P(A|B) = P(AB)/P(B) = 0,75.
c) Sim, pois P(A|B) = P(A) = 0,75.
Notas de Aula - Professor Eduardo 
Lima Campos.
Exemplo 2.8 - Seja uma urna com 8 
bolinhas azuis e 4 vermelhas. 2 bolinhas 
são selecionadas ao acaso desta urna. 
a) Qual a probabilidade de que a primeira 
bolinha retirada da urna seja vermelha 
e que a segunda seja azul? 
Seja A = segunda bolinha azul e 
B = primeira bolinha vermelha. 
Queremos P(AB).
Notas de Aula - Professor Eduardo 
Lima Campos.
Para revolver o problema, basta inverter a 
fórmula da probabilidade condicional para 
obter P(AB) como função de P(A|B) e 
P(B).
P(A|B) = P(AB)/P(B).

P(AB) = P(A|B)P(B).
Notas de Aula - ProfessorEduardo 
Lima Campos.
Sejam A e B dois eventos, com P(B)>0. Qual 
a probabilidade de que A e B ocorram?
Lei da Multiplicação 
(Probabilidade do ´E`)
A Lei da Multiplicação fornece a solução 
deste problema, por meio da fórmula a seguir:
P(AB) = P(A|B)P(B)
Solução do exemplo 2.8, item a:
A = segunda bolinha azul e B = primeira 
bolinha vermelha. Do enunciado, temos 
que: P(A|B) = 8/11 e P(B) = 4/12. 
Assim:
P(AB) = 8/33.
Notas de Aula - Professor Eduardo 
Lima Campos.
21
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Diagrama de Árvore:
B
Bc
A
A
Ac
Ac
P(B)
P(Bc)
P(A|B)
P(Ac|B)
P(A|Bc)
P(Ac|Bc)
Notas de Aula - Professor Eduardo 
Lima Campos.
• Evento AB no Diagrama de Árvore:
B
Bc
A
A
Ac
Ac
P(B)
P(Bc)
P(A|B)
P(Ac|B)
P(A|Bc)
P(Ac|Bc)
Notas de Aula - Professor Eduardo 
Lima Campos.
• Forma-Produto para Independência
Vimos que, pela Lei da Multiplicação: 
P(AB) = P(A|B)P(B). 
Por outro lado, vimos que 2 eventos A e B 
são independentes se: P(A|B) = P(A).
Pode-se concluir que A e B são 
independentes se: P(AB) = P(A)P(B).
Notas de Aula - Professor Eduardo 
Lima Campos.
Exercício 2.1 - Sejam 2 eventos A e B 
tais que P(A) = 0,3 e P(AB) = 0,5. 
Determine o valor de P(B) se: 
a) A e B são mutuamente exclusivos.
b) A e B são independentes.
Respostas: a) 0,2. b) 2/7.
Exemplo 2.8 (cont.) 
b) Qual a probabilidade de que a segunda 
bolinha selecionada seja azul? 
Considere novamente:
A = segunda bolinha azul e 
B = primeira bolinha vermelha.
Notas de Aula - Professor Eduardo 
Lima Campos.
• Evento A no Diagrama de Árvore
B
Bc
A
A
Ac
Ac
P(B)
P(Bc)
P(A|B)
P(Ac|B)
P(A|Bc)
P(Ac|Bc)
Notas de Aula - Professor Eduardo 
Lima Campos.
22
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Sejam A e B dois eventos, em que A 
possa ocorrer condicionado a B ou a Bc. 
A probabilidade “total” do evento A pode 
ser calculada por meio da seguinte fórmula:
P(A) = P(A|B)P(B) + P(A|Bc)P(Bc)
Lei da Probabilidade Total
Notas de Aula - Professor Eduardo 
Lima Campos.
Solução do exemplo 2.8, item b:
Do enunciado, temos que: 
P(A|B) = 8/11, P(B) = 4/12, 
P(A|Bc) = 7/11 e P(Bc) = 8/12. 
Assim:
P(A) = 2/3.
Notas de Aula - Professor Eduardo 
Lima Campos.
Exemplo 2.9 - A empresa X lança um 
serviço inédito de envio de mensagens 
pelo celular. Ela calcula que este novo 
serviço gera lucro no primeiro ano com 
probabilidade 0,6, caso o concorrente 
não introduza um serviço semelhante. 
Caso contrário, a probabilidade de lucro 
é 0,3. Suponha ainda que exista 50% de 
chances de que o concorrente introduza 
um serviço semelhante naquele ano.
Uma dica aqui é começar identificando 
os possíveis eventos de interesse, e as 
probabilidades fornecidas no enunciado:
A: ´serviço é lucrativo p/ a empresa X` 
B: ´concorrente introduz serviço semelhante`.
São fornecidas no enunciado 
as seguintes probabilidades:
P(A|B) = 0,3; P(A|Bc) = 0,6 e P(B) = 0,5.
a) Qual a probabilidade de que o concorrente 
introduza o serviço e que, mesmo assim, ele 
seja lucrativo para a empresa X?
b) Qual a probabilidade de que o serviço 
seja lucrativo para a empresa X?
c) Qual a probabilidade de que o serviço 
seja lucrativo para a empresa X ou o 
concorrente introduza o serviço?
Solução:
a) Pela Lei da Multiplicação, temos que: 
P(AB) = P(A|B)P(B) = 0,3*0,5 = 0,15. 
b) Pela Lei da Probabilidade Total:
P(A) = P(A|B)P(B) + P(A|Bc)P(Bc) 
= 0,3*0,5 + 0,6*0,5 = 0,45.
c) Pela Lei da Adição: 
P(AB) = P(A) + P(B) – P(AB) 
= 0,45 + 0,5 – 0,15 = 0,8. 
23
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Exemplo 2.10 - 2 máquinas (M1 e M2) são 
usadas para fabricar o mesmo tipo de item. 
Suponha que:
60% dos itens tenham sido fabricados por M1,
40% dos itens tenham sido fabricados por M2,
e que:
1% dos itens fabricados por M1 têm defeito,
2% dos itens fabricados por M2 têm defeito.
Notas de Aula - Professor Eduardo 
Lima Campos.
Um item é selecionado aleatoriamente.
a) Qual a probabilidade de 
que ele seja defeituoso?
Notas de Aula - Professor Eduardo 
Lima Campos.
Os eventos de interesse são:
Sejam A = ´ser defeituoso` e 
B = ´ter sido produzido por M1`. 
São fornecidas no enunciado 
as seguintes probabilidades:
P(B) = 0,6, P(Bc) = 0,4,
P(A|B) = 0,01 e P(A|Bc) = 0,02.
Notas de Aula - Professor Eduardo 
Lima Campos.
Solução do item a: 
Pede-se P(A)
Aplicando a Lei da Probabilidade Total:
P(A) = P(A|B)P(B) + P(A|Bc)P(Bc) 
= 0,01*0,6 + 0,02*0,4 = 0,014. 
Notas de Aula - Professor Eduardo 
Lima Campos.
b) Se (= dado que) o item selecionado 
é defeituoso, qual a probabilidade de 
que ele tenha sido produzido por M1? 
Notas de Aula - Professor Eduardo 
Lima Campos.
Solução do item b: pede-se P(B|A), que 
pode ser obtida da seguinte forma:
P(B|A) = P(AB)/P(A) 
= P(A|B)P(B)/P(A)
= 0,01*0,6/0,014 = 0,429.
A fórmula acima, que permite obter P(B|A) a 
partir de P(A|B) é chamada Teorema de Bayes.
Notas de Aula - Professor Eduardo 
Lima Campos.
24
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Sejam A e B eventos definidos em S, sendo 
A dependente de B, na sequência: B  A.
O Teorema de Bayes (p/ 2 eventos) se ocupa 
da sequência reversa: A  B, fornecendo:
Teorema de Bayes
.
)A(P
)B(P)B|A(P
)A|B(P 
obtida 
pela Lei da 
Probabilidade 
Total
Notas de Aula - Professor Eduardo 
Lima Campos.
Exemplo 2.11 - Um candidato que 
cursou o MFEE tem probabilidade 0,9 
de ser selecionado para uma vaga em 
um cargo gerencial. Caso contrário, 
esta probabilidade é de apenas 0,3. 
70% dos candidatos cursaram o MFEE. 
a) Calcule a probabilidade de que um candidato 
ao acaso seja selecionado para a vaga.
Os eventos de interesse são: 
A = ´ser selecionado` 
B = ´ter cursado o MFEE`.
São fornecidas no enunciado 
as seguintes probabilidades:
P(A|B) = 0,9, P(A|Bc) = 0,3 e P(B) = 0,7.
Notas de Aula - Professor Eduardo 
Lima Campos.
Solução do Item a: 
Pede-se P(A).
Aplicando a Lei da Probabilidade Total:
P(A) = P(A|B)P(B) + P(A|Bc)P(Bc)
= 0,9*0,7 + 0,3*0,3 = 0,72.
Notas de Aula - Professor Eduardo 
Lima Campos.
Exemplo 2.11 (cont.) 
b) Se um candidato foi selecionado 
para a vaga, qual a probabilidade 
de que ele tenha cursado o MFEE?
Solução do Item b: 
Pede-se P(B|A) 
P(B|A) = P(A|B)P(B)/P(A)
= 0,9*0,7/0,72 = 0,875.
Notas de Aula - Professor Eduardo 
Lima Campos.
O Teorema de Bayes pode ser ampliado 
para mais de 2 Eventos, fazendo, por 
exemplo: B1, B2 e B3, ao invés de B e B
c.
25
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
• Teorema de Bayes para 3 Eventos
Exemplo 2.12 - Os funcionários de uma 
empresa dividem-se em 3 grupos: economistas, 
engenheiros e analistas de sistemas. Estes 
funcionários podem ocupar cargos técnicos ou 
gerenciais. Sabemos que 20% dos funcionários 
são analistas de sistemas, 30% são engenheiros 
e 50% são economistas. 1% dos analistas 
de sistemas, 2% dos engenheiros e 3% dos 
economistas fazem parte da direção da empresa.
Um funcionário é selecionado aleatoriamente.
a) Qual a probabilidade de que ele 
seja um dos diretores da empresa?
b) Dado que ele é um dos diretores, qual a 
probabilidade de que seja engenheiro? 
Os eventos de interesse são: 
A = ser diretor da empresa
B1 = ser analista
B2 = ser engenheiro
B3 = ser economista.
São fornecidasno enunciado 
as seguintes probabilidades:
P(B1) = 0,2, P(B2) = 0,3, P(B3) = 0,5, 
P(A|B1) = 0,01, P(A|B2) = 0,02, P(A|B3) = 0,03. 
Solução do Item a - Ampliando a Lei 
da Probabilidade Total para 3 eventos:
P(A) = P(A|B1)P(B1) + P(A|B2)P(B2) + 
P(A| B3)P(B3) = 0,01*0,2 + 0,02*0,3 + 
0,03*0,5 = 0,002 + 0,006 + 0,015 = 0,023.
Solução do Item b:
P(B2|A) = P(A|B2)P(B2)/P(A) 
= 0,02*0,3/0,023 = 0,2609.
• Lei da Adição para 3 Eventos
P(ABC) = P(A) + P(B) + P(C) - P(AB) 
- P(AC) - P(BC) + P(ABC).
• Lei da Multiplicação para 3 Eventos
P(ABC) = P(A|BC)P(B|C)P(C).
• Independência para 3 Eventos
P(ABC) = P(A)P(B)P(C),
P(AB) = P(A)P(B),
P(AC) = P(A)P(C),
e
P(BC) = P(B)P(C).
3 eventos A, B e C são 
independentes se, e somente se: 
26
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
3. VARIÁVEIS 
ALEATÓRIAS
Uma variável aleatória (v.a.) é uma 
representação numérica dos resultados 
possíveis de um experimento aleatório.
Variável Aleatória (V.A.)
Exemplo 3.1 - Seja o experimento 
do exemplo 2.3 (lançar três moedas 
e observar o número de caras). A v.a. 
adequada é: X = número de caras observadas.
S (espaço amostral):
(CO,CO,CO) 0
(CA,CO,CO)
(CO,CA,CO) 1
(CO,CO,CA)
(CA,CA,CO) 2
(CA,CO,CA)
(CO,CA,CA) 3
(CA,CA,CA)
Valores de X: • V.A.`s Discretas x Contínuas
A v.a. do exemplo anterior 
assume valores contáveis. 
Este tipo de v.a. é chamada discreta.
Uma v.a. que assuma valores em um 
intervalo contínuo é chamada contínua.
• Distribuição de Probabilidade
Representa como as probabilidades 
distribuem-se de acordo com os valores de X. 
Notação: 
Para a v.a. em si  X (maiúscula).
Para os valores de X  x (minúscula).
É uma função P(X=x) que associa, 
a cada valor possível x de uma v.a. 
discreta X, a sua probabilidade.
Distribuição de 
Probabilidade Discreta
Propriedades de uma distribuição discreta:
 

x
1)xX(P )2
x,0)xX(P )1
27
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Exemplo 3.2 - Na situação do exemplo 3.1, 
qual a distribuição de probabilidade de X?
Solução - a distribuição de probabilidade de X é:
x P(X=x)
0 1/8
1 3/8
2 3/8
3 1/8
Uma distribuição contínua f(x) é 
uma função que permite calcular 
a probabilidade de que uma v.a. 
contínua pertença a um intervalo.
P(aXb) é a área sob o gráfico de f(x) 
que corresponde ao intervalo [a,b].
Distribuição de Probabilidade 
Contínua (Função de Densidade)
Exemplo 3.3 - Seja X = peso de um 
carregamento em Kg, com distribuição: 
A figura mostra: P(6.000X8.000).
f(x)
x
O cálculo desta área 
envolve uma 
integral:

000.8
000.6
dx)x(f
Propriedades de uma função de densidade:
1) f(x)  0, para todo x.
2) A área total sob o gráfico é igual a 1.
3) P(X=x) = 0, para todo x.
Exemplo 3.4 - Seja X uma v.a. 
contínua com a seguinte distribuição: 
f(x) = cx2, 0<x<2.
a) Qual o valor da constante c? 
b) Calcule P(X>1). 
Você tem que igualar a integral a 1.
R: a) 3/8 b) 7/8.
O valor esperado de uma v.a. X, E(X), 
é a média dos valores que X assumiria 
em infinitas repetições do experimento.
Fórmula para o caso discreto: 
Valor Esperado de uma V.A.
.)xX(xP)X(E
x
 
28
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Exemplo 3.5 - Considere a distribuição: 
P(X=0) = 1/2
P(X=1) = 1/3
P(X=2) = 1/6. 
Calcule o valor esperado de X.
Solução: 
E(X) = 0*1/2 + 1*1/3 + 2*1/6 = 2/3.
Observações:
1 - E(X) é também chamado média de X.
2 - E(X) não é um valor que se espera que 
ocorra, podendo ser (e em geral é) um 
valor que não ocorre, como neste caso!
3 - E(X) pode ser interpretado como o 
ponto de equilíbrio da distribuição, em 
que as probabilidades são os pesos.
Exemplo 3.6 - Um investimento de risco 
oferece, em um ano, rentabilidade de 10% 
com probabilidade 0,4 e rentabilidade de 
-4% com probabilidade 0,6. 
Qual a rentabilidade esperada ao final 
do ano? O investimento compensa?
Obs - trata-se de um investimento, 
de tal forma que é imprescindível 
considerar o custo de oportunidade.
Solução:
O retorno de (- 4)% ocorre com 
probabilidade 0,6.
O retorno de 10% ocorre com 
probabilidade 0,4.
O retorno esperado é: (- 4)*0,6 + 10*0,4 
= 1,6%, bem inferior, por exemplo, 
à rentabilidade anual da poupança. 
Portanto, o investimento não compensa.
Fórmula do valor esperado para o caso contínuo:
Exemplo 3.7 - Calcule E(X), 
sendo X a v.a. definida no exemplo 3.4.
.
2
3
4
x
8
3
dxx
8
3
dxx
8
3
x)X(E
2
0
42
0
3
2
2
0



 f(x)
 .dx)x(f x)X(E
• Moda de uma V.A.
No caso discreto, é o valor que ocorre com 
maior probabilidade. No caso contínuo, é 
definida como x tal que f(x) seja máxima.
É o valor que divide a distribuição em 2 
intervalos com probabilidades iguais (0,5).
No caso contínuo, divide f(x) em 2 áreas iguais.
• Mediana de uma V.A.
29
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Exemplo 3.8 - Calcule a mediana 
da v.a. definida no exemplo 3.4.
Solução:
.4k4k5,0
8
k
5,0dxx
8
3
5,0dxx
8
3
33
3
k
0
22
k
0


Valor Esperado de uma Função g(X):
 
x
)xX(P)x(g)]X(g[E
O caso mais importante é do da função
g(X) = [X-E(X)]2, que define a variância.
 dx)x(f)x(g)]X(g[E
A variância V(X) de uma v.a. X 
é o valor esperado de [X-E(X)]2.
A variância costuma ser obtida mediante a 
forma equivalente: V(X) = E(X2) - E2(X) 
Variância de uma V.A.
contínuo. caso no ,dx f(x) x)X(E e
discreto caso no ,)xX(Px)X(E
22
x
22




Exemplo 3.9 - Calcule V(X), 
sendo X a v.a. definida no exemplo 3.5.
Solução: 
E(X2) = 02*1/2 + 12*1/3 + 22*1/6 = 1.
V(X) = E(X2) - E2(X) = 1-(2/3)2 = 1 - 4/9 = 5/9.
Exemplo 3.10 - Calcule V(X), 
sendo X a v.a. definida no exemplo 3.4.
.
20
3
2
3
5
12
)X(E)X(E)X(V
.
5
12
5
x
8
3
dxx
8
3
dxx
8
3
x)X(E
2
22
2
0
52
0
4
2
2
0
22











f(x)
É a raiz quadrada de V(X):
)X(V)X(DP 
.
)X(E
)X(DP
)X(CV 
• Coeficiente de Variação de uma V.A.
• Desvio Padrão de uma V.A.
30
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
• Algumas Propriedades Importantes 
do Valor Esperado e da Variância
(1) Se b é uma constante, e Y = b: 
E(Y) = b e V(Y) = 0. 
(2) Se a é uma constante, e Y = aX: 
E(Y) = aE(X) e V(Y) = a2V(X). 
(3) Se a e b são constantes, e Y = aX + b: 
E(Y) = aE(X) + b e V(Y) = a2V(X).
Exemplo 3.11 - Seja um produto importado 
cujo preço, em dólares, apresenta, ao longo 
de um período, média 80 e desvio padrão 8.
a) Se a taxa de câmbio for 2 R$/Dólar,
calcule o valor esperado, a variância, 
o desvio padrão e o CV do preço em R$.
b) Se o preço do produto aumenta 10 dólares, 
calcule a média, a variância, o desvio padrão 
e o CV do preço (em dólares), após o aumento.
Solução do item a: 
a) Seja X o preço do produto em dólares. 
Então: E(X) = 80, DP(X) = 8 e V(X) = 64.
Seja Y o preço do produto em R$. 
Então: Y = 2X. Logo, E(Y) = 2E(X) = 
R$ 160, V(Y) = 22V(X) = 4*64 = 256 R$2, 
DP(Y) = R$ 16 e CV(Y) = 16/160 = 0,1 = 10%. 
Solução do item b: 
b) Seja Z o preço em dólares após o 
aumento. Então: Z = X + 10.
Logo, E(Z) = E(X) + 10 = 90 dólares, 
V(Z) = V(X) = 64 dólares2, DP(Z) = 
8 dólares e CV(Z) = 8/90 = 8,88%.
• Padronizando uma V.A.
Seja X uma v.a. tal que E(X) =  eV(X) = 2. Seja Z = (X-)/. Então:
E(Z) = 0 e V(Z) = 1.
Isto se chama padronizar a v.a. X (ou seja, 
transformá-la em uma nova v.a., chamada 
de Z, que possui média zero e variância 1).
Função F(x) que associa, a cada valor 
x, a probabilidade de que X seja 
menor ou igual a x, isto é: P(Xx).
Exemplo 3.12 - Ache F(x) para a v.a. do 
exemplo 3.5 (relembrando a distribuição: 
P(X=0) = 1/2, P(X=1) = 1/3, P(X=2) = 1/6). 
Função de Distribuição 
(Acumulada)
31
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Solução: 
Para x < 0, F(x) = 0.
Para 0  x < 1, F(x) = 1/2.
Para 1  x < 2, F(x) = 1/2 + 1/3 = 5/6.
Para x  2, F(x) = 1/2 + 1/3 + 1/6 = 1.
Exemplo 3.13 - Considere a distribuição de 
probabilidade: f(x) = 2x, 0<x<1. Ache F(x).
Solução:
Para x < 0, F(x) = 0.
Para 0  x < 1:
Para x  1, F(x) = 1.
.x xdx2dx)x(f)xX(P)x(F 2
x
0
x
0
 
Propriedades de F(x):
.
dx
)x(dF
)x(f 
.1)x(FLim e 0)x(FLim .1
xx


2. No caso discreto, F(x) é contínua à 
direita. No caso contínuo, é contínua.
3. No caso contínuo, é possível, a partir 
da f.d.a., obter a função de densidade f(x) 
original, derivando F(x) com respeito a x:
• Covariância e Correlação entre 2 V.A.`s
A covariância entre duas variáveis 
aleatórias X e Y é definida como:
).Y(E)X(E)XY(E :ainda ou
))],Y(EY))(X(EX[(E)Y,X(Cov


.
)Y(V)X(V
)Y,X(Cov
)Y,X(Corr XY 
E o coeficiente de correlação é:
Propriedades da Covariância
(a, b, c e d constantes)
P.1) Cov(X,X) = V(X). 
P.2) Cov(aX,cY) = acCov(X,Y).
P.3) Cov(aX+b,cY+d) = acCov(X,Y).
Exercício 3.1 - Seja X uma v.a. com média 1 e 
variância 4. Sejam ainda: Y = 2X e Z = 3X + 2. 
Determine:
a) Cov(X,Y) R:8.
b) Cov(X,Z) R: 12.
c) Cov(Y,Z) R: 24.
d) Corr(X,Z) R: 1.
e) Corr(Y,Z) R: 1.
32
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
4. DISTRIBUIÇOES 
DISCRETAS
É a distribuição discreta mais simples 
possível. Considera que todos os valores 
de X possuem a mesma probabilidade:
Exemplo 4.1 - No lançamento de um dado, 
a v.a. que representa a face voltada para 
cima segue distribuição uniforme discreta.
• Distribuição Uniforme Discreta
k. ..., 2, 1, x ,
k
1
)xX(P 
Experimento de Bernoulli é um 
experimento aleatório que possui 
apenas dois resultados possíveis.
Exemplos:
4.2 - Lançar uma moeda e 
observar a face voltada para cima.
4.3 - Observar se um atirador acerta o alvo. 
• Distribuição de Bernoulli
Um dos resultados é chamado 
“sucesso”, e o outro, “fracasso”.
A probabilidade de sucesso 
é designada por p. 
Como consequência, a 
probabilidade de fracasso é 1-p.
.
Seja agora uma v.a. X que assume valor 
0, se ocorre um fracasso, e 1, se ocorre 
um sucesso. A distribuição desta v.a. é:
x P(X=x)
0 1-p
1 p
A distribuição acima é chamada 
distribuição de Bernoulli.
P(X=x) = px(1-p)1-x, x = 0,1; 0<p<1. 
Fórmula da Distribuição de Bernoulli:
o “~” significa 
“segue distribuição”
Notação usual: X ~ Bernoulli(p).
33
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Sejam agora n realizações independentes
de experimentos de Bernoulli com a 
mesma probabilidade de sucesso p.
Considere que estejamos interessados 
no número de sucessos observados.
• Distribuição Binomial Exemplo 4.4 - Ao lançar 3 moedas, qual 
a probabilidade de obtermos 2 caras?
Façamos: 
{CA} = sucesso e {CO} = fracasso.
Neste problema, a v.a. X de interesse 
representa o número de sucessos (caras).
A distribuição da v.a. que representa o número 
de sucessos em n realizações independentes de 
experimentos de Bernoulli, todos com mesma 
probabilidade de sucesso p, chama-se binomial.
n (número de realizações) e p (probabilidade 
de sucesso) são os parâmetros da distribuição.
Fórmula da Distribuição Binomial:
 )xX(P
probabilidade de 
obter x sucessos 
em n realizações
independentes
xnx )p1(p 






x
n
.1p0 ;n,...,1,0x , 
.
)!xn(!x
!n


Notação usual: X ~ Bin(n,p).
Solução do Exemplo 4.4:
A v.a. de interesse é: X = número de caras. 
X ~ Bin(3,1/2). Pede-se P(X=2).
.
8
3
2
1
2
1
2
3
)2X(P
12



















Exemplo 4.5 - Qual a probabilidade de 
que um atirador acerte o alvo 3 vezes em 5 
tentativas, se a probabilidade dele acertar 
um tiro em uma tentativa qualquer é 2/3?
34
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Solução:
A v.a. de interesse é: 
X = número de acertos. 
Se considerarmos que as tentativas são 
independentes, então: X ~ Bin(5,2/3).
.3292,0
3
1
3
2
3
5
)3X(P
23



















Daí:
Valor Esperado e Variância da Binomial:
E(X) = np 
V(X) = np(1-p)
Exemplo 4.5 (cont.) - Calcule o valor 
esperado do número de acertos do atirador.
Exemplo 4.6 - Considere um exame com 
20 questões de múltipla escolha, cada uma 
com 5 alternativas. Se um aluno que não 
estudou nada resolve “chutar” todas as 
respostas, qual é a probabilidade de que 
acerte 30% da prova (isto é, 6 questões)?
Solução:
    .1091,08,02,0
6
20
)6X(P
146







Qual o valor esperado do número 
de questões que o aluno acerta? 
A v.a. de interesse é: X = número de acertos. 
Logo: X ~ Bin(20;0,2). Daí:
Exemplo 4.7 (importante aplicação em 
finanças) - O preço de uma ação a cada 
dia é uma v.a., com probabilidade 0,4 de 
descer R$ 1,00 e probabilidade 0,6 de subir 
R$ 1,00. As variações de preço a cada dia 
são independentes, e as probabilidades de 
aumento ou queda de preço se mantém 
fixas. Se no primeiro dia o preço da ação 
é R$ 100,00, calcule o valor esperado 
do preço da ação no quinto dia.
Solução:
A trajetória da ação pode ser representada 
em uma árvore, chamada árvore binomial. 
A v.a. de interesse é: 
X = número de vezes que a ação sobe.
Qual a distribuição de X?
35
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
x P(X=x)
0 0,0256
1 0,1536
2 0,3456
3 0,3456
4 0,1296
Seja agora Y uma outra v.a., 
representando o preço final da ação.
Note que, se a ação cair todos os dias 
(X=0), Y será igual a R$ 96,00. 
Por outro lado, se a ação subir todos os 
dias (X=4), Y será igual a R$ 104,00. 
E nos casos intermediários?
y P(Y=y)
96 0,0256
98 0,1536
100 0,3456
102 0,3456
104 0,1296
O valor esperado de Y pode ser 
calculado de 2 formas.
Forma 1 - diretamente da distribuição de Y, 
aplicando a definição de valor esperado: 
.8,1001296,0*1043456,0*1023456,0*100
1536,0*980256,0*96)yY(yP)Y(E
y


R: o valor esperado do preço (preço esperado) 
da ação no quinto dia é R$ 100,80.
Forma 2 - escrevendo Y como função de X:
Y = 2X+96,
e aplicando a fórmula do valor 
esperado de aX+b (capítulo 3):
E(aX+b) = aE(X) + b. 
No caso, a = 2, b = 96 e E(X) = np = 2,4. 
Assim:
E(Y) = 2*2,4+96 = 100,8.
36
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
• Distribuição Hipergeométrica
Exemplo 4.8 - Considere 4 extrações sem 
reposição de bolinhas, de uma urna que 
contém 8 bolinhas azuis e 5 vermelhas.
Calcule a probabilidade de que 3 sejam azuis.
Em princípio, poderíamos pensar na 
extração de cada bolinha como um 
experimento de Bernoulli, e a v.a. X de 
interesse (número de bolinhas azuis na 
amostra) seguindo distribuição binomial.
Pergunta: o que nos impede de fazer isto?
Resposta:
A amostragem é sem reposição, o que faz 
com que sucessivas extrações sejam 
dependentes e as probabilidades de 
sucesso mudem a cada extração.
De formageral, considere uma população 
(no exemplo, urna) com N elementos 
(no exemplo, bolinhas), dentre os quais 
temos r sucessos (no exemplo, ser azul). 
Seja então uma amostra de 
tamanho n, obtida sem reposição. 
Qual é a probabilidade de que tenhamos 
exatamente x sucessos nesta amostra?
A distribuição da v.a. que representa o 
número de sucessos na amostra chama-
se hipergeométrica, c/ parâmetros N, r e n. 
Para obter a fórmula da distribuição 
hipergeométrica é só fazer: P(A) = #A/#S 
(casos favoráveis sobre casos possíveis).
O número de casos possíveis é o número 
total de amostras de tamanho n que 
podemos obter da população, ou seja: 
.
n
N






O número de casos favoráveis é o número de 
formas de extrair x sucessos dentre os r possíveis
e (n-x) fracassos dentre os N-r possíveis: 
.
xn
rN
x
r














37
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Fórmula da Distribuição Hipergeométrica:
.
n
N
xn
rN
x
r
)xX(P





















probabilidade de que ocorram x sucessos, em 
uma amostra sem reposição de tamanho n
Notação usual: X ~ Hiper(N,r,n).
Solução do exemplo 4.8: 
Seja X o número de bolinhas azuis 
na amostra de tamanho 4. Então:
.3916,0
4
13
1
5
3
8
4
13
34
813
3
8
)3X(P 








































Exemplo 4.9
Considere um lote de 10 peças, das quais 
4 são defeituosas. Se extrairmos 5 peças, 
sem reposição, qual a probabilidade de 
que 2 sejam defeituosas?
Solução:
Seja X o número de peças defeituosas 
na amostra de tamanho 5. Então:
.4762,0
5
10
3
6
2
4
)2X(P 



















Exemplo 4.10 - Para tentar passar pela 
alfândega, um traficante esconde 5 pílulas 
de narcóticos em um vidro que contém 
10 pílulas de aspirina. O fiscal fica 
desconfiado, e decide tomar uma amostra 
de 4 pílulas, para inspeção. Qual a 
probabilidade do traficante ser preso?
Solução: seja X = número de pílulas 
de narcóticos na amostra. Que valores X tem 
que assumir para que o traficante seja preso?
38
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
O traficante é preso se X1. Mas P(X1) = 
1-P(X=0), sendo P(X=0) calculada a seguir:
Logo: P(X1) = 1 – 0,1539 = 0,8461.
0,1539.
4
15
4
10
0
5
)0X(P 



















Valor Esperado e Variância 
da Hipergeométrica:






















1N
nN
N
r
1
N
r
nV(X)
N
r
nXE )(
• Aproximação da 
Hipergeométrica pela Binomial
Se N é muito maior do que n (N  20n), 
a distribuição hipergeométrica pode ser 
aproximada pela distribuição binomial 
(cujas probabilidades são mais simples 
de calcular), com parâmetros n e p = r/N.
Exemplo 4.11 - Em uma eleição, suponha 
que 300 dos 1000 habitantes de um 
município são eleitores de um candidato 
A. Toma-se uma amostra de 10 eleitores. 
Qual a probabilidade de que exatamente 5 
deles pretendam votar no candidato A?
Solução: A probabilidade exata seria 
calculada da seguinte forma: 
Note que as combinações envolvidas 
são bastante chatas de se calcular...
.
10
1000
5
700
5
300
)5X(P



















A probabilidade aproximada pode ser 
calculada utilizando a distribuição 
binomial, com n = 10 e p = 300/1000 = 0,3.
Compare com o resultado exato 
(calculado no Excel: 0,1026)
.1029,0)7,0()3,0(
5
10
)5X(P 55 






39
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
• Distribuição Geométrica
Considere, como na definição da 
Binomial, realizações independentes
de experimentos de Bernoulli, todos 
com mesma probabilidade de sucesso p.
A distribuição da v.a. que representa 
o número de realizações necessárias
até que ocorra o primeiro sucesso
chama-se geométrica, com parâmetro p.
Fórmula da Distribuição Geométrica:
1.p0 ,...;2,1x ,p)p1()xX(P 1x  
probabilidade de que o primeiro sucesso 
venha a ocorrer na x-ésima realização.
Notação: X ~ Geom(p).
Parâmetro: p.
.0082,0
3
2
3
2
1)5X(P
4













Exemplo 4.12 - A probabilidade de um 
indivíduo acertar um alvo é 2/3. Se ele 
deve atirar até que acerte o alvo pela 
primeira vez, qual a probabilidade de 
que sejam necessários exatamente 5 tiros?
Solução: Seja X o número de tiros até o 
primeiro acerto. Então: X ~ Geom(2/3).
Valor Esperado e Variância da Geométrica:
E(X) = 1/p 
V(X) = (1-p)/p2
No exemplo 4.12, qual o número de tiros 
esperado até que ocorra o primeiro acerto?
Exercício (Resolvido) 4.1 - Um jogador 
converte 10% dos pênaltis que cobra.
a) Qual a probabilidade de que ele acerte 
apenas uma cobrança em 5 tentativas?
b) Qual a probabilidade de que ele precise 
bater 5 pênaltis até acertar o primeiro?
Solução:
a) Seja X o número de pênaltis 
que o jogador acerta. Então: 
X ~ Bin(5;0,1). 
Pede-se P(X=1).
.32805,0)9,0()1,0(
1
5
)1X(P 41 






40
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
b) Seja X o número de cobranças até que 
o jogador acerte a primeira. Então: 
X ~ Geom(0,1). 
Pede-se:
.06561,0)1,0()9,0()5X(P 4 
Exemplo motivador para a próxima 
distribuição a ser apresentada:
Exemplo 4.13 - Na situação do exemplo 
4.12, calcule a probabilidade de que o 
atirador precise de 4 tiros para acertar pela 
segunda vez o alvo (ou seja, de que o 
segundo acerto ocorra no quarto tiro).
• Distribuição Binomial Negativa
Considere novamente realizações 
independentes de experimentos de 
Bernoulli com probabilidade de sucesso p. 
A distribuição da v.a. que representa o número 
de realizações necessárias até que ocorra o 
r-ésimo sucesso (r = 1, 2, 3, ...) chama-se 
binomial negativa, com parâmetros r e p. 
Se r = 1, caímos na distribuição 
geométrica (caso particular).
Fórmula da Distribuição Binomial Negativa:
.1p0 ,...;1r,rx ,p)p1(
1r
1x
)xX(P rrx 







 
Notação usual: X ~ BNeg(r,p).
Parâmetros: r e p.
probabilidade de que o r-ésimo sucesso 
venha a ocorrer na x-ésima realização.
Solução do exemplo 4.13:
Seja X o número de tiros até o segundo acerto.
X ~ BNeg(2,2/3).
.1481,0
3
2
3
2
1
1
3
)4X(P
22



















Valor Esperado e Variância 
da Binomial Negativa:
E(X) = r/p 
V(X) = r(1-p)/p2
41
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
• Distribuição de Poisson
Seja  a taxa de ocorrência de um evento 
por unidade de tempo ou de espaço. Por 
exemplo, acidentes/hora em uma estrada. 
A distribuição da v.a. que representa 
o número de ocorrências de um evento 
com taxa , no intervalo correspondente, 
chama-se Poisson, com parâmetro . 
Fórmula da Distribuição de Poisson:
.0 ,...;1,0x ,
!x
e
)xX(P
x




probabilidade de que ocorram x eventos, em um 
intervalo no qual ocorrem, em média,  eventos
Notação usual: X ~ Poi().
Parâmetro: .
Valor Esperado e Variância da Poisson:
E(X) = 
V(X) = 
A Poisson é a única distribuição na qual 
a média e a variância são sempre iguais!
Exemplo 4.14 - Em determinada rodovia, 
ocorrem, em média, 3 acidentes por hora. 
Supondo distribuição de Poisson, 
calcule as seguintes probabilidades:
a) De que ocorram 2 acidentes em uma hora.b) De que ocorram pelo menos 2 acidentes 
em 20 minutos (20 minutos = 1/3 de hora).
Solução: 
.e5,4
!2
e3
)2X(P )a 3
32



.e21)]1X(P)0X(P[1)2X(P
:e 1, é minutos 20 para o Assim, minutos. 20 cada
a 1 média em ocorre então hora, uma em acidentes 3
média, em ocorrem, se hora) de 1/3 ( minutos 20
 de período o para oconverter se-deve Aqui )b
1



• Aproximação da Binomial pela Poisson
Se n for grande e p for pequeno, o 
número de sucessos em n realizações 
independentes de experimentos de 
Bernoulli pode ser aproximado pela 
distribuição de Poisson, com  = np.
42
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Exemplo 4.15 - Uma companhia de 
seguros de automóveis descobriu que 
somente cerca de 0,005% da população 
está incluída em um certo tipo de sinistro 
cada ano. Se seus 20.000 segurados são 
escolhidos ao acaso na população, qual é 
a probabilidade aproximada de que 3 
clientes venham a ser incluídos nesta 
categoria de sinistro no próximo ano?
Exercício (Resolvido) 4.1 (cont.)
(combinando conteúdos dos capítulos 2 e 4)
c) Dado que são necessárias mais que 
3 tentativas até o primeiro acerto, qual 
é a probabilidade de que este acerto 
ocorra em, no máximo, 5 tentativas?
Solução:
Um olhar desatento poderia nos levar a 
calcular P(X=4) + P(X=5), quando o que 
é pedido é uma probabilidade condicional:
),3X|5X(P 
sendo X ~ Geom(0,1).
Esta probabilidade é 
calculada da seguinte forma: 
    
 
   
      
.19,0
729,0
1385,0
3XP2XP1XP1
5XP4XP
3XP
3X5XP
)3X|5X(P








Observações:
1 - A probabilidade do denominador 
não exclui P(X = 0), porque uma v.a. 
geométrica não pode assumir valor 0!
Note que a geométrica e a binomial 
negativa são as únicas distribuições 
discretas que não assumem valor 0.
2 - Esta probabilidade P(X > 3) pode ser 
obtida de forma direta pela distribuição 
binomial com n = 3 e p = 0,1, já que, se 
Y ~ Bin(3;0,1), então: P(X > 3) = P(Y = 0).
Assim:
    .729,09,01,0
0
3
)0Y(P)3X(P
30







43
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
5. DISTRIBUIÇOES 
CONTÍNUAS
• Distribuição Uniforme Contínua
É a distribuição contínua 
mais simples que existe.
Pressupõe que as probabilidades estejam 
distribuídas de maneira uniforme pelo 
intervalo de variação de X (de  a ).
Fórmula da Uniforme:
f(x) = 1/(-), <x<.
Parâmetros:  e .
Notação: X ~ Unif(,).
Cálculo de Probabilidades 
Utilizando a Uniforme:
P(aXb) = (b-a)/(-)
Valor Esperado e Variância da Uniforme:
E(X) = (+)/2
V(X) = (-)2/12
Exemplo 5.1 - As notas de uma turma 
apresentam média 5 e variância 3. A 
nota mínima para aprovação é 7. 
Supondo distribuição uniforme, calcule 
a probabilidade de um aluno ser aprovado.
R: 1/6.
44
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
• Distribuição Exponencial
Distribuição definida para valores de X 
estritamente positivos, usual para 
representar tempo (duração, espera, etc.).
Fórmula da Exponencial:
.0 ;0x ,e)x(f x  
Parâmetro: . 
Notação: X ~ Expo().
Valor Esperado e Variância:
E(X) = 1/
V(X) = 1/2
Demonstração do Valor Esperado:
Esta integral deve ser resolvida por partes, 
fazendo u = x e dv = e-xdx. 
Temos então que: du = dx e v = -e-x/. 
Assim: 
.dxxedxex)X(E
0
x
0
x




 
 
  .
1e
xe
dxexe
dx
ee
x)X(E
0
x
0
x
0
x
0
x
0
x
0
x






























 




Demonstração da Variância:
V(X) = E(X2) – E2(X). 
E(X2) é calculado da seguinte forma:
Esta integral também deve ser resolvida 
por partes, mas agora fazendo u = x2 e 
dv = e-xdx.
.dxexdxex)X(E
0
x2
0
x22




 
Função Distribuição 
Acumulada da Exponencial:
F(x) = P(Xx) = 0, x0
= 1-e-x, x>0.
45
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Demonstração da F.D.A.:
Para x0, F(x) = P(Xx) = 0.
Para x>0:
.e1
e1
dxe
dxe )xP(X)x(F
x
xx
0
x
x
0
x











Exemplo 5.2 - O tempo de espera em 
uma fila segue distribuição exponencial. 
Se um cliente espera, em média, 10 minutos
para ser atendido, qual a probabilidade: 
a) De que demore menos do que 12 minutos 
para ele ser atendido? R: 1-e-1,2.
b) De que demore menos do que 7 minutos 
para ele ser atendido? R: 1-e-0,7.
c) E entre 7 e 12 minutos? R: e-0,7-e-1,2.
d) De que ele espere mais do que 10 minutos 
(isto é, mais do que a média E(X))? 
R: e-1  0,368.
O resultado do item d) indica que a média da 
exponencial é sempre maior que a mediana!
Exemplo 5.3 - O tempo (em horas) de 
duração das lâmpadas de uma marca segue 
uma distribuição exponencial com  = 0,01.
Calcule a mediana do tempo 
de duração das lâmpadas. 
R: 69,31 horas.
Interpretação: 50% das lâmpadas desta 
marca duram mais do que 69,31 horas.
• Falta de Memória
É uma importantíssima propriedade 
da distribuição exponencial. Ela diz que: 
P(X>x+s|X>x) = P(X>s). 
Interpretação: se uma lâmpada já durou x 
horas, a probabilidade dela durar mais s 
horas a partir dali é a mesma que ela teria 
de durar s horas a partir da sua fabricação.
Em outras palavras, não há desgaste.
Isto é considerado uma crítica ao uso da 
exponencial para este tipo de aplicação.
46
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Demonstração da Falta de Memória:
P(X>x+s|X>x) =
P[(X>x+s)(X>x)]/P(X>x) =
P(X>x+s)/P(X>x) =
e-(x+s)/e-x = e-s
= P(X>s), C.Q.D. 
Parâmetros:  (=E(X)) e 2 (=V(X)).
Notação: X ~ N(,2).
O gráfico da distribuição Normal apresenta 
formato similar ao de um sino (bell shaped).
.0,;x;e
2
1
)x(f 22
)x(
2
2


 


• Distribuição Normal
Distribuição Normal para diferentes valores de :
Distribuição Normal para diferentes valores de :
• Cálculo de Probabilidades Normais
Exemplo 5.4 - Considere que as 
alturas dos alunos desta turma sigam 
distribuição Normal, com média igual 
a 170 cm e desvio padrão igual a 5 cm. 
Seja o experimento que consiste na 
seleção de um aluno qualquer e na 
medição de sua altura.
A v.a. que representa o resultado 
deste experimento é X ~ N(170,25).
Qual a probabilidade de que a altura 
do aluno esteja entre 170 e 172,3 cm?
Em princípio, você calcularia:
Problema: 
A integral de 
não possui solução analítica!





3,172
170
50
)170x(
dxe
25
1
)3,172X170(P
2
2
2
2
)x(
e
2
1
)x(f 




altura de um aluno selecionado ao acaso
47
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Para calcular a probabilidade 
solicitada, usaremos a tabela Normal.
A tabela Normal fornece probabilidades 
associadas a uma v.a. padronizada, :
que possui média 0 e variância 1 
(como vimos no capítulo 3 do curso).
,
X
Z



P(0 < Z < 0,46) é encontrada na tabela.
).46,0Z0(P
5
1703,172
Z
5
170170
P
3,172X170
P
)3,172X170(P






 

















Usando a Tabela Normal: Resposta final do item a):
A probabilidade de que a altura de 
um aluno selecionado ao acaso esteja 
entre 170 e 172,3 cm é 0,1772.
b) Qual a probabilidade de que a altura 
do aluno esteja entre 170 e 175 cm? 
Neste caso:
).1Z0(P
5
170175
Z
5
170170
P
175X170
P
)175X170(P






 
















k
Ilustrando na Tabela Normal:
48
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Resposta final do item b): 0,3413.
c) Qual a probabilidade de que a altura do 
aluno esteja entre 165 e 170 cm?
Solução: 
Pela simetria da Normal, temos: 
P(-1 < Z < 0) = P(0 < Z < 1) = 0,3413.
Ilustração da Simetria da Normal:
P(-1 < Z < 0) P(0 < Z < 1)
P(-1 < Z < 1)
d) Qual a probabilidade de que a altura do 
aluno esteja entre 165 e 175 cm?
Esta é a probabilidade de X estar a no máximo 
1 desvio padrão de distância da sua média.
Solução: do slide anterior, 
P(-1 < Z < 1) = 0,6826.
99,72%
Revisitando a figura do capítulo 1:
Considerando = 
E(X) e  = DP(X).
e) Qual a probabilidade de que a altura 
do aluno esteja entre 170 e 180 cm?
Solução: P(170 < X < 180) = 
P(0 < Z < 2) = 0,4772.
f) E entre 160 e 180 cm?
Solução: P(160 < X < 180) = 
P(-2 < Z < 2) = 2*0,4772 = 0,9544.
g) Qual a probabilidade de que a altura do 
aluno seja maior do que 170 cm? 
Solução: P(X > 170) = P(Z > 0). 
A área total sob a curva é igual a 1. 
Logo, a resposta é 0,5.
h) E maior do que 175 cm?
Solução: P(X > 175) = P(Z > 1) = 0,5 -
P(0 < Z < 1) = 0,5 - 0,3413 = 0,1587.
P(Z > 0)
49
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
i) E menor do que 175 cm?
Solução: P(X < 175) = P(Z < 1) = 0,5 + 
P(0 < Z < 1) = 0,5 + 0,3413 = 0,8413.
j) E menor do que 165 cm?
Solução: P(X < 165) = 
P(Z < -1) = P(Z > 1) = 0,1587. 
P(Z < 0)
Exemplo 5.5 - O VPL de um projeto, em 
R$ 1.000,00, segue distribuição N(80,16).
Calcule a probabilidade do VPL ser:
a) maior que 80 e menor que 83 mil. 
b) maior que 79 e menor que 82 mil. 
Solução:
a)
).75,0Z0(P
4
8083
Z
4
8080
P
83X80
P
)83X80(P






 

















VPL do projeto
Ilustrando na Tabela Normal:
Resposta do item a)  0,2734.
b)
 
).5,0Z0(P)25,0Z0(P
)5,0Z0(P)0Z25,0(P
5,0Z25,0P
4
8082X
4
8079
P
)82X79(P








 






Por causa da simetria!
Ilustrando na Tabela Normal:
Resposta do item b):
0,0987+0,1915 = 0,2902.
50
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Exemplo 5.6 - A rentabilidade de uma 
estratégia financeira no mercado futuro, 
referente a certo período, possui distribuição 
Normal, com média 5% e desvio padrão 3%.
a) Qual a probabilidade da rentabilidade 
ser negativa, no período considerado?
Solução:
Seja X1 = rentabilidade da estratégia.
 
.0475,0
67,1ZP
3
50
ZP
0X
P
)0X(P
1
1






 













b) Compare a estratégia do item a) 
com outra cuja média é 6% e cujo desvio 
padrão é 4%. Considere como critério 
de comparação a probabilidade de 
perda (rentabilidade negativa).
Considerando este critério, por 
qual das estratégias você optaria?
Solução:
Seja X2 = rentabilidade da nova estratégia.
 
.0668,0
5,1ZP
4
60
ZP
0X
P
)0X(P
2
2






 













Considerando a 
probabilidade de 
perda, a primeira 
estratégia é mais 
vantajosa.
Exemplo 5.7 - As notas dos alunos de um 
vestibular distribuem-se normalmente, com 
média 8 e desvio padrão 1. Se a relação 
candidato/vaga é de 40 para 1, calcule a nota 
mínima para que o aluno seja aprovado. 
Obs - será necessário achar * 
tal que: P(X > *) = 0,025. 
Buscaremos na tabela o valor k tal que: 
P(Z > k) = 0,025, denotado por z0,025.
k
Temos que achar na tabela o valor de k 
correspondente à probabilidade 0,475:
Assim: z0,025 = 1,96.
Resposta do Exemplo 5.7: 9,96.
51
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
• Distribuição Lognormal
Seja uma v.a. Normal 
X ~ N(,2) e seja Y = eX.
A distribuição de Y é chamada 
lognormal, com parâmetros  e 2.
Fórmula:
A distribuição lognormal 
apresenta assimetria positiva.
Valor Esperado:
.0 , 0,y ;e
2y
1
)y(f
2
2
)y(ln
2
1






2
2
e)Y(E



Aplicação da lognormal 
em economia e finanças: 
Pressuposto usual para a distribuição dos 
preços de ativos no mercado financeiro.
Cálculo de probabilidades lognormais:
É conduzido usando que, se Y segue 
distribuição lognormal com parâmetros 
e 2, então X = lnY segue distribuição 
Normal com os mesmos parâmetros.
Exemplo 5.8 - As alturas em uma 
população (em cm) seguem distribuição 
lognormal com parâmetros  = 5,11 e 2 = 
1. Qual a porcentagem de indivíduos desta 
população com altura inferior a 164 cm? 
  .496,001,0ZP
1
11,5164ln
1
11,5X
P 




 


Solução: P(Y<164) = P(lnY<ln164) =
= X ~ N(5,11;1).
 5,1.
• Distribuição Qui-Quadrado
Fórmula:
Parâmetro:  (graus de liberdade) 
Notação: 
0. ;0x ;ex
2
1
)x(f 2
x
1
2
2






.~X 2


Valor Esperado e Variância:
E(X) = 
V(X) = 2
Relação entre a Qui-Quadrado e a Normal:
2
1
2 ~ZY
 :N(0,1)~ ZSe

52
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
6. FUNÇÕES
LINEARES DE V.A.`s
• Soma de V.A.`s
Exemplo 6.1 - Um elevador suporta 
um peso máximo de 500Kg. Podemos 
estar interessados na probabilidade do 
peso limite ser ultrapassado quando 7 
pessoas entram neste elevador. 
Neste caso, a v.a. de interesse é:
e a probabilidade de interesse é: P(S>500).
,XS
7
1i
i


peso da 
i-ésima pessoa.
• Valor Esperado da Soma de n V.A.`s:
• Variância da Soma de n 
V.A.`s Descorrelacionadas:
.)X(V)S(V
n
1i
i


.)X(E)S(E
n
1i
i


• Soma de Normais Independentes 
com Médias e Variâncias Iguais
Considere a soma S de n v.a.`s Xi, i = 
1,2,...,n, Normais e independentes, 
c/ médias  e variâncias 2. Então:
).n,n(N~S 2
E agora estamos aptos a calcular a 
probabilidade de interesse do exemplo 6.1.
Exemplo 6.1 (cont.)
e queremos P(S>500).
Supondo que os pesos das pessoas deste 
universo tenham média  = 70 e variância 
2 = 100, temos que S ~ N(490,700), e:
,XS
7
1i
i


peso da i-ésima pessoa
.3520,0)38,0Z(P
)
700
490500
Z(P)500S(P




Exemplo 6.2 - Uma máquina de café é 
calibrada para produzir pacotes com peso 
500g. Entretanto, na prática, os pesos reais 
dos pacotes produzidos serão v.a.`s.
Suponha que os pesos dos pacotes produzidos 
pela máquina sigam distribuição Normal 
com média 500 g e variância 16 g2. 
a) Se selecionarmos 100 pacotes (considere 
os pesos dos pacotes independentes), 
qual a probabilidade de que o peso 
total seja maior do que 49,96 Kg?
53
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2020 - Professor: Eduardo Lima Campos
Solução:
 
.8413,05,0)1Z0(P
5,0)0Z1(P1ZP
40
000.50960.49
ZP)960.49S(P







 

).n,n(N~XS 2
n
1i
i


peso total = soma dos pesos
• Média de V.A.`s
A média de n v.a.`s X1, X2, ..., Xn,
é definida da seguinte forma:
.
n
X
X
n
1i
i

Note que, assim como a soma, a média de n 
v.a.`s é, também uma variável aleatória.
• Média de Normais Independentes
com Médias e Variâncias Iguais
Considere a média de n v.a.`s Xi, 
i = 1,2,...,n, independentes e Normais, 
c/ médias  e variâncias 2. Então:
).
n
,(N~X
2

X
Em particular, assim como a soma, a média de 
Normais independentes também é Normal.
Demonstração do Valor Esperado

Continue navegando