Buscar

apostila_estatistica

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 77 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 77 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 77 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Universidade Estadual de Mato Grosso do Sul - UEMS
Probabilidade e Estatı́stica
Marina Rodrigues Maestre 1
1 Introdução
Uma das ferramentas mais utilizadas hoje em dia, em todas as áreas do conhecimento é a
Estatı́stica, que descreve os dados observados e desenvolve metodologia para tomada de decisão
em presença da incerteza.
Hoje em dia a metodologia estatı́stica é utilizada em diferentes contextos, como testes li-
gados ao desempenho escolar, pesquisas eleitorais, estudos financeiros, controle de qualidade,
análises de crescimento de doenças, taxas populacionais, data mining, ı́ndices de desenvol-
vimento, ı́ndices de desemprego, ı́ndices de pessoas que fazem passeios turı́sticos e com que
frequência, modelagem de fenômenos da natureza etc.
Definição: A estatı́stica é uma coleção de métodos para planejar experimentos, obter dados
e organizá-los, resumı́-los, analisá-los, interpretá-los e deles extrair conclusões.
É usual dividir-se a Estatı́stica em quatro grandes áreas, embora não se trate de ramos isola-
dos:
• os mecanismos de coleta de dados, amostragem e planejamento de experimentos;
• a estatı́stica descritiva, que se ocupa da organização, apresentação e sintetização dos da-
dos;
• a probabilidade, que estuda eventos com resultados possı́veis, mas incertos;
• a estatı́stica inferencial, que é o conjunto de métodos para a tomada de decisões, nas
situações em que existem incerteza e variação.
A inferência se inter-relaciona com as outras áreas da estatı́stica de acordo com o seguinte
esquema:
Resumo do Procedimento:
Coleta de dados⇒ Crı́tica dos dados⇒ Apresentação⇒ Tabelas e Gráficos⇒ Análise
Definições:
População é o conjunto de elementos que tem, em comum, determinada caracterı́stica.
Variáveis são caracterı́sticas mensuráveis que se quer estudar e que exibem certo grau de
variabilidade.
Notação: X ,Y,Z, . . . (letras maiúsculas).
Denota-se com letras minúsculas os valores por elas assumidos.
Exemplos:
1UEMS. e-mail: marina.maestre.estatistica@gmail.com
1
Variável Realizações
X : Cor dos olhos x: pretos, castanhos, azuis, . . .
Y : Sexo y: masculino, feminino
Z: Número de peças defeituosas em um dia z: 0, 1, 2,. . .
Amostra é qualquer subconjunto retirado de uma população. É usada, em geral, para testar
hipóteses ou fazer inferência sobre algum parâmetro desconhecido.
Recenseamento é quando são coletadas informações de toda a população (censo).
Amostragem: coletar informações de parte da população.
Censo × Amostragem?
Decidir entre censo ou amostragem depende de vários fatores:
- Custo;
- Tempo;
- Nı́vel de precisão desejado;
- Facilidade ou não de acesso aos elementos da população.
2 Tipos de Variáveis
Quando se faz uma pesquisa, de modo geral, para cada elemento investigado, tem-se associ-
ado um (ou mais) resultado correspondendo à realização de uma caracterı́stica (variável).
As variáveis podem ser classificadas:
• Qualitativas: Nominais e Ordinais;
• Quantitativas: Discretas e Contı́nuas.
• Variáveis qualitativas: são aquelas que apresentam como possı́veis realizações uma qua-
lidade ou atributo do indivı́duo pesquisado.
– Variáveis qualitativas nominais: são aquelas para as quais não exite nenhuma ordenação
nos possı́veis resultados.
Exemplos:
∗ Estado Civil (casado, solteiro ...)
∗ Cor dos olhos (preto, azul ...)
∗ Qualidade de uma peça (defeituosa, não defeituosa)
∗ Nacionalidade (brasileiro, japonês, americano ...)
– Variáveis qualitativas ordinais: são aquelas para as quais existe certa ordem nos
possı́veis resultados.
Exemplos:
2
∗ Classe Social (alta, média, baixa)
∗ Grau de Instrução (ensino fundamental, ensino médio, ensino superior)
• Variáveis Quantitativas: suas possı́veis realizações são números resultantes de uma con-
tagem ou mensuração.
– Variáveis quantitativas discretas: cujas possı́veis realizações formam um conjunto
finito ou enumerável de números e que resultam, frequentemente, de uma contagem.
Exemplos:
∗ Número de filhos (0, 1, 2, ...)
∗ Peças com defeito (0, 1, 2, ...)
∗ O ponto obtido em um lançamento de um dado (1, 2, 3, 4, 5, 6)
∗ Número de vôos fretados em um mês (0, 1, 2, ...)
– Variáveis quantitativas contı́nuas: seus possı́veis valores pertencem a um intervalo
de números reais e geralmente resultam de uma mensuração (medida).
Exemplos: Altura, Peso, Tempo, Comprimento, Temperatura, ...
3 Apresentação dos dados das Variáveis em Tabelas e Gráficos
Após a transcrição dos dados em planilhas, convém organizá-los de maneira prática e racional
para facilitar o entendimento do fenômeno estudado.
3.1 Distribuição de frequência
Frequência de um dado valor de uma variável é o número de vezes que esse valor foi obser-
vado.
Notação: fi - frequência do i-ésimo valor observado.
Observação: ∑ki=1 fi = n, em que, k é o número de diferentes valores existentes da variável e,
n é o número total de elementos observados.
Exemplo: Número de peças defeituosas por dia durante uma semana;
S = {1,3,4,0,4,2,2} k = n =
Frequência Relativa ou Proporção de cada possı́vel realização da variável é dada por:
p′i =
fi
n
Observação:
k
∑
i=1
p′i = 1
Quando se estuda uma variável, o interesse do pesquisador é conhecer o comportamento
dessa variável, analisando a ocorrência de suas possı́veis realizações. Uma maneira de dispor
de um conjunto de realizações, para se ter uma ideia global sobre elas é através da tabela de
frequências.
Exemplo: Em uma pesquisa realizada com os funcionários de uma empresa anotou-se o grau
de instrução dos funcionários, sendo que 12 têm ensino fundamental, 18 ensino médio e 6 ensino
superior. Construir uma tabela de frequência para a variável grau de instrução.
Grau de instrução fi p′i %
Ensino fundamental
Ensino médio
Ensino superior
Total
3
3.2 Descrição gráfica das Variáveis Qualitativas
Os gráficos usados para variáveis qualitativas são:
• Gráficos em barras,
• Diagrama circular (pizza, ou de setores),
• ou diagrama equivalente...
Exemplo: A tabela abaixo apresenta os candidatos a um curso de pós-graduação, classifica-
dos segundo sua formação de graduação. Construir um gráfico para a variável.
Formação fi %
Engenharia 38 28,2
Fı́sica 30 22,2
Matemática 35 25,9
Quı́mica 15 11,1
Outros 17 12,6
Total 135 100
3.3 Descrição gráfica das Variáveis Quantitativas Discretas
No caso das variáveis quantitativas discretas, a representação gráfica será, também, por meio
do gráfico de barras ou algum diagrama similar.
Exemplo: Os dados abaixo são realizações da variável “número de defeitos por unidade”, de
aparelhos retirados de uma linha de montagem.
2 4 2 1 2 3 1 0 5 1
0 1 1 2 0 1 3 0 1 2
Construir uma tabela de frequências e o gráfico para a variável em questão.
Número de defeitos fi p′i %
Total
Outra forma de representar as variáveis quantitativas, baseia-se nas frequências acumuladas.
Notação: Fi - frequência acumulada; P′i - frequência relativa acumulada.
Exemplo: Número de defeitos.
Número de defeitos fi p′i Fi P
′
i
Total
4
3.4 Descrição gráfica das Variáveis Quantitativas Contı́nuas
Classes de frequências
Exemplo: Os dados abaixo referem-se ao salário (em salários mı́nimos) de 25 funcionários
de uma indústria.
10,1 7,3 8,5 5,0 4,2 3,1 2,2 9,0 9,4 6,1 6,4 6,5 3,3
11,0 1,0 8,2 10,0 4,7 3,5 6,5 8,9 6,1 7,3 8,0 5,8
A construção de uma tabela de frequências para a variável salário, da forma que foi construı́da
para a variável “número de defeitos” não é viável, pois o objetivo de resumir informação fica
prejudicado.
A solução é agrupar os dados em classes (faixas) de salários.
A construção das classes deve obedecer o seguinte:
• As classes devem abranger todas as observações;
• O extremo superior de cada classe é o extremo inferior da próxima classe;
• Cada valor observado deve-se enquadrar em apenas uma classe.
Procedimento1. O número de classes (k) é arbitrário, mas pode-se utilizar a regra
k =
√
n
2. Amplitude total (R)⇒ R = xmax− xmin
3. Amplitude das classes (h)⇒ h = Rk
Salário fi p′i % Fi P
′
i
Total
Observação: Ao resumir os dados referentes a uma variável contı́nua, perde-se informação.
Por exemplo, não sabemos exatamente quais são os 5 salários da 2a classe a não ser que investi-
guemos os dados originais.
Para representar uma variável quantitativa contı́nua usamos o gráfico conhecido como histo-
grama.
5
Lista de exercı́cios 1
1. Classifique cada uma das variáveis abaixo em qualitativa (nominal/ordinal) ou quantitativa
(discreta/contı́nua):
a) Ocorrência de hipertensão pré-natal em grávidas com mais de 35 anos (possı́veis respostas
para a variável são sim e não).
b) Intenção de voto para presidente (nome dos candidatos ou indeciso).
c) Perda de Peso de maratonistas na Corrida de São Silvestre, em quilos.
d) Intensidade da perda de peso de maratonistas na Corrida de São Silvestre (leve, moderada,
forte).
e) Grau de satisfação da população brasileira com relação ao trabalho de seu presidente (va-
lores de 0 a 5, sendo 0 indicando totalmente insatisfeito e 5 totalmente satisfeito).
f) Idade em anos completos dos alunos de um curso.
g) Número de horas gastas assistindo TV por semana.
2. Quinze pacientes de uma clı́nica de ortopedia foram entrevistados quanto ao no de meses
previstos de fisioterapia, se haverá (S) ou não (N) sequelas após o tratamento e o grau de com-
plexidade da cirurgia realizada: alto (A), médio (M) ou baixo (B). Os resultados obtidos foram:
Pacientes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Fisioterapia 7 8 5 6 4 5 7 7 6 8 6 5 5 4 5
Sequelas S S N N N S S N N S S N S N N
Cirurgia A M A M M B A M B M B B M M A
a) Classifique cada uma das variáveis.
b) Para cada variável, construa uma tabela de frequências e faça a representação gráfica.
c) Para o grupo de pacientes que não ficaram com sequelas, faça um gráfico de barras para a
variável Fisioterapia. Você acha que essa variável se comporta de modo diferente nesse grupo?
3. O tempo de utilização de caixas eletrônicos depende de cada usuário e das operações
efetuadas. Foram coletadas 26 medidas desse tempo (em minutos):
1,1 1,2 1,7 1,5 0,9 1,3 1,4 1,6 1,7 1,6 1,0 0,8 1,5
1,3 1,7 1,6 1,4 1,2 1,2 1,0 0,9 1,8 1,7 1,5 1,3 1,5
a) Construa uma tabela de frequências agrupando os dados em classes.
b) Faça a representação gráfica adequada.
4. Um grupo de estudantes do ensino médio foi submetido a um teste de matemática resul-
tando em:
Nota fi
0 |− 2 14
2 |− 4 28
4 |− 6 27
6 |− 8 11
8 |− 10 4
a) Construa o histograma.
b) Se a nota mı́nima de aprovação é 6, qual será a porcentagem de aprovação?
5. Um estudo pretende verificar se o problema de desnutrição em adultos medida pelo peso,
em quilos, em uma região agrı́cola (A), é maior que em uma região industrial (B). Uma amostra
foi tomada em cada região fornecendo a tabela de frequências a seguir:
6
Região A
Peso fi
30 |− 40 8
40 |− 50 25
50 |− 60 28
60 |− 70 12
70 |− 80 9
Total 82
Região B
Peso fi
50 |− 60 10
60 |− 70 34
70 |− 80 109
80 |− 90 111
90 |− 100 55
Total 319
a) Os dados apresentados sugerem que o grau de desnutrição é diferente nas duas regiões?
(Note que o total de observações difere em cada região).
b) Construa, a partir dos dados das tabelas, um histograma para cada região.
6. Num estudo sobre a rotatividade de mão-de-obra na indústria, anotou-se o número de
empregos nos últimos 3 anos para operários especializados e não especializados.
a) Construa um gráfico de barras correspondente a cada tabela.
b) Junte as informações das duas tabelas em uma só e obtenha um gráfico de barras da rota-
tividade de mão-de-obra na indústria (sem diferenciar a especialização).
c) Você acha que os trabalhadores especializados trocam menos de emprego? Justifique.
Não especializados
Empregos fi
1 106
2 222
3 338
4 292
5 164
Total 1122
Especializados
Empregos fi
1 210
2 342
3 109
4 91
5 35
Total 787
7. Vinte baterias para automóveis de uma certa marca foram testadas quanto à sua vida útil.
O teste simula a utilização da bateria, acelerando seu desgaste de modo a criar uma réplica da
situação real. Os resultados da duração (em meses) são apresentados a seguir.
a) Construa o histograma.
b) Se a amostra for considerada representativa do desempenho dessa marca de bateria, quan-
tas, em 1000 fabricadas, serão repostas pelo fabricante, se ela oferece 6 meses de garantia?
c) Se o fabricante vende cada bateria por 20% acima do preço de custo. em 1000 fabricadas,
descontadas as que repõe, quanto será seu lucro por bateria em função do preço de custo?
Durabilidade fi
0 |− 3 0,02
3 |− 6 0,05
6 |− 9 0,15
9 |− 12 0,25
12 |− 15 0,30
15 |− 18 0,23
8. Um novo medicamento para cicatrização está sendo testado e um experimento é feito
para testar o tempo (em dias) de completo fechamento em cortes provenientes de cirurgia. Uma
amostra de 30 cobaias forneceu os valores:
15 17 16 15 17 14 17 16 16 17 15 18 14 17 15
14 15 16 17 18 18 17 15 16 14 18 18 16 15 14
a) Organize uma tabela de frequências e faça a representação gráfica adequada.
b) Que porcentagem das observações estão abaixo de 16 dias?
c) Classifique como rápida as cicatrizações iguais ou inferiores a 15 dias e como lenta as
demais. Monte novamente uma tabela de frequências e faça a representação gráfica adequada.
7
4 Caracterı́sticas Numéricas de uma Distribuição de Frequências
Medidas de:
• Posição ou tendência central
• Dispersão ou variabilidade
• Assimetria
• Achatamento ou Curtose
4.1 Medidas de Posição
Servem para localizar a distribuição de frequências sobre o eixo de variação da variável em
questão, ou seja, estabelecem o valor em torno do qual os dados se distribuem.
Média, Mediana, Moda.
4.1.1 Média
Seja xi (i = 1,2, . . . ,n) um conjunto de dados, a média desse conjunto é dada por:
x =
x1 + x2 + . . .+ xn
n
=
n
∑
i=1
xi
n
Propriedades:
Sejam x1,x2, . . . ,xn valores da variável X ;
Se y1 = x1 + k,y2 = x2 + k, . . . ,yn = xn + k
Temos que y =
n
∑
i=1
yi
n
=
n
∑
i=1
(xi + k)
n
=
n
∑
i=1
xi
n
+
nk
n
= x+ k
• Média para dados em tabelas de frequências.
x =
x1 f1 + x2 f2 + . . .+ xk fk
n
=
k
∑
i=1
xi fi
n
ou ainda,
x =
k
∑
i=1
xi p′i
Exemplo:
No defeitos fi
0 4
1 7
2 5
3 2
4 1
5 1
Total
8
4.1.2 Mediana
É a quantidade que ocupa a posição central da série de observações, quando estas estão orde-
nadas (crescente ou decrescente).
Ela divide a série de dados em duas partes com igual número de elementos.
Considerando-se as observações em ordem crescente,
x(1) ≤ x(2) ≤ x(3) ≤ . . .≤ x(n)
a mediana da variável X pode ser definida como:
Md(X) =

x( n+1
2
), se n é ı́mpar
x( n
2
)+ x( n
2+1
)
2
, se n é par
Quartis, decis, percentis: visam classificar uma observação segundo a posição, na distribuição
de frequência. Assim, a técnica dos quartis nos dará quatro categorias para classificar uma
distribuição, a técnica dos decis nos dá 10 categorias para classificar e a técnica dos percentis
nos dá 100 categorias.
O boxplot é um gráfico que possibilita representar a distribuição de um conjunto de dados
com base em alguns de seus parâmetros descritivos, quais sejam: a mediana (Q2), o quartil
inferior (Q1), o quartil superior (Q3) e do intervalo interquartil (IQR = Q3 - Q1).
O boxplot permite avaliar a simetria dos dados, sua dispersão e a existência ou não de outliers
nos mesmos, sendo especialmente adequado para a comparação de dois ou mais conjuntos de
dados correspondentes às categorias de uma variável qualitativa.
A Figura 1 apresenta o boxplot, destacando suas principais caracterı́sticas:
Figura 1: Boxplot
9
Exemplos:
1. 40 35 38 40 41 36 37 43 46
2. 14 16 20 17 14 12 15 16
3. Calcular a mediana para a variável “Número de defeitos”.
No de defeitosfi Fi
0 4 4
1 7 11
2 5 16
3 2 18
4 1 19
5 1 20
Total 20
4. Calcule a média e a mediana da renda mensal de 12 pessoas entrevistadas, cujos valores
são:
2500 2700 3000 3200 3300 4200 4800 5000 5500 6000 7000 100000
Qual dos dois valores representa melhor a renda dos entrevistados? Por quê?
4.1.3 Moda
A moda (ou modas) de um conjunto de valores é o valor de maior frequência.
Exemplos
1. A moda do número de defeitos é 1 (pois f = 7).
2. Qual é a moda da renda mensal das 12 pessoas entrevistadas?
Observação: A moda indica a região de máxima frequência.
4.2 Medidas de Dispersão
O resumo de um conjunto de dados pela média, mediana e moda não fornece informações
sobre a variabilidade dos dados. Em geral, é necessário complementar a informação por alguma
medida de dispersão, que indique o quanto os dados estão dispersos em torno da região central.
Exemplo: Um fabricante de ração deseja comprar uma máquina para embalar sacas de 28
kg de ração. Dois modelos foram oferecidos a preços similares. Para decidir qual das máquinas
comprar, o fabricante pediu para fazer um teste com as máquinas. Ele tomou uma amostra de 6
10
sacas embaladas por cada uma das máquinas. Os resultados dos pesos das sacas embaladas são
dados abaixo:
Máquina A: 28,3 27,7 28,1 28,2 27,8 27,9
Máquina B: 28 28,1 29 27,7 27,6 27,6
Qual das máquinas você aconselharia o fabricante a comprar?
Só com a média não é possı́vel responder a essa questão, é necessário alguma medida de
variabilidade.
Para responder essa pergunta, calculamos a variância e o desvio padrão.
4.2.1 Variância
A variância de um conjunto de dados é dada por:
s2 =
n
∑
i=1
(xi− x)2
n−1
Denominador é n−1 para variância amostral.
Exemplo: Calcule a variância dos pesos das sacas para as máquinas A e B.
Observação: Na definição da variância acima, estamos considerando que os dados se refe-
rem a uma amostra. Caso os dados representassem toda a população, a variância seria:
σ
2 =
n
∑
i=1
(xi− x)2
n
Denominador é n para variância populacional.
4.2.2 Desvio Padrão
O desvio padrão é definido como a raiz quadrada positiva da variância.
s =
√
s2
Exemplo:
sA =
sB =
Observação: O desvio padrão é expresso na mesma unidade da variável, por isso é de maior
interesse do que a variância em aplicações práticas.
Variância para dados em tabelas de frequências:
s2 =
k
∑
i=1
(xi− x)2 fi
n−1
11
Expressões Alternativas para o Cálculo da Variância
Pode-se mostrar que s2 =
n
∑
i=1
(xi− x)2
n−1
pode ser reescrita como s2 =
n
∑
i=1
x2i −
( n
∑
i=1
xi
)2
n
n−1
.
Da mesma forma:
s2 =
k
∑
i=1
(xi− x)2 fi
n−1
⇒ s2 =
k
∑
i=1
x2i fi−
( k
∑
i=1
xi fi
)2
n
n−1
;
4.2.3 Coeficiente de Variação (CV )
O coeficiente de variação é dado pelo quociente entre o desvio padrão e a média. Frequente-
mente, é expresso em porcentagem.
CVx =
sx
x
Sua vantagem em relação ao desvio padrão e a variância é que ele caracteriza a dispersão dos
dados em termos relativos ao seu valor médio.
Por ser uma medida adimensional, o CV permite comparar a dispersão de dois conjuntos de
dados diferentes.
Exemplo: Calcular os coeficientes de variação para os dados das máquinas A e B.
É utilizado para comparar dispersões quando as médias são muito desiguais ou as unidades
de medidas são diferentes.
Exemplo: Comparar as dispersões das alturas e dos pesos, considerando-se os dados abaixo:
Altura (m): 1,90 1,62 1,75 1,57 1,72 1,81
Peso (kg): 80 58 74 56 65 75
Lista de exercı́cios 2
1. Determine a média, a mediana e a moda dos seguintes conjuntos de valores:
a) 2,3 2,1 1,5 1,9 3,0 1,7 1,2 2,1 2,5 1,3 2,0 2,7 0,8 2,3 2,1 1,7
b) 37 38 33 42 35 44 36 28 37 35 33 40 36 35 37
2. Calcule a médiada seguinte distribuição de frequências.
Classes fi
89 |− 92 1
92 |− 95 2
95 |− 98 4
98 |− 101 3
101 |− 104 6
104 |− 107 9
107 |− 110 5
110 |− 113 4
113 |− 116 2
116 |− 119 2
119 |− 122 2
Total 40
12
3. Compare a variabilidade dos dois conjuntos de dados no exercı́cio 1 usando uma medida
adequada.
4. Uma amostra de chapas produzidas por uma máquina forneceu as seguintes espessuras,
em milı́metros, para os itens examinados:
6,34 6,38 6,40 6,30 6,36 6,36 6,38 6,20 6,42 6,28 6,38
Se somente as chapas com espessuras superiores a x−2s serão vendidas, qual será a porcen-
tagem de chapas rejeitadas?
5. A decisão de onde realizar congressos costuma depender, dentre outros fatores, da dispo-
nibilidade de quartos nos hotéis das cidades candidatas a sediá-las. Dadas as dez maiores cidades
norte-americanas segundo o número de quartos disponı́veis:
Cidade Quartos Hotéis
Las Vegas 93.719 231
Orlando 84.982 311
Los Angeles 78.597 617
Chicago 68.793 378
Washington D.C. 66.505 351
Nova York 61.512 230
Atlanta 58.445 370
San Diego 44.655 352
Ahahein - Santa Ana 44.374 351
San Francisco 42.531 294
a) Identifique as variáveis em questão e classifique-as.
b) Encontre e interprete a mediana.
c) Calcule a razão entre o número de quartos e o número de hotéis de cada cidade.
d) Determine o número médio de quartos por hotel.
e) Compare a variabilidade do número de quartos com a variabilidade do número de hotéis.
6. Numa competição de salto triplo, três atletas disputavam apenas uma vaga para uma
olimpı́ada entre faculdades de uma cidade. Cada atleta fez 4 tentativas obtendo os seguintes
resultados:
Atleta I 16,50 15,81 16,42 16,12
Atleta II 13,90 17,01 16,82 15,10
Atleta III 15,70 16,02 16,95 17,00
a) Qual deles obteve melhor média?
b) Qual deles foi o mais regular nessas quatro tentativas?
5 Probabilidade
Encontramos na natureza muitas situações que envolvem incerteza.
Definição: Denominamos experimento aleatório à situação ou acontecimento cujos resul-
tados não podem ser previstos com certeza.
Exemplos:
1. Observar a hora do dia que ocorre falha em um determinado equipamento eletrônico;
2. Observar o número de quedas de energia durante um mês;
3. Lançar duas moedas e observar as faces voltadas para cima;
4. Observar as condições climáticas do próximo domingo.
13
Definição: Espaço amostral é o conjunto de todos os possı́veis resultados de um experi-
mento aleatório.
Notação: Ω.
Exemplos: Quais são os espaços amostrais dos experimentos aleatórios anteriores?
Definição: Chama-se evento a qualquer subconjunto do espaço amostral.
Notação: A,B,C, . . .
Exemplos: Alguns eventos associados,
a) Ao experimento 1:
A: ocorrer falha entre 10 e 17 horas.
B: ocorrer falha antes das 6 horas.
b) Ao experimento 2:
C: ocorrer 2 ou mais quedas.
D: ocorrer exatamente 8 quedas.
c) Ao experimento 3:
E: obter pelo menos 1 cara.
Alguns tipos de eventos
• Evento Certo
Exemplo: Considerando o experimento 1, o evento “A: ocorrer falha entre 0 e 24 horas” é
um evento certo.
• Evento Impossı́vel
Exemplo: Dado o experimento 3, o evento “A: ocorrer três caras” é um evento impossı́vel,
porque são lançadas somente 2 moedas.
• Evento Complementar
O complemento do evento A é o conjunto de pontos do espaço amostral que não pertencem
à A.
Exemplo: Considere o experimento 1,
Evento B: ocorrer falha antes das 6 horas.
Evento Bc: ocorrer falha das 6 horas em diante.
Operações com eventos
• União
A união de dois eventos A e B é o conjunto formado por todos os elementos do espaço
amostral que estão em A ou B (ou em ambos).
Notação: A∪B
14
• Intersecção
A intersecção de dois eventos A e B é o evento formado por todos os elementos do espaço
amostral que estão em A e em B (ao mesmo tempo).
Notação: A∩B
Eventos mutuamente exclusivos
Dois eventos são mutuamente exclusivos se, e somente se, eles não têm elementos amostrais
em comum, isto é, A∩B = φ. Também chamados de disjuntos.
Exemplo: Considere o lançamento de dois dados e a observação dos números obtidos.
Qual é o espaço amostral?
Escreva na forma de conjunto os seguintes eventos:
A: Observar 1 nos dois dados;
B: Soma dos pontos igual a 4;
C:Soma dos pontos menor ou igual a 5;
D: Sair 2 no primeiro dado.
Escreva na forma de conjunto os eventos:
a) B∪D =
b) C∩D =
c) Cc =
Definição de Probabilidade: Uma função P(.) é denominada probabilidade se satisfaz as
seguintes condições:
i) 0≤ P(A)≤ 1,∀A⊂Ω
ii) P(Ω) = 1
iii) P
( n⋃
j=1
A j
)
=
n
∑
j=1
P(A j), com os A j, j = 1, . . . ,n disjuntos.
Observe que a probabilidade P é uma função que atribui valores numéricos aos eventos do
espaço amostral.
Como podemos atribuir probabilidades aos elementos do espaço amostral?
1. Definição Frequentista
Poderı́amos definir P(A) como o limite da frequência relativa da ocorrência de A em n
repetições independentes do experimento, com n tendendo ao infinito:
P(A) = lim
n→∞
número de ocorrências de A em n repetições do experimento
n
2. Definição Clássica de Probabilidade
Baseia-se no suposto de que todos os resultados possı́veis do experimento aleatório são equi-
prováveis.
15
Seja A⊂Ω, P(A) = nA
nΩ
, em que, nA é o número de elementos em A e nΩ é o número total de
elementos em Ω.
Exemplo: No lançamento de dois dados, calcular a probabilidade dos seguintes eventos:
A: Observar 1 nos dois dados;
B: Soma dos pontos igual a 4;
C: Soma dos pontos menor ou igual a 5;
D: Sair 2 no primeiro dado.
Exemplo: Suponha que os dados abaixo representem uma divisão dos alunos ingressantes
em três cursos.
PPPPPPPPCurso
Sexo
Masculino (M) Feminino (F) Total
Eng. Ambiental (E) 50 20 70
Matemática (C) 22 8 30
Quı́mica Ind. (Q) 5 15 20
Total 77 43 120
Fonte: Dados Hipotéticos
Considere o experimento: “sortear um aluno e verificar o seu curso e a qual sexo pertence”.
Eventos:
M: Ser do sexo masculino;
F : Ser do sexo feminino;
E: Cursar Eng. Ambiental;
C: Cursar Matemática;
Q: Cursar Quı́mica Industrial.
Calcule as seguintes probabilidades:
a) P(M) b) P(F) c) P(E) d) P(C) e) P(Q)
f) P(E ∪Q) g) P(M∪F) h) P(M∩F)
i) P(F ∩C) j) P(M∪E) k) P(F ∪C)
l) P(Ec) m) P(Mc) n) P
(
(E ∪M)c
)
Propriedades de Probabilidades
1) Se φ é o evento impossı́vel, então P(φ) = 0;
2) Se A é um evento, então, P(Ac) = 1−P(A);
3) Se A e B são dois eventos, então, P(A∪B) = P(A)+P(B)−P(A∩B);
16
4) Sejam A e B dois eventos, se A⊂ B, então, P(A)≤ P(B);
5) Se A, B e C são três eventos, então,
P(A∪B∪C) = P(A)+P(B)+P(C)−P(A∩B)−P(A∩C)−P(B∩C)+P(A∩B∩C)
6) Se A1,A2, . . . ,Ak são k eventos, então, P
( k⋃
i=1
Ai
)
≤
k
∑
i=1
P(Ai).
Exemplo: Sejam A e B dois eventos, tais que P(A) = 0,20, P(B) = 0,40 e P(A∩B) = 0,10.
Calcule
a) P(A∪B)
b) P(A∩Bc)
c) P(Ac∪B)
d) P
(
(A∩B)c
)
Lista de exercı́cios 3
1. Para cada um dos casos abaixo, escreva o espaço amostral correspondente e conte seus
elementos.
a) Uma moeda é lançada duas vezes e observam-se as faces obtidas.
b) Um dado é lançado duas vezes e a ocorrência da face par ou ı́mpar é observada.
c) Uma urna contém 10 bolas azuis e 10 vermelhas com dimensões rigorosamente iguais.
Três bolas são selecionadas ao acaso com reposição e as cores são anotadas.
d) Dois dados são lançados simultaneamente e estamos interessados na soma das faces ob-
servadas.
e) Em uma cidade, famı́lias com 3 crianças são selecionadas ao acaso anotando-se o sexo de
cada uma.
f) Uma máquina produz 20 peças por hora, escolhe-se um instante qualquer e observa-se o
número de defeituosas na próxima hora.
g) Uma moeda é lançada consecutivamente até o aparecimento da primeira cara.
2. Sejam A, B e C três eventos associados a um mesmo espaço amostral Ω. Expressar os
seguintes eventos em notação matemática.
a) Pelo menos um deles ocorre;
b) Apenas A ocorre;
c) Os três ocorrem;
d) Ao menos dois ocorrem;
e) Nenhum dos três ocorrem;
f) Somente um ocorre.
3. Uma universidade tem 10 mil alunos dos quais 4 mil são considerados esportistas. Temos
ainda que 500 alunos são do curso de biologia diurno, 700 da biologia noturno, 100 são espor-
tistas e da biologia diurno e 200 são esportistas e da biologia noturno. Um aluno é escolhido ao
acaso e pergunta-se a probabilidade de:
17
a) Ser esportista;
b) Ser esportista e aluno da biologia noturno;
c) Não ser da biologia;
d) Não ser esportista nem aluno da biologia.
4. Sejam A e B dois eventos em um dado espaço amostral, tais que P(A) = 0,2, P(B) = p,
P(A∪B) = 0,5 e P(A∩B) = 0,1. Determine o valor de p.
5. Dois processadores tipos A e B são colocados em teste por 50 mil horas. A probabilidade
de que um erro de cálculo aconteça em um processador do tipo A é de 130 , no tipo B
1
80 e em
ambos 11000 . Qual é a probabilidade de que:
a) Pelo menos um dos processadores tenha apresentado erro?
b) Nenhum processador tenha apresentado erro?
c) Apenas o processador A tenha apresentado erro?
5.1 Probabilidade Condicional
Considere novamente a tabela:
PPPPPPPPCurso
Sexo
M F Total
Eng. Ambiental (E) 50 20 70
Matemática (C) 22 8 30
Quı́mica Ind. (Q) 5 15 20
Total 77 43 120
Dado que um aluno escolhido ao acaso esteja cursando Eng. Ambiental (E), qual é a proba-
bilidade de ser do sexo feminino?
Observação: Quando falamos dado que cursa Engenharia Ambiental, nosso “universo” deixa
de ser todos os alunos e passa a ser somente os alunos de Engenharia Ambiental.
Qual é a probabilidade de um aluno escolhido ao acaso estar cursando Quı́mica Industrial
dado que é do sexo feminino?
Observe que:
Definição: Sejam A e B dois eventos quaisquer. A probabilidade condicional de A dado que
B ocorreu é dada por:
P(A|B) = P(A∩B)
P(B)
, para P(B)> 0 ou
P(A|B) = P(A), para P(B) = 0
Exemplo: Calcule,
a) A probabilidade de um aluno escolhido ao acaso ser do sexo feminino.
b) A probabilidade desse aluno escolhido ao acaso ser do sexo feminino dado que cursa
Quı́mica Industrial.
Observe que com a informação de que Q ocorreu (o aluno cursa quı́mica industrial), a proba-
bilidade de ser do sexo feminino mudou, ou seja, com essa informação adicional, “atualizamos”
a probabilidade.
18
5.1.1 Regra do Produto de Probabilidades
Da definição de probabilidade condicional, segue que:
P(A∩B) = P(A|B).P(B), com P(B)> 0 ou
P(A∩B) = P(B|A).P(A), com P(A)> 0
Exemplo: Considere o experimento: “Lançar um dado e observar o número que resulta na
parte superior”.
Considere os eventos:
A: “Observa-se um número ı́mpar”
B: “Observa-se um número maior que 3”.
Temos:
Calcule a P(A|B)
5.1.2 Independência entre Eventos
Existem situações, nas quais, saber que algum evento B ocorreu não tem qualquer interesse
quanto à ocorrência ou não ocorrência de A.
Definição: Dois eventos A e B são independentes, se e somente se,
P(A|B) = P(A)
Isto é, a influência da ocorrência de B não altera a probabilidade atribuı́da ao evento A.
Teorema: Dois eventos A e B são independentes, se e somente se,
P(A∩B) = P(A).P(B)
Exemplo: Suponha que um dado equilibrado é lançado duas vezes. Sejam:
A: O primeiro dado mostra número par
B: O segundo dado mostra 5 ou 6
A e B são independentes?
Exercı́cio: Sejam B e C eventos independentes com P(B) = 0,4 e P(C) = 0,5.
a) Calcule P(B∩C), P(B∪C) e P(B|C)
b) Refaça o item a) considerando B e C mutuamente exclusivos, sem considerar B e C inde-
pendentes.
Definição: Dizemos que os eventos B1,B2, . . . ,Bk, representam uma partição do espaço amos-
tral Ω, quando,
a) Bi∩B j = φ, ∀i 6= j (são dois a dois disjuntos);
b)
k⋃
i=1
Bi = Ω (a união de todos eventos é igual ao espaço amostral).
19
5.1.3 Teorema da Probabilidade Total
Suponha que os eventos B1,B2, . . . ,Bk formem uma partição do espaço amostral Ω, com
P(Bi)> 0 ∀i = 1,2, . . . ,k. Então, para qualquer evento A:
P(A) = P(A|B1).P(B1)+P(A|B2).P(B2)+ . . .+P(A|Bk).P(Bk)
Exemplo: A probabilidade de haver atraso no vôo diário que leva a mala postal a certa
cidade é 0,2. A probabilidade de haver atraso na distribuição local da correspondência é 0,15 se
não houve atraso no vôo e de 0,25 se houve atraso. Qual é a probabilidade de a correspondência
ser distribuı́da com atraso em certo dia?
Um outro resultado muito importanteenvolvendo probabilidades condicionais é o Teorema
de Bayes. Esse teorema fornece um mecanismo formal para atualizar probabilidades.
5.1.4 Teorema de Bayes
Suponha que os eventos B1,B2, . . . ,Bk formem uma partição de Ω, com P(Bi) > 0 ∀i =
1,2, . . . ,k. Seja A um evento qualquer com P(A)> 0. Então, ∀ j = 1,2, . . . ,k temos:
P(B j|A) =
P(A|B j).P(B j)
∑
k
i=1 P(A|Bi).P(Bi)
Exemplo: Um fabricante de sorvete recebe 20% de todo o leite que utiliza de uma fazenda
F1, 30% de outra fazenda F2 e 50% de F3. Um órgão de fiscalização inspecionou as fazendas e
observou que 20% do leite produzido por F1 estava adulterado por adição de água, enquanto que
para F2 e F3 essa proporção era de 5% e 2%, respectivamente. Na indústria, os galões de leite são
armazenados sem identificação das fazendas. Uma amostra de leite na indústria indicou que o
leite está adulterado. O fabricante de sorvete deseja saber qual a probabilidade de que a amostra
de leite em questão tenha sido produzida pela fazenda F1.
Exercı́cio: Pelo fato de um novo procedimento médico ter se mostrado efetivo na detecção
prévia de uma doença, propôs-se um rastreamento médico da população. A probabilidade de que
o teste identifique corretamente alguém com doença, dando positivo, é 0,99; e a probabilidade de
que o teste identifique corretamente alguém sem a doença dando negativo, é 0,95. A incidência
da doença na população em geral é 0,0001. Você fez o teste e o resultado foi positivo. Qual a
probabilidade de que você tenha a doença?
20
Lista de exercı́cios 4
1. Verifique se são válidas as afirmações:
a) Se P(A) = 13 e P(B|A) =
3
5 então A e B não podem ser disjuntos.
b) Se P(A) = 12 , P(B|A) = 1 e P(A|B) =
1
2 então A não pode estar contido em B.
2. Uma classe de estatı́stica teve a seguinte distribuição de notas finais: 4 do sexo masculino
e 6 do sexo feminino foram reprovados, 8 do sexo masculino e 14 do sexo feminino foram
aprovados. Para um aluno sorteado dessa classe, denote por M se o aluno escolhido for do sexo
masculino e por A se o aluno for aprovado. Calcule:
a) P(A∪Mc); b) P(Ac∪Mc); c) P(A|M); d) P(Mc|A); e) P(M|A).
3. Você entrega a seu amigo uma carta, destinada à sua namorada, para ser colocada no cor-
reio. Entretanto, ele pode se esquecer com probabilidade 0,1. Se não se esquecer, a probabilidade
de que o correio extravie a carta é de 0,1. Finalmente, se foi enviada pelo correio, a probabilidade
de que a namorada não receba é de 0,1.
a) Sua namorada não recebeu a carta, qual é a probabilidade de seu amigo ter esquecido?
b) Avalie as possibilidades desse namoro continuar se a comunicação depender das cartas
enviadas.
4. Três candidatos disputam as eleições para Governo do Estado. O candidato do partido de
direita tem 30% da preferência eleitoral, o de centro tem 30% e o de esquerda 40%. Em sendo
eleito, a probabilidade de dar efetivamente prioridade para Educação e Saúde é de 0,4; 0,6 e 0,9
para os candidatos de direita, de centro e de esquerda, respectivamente.
a) Qual é a probabilidade de não ser dada prioridade a essas áreas no próximo governo?
b) Se a área teve prioridade, qual a probabilidade do candidato de direita ter ganho a eleição?
5. Um médico desconfia que um paciente tem um tumor no abdômen, pois isso ocorreu em
70% dos casos similares que tratou. Se o paciente de fato tiver o tumor, o exame ultrassom o de-
tectará com probabilidade 0,9. Entretanto, se ele não tiver o tumor, o exame pode, erroneamente,
indicar que tem com probabilidade 0,1. Se o exame detectou um tumor, qual é a probabilidade
do paciente tê-lo de fato?
6. Sejam A, B e C pertencentes a um mesmo espaço amostral. Mostre que:
a) P(Ac|B) = 1−P(A|B);
b) P(A∪B|C) = P(A|C)+P(B|C)−P(A∩B|C);
c) Se B = Ac, então, P(A∪B|C) = 1;
d) P(A∪B∪C) = P(A)+P(B)+P(C)−P(A∩B)−P(A∩C)−P(B∩C)+P(A∩B∩C).
7. Um soro da verdade tem a propriedade de que 90% dos suspeitos culpados sejam julga-
dos corretamente enquanto, é claro, 10% dos suspeitos culpados sejam julgados incorretamente
(declarados inocentes). Por outro lado, sujeitos inocentes são julgados erroneamente em 1% das
vezes. Se um suspeito for selecionado em um grupo de suspeitos, no qual apenas 5% já comete-
ram um crime, e o soro indica que ele é culpado, qual é a probabilidade de que seja inocente?
8. No Jornal USA Today (de 5 de setembro de 1996) foram listados os resultados de uma
pesquisa sobre o uso de roupas de dormir durante viagens:
Sexo Sexo
Masculino Feminino Total
Roupa ı́ntima 220 24 244
Camisola 2 180 182
Nada 160 18 178
Pijama 102 73 175
Camiseta 46 88 134
Outro 84 3 87
21
a) Qual é a probabilidade de que o viajante seja uma mulher e que durma de camiseta?
b) Qual é a probabilidade de o viajante ser homem?
c) Qual é a probabilidade ser homem se ele dorme de camisola?
d) Assumindo que o viajante seja homem, qual é a probabilidade de que ele durma de pijama?
e) Qual é a probabilidade de que o viajante seja homem se ele dorme de pijama ou camiseta?
6 Variáveis Aleatórias
Muitos experimentos produzem resultados não numéricos. Antes de analisá-los, é conveni-
ente transformar seus resultados (os elementos do espaço amostral) em números, o que é feito
por meio da variável aleatória.
Definição: Seja ε um experimento aleatório e Ω um espaço amostral associado ao experi-
mento. Uma função X , que associe a cada elemento w∈Ω um número real, X(w), é denominada
variável aleatória.
Exemplo: Considere o experimento: “lançamento de duas moedas e a observação das faces
voltadas para cima”.
6.1 Variável Aleatória Discreta
Definição: Seja X uma v.a. Se X assumir valores num conjunto (Rx) finito ou infinito enu-
merável, X será chamada de v.a. discreta.
Exemplo: A v.a. do exemplo anterior é uma v.a. discreta.
Considerando que todos os elementos de Ω são igualmente prováveis, cada um desses eventos
tem uma probabilidade associada:
Isso nos leva a seguinte definição.
Definição: Seja X uma v.a. discreta. A função que atribui a cada valor da v.a. discreta X ,
uma probabilidade de ocorrência é chamada função de probabilidade.
Notação: P(X = xi) = p(xi) = pi, i = 1,2, . . . ou
X xi x2 . . .
pi p1 p2 . . .
Uma função de probabilidade satisfaz as seguintes propriedades:
1) 0≤ P(X = xi)≤ 1 ∀xi;
2) ∑
i
P(X = xi) = 1.
22
As v.a.’s são completamente caracterizadas pela sua função de probabilidade. Geralmente
deseja-se encontrar a função de probabilidade que melhor represente o comportamento da v.a.
na população.
Exemplo: Com os dados do último censo, uma assistente social constatou que para as
famı́lias da região, 20% não tem filhos, 30% tem 1 filho, 35% tem 2 filhos e as restantes se
dividem igualmente entre 3, 4 e 5 filhos. Suponha que 1 famı́lia é escolhida aleatoriamente e o
número de filhos averiguado.
Exemplo: Lançamento de 1 dado não viciado.
Valor médio de uma v.a. discreta
Definição: Dada uma v.a. discreta X , assumindo os valores x1,x2, . . . ,xn, chamamos de valor
médio ou esperança matemática de X ao valor
E(X) =
n
∑
i=1
xiP(X = xi) =
n
∑
i=1
xi pi
Exemplo: O tempo de duração em horas de uma lâmpada especial foi modelado por uma
variável aleatória X com a seguinte função de probabilidade:
X 5 6 7 8 9 10
pi 0,1 0,1 0,2 0,4 0,1 0,1
Qual é o tempo médio de duração desse tipo de lâmpada?
Exemplos:
− Um dado:
− Soma de dois dados:
− Número de filhos:
− Número de caras:
Definição: Dada uma v.a. discreta X e a respectiva função de probabilidade p(x), a esperança
matemática (ou valor médio) da função h(x) é dada por:
E[h(X)] = ∑
i
h(xi)p(xi)
Exemplo: O tempo T necessário para um operário processar certa peça é uma v.a. com a
seguinte distribuição de probabilidade.
t 2 3 4 5 6 7
p(t) 0,1 0,1 0,3 0,2 0,2 0,1
a) Calcule o tempo médio de processamento.
23
b) Para cada peça processada o operário ganha um fixo de 2,00, mas se ele processar a peça
em menos de 6 minutos, ganha R$0,50 em cada minuto poupado.
Encontre a distribuição de probabilidade e a média da variável G: quantia em R$ ganha por
peça.
Propriedade: Se h(X) = a+bX , em que a e b são constantes e X uma v.a. discreta, então,
E[h(X)] = a+bE(X).
Definição: Chamamos de variância da v.a. X o valor
σ
2
x =Var(X) =
n
∑
i=1
[xi−E(X)]2 pi = E{[X−E(X)]2}
Observação: σX =
√
σ2X é o desvio padrão de X e
CVX = σXµX .100 é o coeficiente de variação de X .
Exemplo: Calcular a variância do tempo de duração (X) das lâmpadas do exemplo anterior
(página 23).
Fórmula prática para a variância
σ
2
x =Var(X) = E(X
2)− [E(X)]2
Exemplo: Calcular a variância do exemplo anterior usando a fórmula prática.
Propriedade: Var(a+bX) = b2Var(X)
Função de distribuição de probabilidade
Muitas vezes, tem-se o interesse em calcular a probabilidade acumulada até um certo valor
da variável aleatória.
Definição: A função de distribuição (ou função acumulada) de probabilidade de uma v.a.
discreta X é dada por:
F :R→ [0,1]
F(x) = P(X ≤ x).
Exemplo: Considere a função de probabilidade para a variável Número de filhos dada por:
N 0 1 2 3 4 5
pi 0,20 0,30 0,35 0,05 0,05 0,05
a) Usando F(n), obtenha a probabilidade de uma famı́lia selecionada ao acaso ter até 2 filhos
(inclusive).
24
b) Calcule:
1) F(1,5) =
2) F(−1) =
3) F(0) =
4) F(0,8) =
5) F(1) =
6) F(6) =
c) Esboce o gráfico de F .
d) Calcule: P(N ≥ 3), P(2≤ N < 4), P(N < 3,5).
6.2 Principais Modelos Discretos
6.2.1 Modelo Uniforme Discreto
Definição: Dizemos que uma v.a. X , que assume valores x1,x2, . . . ,xk, segue o modelo
uniforme discreto se sua função de probabilidade é dada por:
P(X = x j) = 1/k, ∀ j = 1,2, . . . ,k
Observação: A função de probabilidade uniforme discreta atribui a mesma probabilidade a
cada um dos possı́veis valores de X .
Exemplo: Seja a v.a. X : número de pontos marcados na face superior de um dado, quando
ele é lançado.
a) Descreva a função de probabilidade de X .
b) Obtenha a função de distribuição da v.a. X .
c) Esboce o gráfico de F(x).
d) Calcule P(X ≤ 4) e P(X < 4).
Verifique que se X segue distribuição uniforme discreta, P(X = x j) = 1/k, ∀ j = 1,2, . . . ,k:
E(X) =
1
k
k
∑
i=1
xi e Var(X) =
1
k
[ k
∑
i=1
x2i −
(
k
∑
i=1
xi)2
k
]
F(x) = P(X ≤ x) = ∑
xi≤x
1
k
=
n(x)
k
, em que n(x) é o número de xi ≤ x.
6.2.2 Modelo Bernoulli
Definição: Uma v.a. segue o modelo Bernoulli, se assume apenas os valores 1 ou 0, os quais
correspondem a ocorrência de sucesso ou fracasso, respectivamente. Sua função de probabili-
dade é dada por:
25
P(X = x) = px(1− p)1−x, x = 0,1
Observação: P(X = 0) = p0(1− p)1−0 = 1− p e P(X = 1) = p1(1− p)1−1 = p
X 0 1
pi 1− p p
em que p é a probabilidade de sucesso.
Os experimentos que tem resposta dicotômica do tipo sucesso ou fracasso, são chamados de
ensaio de Bernoulli.
Notação: X ∼ Be(p), com p = P(X = 1)
Exemplo: Um experimento consiste em lançar uma moeda e verificar a face voltada para
cima.
6.2.3 Modelo Binomial
Definição: Seja X o número total de sucessos obtidos na realização de n ensaios de Bernoulli
independentes, com probabilidade de sucesso p. Dizemos que X segue o modelo Binomial com
parâmetros n e p se sua função de probabilidade é dada por:
P(X = k) =
(
n
k
)
pk(1− p)n−k, k = 0,1,2, . . . ,n.(
n
k
)
=
n!
k!(n− k)!
Notação: X ∼ b(n,p)
X segue modelo Binomial com parâmetros n e p.
Exemplo: A taxa de imunização de uma vacina é de 80%. Um grupo de 20 pessoas foram
vacinadas, calcule:
a) A probabilidade de 15 estarem imunizadas;
b) A probabilidade de 10 estarem imunizadas;
c) A probabilidade de pelo menos 18 estarem imunizadas;
d) A probabilidade de no máximo 3 estarem imunizadas;
e) A probabilidade de menos de 18 estarem imunizadas?
Pode-se mostrar que se X ∼ b(n,p), então E(X) = np, Var(X) = np(1− p).
Exemplo: Do exemplo da vacina, calcule E(X) e Var(X).
26
6.2.4 Modelo Geométrico
Considere uma sequência de ensaios de Bernoulli independentes. Seja X : o número de fra-
cassos anteriores ao primeiro sucesso.
Definição: Dizemos que X segue o modelo Geométrico com parâmetro p, 0 < p < 1 e sua
função de probabilidade é dada por:
P(X = k) = p(1− p)k, 0≤ p≤ 1 e k = 0,1,2, . . . .
Notação: X ∼ G(p)
p: probabilidade de sucesso.
Ainda, E(X) =
1
p
e Var(X) =
(1− p)
p2
Exemplo: Uma linha de produção está sendo analisada para efeito de controle da quali-
dade das peças produzidas. A produção é interrompida para regulagem toda vez que uma peça
defeituosa é observada. Admita que a probabilidade da peça defeituosa é 0,01. Calcule as pro-
babilidades abaixo e esboce o gráfico da distribuição de probabilidade.
6.2.5 Modelo Poisson
Definição: Uma v.a. X tem distribuição Poisson, com parâmetro λ > 0 se sua função de
probabilidade é dada por
P(X = k) =
e−λλk
k!
k = 0,1,2, . . . .
λ é chamada taxa de ocorrência.
Notação: X ∼ Po(λ)
Exemplos de v.a. cujas distribuições de probabilidades que podem ser modeladas pelo mo-
delo de Poisson são:
• Número de falhas por unidade de tempo;
• Número de furos em pneus por km rodado;
• Número de defeitos por metro de tecido.
“Dados de contagem”.
Exemplo: Sabe-se que numa certa rede de computadores ocorre em média uma queda por
semana. Um pesquisador deseja realizar um trabalho envolvendo simulação em que são ne-
cessários 2 dias consecutivos sem haver queda de rede. Considerando o modelo de Poisson,
calcule a probabilidade dele não conseguir realizar a simulação.
27
Exemplo: O número de chamadas telefônicas que chegam a uma central é frequentemente
modelado como uma v.a. de Poisson. Considere que em média há 10 chamadas por hora. Cal-
cule:
a) A probabilidade de que haja exatamente 5 chamadas em 1 hora.
b) A probabilidade de que haja 3 ou menos chamadas em 1 hora.
c) A probabilidade de que haja exatamente 15 chamadas em 2 horas.
d) A probabilidade de que haja exatamente 5 chamadas em 30 minutos.
Prova-se que E(X) = λ e Var(X) = λ
“Expansão em série de Taylor”.
6.2.6 Modelo Hipergeométrico
Consideremos uma população com N elementos, dos quais r têm uma determinada carac-
terı́stica (a retirada de um desses elementos corresponde ao sucesso). Retiramos dessa popula-
ção, sem reposição, uma amostra de tamanho n.
Seja X : número de sucessos na amostra (saı́da do elemento com a caracterı́stica).
Qual a P(X = k)?
Podemos tirar
(
N
n
)
amostras sem reposição. Os sucessos na amostra podem ocorrer de(
r
k
)
maneiras e fracassos de
(
N− r
n− k
)
modos.
Logo, P(X = k) =
(
r
k
)(
N− r
n− k
)
(
N
n
) , 0≤ k ≤ n e k ≤ r.
A variável X tem distribuição hipergeométrica. Notação: X ∼ hip(N,r,n).
E(X) = np e Var(X) = np(1− p)(N−n)
N−1
, em que p =
r
N
.
Exemplos:
1) Pequenos motores são guardados em pequenas caixas de 50 unidades. Um inspetor de
qualidade examina cada caixa, antes da posterior remessa, testando 5 motores. Se nenhum motor
for defeituoso, a caixa é aceita. Se pelo menos um for defeituoso, todos os 50 motores são
testados. Há 6 motores defeituosos numa caixa. Qual a probabilidade de que seja necessário
examinar todos os motores dessa caixa?
2) De um baralho com 52 cartas, retiram-se 8 cartas ao acaso, sem reposição. Qual a proba-
bilidade de que 4 sejam figuras?
28
Lista de exercı́cios 5
Nos seguintes exercı́cios identifique qual é a variável aleatória para cada experimento assim
como os valores que pode tomar, a distribuição de probabilidade associada a cada variável para
depois calcular as probabilidades.
1. Um aluno se apresenta a uma prova que contém 8 perguntas, cada pergunta com 3 respostas
opcionais. Suponha que um aluno está respondendo “no chute”. Se para ser aprovado ele deve
responder corretamente 6 ou mais perguntas. Qual é a probabilidade do aluno ser aprovado?
2. Os registros de uma pequena empresa indicam que 30% das faturas expedidas são pagas
após o vencimento. De 10 faturas emitidas,qual é a probabilidade de exatamente três serem
pagas com atraso?
3. Numa linha condutora de água de 60 km de extensão, o número de vazamentos no perı́odo
de um mês segue distribuição Poisson de parâmetro λ = 4. Qual a probabilidade de ocorrer,
durante um mês, pelo menos um vazamento em certo setor de 3 km de extensão?
4. Se há 0,2 de probabilidade de uma pessoa dar crédito a um rumor sobre a vida privada de
certo polı́tico, qual a probabilidade de que a quinta pessoa a ouvir tal rumor seja a primeira a te
lhe dado crédito?
5. Supondo que o número de carros que chegam a uma fila de guichê de um pedágio pos-
sua distribuição Poisson, a uma taxa de três carros por minuto, determine a probabilidade de
chegaram quatro carros nos próximos dois minutos.
6. Uma indústria de tintas recebe pedidos de seus vendedores por meio de fax, telefone e
internet. O número de pedidos que chegam por qualquer meio (no horário comercial) é uma
variável aleatória discreta com distribuição Poisson com taxa de 5 pedidos por hora.
a) Calcule a probabilidade de mais de 2 pedidos por hora.
b) Em um dia de trabalho (8 horas), qual seria a probabilidade de haver 50 pedidos?
7. A AIDS é uma doença que afeta 1% de uma população grande. Suponha que escolhemos
n pessoas aleatoriamente dessa população.
a) Qual é a probabilidade de que nenhuma das n pessoas sejam portadores do vı́rus HIV?
b) Que tamanho deve ter a amostra n, para que esta probabilidade seja menor ou igual a 10%?
8. Ontem 80% das ações mais negociadas na bolsa de valores Alpha Beta caı́ram de preço.
Suponha que você tenha uma carteira com 20 dessas ações e que as ações que perderam valor
tenham distribuição binomial. Calcule:
a) A probabilidade de que tenha caı́do de preço exatamente 15 dessas ações.
b) Calcular a média e a variância das ações que tem na carteira.
9. Você está caçando a baleia Moby Dick. Diariamente você despacha de seu navio um barco
com arpoadores. Há uma probabilidade de 23 de um desses barcos naufragar em um dia qualquer.
Você planeja caçar Moby Dick por 4 dias. Qual é a probabilidade de perder 3 barcos ou mais?
10. Quantas vezes devemos jogar uma moeda para que a probabilidade de aparecerem ao
menos 2 caras seja superior a 12?
11. Qual é a probabilidade de dois dos três próximos presidentes terem nascidos em um
domingo?
12. As máquinas A e B produzem, em média 5% e 10% de peças defeituosas respectivamente.
Qual é a probabilidade de que a amostra obtida da produção da máquina A tenha exatamente uma
peça defeituosa e a amostra correspondente a máquina B contenha duas peças defeituosas?
13. Sabe-se que em certo supermercado vende-se cerveja da marca A em média de 10 caixas
por hora durante o perı́odo de maior venda. Qual a probabilidade de que se venda pelo menos 1
caixa durante os primeiros seis minutos no perı́odo de maior venda?
14. Uma firma compra lâmpadas por centenas. Examina sempre uma amostra de 15 lâmpadas
para verificar se estão boas. Se uma centena inclui 12 lâmpadas queimadas, qual a probabilidade
de se escolher uma amostra com pelo menos uma lâmpada queimada?
29
6.3 Variável Aleatória Contı́nua
A definição dada para v.a. discreta pode ser modificada como se segue:
Definição: Se a v.a. X assumir valores num intervalo de números reais, então, dizemos que
X é uma v.a. contı́nua.
Observação: Como X toma valores num intervalo de números reais, os valores possı́veis de
X são incontáveis (não são mensuráveis). Não podemos falar do i-ésimo valor de X , e por isso,
p(xi) = P(X = xi) fica sem sentido. O que se faz neste caso é substituir a função definida para
x1,x2, . . . por uma função f definida para todos os possı́veis valores de X , chamada de função
densidade de probabilidade (f.d.p.).
Definição: A função densidade de probabilidade f da v.a. contı́nua X é uma função que
satisfaz:
a) f (x)≥ 0 ∀x ∈R
b)
∫
∞
−∞
f (x)dx = 1 (área sob a curva de f é 1).
Além disso, definimos para todo c < d, c,d ∈R
P(c≤ X ≤ d) =
∫ d
c
f (x)dx
Exemplo: Seja uma v.a. contı́nua. Seja f dada por:
f (x) =
{
2x, 0 < x < 1
0, caso contrário
Mostre que f é uma f.d.p.
Calcule: P(X ≤ 1/2) =
P(1/4≤ X ≤ 1/2) =
Esboce o gráfico de f (x)
Exemplo: Seja
f (x) =

0, x≤ 0
ax3, 0 < x≤ 2
0, x > 2
em que a é uma constante não negativa.
Obter o valor de a para que f seja uma f.d.p. de uma v.a. contı́nua X .
Função de distribuição acumulada
Definição: Dada uma v.a. contı́nua X com f.d.p. f , sua função de distribuição acumulada é
dada por:
F(x) = P(X ≤ x) =
∫ x
−∞
f (t)dt, ∀x ∈R
Exemplo: Seja X uma v.a. contı́nua com
f (x) =
{
2x, 0 < x < 1
0, caso contrário
Obtenha F(x).
30
Calcular utilizando F(x).
F(−1) =
F(0,5) =
F(0,8) =
F(1,5) =
Esboce o gráfico de F(x)
Exemplo: Encontre F(x) para a função
f (x) =
{
x3
4 , 0 < x≤ 2
0, caso contrário
Calcule
F(−1) =
F(0,8) =
F(1,5) =
F(2,2) =
Valor médio de uma v.a. contı́nua
Definição: Dada uma v.a. contı́nua X com função densidade de probabilidade f (x), define-se
o valor médio ou esperança de X por:
E(X) =
∫
∞
−∞
x f (x)dx
Exemplo: Seja X uma v.a. contı́nua com f.d.p.
f (x) =
{
2x, 0 < x < 1
0, caso contrário
Calcule E(X).
Exemplo: f (x) =
{
x3
4 , 0 < x≤ 2
0, caso contrário
Calcule E(X).
Variância de uma v.a. contı́nua X
Definição: Seja X uma v.a. contı́nua, com f.d.p f (x), define-se a variância de X por:
Var(X) = E{[X−E(X)]2}=
∫
∞
−∞
[X−E(X)]2. f (x)dx
Fórmula prática:
Pode-se mostrar que
Var(X) = E(X2)− [E(X)]2
Exemplo: Seja X uma v.a. contı́nua com f.d.p.
f (x) =
{
2x, 0 < x < 1
0, caso contrário
Calcule Var(X).
Calcule o desvio padrão de X .
Exemplo: f (x) =
{
x3
4 , 0 < x≤ 2
0, caso contrário
Calcule Var(X).
31
6.4 Alguns Modelos para v.a.’s Contı́nuas
Seguindo a definição de v.a. contı́nua, de modo geral, podemos dizer que as v.a.’s cujos
valores resultam de algum processo de mensuração são v.a.’s contı́nuas. Alguns exemplos são:
a) O peso ou a altura das pessoas de uma cidade;
b) O tempo de vida de uma lâmpada;
c) Erros de medidas, em geral, resultantes de experimentos em laboratórios.
6.4.1 O Modelo Uniforme
É o modelo mais simples para v.a.’s contı́nuas.
Definição: A v.a. X tem distribuição uniforme no intervalo [α,β] se sua f.d.p. é dada por
f (x) =
{ 1
β−α , α≤ x≤ β
0, caso contrário
Notação: X ∼U [α,β]
Gráfico
Função de distribuição acumulada
F(x) = P(X ≤ x) =
∫ x
−∞
f (k)dk =

0, x < α
x−α
β−α , α≤ x < β
1, x≥ β
Gráfico
Para dois valores quaisquer c e d, com c < d, temos
P(c < X < d) = F(d)−F(c)
E(X) = α+β2
Var(X) = (β−α)
2
12
Exemplo: Um ponto é escolhido ao acaso no intervalo [0,2]. Qual a probabilidade de que o
ponto esteja entre 1 e 1,5? Encontre a E(X) e a Var(X).
Exemplo: X ∼ [1,4], calcule P(X < 2), E(X) e Var(X).
32
6.4.2 O Modelo Normal (ou Gaussiano)
O modelo normal é um dos modelos mais importantes para v.a.’s contı́nuas.
Definição: Uma v.a. contı́nua X segue o modelo normal se sua f.d.p. é dada por:
f (x) =
1√
2πσ2
e
−(x−µ)
2
2σ2 , −∞ < x < ∞
com µ,σ ∈R e σ > 0.
Notação: X ∼ N(µ,σ2),
X segue distribuição Normal com média µ e variância σ2.
Gráfico da f.d.p. ( f (x))
Pode-se mostrar que:
E(X) = µ e Var(X) = σ2
Observa-se que: (Pelo gráfico)
f (x)→ 0 quando x→±∞ ou lim
x→−∞
f (x) = lim
x→+∞
f (x) = 0;
µ−σ e µ+σ são pontos de inflexão do gráfico de f ;
x = µ é o ponto de máximo de f (x);
f (x) é simétrica em relação à reta x = µ.
Considere uma v.a. X , com distribuição N(µ = 3,σ2 = 16). Como calcular, por exemplo
P(X ≤ 5)?
A f.d.p. da normal f (x) não possui uma função primitiva. Assim, os valores de probabilida-
des são obtidos por integração numérica e são apresentados em tabelas. Não é necessário fazer
uma tabela para cada par de valores dos µ e σ que se tem interesse. Basta usar uma tabela de
probabilidades com µ = 0 e σ2 = 1 e usar o seguinte resultado.
Propriedade: Se X ∼N(µ,σ2),então, Z = X−µ
σ
∼N(0,1). Assim, a v.a. Z segue a chamada
distribuição normal Padrão (ou reduzida).
Exemplo: Seja X uma v.a. com distribuição N(3,16). Calcule a probabilidade P(X ≤ 5).
Calcule P(X ≤ 2) com N(3,16):
P(2≤ X ≤ 5) =
33
Exercı́cio 1: Seja Z ∼ N(0,1), calcule:
a) P(Z < 2,14)
b) P(Z ≤ 1,50)
c) P(Z < 1)
d) P(Z >−2,17)
e) P(Z >−3,01)
f) P(−2,17 < Z < 1,50)
g) P(Z > 0)
h) P(Z > 1)
i) P(Z <−1)
j) P(1 < Z < 3,01)
k) P(2 < Z < 3)
l) P(−3,01 < Z <−2,17)
m) P(−3 < Z < 2,5)
Exercı́cio 2: Sabendo-se que Z ∼ N(0,1), obter z tal que:
a) P(Z < z) = 0,8810
b) P(Z > z) = 0,025
c) P(|Z|< z) = 0,95
Exercı́cio 3: Se X ∼ N(10,4), calcular:
a) P(8≤ X ≤ 10)
b) P(9≤ X ≤ 12)
c) P(X > 10)
d) P(X < 8 ou X > 11)
6.4.3 O Modelo exponencial
Outra distribuição importante e que tem aplicações em confiabilidade de sistemas é a distribuição
exponencial.
Definição: Uma v.a. contı́nua X , assumindo valores não negativos, segue o modelo exponen-
cial, com parâmetro α > 0 se sua f.d.p. é:
f (x) =
{
αe−αx, x≥ 0
0, caso contrário
Notação: X ∼ exp(α)
X segue distribuição exponencial com parâmetro α.
Gráfico da f.d.p. exponencial:
Para calcular probabilidades com a distribuição exponencial, precisamos resolver a integral
correspondente.
34
Exemplo:
P(a < X < b)
Exemplo: O tempo de vida de um transistor pode ser considerado uma v.a. com distribuição
exponencial com parâmetro α = 1/500. Qual é a probabilidade de que o transistor dure mais que
250 horas? E de durar mais que 1000 horas?
Esperança e Variância
Utilizando a técnica de integração por partes pode-se mostrar que:
i) E(X) = 1
α
ii) Var(X) = 1
α2
Função de distribuição acumulada para v.a. X ∼ Exp(α)
Mostre que a F(x) =
{
0, x < 0
1− e−αx, x≥ 0
Exemplo: Seja X : tempo de vida de um transistor, X ∼ Exp(1/500), calcule:
a) P(X < 250)
b) P(X < 1000)
c) P(X < 500)
d) E(X)
e) Var(X)
Lista de exercı́cios 6
1. Verifique se as expressões a seguir são funções densidade de probabilidade.
a) f (x) =
{
3x, 0≤ x≤ 1
0, em outro caso
b) f (x) =
{
x2, x≥ 0
0, em outro caso
c) f (x) =
{
(x−3)
2 , 3≤ x≤ 5
0, em outro caso
d) f (x) =
{
(2+x)
4 , 0≤ x≤ 1
(2−x)
4 , em outro caso
35
2. Determine o valor da constante k para que as seguintes funções sejam funções densidade
de probabilidade.
a) f (x) =
{
kx2, 0≤ x≤ 4
0, em outro caso
b) f (x) =
{
k(1+2x), 0≤ x≤ 2
0, em outro caso
c) f (x) =
{
ke−x, 0≤ x≤ 4
0, em outro caso
3. O tempo em minutos de digitação de um texto, por secretárias experientes, é considerado
uma variável contı́nua com função densidade apresentada a seguir:
f (x) =

1/4, 0≤ x < 2
1/8, 2≤ x < 6
0, em outro caso
determine:
a) P(X > 3)
b) P(1 < X < 4)
c) Um número b tal que P(X > b) = 0,6.
d) A função de distribuição acumulada da variável aleatória X (F(x) = P(X ≤ x)).
e) O valor esperado e a variância da variável X .
4. A quantia gasta anualmente, em milhões de reais, na manutenção do asfalto de uma cidade
do interior é representada pela variável Y com função densidade dada por
f (y) =
{ 8
9
y− 4
9
, 0,5≤ y < 2
0, em outro caso
Obtenha
a) P(Y < 0,8)
b) A função de distribuição acumulada da variável aleatória Y .
c) O valor esperado e a variância de Y .
5. Numa certa região, fósseis de pequenos animais são frequentemente encontrados e um ar-
queólogo estabeleceu o seguinte modelo de probabilidade para o comprimento, em centı́metros,
desses fósseis
f (x) =

1
40
x, 4≤ x < 8
− 1
20
x+
3
5
, 8≤ x < 10
1
10
, 10≤ x < 11
0, em outro caso
a) Calcule a Função de distribuição acumulada para o comprimento dos fósseis da região.
b) Para um fóssil encontrado nessa região, determine a probabilidade do comprimento ser
inferior a 6 centı́metros. E de ser superior a 5 mas inferior a 10,5 cm.
c) Encontre o valor esperado para o comprimento dos fósseis da região.
6. Uma variável aleatória contı́nua X , assumindo valores não negativos, segue o modelo
Exponencial com parâmetro α > 0 se sua função de densidade é dada por
f (x) =
{
αe−αx, x≥ 0
0, em outro caso
a) Mostre que P(a < X < b) = e−αa− e−αb (a,b constantes com a < b).
b) Mostre que a média da variável aleatória X é 1/α . (Isto é E(X) = 1/α).
7. Para X ∼ N(50,81), obtenha:
a) P(X ≤ 75); b) P(X ≥ 60); c) P(X ≤ 35); d) P(85≤ X ≤ 100); e) P(|X−40| ≤ 10).
36
8. Uma clı́nica de emagrecimento recebe pacientes adultos com peso seguindo uma distribui-
ção normal de média 130kg e desvio padrão 20kg. Para efeito de determinar o tratamento mais
adequado, os 25% pacientes de menor peso são classificados de “magros”, enquanto os 25% de
maior peso de “obesos”. Determine os valores que delimitam cada uma dessas classificações.
9. Um teste de aptidão feito por pilotos de aeronaves em treinamento inicial requer que uma
série de operações seja realizada em uma rápida sucessão. Suponha que o tempo necessário
para completar o teste seja distribuı́do de acordo com uma normal de média 90 minutos e desvio
padrão 20 minutos.
a) Para passar no teste, o candidato deve completá-lo em menos de 80 minutos. Se 65 candi-
datos fazem o teste, quantos são esperados passar?
b) Se os 5% melhores candidatos serão alocados para aeronaves maiores, quão rápido deve
ser o candidato para que obtenha essa posição?
10. O tempo de reação de um motorista para o estı́mulo visual é normalmente distribuı́do
com média de 0,4s e um desvio padrão de 0,05s.
a) Qual é a probabilidade de que uma reação requeira mais de 0,5s?
b) Qual é a probabilidade de que uma reação requeira entre 0,4s e 0,5s?
c) Qual é o tempo de reação que é excedido em 90% do tempo?
11. Na distribuição X ∼ N(µ,σ2) encontre:
a) P(X ≥ µ+2σ);
b) P(|X−µ| ≤ σ);
c) O valor de a tal que P(µ−aσ≤ X ≤ µ+aσ) = 0,99;
d) O valor de a tal que P(X > a) = 0,90.
7 Amostragem
A inferência estatı́stica (ou estatı́stica indutiva) busca tirar conclusões probabilı́sticas sobre
as populações com base em resultados verificados em amostras dessas populações.
Uma amostra deve ser representativa da população, ou seja, a amostra deve ter as mesmas
caracterı́sticas da população no que diz respeito às variáveis que se deseja estudar.
Amostragem Probabilı́stica é aquela em que todos os elementos têm uma probabilidade
conhecida e diferente de zero de pertencer à amostra. Caso contrário, a amostragem será não
probabilı́stica.
• A seleção é feita por sorteio;
• É usada para garantir a representatividade da população.
As principais técnicas de amostragem são:
1. Amostragem Casual Simples - também chamada de amostragem aleatória simples (AAS).
• Todos os elementos da população tem igual probabilidade de pertencer à amostra;
• Todas as possı́veis amostras têm igual probabilidade de ocorrer.
Seja N o número de elementos na população e n o número de elementos na amostra.
Cada elemento da população tem probabilidade
n
N
de pertencer à amostra.
Sendo a amostragem sem reposição⇒ existem CNn =
(
N
n
)
= N!n!(N−n)! possı́veis amostras.
Procedimento:
37
• Numera-se a população de 1 a N, sorteia-se a seguir n números dessa sequência, os quais
corresponderão aos elementos sorteados da amostra.
• O sorteio pode ser feito através de papéis numerados em uma urna, tabelas (ou quadros)
de números aleatórios gerados por algum programa de computador.
Exemplo: De uma população de 800, como obter uma AAS de 50 elementos usando um
quadro de números aleatórios?
- considera-se a população numerada de 001 a 800;
- sorteia-se um dı́gito no quadro de números aleatórios;
- a partir do dı́gito sorteado, considera-se os números de três algarismos subsequentes for-
mados (em qualquer sentido do quadro), os quais irão indicar os elementos da amostra.
Figura 2: Quadro de Números aleatórios
Observação: As técnicas estatı́sticas que serão vistas neste curso, pressupõem que os dados
são obtidos por uma AAS.
2. Amostragem Sistemática (AS)
Quando oselementos da população se apresentam ordenados e a retirada da amostra é feita
periodicamente, temos uma amostragem sistemática.
Exemplos:
a) Veı́culos vistoriados em uma barreira policial, param a cada 10 carros;
b) Plantas enfileiradas, a cada 15 plantas pode-se sortear uma;
c) A cada 10 itens produzidos, pode-se retirar um para pertencer a amostra diária;
d) Se temos uma população de N = 800 elementos ordenados, como retirar uma AS de n= 50
elementos?
Vantagem da AS - facilidade para a determinação dos elementos da amostra;
Desvantagem da AS - possibilidade de existirem ciclos de variação da variável de interesse
e os perı́odos dos ciclos coincidirem com o perı́odo da retirada dos elementos.
38
Exemplo: Contas a receber separadas por mês e valor. Tem meses que tem mais contas a
receber que outros.
3. Amostragem por Conglomerado é adotada por motivos prático, econômico e viabilidade,
quando a população apresenta uma subdivisão em pequenos grupos, chamados conglomerados.
• Sorteiam-se os conglomerados e depois todos os indivı́duos dos conglomerados seleciona-
dos são analisados.
Exemplo: Sorteiam-se domicı́lios e todos os indivı́duos dos domicı́lios são analisados.
• Ou sorteiam-se os conglomerados e em seguida sorteiam-se os indivı́duos dentro dos con-
glomerados (amostragem em dois estágios).
Exemplo: Sorteiam-se escolas públicas em Dourados e depois sorteiam-se alunos dentro
das escolas.
4. Amostragem Estratificada (AE)
Muitas vezes a população se divide em subpopulações (estratos), sendo que dentro de cada
estrato a variável de interesse apresenta comportamento homogêneo e de estrato para estrato o
comportamento é mais heterogêneo (diverso).
Pode-se ter interesse no comportamento da variável em cada estrato separadamente.
Exemplos de estratificação: Zona Rural e Urbana; Setores Censitários; Renda; Bairros para
pesquisa eleitoral.
Exemplo: Considere uma população de N = 10 estudantes para os quais definimos as variáveis:
X1 - renda familiar;
X2 - classe social (A, B, C).
População {1 2 3 4 5 6 7 8 9 10}
X1 10 8 15 6 22 12 7 16 13 11
X2 B C A C A B C A B B
Podemos considerar três estratos determinados pela variável X2:
A amostragem estratificada consiste em especificar quantos elementos serão retirados em
cada estrato. Três tipos de amostragem estratificada podem ser considerados:
a) Uniforme - sorteia-se igual número de elementos em cada estrato.
b) Proporcional - o número de elementos sorteados em cada estrato é proporcional ao tama-
nho do estrato.
c) Ótima - em cada estrato o número de elementos sorteados é proporcional ao número de
elementos no estrato e também à variação da variável de interesse. Quanto menor a variação do
estrato, menos elementos são necessários para bem caracterizar o comportamento da variável.
Exemplos:
1. Suponha uma indústria com 100 funcionários, em que 30 são do sexo feminino e os 70
restantes do sexo masculino. Como você obtém uma amostra estratificada proporcional de 10%
da população, considerando-se os seguintes estratos?
2. Os dados a seguir representam os resultados do ı́ndice de massa corporal (IMC) medido
em mães de crianças pré-escolares da cidade de Piracicaba-SP (Nascimento, 2008).
Rural:
31,1 25,6 28,5 34,1 22,4 33,9 28,1 27 37,6 27,7 20,5 27 21,9 20,9 33,1
26,7 24,4 26,8 33,5 31,9 26,1 19,6 35 21 27,6 24,9 36,3 33,4 22 28 27,4
23,1 26,1 21,1 40,9 23,5 20,2 32 40 26,3 28,2
39
Urbana:
31,9 20 28 32 27,7 22,2 20,7 23,9 23,4 20,2 24,6 24,2 20,1 28,4 26,5
37,9 24 20,2 21,6 19,6 27 22,8 24,9 23 27,8 30,6 31,4 26,7 22,8 29,6
21,5 38,7 34 37,7 25,8 30,2 27,3 35,3 28 22,2 23 22 31,5 24,8 21,7
19,5 29,7 28,1 24,6 29,3 26,5 26,9 26,3 27,8 29,9
a) Considere dois estratos, formados pelas zonas rural e urbana. Obtenha uma amostragem
estratificada proporcional, selecionando as amostras em cada estrato de forma sistemática.
b) Calcule o IMC médio para cada estrato.
Amostragem Não Probabilı́stica - são muitas vezes usadas por impossibilidade de obter
uma amostra probabilı́stica. Mas devem ser utilizadas com cautela.
Alguns casos de amostragens não probabilı́sticas são apresentados a seguir.
1. Inacessibilidade a toda a população
• Não se tem acesso a toda a população;
• Retira-se uma amostra da parte acessı́vel da população;
• Se as caracterı́sticas da variável de interesse forem as mesmas na população objeto e na
população amostrada, então, este tipo de amostragem equivale a uma amostragem proba-
bilı́stica.
Exemplo: Pesquisa domiciliar em uma cidade em que alguns bairros são de difı́cil acesso
(roubos, assassinatos etc.)
2. Amostragem a esmo ou sem norma - é aquela em que o amostrador procura ser aleatório
sem, no entanto, realizar um sorteio propriamente.
Exemplo: Retirar uma amostra de 100 parafusos de uma caixa contendo 10.000, através de
uma AAS demandaria muito tempo, então, vai pegando os parafusos “aleatoriamente”.
Os resultados em geral são equivalentes ao de uma amostragem probabilı́stica se o material
for homogêneo.
3. População formada por material contı́nuo
Neste caso, é impossı́vel realizar uma amostragem probabilı́stica devido a impraticabilidade
em fazer um sorteio.
Exemplo: Amostra de sangue, amostra de água de um rio, ...
4. Amostragens intencionais
O amostrador escolhe deliberadamente certos elementos da população para pertencer à amos-
tra, por julgar tais elementos bem representativos da população. O perigo deste tipo de amostra-
gem é obviamente grande, pois o amostrador pode obviamente se equivocar em seu pré julga-
mento.
5. Amostragem por voluntários - ocorre, por exemplo, no caso da aplicação experimental
de uma nova droga em pacientes, quando a ética obriga que haja concordância dos escolhidos.
8 Distribuições Amostrais
Vamos supor de agora em diante que as amostras são probabilı́sticas, representativas da
população, obtidas através da AAS (Amostra Aleatória Simples).
Ao retirar uma AAS de uma população, estaremos considerando cada valor da amostra como
um valor de uma variável aleatória cuja distribuição de probabilidade é a mesma da população
no instante da retirada desse elemento para a amostra.
40
Como consequência do fato dos valores da amostra serem aleatórios, qualquer quantidade
calculada em função dos elementos da amostra também será uma variável aleatória.
Definição: Os valores T (X1,X2, . . . ,Xn), calculados em função dos elementos de uma amos-
tra aleatória X1,X2, . . . ,Xn são chamados de estatı́stica. Ex.: X , S2.
População⇒ parâmetros. Ex: µ, σ2
As estatı́sticas, sendo v.a.’s, terão alguma distribuição de probabilidade, com uma média, uma
variância etc. A distribuição de probabilidade de uma estatı́stica chama-se distribuição amostral.
Outra forma de interpretar a distribuição de probabilidade de uma estatı́stica é considerando
a distribuição da população de todos os valores que podem ser obtidos para essa estatı́stica em
função de todas as amostras possı́veis de serem retiradas da população original.
Algumas notações:
µ - média da população;
µX , µ(X), E(X) denotarão a média (valor esperado ou esperança matemática) da distribuição
amostral de X .
σ2 - variância da população;
σ2X , σ
2(X), Var(X) denotarão a variância da distribuição amostral de X .
8.1 Distribuição amostral de X
Como exemplo, considere a seguinte população {1,3,5,7}. Seja X a v.a. “valor assumido
por um elemento sorteado ao acaso dessa população”.
a) Obtenha a distribuição de X e um gráfico que a represente.
b) Calcule a média e a variância dessa população.
c) Considere todas as possı́veis amostras, com reposição, de tamanho 2 dessa população. Se-
jam X1: no selecionado na 1a extração e X2: no selecionado na 2a extração. Obtenha a distribuição
amostral de X e um gráfico da distribuição.
d) Obtenha a média e a variância da distribuição amostral de X .
e) Compare a média da distribuiçãoamostral de X (µX ) com a média da população (µ) e
também a variância da distribuição amostral de X (σ2X ) com a variância da população (σ
2). O
que você observa?
Propriedades: Do cálculo de probabilidades.
Para a média:
41
a) Multiplicando-se os valores de uma variável aleatória X por uma constante c, a média fica
multiplicada por essa constante.
µ(cX) = cµ(X) ou E(cX) = cE(X)
b) A média de uma soma ou diferença de variáveis aleatórias é igual a soma ou diferença das
médias dessas variáveis, respectivamente.
µ(X1±X2) = µ(X1)±µ(X2) ou E(X1±X2) = E(X1)±E(X2)
Temos que X =
∑
n
i=1 Xi
n
=
1
n
(X1 +X2 + . . .+Xn).
Usando as propriedades a) e b) mostre que E(X) = µ.
Nota-se, portanto, que a média em torno da qual devem variar os possı́veis valores da es-
tatı́stica X (média amostral) é a própria média µ da população, o que é intuitivo.
Observação: Se forem tomadas várias amostras e para cada uma for calculada a estatı́stica
X , então, a média dos valores obtidos será aproximadamente µ. Se forem tomadas todas as
amostras (como no exemplo), então E(X) = µ.
Para a variância:
c) Multiplicando-se os valores de uma variável aleatória X por uma constante c, a variância
fica multiplicada pelo quadrado dessa constante.
σ2(cX) = c2σ2(X) ou Var(cX) = c2Var(X)
d) A variância de uma soma ou diferença de variáveis aleatórias independentes é igual a
soma das variâncias.
Isto é, se X1,X2, . . . ,Xn são independentes, então, σ2(X1±X2± . . .±Xn) = σ2(X1)+σ2(X2)+
. . .+σ2(Xn) ou Var(X1±X2± . . .±Xn) =Var(X1)+Var(X2)+ . . .+Var(Xn).
Usando as propriedades c) e d) mostre que σ2(X) =
σ2
n
.
Nota-se, portanto, que a variância da estatı́stica X é n vezes menor que a variância da população
da qual é retirada a amostra. E o erro padrão de X é dado por σ(X) =
√
σ2
n
=
σ√
n
.
Resumindo, vimos que a média da estatı́stica X é µ (igual a média da população) e a variância
da estatı́stica X é
σ2
n
(variância da população dividida por n).
Vejamos qual é o formato da distribuição amostral de X .
Teorema das Combinações Lineares. Uma variável aleatória obtida pela combinação linear
da variáveis aleatórias normais independentes, também tem distribuição normal.
Seja a v. a. X normalmente distribuı́da, e seja X =
n
∑
i=1
Xi
n
=
1
n
(X1 +X2 + . . .+Xn), e as-
sim X é uma combinação linear das v.a.’s independentes X1,X2, . . . ,Xn, logo, X também segue
distribuição normal.
Notação: X ∼ N
(
µ,
σ2
n
)
, X tem distribuição normal com média µ e variância
σ2
n
.
Teorema Central do Limite (TCL). Uma variável aleatória resultante de uma soma de n
variáveis aleatórias independentes, tem distribuição normal quando n é grande (n→ ∞). Ou
seja, se a distribuição populacional não for normal, mas n grande, então pelo TCL, a distribuição
amostral de X se aproxima da normal. (Na prática n≥ 30 já é considerado grande).
42
Resumo:
X ∼ N
(
µ,σ2
)
⇒ X ∼ N
(
µ,
σ2
n
)
∀n
X ∼ ? ⇒ X ∼ N
(
µ,
σ2
n
)
para n≥ 30.
Note que se X ∼ N
(
µ,
σ2
n
)
, então Z =
X−µ
σ√
n
∼ N(0,1).
Lista de exercı́cios 7
1. Indique como seria possı́vel retirar uma amostra sistemática de 35 elementos a partir de uma
população ordenada por 2590 elementos. Na ordenação geral, qual dos elementos abaixo seria
escolhido para pertencer à amostra, sabendo-se que o elemento de ordem 1546 a ela pertence?
a) 1028o
b) 242o
c) 636o
d) 2323o
e) 1841o
2. Uma população se encontra dividida em três estratos, com tamanhos, respectivamente, N1 =
80, N2 = 120 e N3 = 60. Ao se realizar uma amostragem estratificada proporcional, 12 elementos
da amostra foram retirados do primeiro estrato. Qual o número total de elementos da amostra?
3. Uma amostragem entre os moradores de uma cidade é realizada da seguinte forma: em cada
subdistrito, sorteia-se um certo número de quarteirões proporcional à área do subdistrito; de cada
quarteirão, são sorteadas cinco residências, cujos moradores são entrevistados.
a) Essa amostra será representativa da população ou poderá apresentar algum vı́cio?
b) Que tipos de amostragem foram usados no procedimento?
4. Uma indústria especializada em montagem de grandes equipamentos industriais recebeu se-
tenta dispositivos de controle do fornecedor A e outros trinta dispositivos do mesmo tipo do
fornecedor B. O aspecto relevante que se deseja controlar, relativo a esses dispositivos, é a re-
sistência elétrica de certo componente crı́tico. Vamos admitir que os cem dispositivos recebidos
foram numerados de um a cem ao darem entrada no almoxarifado, e que os setenta primeiros
foram recebidos do fornecedor A. Vamos admitir, também, que os valores reais da variável de
interesse (a resistência elétrica do componente crı́tico) dos cem dispositivos recebidos sejam os
dados seguintes, respectivamente na ordem de entrada no almoxarifado (lê-se segundo as linhas,
tal como se lê um livro):
33 38 34 34 34 31 36 35 32 37
35 34 30 37 36 33 34 34 32 39
35 33 33 34 31 32 36 33 29 36
34 35 34 33 31 35 35 35 37 32
34 34 36 35 34 33 32 38 34 33
33 32 34 35 37 35 35 30 35 34
36 36 33 34 33 32 31 37 35 34
39 40 40 42 39 38 40 40 40 40
40 41 45 41 40 39 41 41 40 42
39 40 41 40 40 42 39 39 38 40
a) Uma amostra simples ao acaso de dez dispositivos foi retirada da população de cem dispo-
sitivos, com auxı́lio dos números aleatórios (Figura 2). O processo de utilização do quadro foi o
usual, com inı́cio no dı́gito situado na interseção da quinta linha com a oitava coluna do referido
43
quadro. A seguir, foi calculada a resistência elétrica média da amostra de dez dispositivos. Que
valor você acha que foi obtido para essa média?
b) Suponha agora que se pensasse em fazer amostragem estratificada. Em sua opinião, seria
isso razoável, no caso? Caso afirmativo, indique como você procederia, ainda utilizando os
números aleatórios. Suponha que o número total de dispositivos a examinar na amostra continue
sendo dez.
c) Suponha agora que tivesse sido utilizada amostragem estratificada uniforme, num total
ainda de dez dispositivos examinados, e que tivessem sido obtidos, no primeiro e no segundo
estratos, respectivamente, x1 = 33,8 e x2 = 40,2. Em quanto você estimaria a média da população
de cem dispositivos?
d) Suponha agora que, dos setenta dispositivos provenientes do fornecedor A, tenha sido
colhida uma aostra sistemática de dez dispositivos, sendo constante o perı́odo de retirada dos
elementos para a amostra e sendo conhecido que o segundo dispositivo a entrar no almoxarifado
(cujo valor da resistência elétrica é 38) pertencia a essa amostra. Calcule a média dos valores da
resistência elétrica observados nessa amostra.
5. A média e a variância de uma população equiprovável, cujos possı́veis valores são os
inteiros 1, 2, 3 e 4, são µ = 2,5 e σ2 = 1,25. Considere a distribuição amostral de X para amostras
de n = 2 elementos e determine sua média e variância.
6. Para o exercı́cio anterior, construa a distribuição amostral de X supondo agora n = 3. Faça
o gráfico dessa distribuição.
9 Estimação de Parâmetros
Parâmetros são funções de valores populacionais.
Exemplos:
µ - média da população; σ2 - variância da população; p - proporção populacional...
Estatı́sticas são funções de valores amostrais.
T (X1,X2, . . . ,Xn)
Estimador é a quantidade calculada em função dos elementos da amostra que será usada na
estimação de um parâmetro.
Observação: Um estimador é uma estatı́stica.
Exemplo:
X = 1n ∑
n
i=1 Xi é um estimador da média da população⇒ µ̂ = X = 1n ∑
n
i=1 Xi
S2 = 1n−1 [∑
n
i=1 X
2
i −
(∑ni=1 Xi)
2
n ] é um estimador da variância da população⇒
σ̂2 = S2 = 1n−1 [∑
n
i=1 X
2
i −
(∑ni=1 Xi)
2
n ]
Estimativa é cada particular valor assumido por um estimador.
Exemplo: Uma amostra de 6 parafusos retirada ao acaso da produção apresentou os seguintes
diâmetros (em mm).
25,4 25,2 25,6 25,3 25,0 25,4
A estimativa

Outros materiais