Buscar

Probabilidade e estatística

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 113 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 113 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 113 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

UNIVERSIDADE DE CAXIAS DO SUL 
PROFESSORA: CÍNTIA PAESE GIACOMELLO 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Probabilidade e Estatística 
 
 
 
 
 
 
 
 
 
 
 
 
 
Prof. Cíntia Paese Giacomello 2 
Índice 
 
1 Introdução _____________________________________________________1 
1.1 Amostragem ________________________________________________________ 2 
1.2 Tipos de variáveis ____________________________________________________ 4 
2 Séries estatísticas _______________________________________________5 
3 Gráficos _______________________________________________________6 
4 Distribuições de freqüências______________________________________12 
4.1 Construção de distribuição de freqüência para dados contínuos ______________ 12 
4.2 Gráficos das distribuições de freqüência _________________________________ 13 
4.3 Construção de distribuição de freqüência para dados discretos ______________ 15 
4.4 Construção de uma distribuição de freqüência acumulada___________________ 17 
4.5 Distribuições de freqüência para dados nominais e por postos _______________ 18 
4.6 Gráficos para distribuições de freqüência ________________________________ 19 
5 Medidas de tendência central _____________________________________20 
5.1 Média_____________________________________________________________ 20 
5.2 Mediana ___________________________________________________________ 23 
5.3 Moda _____________________________________________________________ 25 
5.4 Relação entre as medidas de tendência central ___________________________ 26 
6 Medidas de variabilidade ________________________________________28 
6.1 Amplitude _________________________________________________________ 28 
6.2 Variância __________________________________________________________ 29 
6.3 Desvio padrão ______________________________________________________ 29 
6.4 Coeficiente de variação ______________________________________________ 30 
7 Medidas de assimetria e curtose __________________________________31 
8 Introdução à probabilidade_______________________________________33 
8.1 Experimento aleatório _______________________________________________ 33 
8.2 Espaço amostral ____________________________________________________ 34 
8.3 Eventos ___________________________________________________________ 34 
8.4 A probabilidade de um evento _________________________________________ 34 
8.5 Cálculo das probabilidades ____________________________________________ 37 
9 Distribuições de probabilidade ____________________________________43 
10 Teoria elementar da amostragem ________________________________56 
10.1 Amostragem com e sem reposição ____________________________________ 56 
10.2 Distribuições amostrais _____________________________________________ 56 
Prof. Cíntia Paese Giacomello 3 
11 Estimação ___________________________________________________62 
12 Testes de hipóteses ___________________________________________68 
12.1 Teste de hipóteses para médias ______________________________________ 70 
12.2 Testes de duas amostras para médias _________________________________ 72 
12.3 Teste para proporções _____________________________________________ 72 
12.4 Teste do qui-quadrado (k amostras para proporções) ____________________ 73 
13 Análise de variância (ANOVA - Analysis of Variance) _________________79 
13.1 Formulário para solução ____________________________________________ 83 
13.2 Exemplo de solução no Excel ________________________________________ 85 
14 Regressão e correlação ________________________________________90 
Regressão ______________________________________________________________ 91 
14.1 Aplicações da regressão ____________________________________________ 91 
14.2 Classificação das regressões_________________________________________ 91 
14.3 Modelo linear _____________________________________________________ 91 
Correlação ______________________________________________________________ 94 
14.4 Objetivo da correlação _____________________________________________ 94 
14.5 O coeficiente r de Pearson (correlação)________________________________ 94 
14.6 Coeficiente de determinação ________________________________________ 94 
14.7 Exemplo de solução no Excel ________________________________________ 96 
14.8 Outros modelos __________________________________________________ 100 
15 Tabelas ____________________________________________________106 
 
 
Prof. Cíntia Paese Giacomello 1 
11 IInnttrroodduuççããoo 
 
Estuda-se estatística para aplicar seus conceitos como auxílio nas tomadas de decisão 
diante de incertezas, justificando cientificamente as decisões. 
Os princípios estatísticos são utilizados em uma grande variedade de situações – no 
governo, nos negócios e na indústria, bem como no âmbito das ciências sociais, biológicas 
e físicas. 
Estatística é a ciência ou método científico que estuda os fenômenos multicausais, 
coletivos ou de massa e procura inferir as leis que os mesmos obedecem. 
Método estatístico é um processo para se obter, apresentar e analisar características ou 
valores numéricos para uma melhor tomada de decisão em situações de incerteza. Os 
passos da metodologia estatística são os seguintes: 
• Definição cuidadosa do problema 
• Formulação de um plano para coleta das unidades de observação 
• Coleta, resumo e apresentação das unidades de observação ou de seus valores 
numéricos 
• Análise dos resultados 
• Divulgação de relatório com as conclusões, de tal modo que estas sejam facilmente 
entendidas por quem as for usar na tomada de decisões. 
 
Em geral, é aceita a divisão da estatística em dois grandes grupos: estatística descritiva e 
indutiva. 
Descritiva: corresponde aos procedimentos relacionados com a coleta, elaboração, 
tabulação, análise, interpretação e apresentação dos dados. Isto é, inclui as técnicas que 
dizem respeito à sintetização e à descrição de dados numéricos. Tais métodos podem ser 
gráficos e envolvem a utilização de recursos computacionais. O objetivo da estatística 
descritiva é tornar as coisas mais fáceis de entender, relatar e discutir. 
Indutiva (ou inferencial): parte de uma ou mais amostras (subconjuntos da população) e 
conclui sobre a população. Utiliza técnicas como a teoria das probabilidades, inferência 
estatística, amostragem. 
 
Com maior freqüência utilizamos o estudo da amostra do que da população, não só por 
serem menos dispendiosas e consumirem menos tempo no processamento dos dados, mas 
também porque muitas vezes não dispomos de todos os elementos da população. 
 
Prof. Cíntia Paese Giacomello 2 
Definições: 
População: coleção completa de todos os elementos (valores, pessoas, medidas,...) a 
serem estudados. 
Amostra: subcoleção de elementos extraídos da população. 
Censo: coleção de dados relativos a todos os elementos de uma população. 
Amostragem: coleção de dados relativos a elementos de uma amostra. 
 
Exemplo: 
População Amostra 
 
 
 
 
Parâmetro: medida numérica que descreve uma característica de uma população 
Estatística: medida numérica que descreve uma característica de uma amostra 
 
 
1.1 Amostragem 
O objetivo da amostragem é permitir fazer inferências sobre uma população após inspeção 
de apenas parte dela. Fatores como custo, tempo, ensaios destrutivos e populações 
infinitas tornam a amostragem preferível a um estudo completo (censo). 
Os principais tipos de amostragem utilizados são os probabilísticos, onde todos os 
indivíduos da população têm a mesma chance de serem selecionados. Os planos de 
amostragem probabilística são delineados de tal modo que se conhece todas as 
combinações amostrais possíveis e suas probabilidades, podendo-se então determinar oerro amostral. 
Os métodos mais comuns de amostragem probabilística são: 
• Amostragem aleatória simples: os elementos de uma população são escolhidos de 
tal forma que todos tenham a mesma chance de serem escolhidos. Pode-se utilizar 
uma tabela de números aleatórios ou um programa de geração de números 
aleatórios. 
• Amostragem estratificada: subdivide-se a população em, no mínimo, dois estratos 
(subpopulações) que compartilham a mesma característica e em seguida escolhe-se 
uma amostra de cada. Exemplo: homens e mulheres. 
• Amostragem sistemática: escolhe-se um ponto de partida e então, 
sistematicamente, selecionam-se os outros. Por exemplo: o 3°, 403°, 803°, 
1203°,... indivíduos 
Prof. Cíntia Paese Giacomello 3 
• Amostragem por conglomerados: divide-se a população em conglomerados (áreas), 
em seguida sorteiam-se algumas áreas e analisam-se todos os elementos dos 
conglomerados escolhidos. Por exemplo: bairros. 
 
 
Fonte: Triola, Mário. 1999, 11. 
 
Amostragens não probabilísticas são utilizadas quando a população em estudo é muito 
pequena ou de difícil obtenção. Neste caso a análise de uma amostra poderia causar 
distorções. Uma pessoa familiarizada com a população pode indicar melhor as unidades 
amostrais. Este tipo de amostragem não permite avaliar o erro amostral. EX: doença rara. 
Prof. Cíntia Paese Giacomello 4 
1.2 Tipos de variáveis 
Alguns conjuntos de dados consistem em números, enquanto outros são não numéricos. 
Utiliza-se a nomenclatura de dados (ou variáveis) qualitativos e quantitativos. 
 
 
 
 
 
 
 
 
 
 
 
 
 
Exercícios: 
Identifique cada número como discreto ou contínuo 
1. Cada cigarro Camel tem 16,13 mg de alcatrão 
2. O altímetro de um avião da American Airlines indica uma altitude de 21.359 pés 
3. Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são assinante de um 
serviço de informação on-line. 
4. O tempo total gasto anualmente por um motorista de táxi de Nova York ao dar 
passagem a pedestres é de 2367 segundos. 
 
Apresente dois exemplos de dados discretos ou contínuos de sua empresa / pesquisa. 
Quantitativas Qualitativas 
Discretas Contínuas 
Variáveis 
Prof. Cíntia Paese Giacomello 5 
22 SSéérriieess eessttaattííssttiiccaass 
Consiste no agrupamento dos dados estatísticos em tabelas. 
Em qualquer série estatística são observados três elementos fundamentais: 
• O fato, isto é, o que está sendo observado 
• O espaço geográfico 
• A época 
Estes elementos criam classificações para as séries: específicas, temporais ou geográficas. 
 
Séries temporais (ou históricas) 
Os dados estão reunidos de acordo com o tempo, que varia. Os outros dois fatores - local 
e fato - permanecem inalterados. 
 
 
 
 
 
 
 
 
 
 
Séries geográficas 
Os dados estão reunidos de acordo com o local, que varia. Os outros dois fatores - fato e 
data - permanecem inalterados. 
 
 
 
 
 
 
 
 
Prof. Cíntia Paese Giacomello 6 
Séries específicas 
Os dados estão reunidos de acordo com o evento, que varia. Os outros dois fatores - local 
e data - permanecem inalterados. 
 
 
 
 
 
 
 
 
 
 
As séries podem ainda apresentar-se sob a forma mista, resultante da combinação dos 
fatores. 
 
 
 
 
 
 
 
 
 
 
33 GGrrááffiiccooss 
Os gráficos consistem em uma forma de apresentação dos dados, usualmente utilizada 
pois facilita a interpretação dos resultados. 
São elementos complementares de um gráfico: 
• Título geral, época e local 
• Escalas e respectivas unidades de medida 
• Indicação das convenções adotadas (legenda) 
• Fonte de informação dos dados 
 
Prof. Cíntia Paese Giacomello 7 
Principais tipos de gráficos: (Fonte: Site da Microsoft – www.microsoft.com.br) 
 
Colunas 
Um gráfico de colunas mostra as alterações 
de dados em um período de tempo ou 
ilustra comparações entre itens. As 
categorias são organizadas na horizontal e 
os valores são distribuídos na vertical, para 
enfatizar as variações ao longo do tempo. 
Gráficos de colunas empilhadas mostram o relacionamento de itens individuais com o todo 
. O gráfico de colunas em perspectiva 3D 
compara pontos de dados ao longo dos dois 
eixos. 
Nesse gráfico 3D, você pode comparar o 
desempenho das vendas de quatro 
trimestres na Europa com o desempenho de 
outras duas divisões. 
Vendas por local 
 
 
 
 
Barras 
Um gráfico de barras ilustra comparações 
entre itens individuais. As categorias são 
organizadas na vertical e os valores na 
horizontal para enfocar valores de 
comparação. 
 
 
Gráficos de barras empilhadas mostram o 
relacionamento de itens individuais com o 
todo. 
 
Vendas por produto 
 
 
 
Prof. Cíntia Paese Giacomello 8 
Linha 
Um gráfico de linhas mostra 
tendências nos dados em 
intervalos iguais. 
A união dos pontos faz sentido 
pois a variável é contínua. 
Meses usualmente são 
tratados como variáveis 
contínuas 
 
Valor de venda do produto X 
 
 
 
Pizza 
Um gráfico de pizza mostra o tamanho 
proporcional de itens que constituem uma série 
de dados para a soma dos itens. Ele sempre 
mostra somente uma única série de dados, sendo 
útil quando você deseja dar ênfase a um 
elemento importante. 
Totaliza a informação (100%). Cada faixa do 
gráfico é proporcional à informação. 
 
 
 
Para facilitar a visualização de fatias pequenas, você pode 
agrupá-las em um único item do gráfico de pizza e 
subdividir esse item em um gráfico de pizza ou de barras 
menor, ao lado do gráfico principal. 
 
 
Diagrama de Dispersão (Dispersão XY) 
Um gráfico xy (dispersão) mostra a 
relação existente entre os valores 
numéricos em várias séries de dados ou 
plota dois grupos de números como uma 
série de coordenadas xy. Esse gráfico 
mostra intervalos irregulares ou clusters 
de dados e é usado geralmente para 
dados científicos. 
Relação entre tempo e temperatura 
 
Prof. Cíntia Paese Giacomello 9 
 
 
Histograma 
É um gráfico de colunas, porém utilizado 
para apresentar distribuições de 
freqüências. 
Apresenta as classes ao longo do eixo 
horizontal e as freqüências (absolutas ou 
relativas) ao longo do eixo vertical. As 
fronteiras das “barras” coincidem com os 
pontos extremos dos intervalos de classe. 
Distribuição da quantidade produzida 
0.00
0.05
0.10
0.15
0.20
0.25
0.30
3 a 8 8 a 13 13 a 18 18 a 23 23 a 28 28 a 33
Safras (alq.)
%
 
da
s 
ár
v
o
re
s
 
 
Área 
Um gráfico de área enfatiza a 
dimensão das mudanças ao longo do 
tempo. Exibindo a soma dos valores 
plotados, o gráfico de área mostra 
também o relacionamento das partes 
com um todo. 
Nesse exemplo, o gráfico de área 
enfatiza o aumento das vendas em 
Washington e ilustra a contribuição 
de cada estado para o total das 
vendas. 
 
 
Superfície 
Um gráfico de superfície é útil quando 
você deseja localizar combinações 
vantajosas entre dois conjuntos de dados. 
Como em um mapa topográfico, as cores e 
os padrões indicam áreas que estão no 
mesmo intervalo de valores. 
Esse gráfico mostra as várias combinações 
de temperatura e tempo que resultam na 
mesma medida de resistência à tração. 
 
Prof. Cíntia Paese Giacomello 10 
 
 
Radar 
Um gráfico de radar compara os 
valores agregados de várias séries de 
dados. 
 
Nesse gráfico, a série de dados que 
cobre a maior parte da área, Marca A, 
representa a marca com o maior 
conteúdo de vitamina. 
 
 
 
 
Ações 
O gráfico de alta-baixa-fechamento é usado muitas vezes para ilustrar preços de ações. 
Esse gráfico também pode ser usado comdados científicos para, por exemplo, indicar 
mudanças de temperatura. Você deve organizar seus dados na ordem correta para criar 
esse e outros gráficos de ações. 
 
Um gráfico de ações que mede o volume tem dois eixos de valores: um para as colunas, 
que medem o volume, e outro para os preços das ações. Você pode incluir volume em um 
gráfico de alta-baixa-fechamento ou de abertura-alta-baixa-fechamento. 
 
 
Prof. Cíntia Paese Giacomello 11 
Bolhas 
Um gráfico de bolhas é um tipo de gráfico xy (dispersão). O tamanho do marcador de 
dados indica o valor de uma terceira variável. 
Para organizar seus dados, coloque os valores de x em uma linha ou coluna e insira os 
valores de y e os tamanhos das bolhas correspondentes nas linhas ou colunas adjacentes. 
 
O gráfico nesse exemplo mostra que a Empresa A tem a maioria dos produtos e a maior 
fatia do mercado, mas não necessariamente as melhores vendas. 
 
Cone, cilindro e pirâmide 
Os marcadores de dados em forma de cone, cilindro e pirâmide podem dar um efeito 
especial aos gráficos de colunas e de barras 3D. 
 
 
Rosca 
Como um gráfico de pizza, o gráfico de 
rosca mostra o relacionamento das partes 
com o todo, mas pode conter mais de uma 
série de dados. Cada anel do gráfico de 
rosca representa uma série de dados. 
 
 
 
 
Prof. Cíntia Paese Giacomello 12 
44 DDiissttrriibbuuiiççõõeess ddee ffrreeqqüüêênncciiaass 
Distribuição de freqüência é uma tabela resumida na qual os dados são organizados em 
grupos de classe ou categorias convenientemente estabelecidas e numericamente 
ordenadas. 
As distribuições de freqüências são series heterógrafas, isto é, séries na qual o fenômeno 
ou fato apresenta graduações ou subdivisões. Embora fixo, o fenômeno varia de 
intensidade. 
Nas distribuições de freqüência, os dados são agrupados segundo um critério de 
magnitude, em classe ou pontos, permanecendo constante o fato, local e tempo, de tal 
forma que se possa determinar a percentagem ou número, de cada classe. É um tipo de 
apresentação que condensa uma coleção de dados conforme as freqüências ou repetições 
de seus valores. 
 
A construção da distribuição de freqüência depende do tipo de dado com os quais se está 
lidando: contínuos ou discretos. 
 
4.1 Construção de distribuição de freqüência para dados contínuos 
Os principais estágios são: 
1. Estabelecer a quantidade de classes ou intervalos de grupamento dos dados. O 
número de classes deve variar entre 5 e 15. Aconselha-se utilizar n onde n é o 
número de observações. 
2. Determinar a amplitude das classes. Aconselha-se fazer amplitude / no de classes. 
(OBS: amplitude = maior valor – menor valor) 
3. Enquadrar os dados nas classes, mediante contagem e apresentar os resultados em 
uma tabela ou gráfico 
 
Exemplo: 
Os dados a seguir representam o tempo (em minutos) que 45 operadores de máquina 
demoraram para fazer o setup de uma máquina. 
6,5 4,0 7,1 8,3 5,4 7,6 9,0 15,7 16,7 
6,4 5,0 8,5 5,7 7,7 7,2 12,4 7,1 5,5 
9,7 4,4 7,0 6,3 8,3 6,9 5,7 7,6 7,9 
7,9 6,0 8,2 10,4 9,9 3,9 9,8 8,2 5,6 
7,9 6,4 7,4 7,0 13,0 8,7 6,4 6,7 7,4 
 
1 – Número de classes � 45 valores � 45 =6,7 ≅ 7 classes 
2 – Amplitude das classes � 16,7 – 3,9 = 12,8 (Maior valor = 16,7; Menor valor = 
3,9). Logo, tem-se a amplitude das classes 12,8 / 7 = 1,83 ≅ 2 
 
Prof. Cíntia Paese Giacomello 13 
3 – Escrever as classes e contar os valores 
 
Tempo 
(minutos) 
Número de 
operadores 
% de 
operadores 
3 –| 5 4 8,9% 
5 –| 7 15 33,3% 
7 –| 9 18 40,0% 
9 –| 11 4 8,9% 
11 –| 13 2 4,4% 
13 –| 15 0 0,0% 
15 –| 17 2 4,4% 
Total 45 100% 
 
3 –| 5 equivale a 3 < x ≤ 5 
Ou seja, são contados no 
intervalo todos os valores 
superiores a 3 e inferiores ou 
iguais a 5. 
 
 
A freqüência absoluta (fi) corresponde ao número de operadores 
A freqüência relativa (fri) corresponde ao percentual de operadores 
 
4.2 Gráficos das distribuições de freqüência 
Histograma de freqüências 
Análise dos tempos para fazer o setup da máquina
4
15
18
4
2
0
2
0
2
4
6
8
10
12
14
16
18
20
3 –| 5 5 –| 7 7 –| 9 9 –| 11 11 –| 13 13 –| 15 15 –| 17
Tempo (minutos)
N
úm
e
ro
 
de
 
op
er
a
do
re
s
 
Uma alternativa ao histograma de freqüências é o polígono de freqüências, construído 
mediante a conexão dos pontos médios dos intervalos do histograma, com linhas retas. 
Prof. Cíntia Paese Giacomello 14 
Análise dos tempos para fazer o setup da máquina
4
15
18
4
2
0
2
0
2
4
6
8
10
12
14
16
18
20
3 –| 5 5 –| 7 7 –| 9 9 –| 11 11 –| 13 13 –| 15 15 –| 17
Tempo (minutos)
N
úm
er
o 
de
 
op
er
ad
or
es
 
OBS: uma vez que a área do polígono deve ser 100%, deve-se ligar o primeiro e o último 
pontos médios com o eixo horizontal, de modo a cercar a área da distribuição observada. 
 
Exercícios: 
1. A tabela de dados representa o peso de 30 sacos de arroz da marca A selecionados 
aleatoriamente em um supermercado. Construa a distribuição de freqüências e 
apresente em um gráfico. (para facilitar os dados já estão ordenados) 
922 930 936 950 954 954 958 965 968 974
977 979 987 989 1001 1006 1008 1010 1013 1017
1018 1034 1034 1035 1042 1044 1044 1048 1070 1116
 
 
2. Construa a distribuição de freqüência e o polígono de freqüências. 
6,2 9,0 12,2 14,7 7,9 9,8 8,0 13,3 13,3 8,9 
8,8 8,3 11,8 11,8 14,7 8,5 7,7 11,4 11,2 10,6 
 
 
 
 
 
 
 
 
 
Prof. Cíntia Paese Giacomello 15 
4.3 Construção de distribuição de freqüência para dados discretos 
Na construção de uma distribuição de freqüência utilizando dados contínuos, perde-se 
certa quantidade de informação porque os valores individuais perdem sua identidade 
quando são agrupados em classes. Isso pode ou não ocorrer com dados discretos, 
dependendo da natureza dos dados e os objetivos do analista. 
 
Consideremos os seguintes dados relativos ao número de acidentes diários em um grande 
estacionamento, durante o período de 50 dias. 
1 6 3 6 2 4 5 3 7 9 
5 4 5 3 4 5 6 0 8 4 
4 1 9 5 7 5 5 4 5 8 
4 5 3 2 6 7 4 3 1 4 
0 0 5 4 2 6 6 2 8 7 
 
Note que os dados estão entre 0 e 9. 
Podemos construir uma distribuição de freqüência sem perda dos valores originais, 
utilizando os próprios valores. 
 
 
Classe Freqüência dias 
% dos 
dias 
0 3 0,06 
1 3 0,06 
2 4 0,08 
3 5 0,10 
4 10 0,20 
5 10 0,20 
6 6 0,12 
7 4 0,08 
8 3 0,06 
9 2 0,04 
 50 1,00 
0
2
4
6
8
10
12
0 1 2 3 4 5 6 7 8 9
Nú
m
er
o 
de
 
di
as
 
 
Não houve perda de informação, ou seja, poderíamos construir a tabela original a partir da 
distribuição de freqüências. 
Prof. Cíntia Paese Giacomello 16 
Por outro lado, poderíamos usar como classes 0-1, 2-3, 4-5, 6-7 e 8-9. 
 
Classe 
Freqüência 
dias 
% dos 
dias 
0-1 6 0,12 
2-3 9 0,18 
4-5 20 0,40 
6-7 10 0,20 
8-9 5 0,10 
 50 1,00 
0
5
10
15
20
25
0-1 2-3 4-5 6-7 8-9
Nú
m
er
o
 
de
 
dia
s
 
 
De modo geral prefere-se uma distribuição de freqüência sem perda de informação 
quando: 
• Os dados são constituídos de valores inteiros. 
• Há menos de, digamos, 16 classes. 
• Há suficientes observações para originar uma distribuição significativa 
 
Por outro lado, prefere-se uma distribuição de freqüência com perda da informação 
quando: 
• Estão em jogo inteiros e não inteiros 
• Só existem inteiros, porém em número muito alto para permitir uma distribuição 
útil. 
• A perda da informação é de importância secundária (por exemplo, o 
arredondamento do peso de um caminhão ou da renda anual para a unidade mais 
próxima) 
Prof.Cíntia Paese Giacomello 17 
4.4 Construção de uma distribuição de freqüência acumulada 
Uma distribuição de freqüência acumulada tem por objetivo indicar o número ou 
percentual de itens menores do que, ou iguais a, determinado valor. 
No caso dos acidentes podemos construir distribuições acumuladas para a distribuição com 
e sem perda da informação. 
 
Sem perda da informação 
Classe N° dias % dias Freqüências 
acumuladas 
0 3 0,06 0,06 
1 3 0,06 0,12 
2 4 0,08 0,20 
3 5 0,10 0,30 
4 10 0,20 0,50 
5 10 0,20 0,70 
6 6 0,12 0,82 
7 4 0,08 0,90 
8 3 0,06 0,96 
9 2 0,04 1,00 
 50 1,00 
 
Com perda da informação 
Classe N° dias % dias Freqüências 
acumuladas 
0-1 6 0,12 0,12 
2-3 9 0,18 0,30 
4-5 20 0,40 0,70 
6-7 10 0,20 0,90 
8-9 5 0,10 1,00 
 50 1,00 
Podemos, pela primeira tabela, concluir que 90% dos dados correspondem a valores 
menores ou iguais a 7. ou seja, Em 90% dos dias o número de acidentes não excede 7. 
 
 
 
Prof. Cíntia Paese Giacomello 18 
0.0
0.2
0.4
0.6
0.8
1.0
0 1 2 3 4 5 6 7 8 9
0.0
0.2
0.4
0.6
0.8
1.0
0-1 2-3 4-5 6-7 8-9
 
 
Os polígonos de freqüências acumuladas são também chamados de ogivas. 
0,0
0,2
0,4
0,6
0,8
1,0
0 1 2 3 4 5 6 7 8 9
N. acidentes
%
 d
o
s 
d
ia
s
 
 
4.5 Distribuições de freqüência para dados nominais e por postos 
As distribuições de freqüências para dados nominais se assemelham às distribuições de 
freqüência normais, porém apresentam as categorias em lugar das classes. 
Por exemplo: 
 Vendas 
absolutas 
Vendas 
relativas 
Limão 600 0,375 
Laranja 400 0,250 
Melão 300 0,188 
Melancia 200 0,125 
Abacaxi 100 0,063 
Total 1600 1,000 
 
Usa-se o gráfico de barras ou colunas para representar dados nominais. 
 
Prof. Cíntia Paese Giacomello 19 
4.6 Gráficos para distribuições de freqüência 
A distribuição de freqüência é muitas vezes utilizada para determinar o formato da 
distribuição. A distribuição dos dados pode ser simétrica ou não. 
 
 
 
 
 
 
 
 
Exercício: 
Construa a distribuição de freqüência e desenhe o histograma dos dados a seguir. Qual é 
o formato da distribuição? 
20,7 18,7 26,2 21,7 18,8 20,6 20,7 20,2 
18,5 21,3 19,3 18,3 25,1 18,8 24,3 28,4 
23,3 25,3 20,4 18,3 24,0 21,2 19,4 20,6 
18,9 26,6 22,4 18,9 22,6 21,4 27,0 23,6 
28,3 20,3 21,7 18,2 20,3 19,2 24,7 18,4 
 
 
 
 
 
Distribuições discretas 
Simétrica Assimétrica à esquerda Assimétrica à direita 
Prof. Cíntia Paese Giacomello 20 
55 MMeeddiiddaass ddee tteennddêênncciiaa cceennttrraall 
As medidas de tendência central são usadas para indicar um valor que tende a representar 
melhor um conjunto de números. As três medidas mais usadas são a média, a mediana e a 
moda. 
 
5.1 Média 
5.1.1 Média aritmética 
A média aritmética é o resultado da divisão da soma de todos os valores da amostra pela 
quantidade total de valores. 
 
 
 
 
 
OBS: x lê-se X barra e significa média. ∑
=
n
i
ix
1
 lê-se somatório de x i, i variando de 1 a n. 
∑
=
+++=
n
i
ni x...xxx
1
21 
 
Se um estudante faz quatro provas, obtendo as notas 70, 60, 80 e 75, sua média é: 71,25. 
 
Algumas propriedades da média 
• A média de um conjunto de dados pode ser sempre calculada. 
• Para um dado conjunto de números, a média é única. 
• A média é sensível a (ou afetada por) todos os valores do conjunto, assim, se um 
número se modifica, a média também se modifica. 
• Somando-se uma constante a cada valor do conjunto, a média ficará aumentada do 
valor constante. Analogamente, extraindo-se um valor constante de cada valor do 
conjunto, a média também ficará diminuída desse valor. 
• A soma dos desvios dos números de um conjunto a contar da média é zero. 
 
n
x
x
n
i
i∑
=
=
1 ou simplesmente 
n
x
x
∑
= 
Prof. Cíntia Paese Giacomello 21 
5.1.2 Média ponderada 
A fórmula anterior para calcular a média aritmética supõe que cada observação tenha a 
mesma importância. A média ponderada considera que as informações não tem a mesma 
importância, ou seja, devem ser levados em conta o peso das informações. 
 
 
 
 
 
Onde wi é o peso da observação de ordem i. 
 
Consideremos que um professor informe a classe de que haverá dois exames parciais, 
valendo cada um 30% da nota e um exame final valendo 40%. Um aluno obtém 
desempenho 70 na primeira avaliação, 65 na segunda e 80 no exame final. 
Média ponderada = 5072
001
400803006530070
1
1 ,
,
,x,x,x
w
xw
n
i
i
n
i
ii
=
++
=
∑
∑
=
= 
5.1.3 Média geométrica 
A média geométrica é utilizada quando se deseja fazer a média de taxas de juro, por 
exemplo. Neste caso, multiplicam-se os n termos e em seguida extraí-se a raiz de ordem 
n. 
A média geométrica é o resultado da raiz de ordem n do produto de todos os valores da 
amostra. 
 
 
 
OBS: n
n
i
i x...xxxx 321
1
=∏
=
 lê-se produtório de x i, i variando de 1 a n. 
 
5.1.4 Média harmônica 
A média harmônica de um conjunto de n números é a recíproca da média aritmética dos 
recíprocos dos números. 
Média geométrica = n
n
i
ix∏
=1
 
Média ponderada =
∑
∑
=
=
n
i
i
n
i
ii
w
xw
1
1 
Prof. Cíntia Paese Giacomello 22 
 
 
5.1.5 Relação entre as médias aritmética, geométrica e harmônica 
A média geométrica de um conjunto de números positivos é menor ou igual à sua média 
aritmética, mas é maior ou igual à sua média harmônica. 
Em símbolos: xGH ≤≤ 
O sinal de igualdade vale somente quando todos os números forem iguais. 
Exemplo: o conjunto 2,4 e 8 tem média aritmética 4,67, média geométrica 4 e média 
harmônica 3,43. 
 
 
5.1.6 Cálculo da média para uma distribuição de freqüência 
A média de uma distribuição de freqüência é calculada com base valor e na freqüência de 
cada classe. 
n
xf
x ii∑= 
 
Onde fi é a freqüência da classe i. 
Para dados com perda da informação, utiliza-se em lugar de x i o ponto médio do intervalo. 
 
Exemplo: 
Classe Ponto médio (x i) N° dias (f i) f i xi 
0-1 0,5 6 3,0 
2-3 2,5 9 22,5 
4-5 4,5 20 90,0 
6-7 6,5 10 65,0 
8-9 8,5 5 42,5 
 n = 50 223 
464
50
223
,
n
xf
x ii === ∑ 
 
Média harmônica = 
∑∑
=
−
x
n
xn
n
i i
111
1
1
 
Prof. Cíntia Paese Giacomello 23 
 
Classe (x i) N° dias (f i) f i xi 
0 3 0 
1 3 3 
2 4 8 
3 5 15 
4 10 40 
5 10 50 
6 6 36 
7 4 28 
8 3 24 
9 2 18 
 50 222 
444
50
222
,
n
xf
x ii === ∑ 
 
Se fizéssemos a média a partir da tabela original obteríamos o valor de 4,44. 
 
5.2 Mediana 
A principal característica da mediana é dividir o conjunto de números em dois grupos 
iguais: a metade terá valores inferiores ou iguais à mediana e a metade terá valores 
superiores ou iguais à mediana. 
Para calcular a mediana inicia-se ordenando os valores em ordem crescente. Em seguida 
conta-se até a metade deles. Em geral a mediana ocupa a posição (n+1)/2. 
Para número ímpar de valores a mediana é o valor do meio. Para amostras com número 
par de unidades, a mediana é a média dos dois valores centrais. 
 
Exemplos: 
Amostra Número de elementos Dados ordenados Mediana 
2 3 3 4 2 5 1 4 5 9 elementos � ímpar 1 2 2 3 3 4 4 5 5 3 
2 4 3 1 7 3 8 9 2 4 10 elementos � par 1 2 2 3 3 4 4 7 8 9 3,5 
3 4 2 3 1 5 3 2 
6 7 3 2 5 2 3 6 2 1 
 
Prof. Cíntia Paese Giacomello 24 
Uma medida semelhante à mediana é o quartil. Os quartis dividem o conjunto ordenado de 
dados em quatro grupos iguais. 25% dos valores são inferiores ao primeiro quarti(Q1), 
25% estão entre Q1 e a mediana, 25% estão entre a mediana e o terceiro quartil (Q3). 
OBS: o segundo quartil corresponde à mediana (Q2=mediana). 
 
 
 
LI Q1 Q2=mediana Q3 LS 
LI = Limite inferior LS=Limite superior 
 
5.2.1 Cálculo da mediana para uma distribuição de freqüência 
Da mesma forma que para dados apresentados em série, a mediana é o ponto que divide 
as informações ao meio. 
 
A mediana pode ser obtida por interpolação, e é dada pela fórmula. 
cf
fn
LMediana
mediana
 
)(
2 1
1












−
+=
∑
 
onde: L1= limite inferior da classe mediana, isso é, da classe que contém a mediana 
 n = número de itens dos dados (freqüência total) 
 (Σf)1=soma de todas as freqüências das classes anteriores à mediana 
 fmediana= freqüência da classe mediana 
 c = amplitude do intervalo da classe mediana 
 
Exemplo: 
No caso dos acidentes, temos 50 observações, logo a mediana deve estar localizada na 
posição (50+1)/2 = 25,5, ou seja, a classe que contém a mediana é a classe 4-5. 
O limite inferior da classe mediana é 4. Antes da classe mediana ((Σf)1) haviam “passado” 
15 dados. A classe mediana contém 20 observações e a amplitude da classe mediana é 1. 
Então 
545041
20
15
2
50
4 ,,xMediana =+=












−
+= 
Prof. Cíntia Paese Giacomello 25 
5.3 Moda 
A moda é o valor que aparece com maior freqüência na amostra. Um conjunto de dados 
pode não apresentar moda, apresentar uma moda, duas modas (bimodal), três modas 
(trimodal) ou mais modas (polimodal). 
 
Exemplo: 
A moda do conjunto 2 3 4 3 2 3 5 1 2 é 3, pois o três é o valor que mais vezes aparece. 
 
5.3.1 Cálculo da moda para uma distribuição de freqüência 
Quando não há perda da informação, a moda é idêntica ao valor da classe modal, que é a 
classe com maior freqüência. 
Quando há perda da informação, a moda representa o(s) valor(es) de X 
correspondente(m) ao(s) ponto(s) de ordenada(s) máxima(s) da curva e pode ser 
calculada pela fórmula: 
 
cLModa 





∆+∆
∆
+=
21
1
1 
onde: L1=limite inferior da classe modal (isto é, a classe que contém a moda) 
 ∆1=excesso da freqüência modal sobre a da classe imediatamente anterior 
∆2= excesso da freqüência modal sobre a da classe imediatamente posterior 
c = amplitude da classe modal 
 
Exemplo: 
No caso dos acidentes.... 
Classe N° dias (f i) 
0-1 6 
2-3 9 
4-5 20 
6-7 10 
8-9 5 
 n = 50 
52452041
1011
114 ,,Moda =+=





+
+= 
Classe modal 
Prof. Cíntia Paese Giacomello 26 
A distribuição pode ter mais de uma moda, sendo bimodal ou de modas múltiplas. OBS: as 
duas modas não precisam, necessariamente, ter a mesma freqüência. Isso acontece 
quando há um deslocamento da distribuição. 
 
 
 
 
 
 
 
5.4 Relação entre as medidas de tendência central 
Para as curvas de freqüência unimodal moderadamente inclinadas (assimétricas) vigora a 
relação empírica 
Média – Moda = 3 (Média – Mediana) 
 
 
 
 
 
 
 
Exercícios: 
1. Para os seguintes conjuntos de dados, determine os valores da média aritmética, 
média geométrica, média harmônica, mediana e moda. 
a) 12 15 16 15 12 15 15 5 7 14 
 
 
b) 2 6 3 6 3 3 4 
 
 
c) 2 8 3 10 2 1 6 9 4 3 
 
 
d) 38 38 70 92 22 17 
 
Moda Classe modal Classes modais Classes modais 
Mediana 
Média 
Moda 
Mediana 
Média 
Moda Mediana 
Média 
Moda 
Prof. Cíntia Paese Giacomello 27 
2. Determine Q1, Q2 e Q3 nos conjuntos de dados que seguem: 
a) 15 15 4 7 16 16 4 11 7 
 8 19 7 6 12 17 16 9 20 
 16 14 3 12 4 9 8 3 16 
 
 
b) 4 12 4 7 4 9 11 12 5 8 9 4 
 
 
3. Qual seria o efeito sobre a média de um conjunto de dados se se adicionasse 10: 
a) a um dos números? b) a cada um dos números? 
 
 
4. João possui 5 imóveis localizados nesta cidade. Ele deseja saber qual o valor 
médio, por metro quadrado, das suas propriedades. Sabendo que imóveis no centro 
valem R$ 450,00/m2 e imóveis em bairros valem R$ 300,00/m2, calcule o valor 
médio por m2 do seu capital. 
Apartamento de 80 m2 no centro 
Pavilhão de 450 m2 no bairro 
Casa de 280 m2 no centro 
Apartamento de 120 m2 no bairro 
Casa de 320 m2 no bairro 
 
Prof. Cíntia Paese Giacomello 28 
66 MMeeddiiddaass ddee vvaarriiaabbiilliiddaaddee 
As medidas de variabilidade ou dispersão indicam se os valores estão relativamente 
próximos ou não uns dos outros. 
Na análise de um conjunto de dados é necessário que sejam observados tanto as 
informações relativas à localização (medidas de tendência central) quanto as informações 
de dispersão (medidas de variabilidade). 
Exemplo: 
 
 
 
 
 
 
Exemplo: 
Duas máquinas estão sendo comparadas. A seguir está descrita a produção de cada uma 
durante 5 dias. 
 Produção Média 
Máq 1 10 10 10 10 10 10 
Máq 2 5 18 8 3 16 10 
Você acha que a programação da produção para as duas máquinas pode ser a mesma 
durante 1 semana? Por quê? 
 
 
Consideraremos quatro medidas de dispersão: amplitude, variância, desvio padrão e 
coeficiente de variação. Todas elas, exceto a amplitude, têm na média o ponto de 
referência. Em cada caso, o valor zero indica ausência de variação; a dispersão aumenta à 
proporção que aumenta o valor da medida (intervalo, variância, etc.). 
6.1 Amplitude 
Também conhecida como intervalo. 
A amplitude de um grupo de dados é, de modo geral, mais simples de calcular e de 
entender. Consiste na diferença entre o maior e o menor valor, ou seja, entre os valores 
extremos. 
 
Amplitude = Xmax - X mín 
 
Pequena variabilidade 
Grande variabilidade 
Prof. Cíntia Paese Giacomello 29 
A maior limitação da amplitude é o fato de só levar em conta os valores extremos de um 
conjunto, nada informado sobre os outros valores. 
 
Exemplo: 
1. Calcule a amplitude dos seguintes conjuntos de dados. Você acha que a dispersão 
dos conjuntos é igual? 
a) 15 15 12 14 16 16 4 15 
b) 5 4 5 4 6 5 16 4 
 
 
6.2 Variância 
Calcula-se a variância de uma amostra elevando-se as diferenças de cada um dos valores 
em relação à média, somando-se estas diferenças e dividindo-se por n-1. 
1
2
2
−
−
=
∑
n
)xx(
s ix 
 
Quando se deseja a variância populacional, deve-se substituir n-1 por n na fórmula. 
Usualmente iremos utilizar a variância amostral. 
 
Exemplo: 
Cálculo da variância do conjunto de dados 2,4,6,8, e 10. 
 
x i x xx i − ( xx i − )
2 
2 6 -4 16 
4 6 -2 4 
6 6 0 0 
8 6 2 4 
10 6 4 16 
Somas 0 40 
10
15
40
1
2
2
=
−
=
−
−
=
∑
n
)xx(
s ix 
 
 
6.3 Desvio padrão 
O desvio padrão é simplesmente a raiz quadrada da variância. Assim se a variância é 81, o 
desvio padrão será 9. 
Prof. Cíntia Paese Giacomello 30 
( )
11
2
2
2
−








−
=
−
−
=
∑ ∑
∑
n
n
x
x
n
)xx(
s
i
i
i
x 
 
Como anteriormente, a substituição de n-1 por n produz as fórmulas para a população. 
A unidade na qual o desvio padrão é expresso é a mesma dos dados originais, ou seja, se 
os dados são em Reais, o desvio padrão também vai ser em reais (e a variância em 
reais2). 
 
Exemplo: 
Cálculo do desvio padrão do conjunto de dados 20, 5, 10, 15 e 25. 
Usando a fórmula normal: 
x i x xx i − ( xx i − )
2 
20 15 5 25 
5 15 -10 100 
10 15 -5 25 
15 15 0 0 
25 15 10 100 
Somas 0 250 
917562
15
250
1
2
,,
n
)xx(
s ix ==
−
=
−
−
=
∑Usando a fórmula simplificada: 
∑ =++++= 75251510520ix 
∑ =++++= 1375251510520 222222ix 
( )
917
15
250
15
5
751375
1
2
2
2
,
n
n
x
x
s
i
i
x =
−
=
−
−
=
−








−
=
∑ ∑
 
 
6.4 Coeficiente de variação 
O coeficiente de variação é uma medida de variação útil para comparar conjuntos de 
dados diferentes. Ele é usualmente expresso em percentual. 
 
O coeficiente de variação é dado pelo quociente entre o desvio padrão e a média dos 
dados. 
Prof. Cíntia Paese Giacomello 31 
X
S
Média
padrão Desvio
CV x== 
 
Exemplo: 
Entre os conjuntos de dados a seguir apresentados, qual apresenta maior variabilidade? 
Conjunto A Conjunto B 
12 3 
25 4 
16 5 
23 2 
Solução: 31870
19
066
,
,
MédiaA
 APadrão Desvio
CVA === 
36880
53
291
,
,
,
MédiaB
B Padrão Desvio
CVB === 
Então o conjunto que possui maior variabilidade é o conjunto B. 
 
Exercícios: 
1. O desvio padrão pode ser zero? Explique. Pode ser negativo? Explique. 
 
 
2. Calcule a média e o desvio padrão para as vendas diárias. 
R$ 8100 R$ 9000 R$ 4580 R$ 5600 R$ 7680 R$ 4800 R$ 10640 
 
 
3. Consideremos os seguintes dados correspondentes a preços de propostas. 
26,5 27,5 25,5 26,0 27,0 23,4 25,1 26,2 26,8 
Calcule a amplitude, a variância, o desvio padrão, a média, moda, mediana e os 
quartis 
 
77 MMeeddiiddaass ddee aassssiimmeettrriiaa ee ccuurrttoossee 
As medidas de assimetria e curtose indicam qual o formato da distribuição dos dados em 
relação à distribuição normal (descrita adiante). 
Assimetria é o grau de desvio, ou afastamento da simetria, de uma distribuição. Ela 
retorna a distorção de uma distribuição. O valor enviesado caracteriza o grau de assimetria 
de uma distribuição em torno de sua média. Um valor positivo indica uma distribuição com 
uma ponta assimétrica que se estende em direção a valores mais positivos. Um valor 
Prof. Cíntia Paese Giacomello 32 
negativo indica uma distribuição com uma ponta assimétrica que se estende em direção a 
valores mais negativos. No excel a função correspondente é distorção. 
Assimetria = ∑ 




 −
−−
3
21 s
xx
)n)(n(
n i 
 
 
 
 
 
 
A curtose é o grau de achatamento de uma distribuição e caracteriza uma distribuição em 
cume ou plana se comparada à distribuição normal (chamada mesocúrtica). A curtose 
positiva indica uma distribuição relativamente em cume (chamada leptocúrtica). A curtose 
negativa indica uma distribuição relativamente plana (chamada platicúrtica). A função 
correspondente no excel chama-se CURT, e calcula a curtose de um conjunto de dados de, 
no máximo, 30 valores. 
Curtose = 
)n)(n(
)n(
s
xx
)n)(n)(n(
)n(n i
32
13
321
1 24
−−
−
−













 −
−−−
+
∑ 
 
 
 
 
 
 
 
 
Simétrica 
a=0 
Assimétrica negativa 
a<0 
Assimétrica positiva 
a>0 
Mesocúrtica 
c=0 
Platicúrtica 
c<0 
Leptocúrtica 
c>0 
Prof. Cíntia Paese Giacomello 33 
88 IInnttrroodduuççããoo àà pprroobbaabbiilliiddaaddee 
 
As origens da probabilidade remontam ao século XVI. As aplicações iniciais referiam-se 
quase todas a jogos de azar. Os jogadores aplicavam o conhecimento da teoria das 
probabilidades para planejar estratégias de apostas. 
Atualmente a utilização das probabilidades ultrapassou de muito o âmbito desses jogos. 
Hoje os governos, as empresas, as organizações profissionais incorporam a teoria das 
probabilidades em seus processos diários de deliberações. 
Independentemente de qual seja a aplicação em particular, a utilização das probabilidades 
indica que existe um elemento de acaso, ou de incerteza, quanto à ocorrência ou não de 
um evento futuro. Assim é que, em muitos casos, pode ser virtualmente impossível afirmar 
por antecipação o que ocorrerá, mas é possível dizer o que pode ocorrer. 
Há numerosos exemplos de tais situações no campo dos negócios e do governo. A previsão 
da procura de um novo produto, o cálculo dos custos da produção, a previsão das safras, 
a compra de apólices de seguros, a avaliação da redução de impostos sobre a inflação. As 
probabilidades são úteis pois ajudam a desenvolver estratégias. 
O ponto central em todas as situações é a possibilidade de quantificar quão provável é 
determinado evento. 
As probabilidades são utilizadas para exprimir a chance de ocorrência de determinado 
evento. O estudo das probabilidades é importante pois elas são a base para o estudo 
estatístico. 
 
8.1 Experimento aleatório 
Experimentos aleatórios são aqueles que, mesmo repetidos várias vezes sob condições 
semelhantes, apresentam resultados imprevisíveis. 
Características dos experimentos aleatórios: 
1. Podem ser repetidos indefinidamente sob as mesmas condições. 
2. Não se pode adiantar um resultado particular, mas pode-se descrever todos os 
resultados possíveis 
3. Se repetidos muitas vezes apresentarão uma regularidade em termos de 
freqüência de resultados. 
Exemplos: lançamento de uma moeda, lançamento de um dado, aposta na loteria, .... 
 
Ao descrever um experimento aleatório deve-se especificar não somente que operação ou 
procedimento deva ser realizado, mas também o que deverá ser observado. (Note a diferença 
entre o 2o e o 3o) 
• Joga-se um dado e observa-se o número obtido na face superior. 
• Joga-se uma moeda 4 vezes e o observa-se o número de caras obtido. 
Prof. Cíntia Paese Giacomello 34 
• Joga-se uma moeda 4 vezes e observa-se a seqüência de caras e coroas. 
• Um lote de 10 peças contém 3 defeituosas. As peças são retiradas uma a uma 
(sem reposição) até que a última defeituosa seja encontrada. Conta-se o 
número de peças retiradas. 
• Uma lâmpada nova é ligada e observa-se o tempo gasto até queimar. 
• Lança-se uma moeda até que ocorra uma cara e conta-se então o número de 
lançamentos necessários. 
• Lançam-se dois dados e anota-se o total de pontos obtidos. 
• Lançam-se dois dados e anota-se o par obtido. 
 
8.2 Espaço amostral 
O espaço amostral (S) de um experimento aleatório é o conjunto de todos os possíveis 
resultados do experimento. 
n(S) é o número de elementos do conjunto S, ou o número de resultados possíveis. 
 
Exemplo: um experimento é o lançamento de uma moeda. Os possíveis resultados são 
cara ou coroa, então, S={cara, coroa}. 
Em dois lançamentos de uma moeda, sendo interessante observar a ordem dos resultados, 
os possíveis resultados são: 1) cara e cara, 2) cara e coroa, 3) coroa e cara e 4) coroa e 
coroa. O espaço amostral é S={(Ca,Ca), (Ca,Co), (Co,Ca) e (Co,Co)}. n(S)=4 
 
8.3 Eventos 
Chama-se de evento qualquer subconjunto do espaço amostral S de um experimento 
aleatório, ou seja, qualquer resultado do espaço amostral. 
n(A) é o número de resultados associados ao evento A. 
 
Exemplo: no lançamento de uma moeda S={cara, coroa}. Um evento de interesse A pode 
ser “obter cara no lançamento de uma moeda” e n(A)=1. 
No lançamento de um dado, o evento de interesse (A) pode ser obter face par e n(A)=3. 
 
8.4 A probabilidade de um evento 
Seja A um evento. A probabilidade deste evento ocorrer é dada por P(A), que é um 
número entre 0 e 1. Quanto mais próxima a probabilidade estiver de 1, maior será sua 
chance de ocorrência. A um evento impossível atribui-se probabilidade 0, enquanto que 
um evento certo tem probabilidade 1. 
Há três maneiras diferentes de calcular ou estimar probabilidades: o método clássico, 
quanto o espaço amostral tem resultados igualmente prováveis. O método empírico, que 
Prof. Cíntia Paese Giacomello 35 
se baseia na freqüência relativade ocorrência de um evento num grande número de 
provas repetidas e o método subjetivo, que utiliza estimativas pessoais de probabilidade, 
baseadas num certo grau de crença. Em geral vamos utilizar o método clássico de cálculo 
de probabilidades. 
 
Quando os resultados são equiprováveis, a probabilidade de cada resultado é função do 
número de resultados possíveis: 
possíveis resultados de total úmeron
 Aevento ao associados resultados de número
)A(P = 
 
Exemplo: 
Experimento: lançar um dado e observar a face superior 
Espaço amostral: S={1,2,3,4,5,6} n(S)=6 
Evento A: face par n(A)=3 
P(A)= 3/6 = ½ = 0,5 ou 50% 
 
OBS: existe uma pequena diferença entre probabilidade e chance de um evento. A probabilidade 
relaciona o número de resultados de A com o número de resultados total, enquanto que chance 
compara o número de resultados de A com o número de resultados de outro evento (B ou C). 
Em uma urna com 5 bolas brancas, 3 vermelhas e 2 azuis, 
A probabilidade de selecionar uma bola branca é P(branca)=5/10=0,5 ou 50% 
E a chance de selecionar uma bola branca é 5:5, que é semelhante a 1:1, o que significa que existe a 
mesma chance de retirar uma bola branca ou uma bola de outra cor. 
 
Exercícios: 
1. Escreva o espaço amostral no lançamento de um dado. Ache a probabilidade 
associada a cada evento. 
 
 
2. Extrai-se uma carta de um baralho de 52 cartas. Determine a probabilidade de: 
a) um valete 
b) uma carta vermelha 
c) um dez de paus 
d) uma figura 
e) uma carta de ouros 
f) um nove vermelho 
 
Prof. Cíntia Paese Giacomello 36 
3. Complete a tabela com os valores calculados da probabilidade dos eventos 
ocorrerem 
 
Experimento Evento P(Evento) 
Lançar uma moeda uma vez Cara 
Lançar um dado uma vez Face 3 
Extrair uma carta de um baralho com 
52 cartas 6 vermelho 
Extrair uma carta de um baralho de 52 
cartas 
Valete de ouros 
 
4. Encontre n(S), n(A) e P(A) no lançamento de dois dados 
Experimento: Lançar dois dados e observar a seqüência dos resultados 
S={(1,1), (1,2), (1,3),.....,(6,4),(6,5),(6,6)} 
N(S)=36 
a. A: apareçam faces iguais 
b. A: a segunda face é o dobro da primeira 
c. A: apareçam somente números ímpares 
d. A: apareçam faces iguais ou a segunda face é o quadrado da primeira 
e. A: a soma das faces é igual a 7 
 
 
5. Há 50 bolas numa urna: 20 azuis, 15 vermelhas, 10 pretas e 5 verdes. Misturam-se 
as bolas. Determine a probabilidade da bola escolhida ser: 
a) Verde 
b) Azul 
c) Verde ou azul 
d) Não-vermelha 
e) Vermelha ou verde 
f) Amarela 
g) Não-amarela 
 
 
Prof. Cíntia Paese Giacomello 37 
6. Um motorista tem uma marca num de seus pneus, e 20% do pneu é visível. Ao 
parar, qual a probabilidade da marca ficar na parte visível? 
 
 
 
7. Um motor tem 6 velas, e uma está defeituosa, devendo ser substituída. Duas estão 
em posição de difícil acesso, o que torna difícil a substituição. 
a) Qual a probabilidade de a vela defeituosa estar em posição difícil? 
b) Qual a de não estar em posição difícil? 
 
 
 
8. Os dados compilados pela gerência de um supermercado indicam que 915 dentre 
1500 clientes compradores de domingo gastam mais de R$ 40,00 em suas compras. 
Estime a probabilidade de um comprador em qualquer domingo gastar mais de R$ 
40,00. 
 
 
9. Uma pesquisa de tráfego levada a efeito das 5 às 6 horas da manhã num trecho de 
uma rodovia federal revelou que, de 200 carros que pararam para uma verificação 
rotineira de segurança, 25 tinham pneus em más condições. Estime a probabilidade 
de um carro que pare naquele trecho ter seus pneus em boas condições 
 
 
 
8.5 Cálculo das probabilidades 
Muitas aplicações da estatística exigem a determinação da probabilidade de combinações 
dos eventos. Há duas características de combinações. Pode ser necessário determinar a 
probabilidade de ambos os eventos acontecerem P(A e B) ou a probabilidade de um deles, 
A ou B, ou seja, P(A ou B). 
 
Em um prédio com 2 elevadores, poderíamos perguntar: Qual a probabilidade de ambos 
elevadores estarem em serviço? Ou então, Qual a probabilidade de um ou outro elevador 
estar em serviço? 
 
Ambos implica P(A e B) 
Um ou outro implica P(A ou B) 
 
Prof. Cíntia Paese Giacomello 38 
Regra da adição: 
A regra da adição leva em conta a ocorrência do evento A ou do evento B ou de ambos os 
eventos e é denotada por P(A∪B). 
 
 
 
 
P(A ou B) = P(A) + P(B) – P(A e B) 
Quando os eventos são mutuamente excludentes (não tem elementos em comum), então a 
probabilidade de ambos é nula e o termo P(A e B) será zero. 
Se A e B são mutuamente excludentes � P(A ou B) = P(A) + P(B) 
 
OBS: Para apresentar os eventos utilizam-se os Diagramas de Venn [apresentados por John Venn 
(1834-1923)], que representam os espaços amostrais e os eventos como círculos, quadrados, ou outra 
figura geométrica conveniente. 
 
 
Exercícios: 
1. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso. 
Qual a probabilidade do número ser par ou maior que 4? 
 
 
2. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso. 
Qual a probabilidade do número ser um número primo ou maior que 8? 
A B
 
Prof. Cíntia Paese Giacomello 39 
Regra da multiplicação 
Considerando-se dois eventos A e B de um mesmo espaço amostral, a probabilidade de A e 
B ocorrerem P(A∩B) é dada por: 
 
 
 
 
 
A probabilidade de A e B é igual à probabilidade de A, dado B, vezes 
a probabilidade de B. 
P(A e B) = P(A|B) P(B) 
Onde P(A|B) é a probabilidade de A ocorrer dado que B tenha ocorrido. 
 
Quando a probabilidade de B ocorrer não depender de A ter ocorrido, dizemos que A e B 
são independentes, e P(B| A)=P(B) 
Se A e B são independentes � P(A e B)=P(A)P(B) 
 
Exemplo 1: Deve-se inspecionar uma grande caixa de peças. Os registros indicam que 2% 
das caixas acusam conteúdo inferior ao estipulado. Escolhidas duas caixas aleatoriamente, 
qual a probabilidade de ambas acusarem conteúdo inferior, admitindo-se que a remessa 
inspecionada é semelhante as anteriores (isto é, 2% de deficientes)? 
P(ambas deficientes)=P(deficiente)P(deficiente) 
 =0,02 x 0,02 
 =0,0004 ou seja, 0,04% de probabilidade das caixas serem defeituosas. 
 
Exemplo 2: Suponha que 20 canetas estão expostas numa papelaria. Seis são vermelhas e 
14 azuis. Do conjunto de 20, iremos escolher 2 canetas aleatoriamente. Qual a 
probabilidade de que as duas canetas selecionadas sejam vermelhas? 
 Neste caso os eventos não são independentes, pois a cor da primeira caneta 
selecionada vai determinar a probabilidade da segunda caneta ser vermelha. 
 Seja A=a segunda caneta selecionada é vermelha 
 B=a primeira caneta selecionada é vermelha 
Desejamos P(A e B) = P(A|B) P(B) = 07890
380
30
20
6
19
5
,=





=











 
A B
 
Prof. Cíntia Paese Giacomello 40 
 
Regras de probabilidade 
P(A ou B), Para eventos não mutuamente excludentes: 
P(A ou B ou ambos) = P(A) + P(B) – P(A e B) 
para eventos mutuamente excludentes: 
P(A ou B) = P(A) + P(B) 
P(A e B), para eventos independentes: 
P(A e B) = P(A) . P(B) 
Para eventos dependentes 
P(A e B) = P(B).P(A/B) ou P(A).P(B/A) 
 
 
Outra forma de apresentar os eventos é através de tabelas de contingência (tabelas com 
cruzamento de classificações). 
Por exemplo: 
 Vermelha Preta Totais 
Ás 2 2 4 
Não ás 24 24 48 
Totais 26 26 52 
 
 
Exercícios 
 
1. Uma urna contém 6 bolas vermelhas e 4 azuis. Em duas bolas consecutivas, sem 
reposição, determine a probabilidade de retirar a primeira azule a segunda 
vermelha. 
 
 
2. Uma urna contém 6 bolas vermelhas e 4 azuis. Em duas bolas consecutivas, com 
reposição, determine a probabilidade de retirar a primeira azul e a segunda 
vermelha. 
 
 
 
3. Em um lote de 12 peças, quatro são defeituosas. Retira-se uma peça e inspeciona-
se. Qual a probabilidade: 
a. Da peça ser defeituosa 
b. Dela não ser defeituosa 
 
 
Prof. Cíntia Paese Giacomello 41 
 
 
4. Uma loja dispõe de pneus novos e recapados. Entre 100 pneus, sabe-se que 30 são 
recapados. 
a. Se um cliente levar um pneu, qual a probabilidade de que ele seja recapado? 
 
b. Se um cliente levar dois pneus, qual a probabilidade de que ambos sejam 
recapados? 
 
 
c. Se um cliente levar 4 pneus, qual a probabilidade de que todos sejam 
recapados? 
 
 
 
 
5. Um dado é lançado 3 vezes. Calcule a probabilidade de que se obtenha face 6 nos 3 
lançamentos. 
 
 
 
 
 
6. Uma urna contém 50 bolas numeradas de 1 a 50. Serão selecionadas 5 bolas, sem 
reposição. Qual a probabilidade de que uma pessoa que tenha feito um jogo 
anotando os 5 número acerte todos? 
 
 
 
 
Prof. Cíntia Paese Giacomello 42 
7. Nos últimos anos, as empresas de cartões de crédito intensificaram esforços no 
sentido de abrir mais contas para alunos de faculdade. Suponha que uma amostra 
de 200 alunos em sua faculdade apresentou as seguintes informações em termos 
de o aluno possuir cartão de crédito bancário e/ou cartão de crédito de viagem e 
entretenimento: 
 
 CC de viagem e entretenimento 
 Sim Não 
Totais 
Sim 60 60 120 
CC bancário 
Não 15 65 80 
 Totais 75 125 200 
 
a. Se um aluno é selecionado aleatoriamente, qual a probabilidade de que o 
aluno possua um cartão de crédito bancário? 
b. Se um aluno é selecionado aleatoriamente, qual a probabilidade de que o 
aluno não possua um cartão de crédito bancário? 
c. Se um aluno é selecionado aleatoriamente, qual a probabilidade de que o 
aluno possua um cartão de crédito bancário e um cartão de viagem e 
entretenimento? 
d. Se um aluno é selecionado aleatoriamente, qual a probabilidade de que o 
aluno não possua um cartão de crédito bancário nem cartão de viagem e 
entretenimento? 
e. Se um aluno é selecionado aleatoriamente, qual a probabilidade de que o 
aluno possua um cartão de crédito bancário ou possua um cartão de viagem 
e entretenimento? 
f. Suponha que um aluno possui um cartão de crédito bancário. Qual a 
probabilidade de que ele possua um cartão de viagem e entretenimento? 
g. Suponha que o aluno não possui um cartão de viagem e entretenimento. 
Qual a probabilidade de que ele ou ela possua um cartão de crédito 
bancário? 
h. Os dois eventos, possuir um cartão de crédito bancário e possuir um cartão 
de viagem e entretenimento, são estatisticamente independentes? Explique. 
 
Prof. Cíntia Paese Giacomello 43 
 
99 DDiissttrriibbuuiiççõõeess ddee pprroobbaabbiilliiddaaddee 
 
O histograma é usado para apresentar dados amostrais (Amostra=conjunto de 
observações extraídas de uma população) 
Por exemplo, 50 valores de satisfação dos clientes são interpretados como uma amostra 
da satisfação de todos os clientes. 
O uso de métodos estatísticos permite que se analise essa amostra e se tire alguma 
conclusão sobre a satisfação dos clientes. 
Uma distribuição de probabilidade é um modelo matemático que relaciona um certo valor 
da variável em estudo com a sua probabilidade de ocorrência. 
 
Há dois tipos de distribuição de probabilidade 
 1. Distribuições Contínuas: Quando a variável que está sendo medida é expressa 
em uma escala contínua, como por exemplo, o peso de peças produzidas, diâmetro, etc. 
2. Distribuições Discretas: Quando a variável que está sendo medida só pode 
assumir certos valores, como por exemplo os valores inteiros 0, 1, 2, etc. 
 
No caso de distribuições discretas, a probabilidade que a variável X assuma um valor 
específico xo é dada por: P {X = xo} = P(xo) 
No caso de variáveis contínuas, as probabilidades são especificadas em termos de 
intervalos: 
 
Relembrando: uma variável aleatória é uma função com valores numéricos, cujos 
valores são determinados por fatores de chance. 
Uma variável aleatória é considerada discreta se toma valores que podem ser 
contados. 
Uma variável aleatória é considerada contínua quando pode tomar qualquer valor 
em determinado intervalo. 
 
{ }P a x b f x dxab≤ ≤ = ∫ ( ) 
Prof. Cíntia Paese Giacomello 44 
Os gráficos a seguir apresentam exemplos de distribuições de probabilidades discreta e 
contínua. 
 
 
Exemplo: 
Distribuição de probabilidade para a variável aleatória “número de caras em duas jogadas 
de uma moeda”. 
 
Resultado 
Número de 
caras 
Valor da V.A. 
Prob. do 
resultado 
 Número de 
caras 
Valor da V.A 
Prob. do 
resultado 
Cara Cara 2 ½ x ½ = ¼ 0 ¼ 
Cara Coroa 1 ½ x ½ = ¼ 
Coroa Cara 1 ½ x ½ = ¼ 
1 ¼ + ¼ = ½ 
Coroa Coroa 0 ½ x ½ = ¼ 2 ¼ 
 Soma = 1 Soma = 1 
 
 
O valor esperado, ou esperança matemática, de uma variável aleatória é E(x), que consiste 
no valor esperado para ela, ou seja, o valor médio da variável. 
∑
=
=
n
i
iixp)x(E
1
 se X é v.a. discreta 
ou 
∫
∞
∞−
= dx f(x) .x)X(E se X é v.a. contínua 
E a variância de X é dada por 22 )]X(E[)X(E)X(Var −= . 
O desvio padrão é )X(Var 
Prof. Cíntia Paese Giacomello 45 
Neste exemplo, o valor esperado é 0 . ¼ + 1 . ½ + 2 . ¼ = 1. 
E a variância é Var(X)=E(X2)-[E(X)]2= E(X2) - 1= (02.¼ + 12 .½ + 22 .¼) –1 =1,5-1=0,5 E 
o desvio padrão = 0,71 
 
Exemplo: um investidor julga que tem 0,4 de probabilidade de ganhar $ 25.000 e 0,6 de 
perder $ 15.000. Seu ganho esperado é de: 
E(X) = 0,4 (25.000) + 0,6 (-15.000) = $ 1.000. 
E a variância é Var(X)=E(X2)-[E(X)]2 
= E(X2) – 1.0002 
=(0,4.25.0002 + 0,6.(-15.000)2)-1.0002 
=(0,4 x 625.000.000 + 0,6 x 225.000.000)-1.0002 
= 250.000.000+ 135.000.000 –1.0002 
= 385.000.000 –1.000.000 
= 384.000.000 
Desvio padrão = $ 19.595,92 
 
 
Exercícios: 
1. O número de chamadas telefônicas recebidas por uma mesa e suas respectivas 
probabilidades para um intervalo de 3 minutos são: 
Número de chamadas 0 1 2 3 4 5 Total 
Freqüência relativa 0,60 0,20 0,10 0,04 0,03 0,03 1,00 
 Em média, quantas chamadas podem ser esperadas num intervalo de três minutos? 
 
2. Um bilhete de loteria tem 0,00001 de chance de dar um prêmio de $ 100.000, 
0,00002 de chance de dar um prêmio de $ 50.000 e 0,004 de chance de um prêmio 
de $ 25. Qual seria o preço justo de venda do bilhete? 
 
3. Uma confeitaria estabeleceu um registro de vendas para certo tipo de bolo. 
Determine o número esperado de bolos encomendados. 
N° bolos/dia 0 1 2 3 4 5 6 7 8 9 Total 
Freqüência relativa 0,02 0,07 0,09 0,12 0,20 0,20 0,18 0,10 0,01 0,01 1,00 
 
Prof. Cíntia Paese Giacomello 46 
9.1.1 Distribuições discretas mais importantes 
As principais distribuições discretas são a Distribuição de Bernoulli, Distribuição 
Binomial e Distribuição Poisson. 
 
Distribuição de Bernoulli 
A distribuição de Bernoulli consiste em uma distribuição adequada à variável aleatória de 
Bernoulli, que por sua vez é uma v.a. que assume apenas os valores 0 e 1, com função de 
probabilidade tal que: 
P(0) = P(X=0) = 1-p 
P(1) = P(X=1) = p 
 
Então, E(X)=p e Var(X)=p(1-p) 
 
Distribuição Binomial 
Seja um processo composto de uma seqüência de observações independentes, onde o 
resultado de cada observação pode ser um sucesso ou uma falha. 
Se a probabilidade de sucesso é constante e igual a p, a distribuição do número de 
sucessos seguirá o modelo Binomial. 
A distribuição Binomial é usada com freqüênciano controle de qualidade. É o modelo 
apropriado quando a amostragem é feita sobre uma população infinita ou muito grande. 
 
A distribuição binomial possui quatro propriedades essenciais: 
1. As observações possíveis podem ser obtidas através de dois diferentes 
métodos de amostragem. Cada observação pode ser considerada como se 
tivesse sido selecionada a partir de uma população infinita sem reposição ou 
a partir de uma população finita com reposição. 
2. Cada observação pode ser classificada em uma de duas categorias 
mutuamente excludentes e coletivamente exaustivas, usualmente chamadas 
sucesso ou falha. 
3. A probabilidade de uma observação ser classificada como sucesso (p) é 
constante de observação para observação. Assim sendo, a probabilidade de 
fracasso 1-p também é constante. 
4. O resultado (isto é, sucesso ou fracasso) de qualquer observação 
independe do resultado de qualquer outra observação. 
 
Em aplicações de controle da qualidade, x em geral representa o número de defeituosos 
observados em uma amostra de n itens. 
Prof. Cíntia Paese Giacomello 47 
xnx )p(p
x
n
)x(P −−





= 1 e 
)!xn(!x
!n
x
n
−
=





 
onde 





x
n
 representa o número de combinações de n objetos tomados x de cada vez 
 P(X) = probabilidade de X sucessos uma vez que n e p são conhecidos 
 n = tamanho da amostra 
 p = probabilidade de sucesso � 1-p = probabilidade de falha 
 X = número de sucessos na amostra (X=0, 1, 2, ..., n) 
A média de uma variável aleatória com distribuição binomial é µ = np e a variância é 
dada por σ2= np(1-p) onde p é proporção de sucessos na amostra 
n
x
p = 
 
Exemplo: 
Um processo industrial opera com média de 1% de defeituosos. Baseado em amostras de 
100 unidades, calcule as probabilidades de uma amostra apresentar 0 , 1 , 2 , 3 e 4 
defeituosos. Plote a distribuição de probabilidade correspondente. 
Como a variável aleatória pode apresentar apenas duas possibilidades, ser boa ou 
defeituosa, a distribuição que melhor se ajusta é a distribuição binomial, com 
parâmetros p=0,01 e n=100. 
Então, a probabilidade de uma amostra de tamanho n = 100 apresentar 0 
defeituosos é 
 xnx )p(p
x
n
)x(P −−





= 1 � P(x=0) = P(0) = =−





− 01000 0101010
0
100
),(, 0,366 
 P(x=1) = P(1) = =−





−11001 0101010
1
100
),(, 0,370 
 P(x=2) = P(2) = =−





−21002 0101010
2
100
),(, 0,185 
 P(x=3) = P(3) = =−





−31003 0101010
3
100
),(, 0,061 
 P(x=4) = P(4) = =−





−41004 0101010
4
100
),(, 0,015 
 
Prof. Cíntia Paese Giacomello 48 
0
0,1
0,2
0,3
0,4
x=0 x=1 x=2 x=3 x=4
P(
x
)
 
 
Exercícios: 
1. Um processo opera segundo uma chance de falha de 2%. Coletando amostras de 25 
unidades, qual a probabilidade de uma amostra selecionada apresentar 2 
defeituosos ou menos. 
 
 
 
 
 
2. Imagine que para o processo anterior, fossem coletadas amostras de 50 unidades e 
o critério para parar o processo e procurar causas especiais fosse X=1 ou mais. 
Calcule a percentagem de vezes que o processo seria interrompido logo após a 
amostragem. 
 
 
 
 
 
Distribuição de Poisson 
 
A aplicação típica da distribuição de Poisson no controle da qualidade é como um modelo 
para o número de defeitos (não-conformidades) que ocorre por unidade de produto (por 
m2, por volume ou por tempo) 
Diz-se que existe um processo de Poisson se pudermos observar eventos discretos numa 
área de oportunidade – um intervalo contínuo (de tempo, de comprimento, de área, ...) de 
maneira tal que, se encurtarmos a área de oportunidade ou intervalo suficientemente: 
1. A probabilidade de se observar exatamente um sucesso no intervalo é 
estável 
Prof. Cíntia Paese Giacomello 49 
2. A probabilidade de se observar mais de um sucesso no intervalo é zero 
3. A ocorrência de um sucesso em qualquer intervalo é estatisticamente 
independente da ocorrência em qualquer outro intervalo 
 
A distribuição de Poisson tem um parâmetro λ (lambda) que é a média ou o número 
esperado de sucessos por unidade. A variância desta distribuição é σ2=λ. O número de 
sucessos X da variável aleatória de Poisson varia de 0 a ∞. 
 
A expressão matemática para a distribuição de Poisson para se obterem X sucessos, dado 
que λ sucessos são esperados é: 
!x
e
)x(P
xλλ−
=
 onde x=0,1,2,.... 
onde P(X) = probabilidade de X sucessos, dado o conhecimento de λ 
 λ = número esperado de sucessos 
 e = constante matemática (aproximadamente 2,71828) 
 X = número de sucessos por unidade 
 
Exemplo: 
Suponha que o número de defeitos no cordão de solda de uma carroceria siga uma 
distribuição de Poisson com λ = 2. 
Então a probabilidade de uma carroceria apresentar mais de 3 defeitos será: 
P(X> 3) = 1 – P(x≤3) = 1-[ P(x=0) + P(x=1) + P(x=2) + P(x=3)] 
Onde 
!x
e
)x(P
xλλ−
=
 � 
!
e
)(P
0
20
02−
= = 0,135 
P(x=1) = 
!
e
)(P
1
21
12−
= = 0,271 
P(x=2) = P(2) = 0,271 P(x=3) = P(3) = 0,180 
Logo, 
P(X> 3) = 1 – P(x≤3) = 1-[ P(x=0) + P(x=1) + P(x=2) + P(x=3)] 
 = 1 – [0,135+0,271+0,271+0,180] 
 = 1 – [0,857] 
 =0,143 � 14% 
A probabilidade de uma carroceria apresentar mais de três defeitos é 14%. 
 
Exemplo 2: 
Prof. Cíntia Paese Giacomello 50 
Se chegam em média 2 carros por minuto em um posto de gasolina, qual a probabilidade 
de que cheguem exatamente 5 carros em dois minutos? 
Neste caso o tempo é diferente do tempo correspondente ao λ. Então deve-se transformar 
o λ para que ele corresponda ao tempo de 2 minutos. Chegam em média 2 carros por 
minuto � chegam em média 4 carros em 2 minutos 
λ = 4 
!x
e
)x(P
xλλ−
=
 � 
!5
4)5(
54−
=
eP = 0,1563 = 15,63% 
 
Exercícios: 
1. O setor financeiro de uma loja de departamentos está tentando controlar o número 
de erros cometidos na emissão das notas fiscais. Suponha que esses erros sigam o 
modelo de Poisson com média λ = 0,03. Qual a probabilidade de uma nota 
selecionada ao acaso conter 1 ou mais erros? 
 
 
2. Em uma indústria automotiva, defeitos superficiais de pintura ocorrem a uma taxa 
de 0,15 defeitos/unidade. Encontre a probabilidade que uma unidade escolhida ao 
acaso apresente 1 ou mais defeitos superficiais. 
 
 
 
3. Em uma empresa industrial ocorrem, em média, 3 acidentes por mês. Qual a 
probabilidade de que em um determinado mês, ocorra apenas um acidente? 
 
 
 
4. Dez por cento das ferramentas produzidas por um certo processo de fabricação 
revelaram-se defeituosas. Determinar a probabilidade de, em uma amostra de 10 
ferramentas escolhidas ao acaso, exatamente duas serem defeituosas mediante o 
emprego da distribuição de Poisson. 
 
 
5. Se a probabilidade de um indivíduo sofrer uma reação nociva, resultante da injeção 
de um determinado soro é 0,001, qual a probabilidade de, entre 2000 indivíduos, 
a) exatamente 3 sofrerem aquela reação? b) Mais de 2 sofrerem a reação? 
 
Prof. Cíntia Paese Giacomello 51 
 
9.1.2 Distribuições contínuas 
A distribuição mais importante e mais utilizada na prática é a Distribuição Normal. 
Outros modelos importantes de distribuições contínuas são: Uniforme, Exponencial, Gama, 
Qui-Quadrado, t de Student e F de Snedecor. 
 
Distribuição Normal 
A Distribuição Normal é essencialmente importante na estatística por três razões 
principais: 
1. Inúmeros fenômenos contínuos parecem seguí-la ou podem ser aproximados por 
meio dela 
2. Podemos utilizá-la para aproximar várias distribuições de probabilidadediscretas 
3. Ela oferece a base para a inferência estatística clássica, devido à sua afinidade 
com o teorema do limite central 
 
Os parâmetros da distribuição Normal são a média e o desvio padrão. Trata-se de uma 
distribuição simétrica, unimodal, em forma de sino. 
 
A função de probabilidade da distribuição normal é dada por: 
2
2
1
2
1 



 −−
=
σ
µ
piσ
x
exp)x(f 
 
onde: e = constante matemática (aproximada por 2,71828) 
 pi = constante matemática (aproximada por 3,14159) 
 µ = média aritmética da população 
 σ = desvio padrão da população 
 X = qualquer valor da variável aleatória contínua onde -∞ < X < ∞ 
Prof. Cíntia Paese Giacomello 52 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Para simplificar a notação de uma v.a.c. com distribuição normal, com média µ e variância 
σ2 utiliza-se: 
X~ N(µ,σ2) 
A distribuição Normal acumulada é obtida calculando a probabilidade de X ser menor que 
um dado valor a: 
∫
∞−
==≤
a
dx)x(f)a(F)ax(P � Função densidade acumulada 
Essa integral não pode ser resolvida em forma fechada, mas a solução está apresentada 
em tabelas onde se entra com a variável reduzida ou variável padronizada Z e 
encontra-se F(Z) ou vice-versa. 
 )Z(F
a
ZP)ax(P =





 −≤=≤
σ
µ
 
 
Valor tabelado (Procurar na tabela da distribuição Normal padronizada) 
 
µµµµ 
 99,73%
 95,44%
 68,26%
 -1σ +1σ
 -2σ +2σ
 -3σ +3σ
Prof. Cíntia Paese Giacomello 53 
Exemplo: 
O peso de um produto é uma característica muito importante. Sabe-se que o peso segue 
um modelo normal com média 1000 gramas e desvio padrão 40 gramas. Se a especificação 
técnica estabelece que o peso deve ser maior que 950 gramas, qual a probabilidade de 
que um pacote selecionado aleatoriamente satisfaça a especificação? 
OBS: este esquema equivale 
P(x>950) = 894405000039440251
40
1000950
,,,),Z(PZP =+=−>=





 −
> 
 
 
 
 
 
 
A probabilidade de que um pacote selecionado aleatoriamente satisfaça a especificação é 
de 89%. 
 
Exemplo 2: Sabe-se que X representa medições feitas em um processo que segue o 
modelo Normal com média 100 e desvio padrão 10. Se forem feitas 4000 medições, 
quantas estarão entre 95 e 112? 
 
P(95<x<112)= 





 −
<<
−
10
100112
10
10095
ZP 
= P(-0,5<Z<1,2) 
=0,1915+0,3849 
=0,5764 � Aproximadamente 58% estarão entre 95 e 112. 
 
Se forem feitas 4000 medições, aproximadamente 2305 estarão entre 95 e 112. (4000 x 
57,64%) 
 
µ=1000 
σ=40 
 
X=950 µ=0 
σ=1 
 
Z=-1,25 
µ=100 
σ=10 
 
Valores tabelados 
T
abelado 
Prof. Cíntia Paese Giacomello 54 
Exercícios: 
1. A resistência à tração do papel usado em sacolas de supermercado é uma 
característica de qualidade importante. Sabe-se que essa resistência segue um 
modelo Normal com média 40 psi e desvio padrão 2 psi. Se a especificação 
estabelece que a resistência deve ser maior que 35 psi, qual a probabilidade que 
uma sacola produzida com este material satisfaça a especificação? 
 
 
 
 
 
2. O diâmetro do eixo principal de um disco rígido segue a distribuição Normal com 
média 25,08mm e desvio padrão 0,05mm. Se as especificações para esse eixo são 
25,00 ± 0,15mm (isto é, varia de 24,85 a 25,15mm), determine o percentual de 
unidades produzidas em conformidades com as especificações. 
 
 
 
 
 
3. A resistência à tração de isoladores cerâmicos apresenta distribuição Normal com 
média 95 Kg e desvio padrão 4 Kg. Se são produzidas 10.000 unidades desses 
isoladores, quantos apresentarão resistência inferior a 85 Kg? E quantos 
apresentarão resistência superior a 90 Kg? 
 
 
 
 
 
4. A saída de uma bateria segue o modelo Normal com média 12,15 V e desvio padrão 
0,2 V. Encontre o percentual que irá falhar em atender às especificações 12 V ± 
0,5 V. 
 
 
 
Prof. Cíntia Paese Giacomello 55 
5. A vida útil de lavadora de pratos automáticas é de 1,5 anos, com desvio padrão 0,3 
anos. Se os defeitos se distribuem normalmente, qual é a probabilidade de uma 
lavadora necessitar conserto antes de expirar o período de 1 ano de garantia? 
 
 
 
 
6. O tempo necessário, em uma oficina, para o conserto de transmissão para certo 
carro é normalmente distribuído com média 45 min e desvio padrão 8 min. O 
mecânico planeja começar o conserto do carro 10 min após o cliente deixá-lo na 
oficina, comunicando que o carro estará pronto em 1 h. Qual a probabilidade de 
que o cliente tenha que esperar caso o mecânico esteja enganado e o cliente fique 
esperando? 
 
 
 
7. Sabe-se que o conteúdo de uma lata de cerveja é 350 ml e que tem distribuição 
aproximadamente normal com média 350 ml e desvio padrão 10 ml. 
a. Que % de latas tem menos que 345 ml de conteúdo? 
b. Que % de latas tem mais que 360 ml de conteúdo? 
 
 
 
8. Uma fábrica de pneus fez um teste para medir o desgaste de pneus e verificou que 
ele seguia o comportamento de uma curva normal com média 48.000 km e desvio 
padrão de 2.000 km. Calcule a probabilidade de um pneu escolhido ao acaso: 
a. Dure mais que 47.000 km? 
b. Dure entre 45.000 e 51.000 km? 
c. Até que quilometragem duram 90% dos pneus? 
 
 
 
9. Descreva um exemplo de aplicação da distribuição normal na sua profissão. Qual 
seria a média dos dados e o desvio padrão? 
 
 
Prof. Cíntia Paese Giacomello 56 
1100 TTeeoorriiaa eelleemmeennttaarr ddaa aammoossttrraaggeemm 
 
A teoria da amostragem é o estudo das relações existentes entre uma população e as 
amostras dela extraídas. É muito utilizada para a estimação das grandezas desconhecidas 
da população (parâmetros) através de conhecimento das grandezas correspondentes nas 
amostras (estatísticas amostrais). 
A teoria da amostragem é também útil para determinar se as diferenças observadas entre 
duas amostras são devidas a uma variação casual ou são verdadeiramente significativas. 
Por exemplo: queremos testar se os tempos de processamento da matéria prima de dois 
sistemas de produção são diferentes ou não. A resposta a esta questão implica o uso de 
testes de hipótese, que será visto mais adiante. 
Denomina-se inferência estatística a inferência de parâmetros (da população) com base 
nos resultados obtidos na amostra. 
Para que as conclusões sejam válidas, é necessário que a amostra selecionada seja 
representativa da população. Para isso podem ser utilizados os métodos de amostragem 
probabilísticos apresentados no capítulo 1: aleatória, sistemática, estratificada ou por 
conglomerados. O método mais utilizado é o por amostragem aleatória. 
 
10.1 Amostragem com e sem reposição 
Quando selecionamos uma amostra devemos analisar se esta amostragem é com ou sem 
reposição. Na amostragem com reposição o mesmo elemento pode ser escolhido mais de 
uma vez. Na amostragem sem reposição cada elemento só pode ser selecionado uma única 
vez. 
Exemplo: uma urna contém dez bolas, numeradas de 0 a 9. Retira-se a primeira bola, 
anota-se o número, 3 por exemplo, e não se recoloca a bola na urna. Os outros números 
que podem ser sorteados são 0, 1, 2, 4, 5, 6, 7, 8 e 9. Este sistema é o sistema sem 
reposição. Entretanto, se tivéssemos recolocado a bola 3 na urna, então todos os números 
poderiam ser selecionados na segunda extração, inclusive o 3. Este

Outros materiais