Buscar

Apostila Estatística 2016 atualizada 2016 out

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 160 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 160 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 160 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Apostila de Estatística
com os softwares “Excel” e “R”
Prof Rogério César dos Santos – FUP/UnB
Versão 2016
Índice
REVISÃO / Dicas da Calculadora / Onde baixar os softwares.........................................................................2
Capítulo 1 – Gráficos e Tabelas........................................................................................................................5
Lista de Exercícios 1......................................................................................................................11
Capítulo 2 – Tipos de Médias; Moda..............................................................................................................17
Lista de Exercícios 2......................................................................................................................21
Capítulo 3 – Percentis; Mediana.....................................................................................................................23
Lista de exercícios 3......................................................................................................................27
Capítulo 4 – Dados suspeitos (outliers); Gráfico Boxplot...............................................................................30
Lista de exercícios 4......................................................................................................................33
Capítulo 5 – Inclinação; Média calculada a partir de Histograma...................................................................36
Lista de exercícios 5......................................................................................................................39
Capítulo 6 – Desvio Padrão, Variância e Coeficiente de Variação..................................................................40
Lista de exercícios 6......................................................................................................................45
Capítulo 7 – Noções de Análise Combinatória...............................................................................................47
Lista de exercícios 7......................................................................................................................51
Capítulo 8 – Noções de Probabilidades..........................................................................................................52
Lista de exercícios 8......................................................................................................................58
Capítulo 9 – Distribuição Binomial e Esperança Matemática.........................................................................61
Lista de exercícios 9......................................................................................................................64
Capítulo 10 – Escore Padrão e Distribuição Normal.......................................................................................66
Lista de exercícios 10....................................................................................................................73
Capítulo 11 – Probabilidades na Distribuição Normal e na Normal Padrão....................................................75
Lista de exercícios 11.....................................................................................................................80
Capítulo 12 – Outras Distribuições de Probabilidade.....................................................................................81
Lista de exercícios 12....................................................................................................................86
Capítulo 13 – Médias Amostrais.....................................................................................................................90
Lista de exercícios 13....................................................................................................................95
Capítulo 14 – Proporções Amostrais...............................................................................................................97
Lista de exercícios 14..................................................................................................................100
Capítulo 15 – Intervalo de Confiança para médias e proporções..................................................................101
Lista de exercícios 15..................................................................................................................107
Capítulo 16 – Teste de Hipóteses para Médias e Proporções........................................................................108
Lista de exercícios 16...................................................................................................................116
Capítulo 17 – Teste para diferença de 2 Médias e diferença de Proporções..................................................118
Lista de exercícios 17..................................................................................................................121
Capítulo 18 – Teste Qui-quadrado para modelos e Teste F para Variâncias..................................................122
Lista de exercícios 18..................................................................................................................125
Capítulo 19 – Teste de Igualdade de 3 ou mais médias.................................................................................126
Lista de exercícios 19..................................................................................................................132
Capítulo 20 – Correlação e Covariância entre duas variáveis.......................................................................137
Lista de exercícios 20..................................................................................................................142
Capítulo 21 – Reta de Ajuste e Teste F; Coeficiente de Determinação..........................................................148
Lista de exercícios 21..................................................................................................................152
TABELAS....................................................................................................................................................154
Tabela z – colocar vírgula após a segunda casa, e % ao fim de cada valor do miolo da tabela 154
Tabela t.........................................................................................................................................155
Tabela Qui-quadrado (Graus de Liberdade na coluna e Nível de Significância α na linha)........156
Tabela F, a 5%..............................................................................................................................157
Tabela Teste Tukey.......................................................................................................................158
REVISÃO / Dicas da Calculadora / Onde baixar os softwares
LEMBRETES sobre a CALCULADORA:
 O ponto na calculadora é a nossa vírgula!!
Ex: 67.807 na calculadora = 67 inteiros e 807 milésimos
(ou seja: 67,807)
 A vírgula na calculadora é o nosso ponto!!
Ex: 78,090 na calculadora = 78 mil e noventa
(ou seja: 78.090)
BAIXANDO OS SOFTWARES
 Onde baixar o software Maxima: http://andrejv.github.io/wxmaxima/
 Onde baixar o software R: https://www.r-project.org/ → CRAN → escolha o
país → Download R for Windows → install R for the first time → Download
R for Windows
 Baixando o Análise de Dados do Excel: abra o Excel → clique no ícone do
windows acima à esquerda → clique Opções do Excel → Suplementos → ir...
→ Ferramentas de Análise → Ok.
Lista de exercícios de REVISÃO
1- Transforme em porcentagem como no modelo (basta multiplicar por 100%):
a) 0,7 = 70% b) 0,8 c) 0,9 d) 0,67 e) 2,45 f) 444,5
g) 0,007 h) 0,00073 i) 1,001 j) 45 k) 1 l) 0
2- Transforme em decimal como no modelo (basta dividirpor 100):
a) 55,6% = 0,556 b) 78,92% c) 0,985% d) 12,009% e) 241% f) 0%
g) 100% h) 200%
3- Qual vale mais:
a) 40% de 20 ou 20% de 40? b) 35% de y ou y% de 35? c) z% de w ou w% de z?
4- Numa turma de 40 homens, 60% são guitarristas. Quantos são
a) os guitarristas? b) os não guitarristas?
5- Numa turma, 70% são mulheres, e há 45 homens. Calcule:
a) Quantos alunos têm a turma? b) Quantas são as mulheres na turma?
Respostas: a) 150 alunos b) 105 mulheres
2
6- Quanto é: a) 60% de 20% de 120?
b) 45% de 38%? Resposta b) 0,171
7- Calcule (use calculadora apenas nos itens c, d e e):
a) 45 +
7
2 b) 
7
6
−3∙(5−73) c) 3√5 ∙4 d) 5√0,5∙3 ∙9,3
e) 2√4,7 ∙6 f) (92−54)∙3−4
1
2 g) 7 ∙9
5
2
Respostas a) 43/10 b) – 41/6 
c) Na calculadora, faça: (5 x 4) ^ (1/3) = 2,71
d) Na calculadora, faça: (0.5 x 3 x 9.3) ^ (1/5) = 1,69
e) 5,31 f) 31/4 g) 1.701 (mil setecentos e um)
8- Faça o gráfico das funções:
a) y=f ( x )=2x−1,0≤x ≤5
b) w=f ( y )= y+ 13 ,0≤ y ≤
1
2
Resposta b)
c) y=f ( x )= x3−
2
5
,−2
3
≤ x≤ 3
2
d) y=f ( x )=x2−3x+5,0≤x ≤2 (parábola)
Resposta d) x vértice = – b / (2a) = 3/2; y vértice = – ∆/(4a) = 11/4
Não tem raízes, pois Delta deu negativo!
e) w=f ( y )=− y
2
4
+ 1
3
,0≤ y≤6 
3
    


y
w
(1/2, 5/6)
(0, 1/3)
       





x
y
(2, 3)
(0, 5)
(3/2, 11/4)
f) y=f ( x )=5,−9≤x ≤12 (função constante)
Resposta f)
g) w=f ( y )=2π ,−3≤ y≤ π2 h) y=f ( x )=−3,5≤x ≤11
9- Calcule a integral:
a) ∫
−2
3
3 y−4
3
dy b) ∫
−1
2
2 x2
4
+2dx c) ∫
0
1
w
3
2−w+ewdw
Respostas
a) 5/6 b) 545/96 c) (10e –11)/10
10- Calcule a integral das funções, no intervalo dado, onde a > 0:
a) y=f ( x )=x2+x+a ,1≤x ≤2 b) w=f ( y )= y
2
3
+ y
3
,0≤ y≤a
c) w=f ( y )= y+ 43 ,0≤ y ≤3 a d) w=f ( y )=3a ,−3≤ y≤1
e) y= f ( x )=a3 , a≤ x≤2a f) w=f ( y )=e
− y
a ,0≤ y ≤2
Respostas
a) (6a + 23)/6 b) a
2(2a+3)
18 c) a(9a + 8)/2 d) 12a
e) a
2
3 f) a−a⋅e
−2
a
11- Resolva as equações: a) 21=9−x5 b) −1=
z+3
2 
c) z3−
1
2
=9− z
4 d) 9=−z+
1
2 e) 8 z−
1
2
=−3 z+ 3
4 f) 4=
x−9
−2
Respostas
a) – 96 b) – 5 c) 114/7 d) – 17/2 e) 5/44 f) 1
4
                       








x
y
(-9, 5) (12, 5)
Capítulo 1 – Gráficos e Tabelas
1.1 Histograma – um gráfico de colunas
Um dos objetivos da Estatística é a organização de dados através de gráficos.
Uma das maneiras de fazer isto é construindo o chamado Histograma. Mas, o que é
um Histograma? É um gráfico de colunas (verticais) que organiza os dados em
classes, ou em grupos. Vejamos o exemplo: suponha que, numa certa academia,
existam 4 classes de clientes, com relação ao peso:
• 4 clientes da academia pesam entre 50kg e 60kg;
• 3 clientes pesam entre 60kg e 70kg;
• 5 clientes pesam entre 70kg e 80kg e
• 1 cliente pesa entre 80kg e 90kg.
Visualizando no gráfico de colunas:
Gráfico 1: Histograma com 4 classes ou grupos.
Este gráfico é o chamado Histograma, que organiza os dados em classes. As
quantidades 4, 3, 5 e 1 de cada classe, são as chamadas frequências absolutas do
Histograma. A frequência absoluta da primeira classe é 4, da segunda classe é 3, e
assim por diante.
1.2 Como Construir um Histograma
Suponha que, numa clínica de emagrecimento, quinze clientes têm os seguintes
pesos, em quilos:
5
Entre 50 e 60 Entre 60 e 70 Entre 70 e 80 Entre 80 e 90
0
1
2
3
4
5
6
4
3
5
1
Número de clientes
100, 99, 100, 95, 88, 88, 102, 99, 98, 97, 99, 100, 101, 95 e 96.
Vamos ver então o procedimento para construção do Histograma:
•Chame de n a quantidade de dados, no nosso exemplo, n = 15.
•k é a quantidade de classes do Histograma, dada pela seguinte regra:
 se n < 100, k é o inteiro mais próximo de n
 se n ≥ 100, k é inteiro mais próximo de 5⋅log n
Ora, n = 15. Então, k é o inteiro mais próximo de 15=3,87... , isto é, k = 4.
Assim, em nosso exemplo, o histograma deve conter 4 classes.
•A é a Amplitude = Máximo – Mínimo. Em nosso exemplo, A = 102 – 88 = 14.
•c é o comprimento de cada classe, dada pela fórmula c = Ak−1 .
Então, c= 144−1
=14
3
=4,66. . . ≈ 4,7.
•L é o limite inferior da primeira classe, dado pela fórmula L = Mínimo – c2 .
Então, L = 88 – 4,72 ≈ 85,7. 
Agora, marcamos no eixo x os valores L, L + c, L + 2c, L + 3c, etc, até completar
as k classes:
• L = 85,7
• L + c = 85,7 + 4,7 = 90,4
• L + 2c = 90,4 + 4,7 = 95,1
• L + 3c = 99,8 e
• L + 4c = 104,5.
Em seguida, contamos quantos dados se encontram em cada classe (as frequências
absolutas de cada classe), e montamos o Histograma:
6
Entre 85,7 e 90,4 Entre 90,4 e 95,1 Entre 95,1 e 99,8 Entre 99,8 e 104,5
0
1
2
3
4
5
6
7
2 2
6
5
Número de clientes
Gráfico 2: Histograma que organiza os quinze clientes de uma clínica em classes de pesos.
Uma observação importante é que, se houver um dado que pertença a duas
classes, deve-se decidir a qual irá de fato pertencer: se a da esquerda ou a da direita, e
essa escolha deverá ser coerente para os demais dados que estejam no limite entre
duas classes.
1.3 Frequências acumuladas e frequências relativas
Suponha que, numa turma, 8 alunos pesam entre 60kg e 70kg, 5 alunos pesam
entre 70kg e 80kg e 3 alunos pesam entre 80kg e 90kg (veja tabela abaixo):
Pesos em quilos Frequências absolutas
Entre 60 e 70 8
Entre 70 e 80 5
Entre 80 e 90 3
Quantos alunos pesam entre 60kg e 80kg? Logicamente, existem 8 + 5 = 13
alunos pesando entre 60kg e 80kg. Esse número, 13, é chamado frequência
acumulada, pois acumula a primeira com a segunda frequências. Ou seja, a
frequência acumulada é a soma da respectiva frequência com as anteriores. 
Já a frequência relativa é a frequência absoluta dividida pelo número total de
dados, em porcentagem. 
Usando a tabela acima, podemos encontrar todas as frequências:
Pesos em quilos Frequências
absolutas
Frequências
absolutas
acumuladas
Frequências
relativas
Frequências
relativas
acumuladas
Entre 60 e 70 8 8 8 / 16 = 50% 50,00%
Entre 70 e 80 5 8 + 5 = 13 5 / 16 = 31,25% 81,25%
Entre 80 e 90 3 8+ 5 + 3 = 16 3 / 16 = 18,75% 100,00%
Podemos concluir, por exemplo, que 81,25% dos alunos pesam até 80kg.
Também, podemos concluir que 18,75% dos alunos pesam entre 80kg e 90kg.
1.4 Gráfico de Pizza, ou de setores
O gráfico de Pizza ou de setores tem a forma de um círculo, e cada fatia da pizza
representa uma classe. Como exemplo, suponha que numa turma de 10 alunos há 6
homens e 4 mulheres. Calcula-se o ângulo de cada classe por regra de 3:
7
Fazendo a regra de 3 para a classe das 4 mulheres:
Pessoas Graus
10 pessoas no total – 360 graus no total
 4 mulheres – x graus
Multiplicando cruzado:
10 x=4⋅360
x=1.440
10 , isto é, x=144 graus.
Agora, a regra de 3 para a classe (fatia) dos 6 homens:
Pessoas Graus
10 pessoas no total – 360 graus no total
 6 homens – x graus
Resolvendo:
10 x=6⋅360
x= 2.160
10
, isto é, x=216 graus.
Agora, desenhando o gráfico de Pizza:
Observe que o gráfico de Pizza vem com uma legenda.
Esse gráfico de pizza mostra as frequências absolutas, porém, o gráfico de pizza
8
também pode conter as frequências relativas (aquelas em porcentagens).
1.5 Coletando Amostras no Software R
> a<-c(4,5,6,7,7,9) → Serve para, primeiramente, criar o conjunto de onde será
retirada a amostra aleatória
> sample(a,size=3,replace=FALSE) → Serve para retiraruma amostra aleatória de
tamanho 3, sem reposição. Size significa o tamanho da amostra. Se replace = TRUE,
é com reposição.
1.6 Construindo gráfico de Pizzas no Excel
Por exemplo, fazer o gráfico de pizza dos dados abaixo, digitados no Excel:
Basta selecionar estas duas colunas no Excel, e clicar Inserir → Pizza 2D.
Clique com o botão direito sobre a pizza, e Adicionar Rótulos de dados.
1.7 Construindo o Histograma no software R
Para construir o histograma no software R, dos dados 0, 1, 1, 2, 2, 2, 3, 3, 3, 3, 4,
4, 4, 5, 5, 6, digite:
hist(c(0,1,1,2,2,2,3,3,3,3,4,4,4,5,5,6))
Obs: a construção do histograma no R é feita por um outro procedimento, distinto
do apresentado aqui na apostila.
1.8 Construindo o Histograma no Excel
Primeiro, no Excel, deve-se instalar Análise de Dados, conforme mostrado no início
do Capítulo de Revisão desta apostila (o próprio Excel possui este pacote, basta
seguir as instruções).
Vamos construir, no Excel, o Histograma dos seguintes dados: {2; 5; 5; 6; 10;
12; 12}. Temos então que n = 7. Calculemos:
Número de classes: k = inteiro mais próximo de √7≃2,65 → k = 3 classes.
Amplitude A = 12 – 2 = 10.
Comprimento da classe c = AK−1=
10
2
=5 .
9
L = Mín – c/2 = 2 – 5/2 = 2 – 2,5 = – 0,5.
Somando c, os limites ficam:
L = – 0,5. L + c = 4,5. L + 2c = 9,5. L + 3c = 14,5.
As classes são, portanto:
entre –0,5 e 4,5
entre 4,5 e 9,5
entre 9,5 e 14,5
Em seguida, digitamos no Excel os limites, exceto o primeiro e o último limites, bem
como digitamos todos dados do conjunto:
Depois, clicamos em Dados, Análise de Dados, Histograma.
Em Intervalo de Entrada, selecione os dados do conjunto. Em Intervalo do bloco,
selecione os limites 4,5 e 9,5. Em Intervalo de Saída, clique numa célula vazia mais
abaixo.
Marque o campo Resultado do Gráfico, e clique Ok. 
Após criar o Histograma, clique com o botão direito em uma das barras e marque
Adicionar Rótulo de dados.
Clique novamente com o botão direito em uma das barras, clique em Formatar série
de dados, Largura do espaçamento igual a zero, e Cor da borda → Borda sólida →
Cor preta.
O resultado fica assim:
Obs: neste exemplo, a primeira coluna do gráfico representa a classe entre –0,5 e 4,5.
A última coluna, a classe entre 9,5 e 14,5.
10
Lista de Exercícios 1
1- Numa turma de informática, há 5 alunos com idades entre 9 e 14 anos, 5 alunos
com idade entre 14 e 19 anos, 3 entre 19 e 24, e 7 entre 24 e 29. Esboce o histograma.
2- Numa turma há 50 alunos. Se o professor desejar fazer o histograma com as notas
desta turma, quantas classes terá o histograma?
3- Numa turma, a maior nota em estatística foi 10,0, e a menor foi 3,0. Qual é a
amplitude das notas desta turma?
4- Numa fábrica, foram selecionadas algumas embalagens para serem pesadas, a fim
de se verificar se as mesmas estão de acordo com as especificações exigidas. Os
resultados foram (em gramas): {12; 11; 8; 7; 12; 10; 11; 8; 8; 11; 11; 12; 10; 8; 7; 6;
7; 13; 13; 12; 11; 10; 18}.
a) Construa o histograma.
b) Construa a tabela de frequências absolutas, relativas e as respectivas frequências 
acumuladas
c) Construa o respectivo gráfico de pizza, associado ao Histograma
d) Quantos porcento das embalagens pesam acima de 10,5 gramas?
e) Quantas embalagens pesam entre 7,5 e 16,5 gramas?
f) Quantas embalagens pesam acima de 13,5 gramas?
g) Faça o Histograma no R segundo o roteiro apresentado no capítulo.
h) Faça o Histograma no Excel segundo o roteiro apresentado no capítulo.
5- Os lucros da empresa X nos últimos quinze meses foram, em milhares de reais:
{4; 12; 14; 12; 10; 13; 8; 11; 12; 5; 6; 7; 6; 12; 14}.
a) Construa o histograma
b) Construa a tabela de frequências absolutas, relativas e as respectivas frequências 
acumuladas
c) Construa o respectivo gráfico de pizza, associado ao Histograma
d) Quantos porcento dos lucros são maiores que R$5.670,00?
e) Quantos meses possuem lucro acima de R$9.000,00?
f) Quantos porcento dos lucros estão entre R$2.333,00 e R$9.000,00?
6- As idades dos funcionários da empresa X são: {20; 22; 39; 20; 22; 24; 28; 29; 31; 
26; 30; 25; 32; 26; 34; 25; 24}
a) Construa o histograma
b) Construa a tabela de frequências absolutas, relativas e as respectivas frequências 
acumuladas
c) Construa o respectivo gráfico de pizza, associado ao Histograma
11
7- Uma empresa possui dezessete funcionários. As vendas, em milhares de reais, de 
cada um deles no último mês foram:
{3; 2,5; 2,5; 4,5; 2,8; 3; 1; 1; 0,5; 0,8; 1,8; 4,2; 3,9; 3; 2,8;
1,9; 2}
a) Construa o histograma
b) Construa a tabela de frequências absolutas, relativas e as respectivas frequências 
acumuladas
c) Construa o respectivo gráfico de pizza, associado ao Histograma
8- A partir do gráfico de pizza abaixo, construa a tabela de frequências completa, e o
respectivo Histograma:
9- As idades dos clientes de uma academia são: 17, 18, 20, 24, 19, 18, 23, 33, 30, 30,
18. Fazendo o histograma destes dados, qual a frequência relativa da penúltima
classe?
10- Num histograma de 4 classes, a primeira classe contém 16 dados, enquanto que a
segunda contém 10 dados. É possível descobrir a frequência relativa acumulada da
segunda classe? Por quê?
11- Considere os seguintes dados: {2; 2,3; 2,3; 5; 5; 8; 6,5; 9}. Fazendo o
histograma, qual a frequência absoluta da segunda classe?
12- Considere os seguintes dados: {5; 5; 5; 5; 5; 8; 8; 9}. Fazendo o
histograma, qual a frequência absoluta da segunda classe?
13- Considere os seguintes dados: {1; 3; 3; 3; 5; 11; 9; 10}. Fazendo o
histograma, qual a frequência absoluta da segunda classe?
14- Considere os seguintes dados: {0; 0; 0; 3; 5; 14; 19; 1}. Fazendo o
histograma, qual a frequência absoluta da segunda classe?
12
15- Considere os seguintes dados: {-2; -2; 0; 3; -5; 1; 9; -1}. Fazendo o
histograma, qual a frequência absoluta da segunda classe?
RESPOSTAS
Questão 1
Questão 2- 7 classes
Questão 3- Amplitude = 7,0.
Questão 4 
a)
b)
Classe Freq absoluta Freq abs acum Freq relat Freq relat acum
Entre 4,5 e 7,5 4 4 17,39% 17,39%
Entre 7,5 e 10,5 7 11 30,43% 47,82%
Entre 10,5 e 13,5 11 22 47,83% 95,64%
Entre 13,5 e 16,5 0 22 0,00% 95,64%
Entre 16,5 e 19,5 1 23 4,35% 100,00%
c)
Classe Ângulo Classe Ângulo
Entre 4,5 e 7,5 62,6º Entre 13,5 e 16,5 0º
13
Entre 7,5 e 10,5 109,6º Entre 16,5 e 19,5 15,7º
Entre 10,5 e 13,5 172,2º
 
d) 52,18% e) 18 embalagens f) 1 embalagem
Questão 5
a)
b)
 
c)
d) 86,67% dos lucros e) 9 meses f) 40%
Questão 6- a)
14
b) 
c)
Questão 7
a)
15
b)
c)
Questão 8
Tabela de frequências:
Histograma:
Questão 9- A frequência relativa da penúltima classe é 18,18%.
Questão 10- Dica: para se calcular as frequências relativas, é necessário saber quantos
dados há, ao todo?
Questão 11- 3 Questão 12- 2 Questão 13- 1 Questão 14- 2
Questão 15- 4
16
Capítulo 2 – Tipos de Médias; Moda
2.1 Média Aritmética
A média representa o centro de uma amostra ou de uma população. É a soma dos
valores do conjunto dividida pela quantidade de valores, e é representada por x¯ (x
barra).
Exemplo de média: Seis bois foram pesados, e os resultados foram:
12 arrobas, 11 arrobas, 12 arrobas, 10,5 arrobas, 11 arrobas e 13 arrobas.
Qual é a média de peso destes seis bois? 
x=
12111210,51113
6
=11,5833... Arrobas.
Arredondando: x= 11,6 arrobas. Esta é a chamada Média Aritmética.
2.2 Média Ponderada
Suponha que você seja professor e aplicou duas avaliações:
• A primeira avaliação tem peso 3, e João tirou 8,0.
• A segunda avaliação tem peso 20, e João tirou 4,0.
Como calcular a média x deste aluno? Cada avaliação tem o seu peso. Quando
há pesos, a média x é chamada de Média Ponderada, calculada assim: 
Multiplica-se cada valor pelo seu respectivopeso, somam-se os resultados, e depois
divide-se pelos pesos somados:
 x=3⋅820⋅4320 =
104
23
=4,52... .
2.3 Média Geométrica
É a raiz n-ésima (enésima) do produto dos valores. Exemplo: calcule a média
geométrica dos valores {3; 5; 6; 6}. Temos n = 4, portanto, a média geométrica é
43⋅5⋅6⋅6=4540=4,82... , ou, 3⋅5⋅6⋅6
1
4=540
1
4 , que dá no mesmo.
17
2.4 Média Harmônica
É o inverso da média dos inversos (vixi), isto é,
1
 1x1 1x2... 1xnn  .
Como exemplo, vamos calcular a média harmônica dos valores {3; 3; 4}:
1
 1313 143 
= 3
1
3
1
3
1
4
= 3
443
12
= 3
1112
=3⋅12
11
=36
11
≃3,27≃3,3
.
Uma aplicação da Média Harmônica é no cálculo da velocidade média: Imagine
que um carro
• viaje um determinado trecho à velocidade média de 45 km/h,
• e volte pelo mesmo trecho à velocidade média de 58 km/h.
Qual foi a velocidade média de todo o percurso?
Pelas fórmulas da Física, demonstra-se facilmente (prove) que será a média
harmônica (e não a média aritmética, como pensaríamos):
1
 145 1582 
= 2
1
45
1
58
= 2
5845
2.610
= 2
 1032.610 
=2⋅2.610
103
=5.220
103
≃50,7
2.5 Moda
A moda é o valor que mais se repete numa amostra. Como exemplo, considere os
seguintes pesos dos bois de uma fazenda:
10 arrobas, 11 arrobas, 12 arrobas, 10 arrobas, 11 arrobas e 10 arrobas.
A moda é 10 arrobas.
Um conjunto pode ser
• amodal, quando nenhum valor se repete. 
• bimodal, quando há dois valores que mais se repetem.
• trimodal: o conjunto
18
•
{2, 2, 3, 3, 3, 4, 5, 5, 5, 7, 7, 8, 8, 8}
é trimodal, pois há três valores que mais se repetem. As modas são: 3, 5 e 8.
Atenção: 2 e 7 não são modas, apesar de se repetirem.
2.6 No software R
Tamanho do conjunto, ou seja, o valor de n:
Seja o conjunto a = {2; 2; 3}
> a < – c(2,2,3)
> length(a)
Média do conjunto a = {2; 2; 3}
> mean(a)
Média Harmônica do conjunto a = {2; 2; 3}
> length(a)/sum(1/a)
Média Geométrica do conjunto a = {2; 2; 3}
> prod(a)^(1/length(a))
Moda do conjunto a = {2; 2; 3}
> subset(table(a), table(a) == max(table(a)))
2.7 No software Excel, nas células A1 até C1
Tamanho do conjunto a = {2; 2; 3}, ou seja, o valor de n
=cont.valores(2;2;3)
ou
=cont.valores(A1:C1)
Média do conjunto {2; 2; 3}
=média(2;2;3)
19
ou
=média(A1:C1)
Média Harmônica do conjunto a = {2; 2; 3}
=média.harmônica(2;2;3)
ou
=média.harmônica(A1:C1)
Média Geométrica do conjunto a = {2; 2; 3}
=média.geométrica(2;2;3)
ou
=média.geométrica(A1:C1)
Moda do conjunto a = {2; 2; 3}
=modo(2;2;3)
ou
=modo(A1:C1)
20
Lista de Exercícios 2
1- Um chefe de setor de uma empresa decidiu anotar os minutos de atraso do
funcionário X, durante vinte dias. Os resultados foram {7; 7; 3; 0; 1; 7; 8; 19; 7; 5; 11;
0; 0; 15; 28; 11; 6; 1; 2; 1}.
a) Calcule a média desses minutos de atraso.
b) Calcule a moda.
c) Calcule a média e a moda no Excel segundo o roteiro apresentado no capítulo.
d) Calcule a média e a moda no R segundo o roteiro apresentado no capítulo.
2- Um professor dará um trabalho com peso 5 e uma prova com peso 11. Ambas as
avaliações valem 10,0 pontos.
a) Se um aluno tirou 6,0 no trabalho e 4,0 na prova, qual foi a sua média 
(ponderada)?
b) Se um aluno tirou 7,0 no trabalho, quanto ele precisa tirar na prova para ter média
(ponderada) igual a 5,0?
3- Encontre a média harmônica e a média geométrica do conjunto {3; 3; 17}.
4- Um caminhão fez uma viagem a uma velocidade média de 78 km/h, e voltou pelo 
mesmo trecho a 90 km/h. Qual foi a sua velocidade média de todo o percurso?
5- Calcule a média aritmética, a média harmônica, a média geométrica e a moda dos
seguintes dados:
a) {3; 2,5; 2,5} b) {20; 22; 39; 20} c) {4; 12; 14; 12; 10}
d) Calcule tudo no software Excel.
6- Uma prova tem peso 4 e a outra tem peso 11. Se eu tirei 0 na primeira e 8 na
segunda, qual foi minha média?
7- Uma prova tem peso 8 e a outra tem peso 2. Se eu tirei 5 nas duas, qual foi a minha
média?
8- Uma prova tem peso 9 e a outra tem peso 1. Se eu tirei 4 nas duas, qual foi a minha
média?
9- Qual a(s) moda(s) do conjunto {4 5 4 6 7 7 7 4}?
21
10- Um caminhão fez uma viagem a uma velocidade média de 70 km/h, e voltou pelo
mesmo trecho a 100 km/h. Qual foi a sua velocidade média de todo o percurso?
11- Um caminhão fez uma viagem a uma velocidade média de 60 km/h, e voltou pelo
mesmo trecho a 80 km/h. Qual foi a sua velocidade média de todo o percurso?
12- Um caminhão fez uma viagem a uma velocidade média de 40 km/h, e voltou pelo
mesmo trecho a 80 km/h. Qual foi a sua velocidade média de todo o percurso?
13- Qual a média geométrica dos valores 40 e 80?
14- Qual média é maior, a aritmética ou a geométrica, dos valores 3 e 7?
15- Qual média é maior, a geométrica ou a harmônica dos valores 3 e 7?
16- Formule uma amostra trimodal.
RESPOSTAS
1
a) 6,95 minutos b) 7 minutos
2
a) 4,63 pontos b) 4,09 pontos
3- Média geométrica = 5,35; média harmônica = 4,14
4- 83,57 km/h
5- a) Média = 2,67, média harmônica = 2,65, média geométrica = 2,66
Moda = 2,5
b) Média = 25,3, média harmônica = 23,4, média geométrica = 24,2
Moda = 20
c) Média = 10,4, média harmônica = 8,5, média geométrica = 9,58
Moda = 12
6- 5,87. 7- 5 8- 4
9- Duas modas: 4 e 7. 10- 82,4 km/h 11- 68,6 km/h
12- 53,3 km/h
13- 56,6 14- A aritmética 15- A geométrica
22
Capítulo 3 – Percentis; Mediana
3.1 O que é percentil?
Seja a amostra de dados abaixo
{4; 4; 6; 6; 7; 7,5; 8,5; 10}.
O valor que é maior do que 25% dos outros valores desta amostra é chamado
de 25 ° percentil (vigésimo quinto percentil). Que valor seria este? Veremos na seção
3.2.
O valor acima de 80% dos outros valores desta amostra é chamado de 80°
percentil (octogésimo percentil). Que valor seria este? Veremos em 3.2 a seguir.
O valor acima de 100% dos demais valores da amostra é o maior de todos,
chamado de 100° percentil (centésimo percentil).
O valor acima de 0% dos demais valores da amostra (acima de nenhum valor
da amostra) é o menor de todos, corresponde ao percentil zero (0%).
E assim por diante, para qualquer porcentagem entre 0% e 100%. Neste capítulo,
vamos aprender como encontrar estes percentis.
3.2 Como calcular os percentis?
Vamos calcular o 25o percentil da amostra, que já está com seus 8 dados
ordenados:
{4; 4; 6; 6; 7; 7,5; 8,5; 10}.
3.2.1 Calculando primeiro a posição do percentil
Com os dados ordenados em ordem crescente, jogamos na seguinte regra para
obter, primeiro, a posição do 25° percentil:
Posição 1 → Percentil 0%
Posição 8 → Percentil 100%
Posição x → Percentil 25%
23
(—)
(—)
(—)
(—)
O número do meio menos o de cima, sobre o do meio menos o de baixo, sem as
porcentagens:
8−1
8−x
= 100−0
100−25
Resolvendo:
7
8−x
= 100
75
,
800−100 x=525 ,
−100 x=525−800 ,
100 x=275 , x=2,75 .
Atenção: 2,75 não é a resposta ainda. 2,75 é apenas a posição do valor (percentil)
que estamos procurando.
Se a posição fosse um número redondo, sem vírgula, a resposta seria o valor
correspondente. Por exemplo, se a posição x fosse 5, a resposta seria o quinto valor,
isto é, seria o valor 7 do nosso conjunto.
Mas, nosso exemplo não deu uma posição redonda, então temos de fazer um
esquema semelhante para achar o valor procurado.
Uma observação: essa regra vem do fato de que os três pares ordenados da tabela
(1, 0%), (8, 100%) e (x, 25%) pertencem a uma mesma reta.
3.2.2 Encontrando o percentil de fato
Agora, vamos finalmente achar o 25o percentil, que está na posição 2,75 na
amostra
{4; 4; 6; 6; 7; 7,5; 8,5; 10}. 
A posição 2,75 está entre as posições 2 e 3, então o esquema será:
Posição 2 → Valor4
Posição 3 → Valor 6
Posição 2,75 → Valor y
Da mesma forma, 
24
3−2
3−2,75
=6−4
6− y ,
1
0,25
= 2
6− y ,
6− y=2⋅0,25 , 6− y=0,5 , −y=0,5−6 , y=5,5 .
Portanto, a resposta: o 25º percentil é o valor 5,5.
Isto é, o valor 5,5 está acima de 25% dos demais valores da amostra. Observe que
o valor 5,5 não pertence ao conjunto. Os percentis não precisam pertencer ao
conjunto necessariamente.
Observe que é sempre necessário executar duas etapas, uma para encontrar a
posição do percentil, e outra para encontrar o próprio percentil, exceto quando a
posição é um número inteiro.
3.3 Percentis especiais
Alguns percentis têm nomes especiais:
O 50° percentil (quinquagésimo percentil) também é chamado de Mediana.
O 25° percentil também é chamado de 1° quartil (primeiro quartil).
O 50° percentil também é chamado de 2° quartil (segundo quartil), além também
de ser chamado de Mediana.
O 75° percentil também é chamado de 3° quartil (terceiro quartil).
Então, no nosso exemplo, o que fizemos foi encontrar o 1° quartil.
Para a Mediana, em particular, é fácil encontrar o valor rapidamente, sem passar
pelas duas etapas mencionadas acima, como veremos na próxima seção.
3.4 A Mediana
Regra prática para o cálculo da mediana (50o percentil)
Se a amostra tiver uma quantidade n par de elementos, a mediana (50°
percentil) será a média aritmética entre os valores centrais, ou seja, entre os
valores de posições 
n
2 e 
n
2
1 .
Se a amostra tiver uma quantidade n ímpar de elementos, a mediana será o
valor do meio, ou seja, o valor de posição 
n1
2 .
No nosso exemplo, n = 8, par. A mediana é então a média aritmética entre os
valores centrais, ou seja, os de posição 4 e 5. Isto é, a mediana é a média entre os
valores 6 e 7 da amostra. Enfim, a mediana do nosso conjunto é, portanto: (6 + 7) / 2
= 6,5.
25
Outro exemplo: qual é a mediana da amostra {3; 8; 11; 12; 12; 31; 32}? Ora, n
= 7, ímpar. Então a mediana é o valor central, 12, o quarto valor da amostra.
3.5 No software R
O 75o percentil, ou seja, o 3o quartil, da amostra a = {2; 2; 3}
> a < – c(2,2,3)
> quantile(a,0.75)
A mediana da amostra a = {2; 2; 3}
> median(a)
Os quartis da amostra a = {2; 2; 3}
> quantile(a)
3.6 No software Excel, nas céluas A1 até C1
O 75o percentil, ou seja, o 3o quartil, da amostra a = {2; 2; 3}
=percentil(A1:C1;0,75)
A mediana da amostra a = {2; 2; 3}
=med(2;2;3)
ou
=med(A1:C1)
Os quartis da amostra a = {2; 2; 3}
=quartil(A1:C1;1)
=quartil(A1:C1;2)
=quartil(A1:C1;3)
26
Lista de exercícios 3
1- Numa amostra em ordem crescente contendo 20 elementos, o décimo e o décimo
primeiro elementos são, respectivamente, 45 e 89. Qual é a mediana desta amostra?
2- Os lucros de uma empresa foram os seguintes, nos últimos 12 anos, em milhares
de reais: {90; 100; 105; 104; 103; 88; 88; 90; 110; 110; 109; 107}. Deste conjunto,
encontre:
a) a mediana
b) o 30° percentil
c) o 3° quartil
d) o lucro maior do que 90% dos demais
e) Fazer os itens a), b) e c) no software Excel.
f) Fazer os itens a), b) e c) no software R.
3- Encontre a mediana da amostra ordenada {1; 2; 3; 3; 4; 8; 100};
4- Dos dados da segunda questão, o dado 103 corresponde a qual percentil?
5- Qual a mediana do conjunto {9, 9, 10, 10, …, 10, 20}, no qual há sessenta valores
iguais a 10?
6- Do conjunto {5; 4; 4; 5; 10}, encontre:
a) o vigésimo percentil
b) a mediana
c) o nonagésimo percentil
d) o terceiro quartil
e) o valor maior do que 60% dos dados
f) qual o percentil referente ao dado 5 do conjunto?
g) Fazer os itens a), b), c) e d) no software Excel.
h) Fazer os itens a), b), c) e d) no software R.
(lembre-se, os dados devem estar ordenados para se encontrarem os percentis)
7- Para o conjunto {1; 4; 6; 11}, determine o percentil do dado 6.
8- Para o conjunto {1; 4; 6; 11}, determine o percentil do valor 2.
9- Para o conjunto {1; 4; 6; 11}, determine o percentil do valor 5.
10- Para o conjunto {1; 4; 6; 11}, determine a mediana.
27
11- Na amostra {6; 7; x; 22} , a mediana vale 8. Encontre x:
12- Na amostra {6; 8; x; 22} , a mediana vale 8. Encontre x:
13- Na amostra {6; x; 11; 22} , a mediana vale 8. Encontre x:
14- Na amostra {6; x; 8; 22} , a mediana vale 8. Encontre x:
15- Numa amostra ordenada, a mediana é a soma do sétimo com o oitavo elemento,
dividida por 2. Quantos elementos possui a amostra?
Respostas:
1- 67
2- a) mediana = 103,5 mil reais
b) 93 mil reais
c) 107,5 mil reais
d) 109,9 mil reais
3- Mediana = 3
4- Resposta
Dados em ordem: {88; 88; 90; 90; 100; 103; 104; 105; 107; 109; 110; 110}
Já sabemos que o valor 103 ocupa a posição 6.
Logo, basta fazermos posição versus percentil, colocando a incógnita na última
sentença para facilitar as contas:
percentil 0 – posição 1
percentil 100 – posição 12
percentil x – posição 6
100−0
100−x
=12−1
12−6
100
100−x
=11
6
1100−11 x=600 −11 x=−500 x=500/11=45,45 .
Logo, o valor 103 é o 45,45o percentil, ou seja, é maior do que 45,45% dos demais
dados do conjunto!
Obs: no Excel, basta digitar os dados nas células A1 até A12, por exemplo, e depois
o comando
28
=ORDEM.PORCENTUAL(A1:A12;103)
5-
10
6- a) 4
b) 5
c) 8
d) 5
e) 5
f) A mediana ou então o terceiro quartil
7- 66,6%
8- A mediana, o quinquagésimo percentil, ou seja, o segundo quartil.
9- 11,1%
10- 
5
11-
9
12-
8
13-
5
14-
8
15- 
14 elementos
29
Capítulo 4 – Dados suspeitos (outliers); Gráfico Boxplot
4.1 Dados suspeitos (outliers)
Os dados que são muito pequenos em relação aos demais, ou muito grandes, são
chamados de outliers, ou dados suspeitos. Veremos agora como identificar os
outliers:
Seja Q1 o 1° quartil e Q3 o 3°quartil.
Então, um valor que seja, ou:
• menor do que Q1−1,5⋅Q3−Q1 , ou
• maior do que Q31,5⋅Q3−Q1 ,
será considerado um dado suspeito (outlier).
Os valores acima, Q1−1,5⋅Q3−Q1 e Q31,5⋅Q3−Q1 são chamados
de barreira esquerda e barreira direita, respectivamente.
A diferença Q3−Q1 é chamada de Diferença Interquartil.
Um exemplo: encontre os outliers da amostra ordenada
{11; 11,5; 12; 12; 12; 13; 13; 13; 15}, com 9 dados.
Mediana = 12. 
Encontrando o 1° quartil, como feito no capítulo 3:
9−1
9− x
= 1−0
1−0,25
; 6=9−x ; x=3 .
Portanto, o 1° quartil é o valor da terceira posição, isto é, o valor 12 (coincidiu
com a mediana).
Agora, o 3° quartil:
9−1
9− x
= 1−0
1−0,75
; 2=9−x ; x=7 .
O 3° quartil é o valor da sétima posição, isto é, o valor 13. Agora, as barreiras:
30
Q1−1,5Q3−Q1=12−1,513−12=12−1,5=10,5 .
10,5 é a primeira barreira, a barreira esquerda.
Agora, a outra barreira, a direita:
Q31,5Q3−Q1=131,513−12=131,5=14,5 .
No nosso conjunto {11; 11,5; 12; 12; 12; 13; 13; 13; 15} não existem valores
menores do que a barreira esquerda 10,5. No entanto, o valor 15 é maior do que a
barreira direita 14,5. Portanto, o valor 15 é considerado dado suspeito, ou outlier.
4.2 O gráfico Boxplot
Uma maneira de visualizarmos a dispersão dos dados de um conjunto é
construindo um gráfico chamado de Boxplot.
O gráfico Boxplot é construído da seguinte forma:
Localizamos no eixo horizontal cinco valores: o menor dado que não seja outlier, o 1°
quartil, o 2° quartil (também chamado de mediana), o 3° quartil e o maior valor que
não seja outlier.
Entre o 1°quartil e o 3° quartil desenhamos uma caixa (box, em inglês). Veja a
figura abaixo (md = mediana):
O boxplot ainda mostra os outliers como pontos que aparecem antes da barreira
esquerda, e após a barreira direita.
O boxplot pode aparecer na horizontal ou na vertical.
4.3 Exemplo de como construir o Boxplot
Vamos usar o mesmo exemplo anterior, da amostra
{11;11,5; 12; 12; 12; 13; 13; 13; 15}, com 9 dados.
Já vimos que:
• barreira esquerda = 10,5
31
• Dado mínimo, não outlier = 11
• 1o quartil = 12
• 2o quartil = 12
• 3o quartil = 13
• barreira direita = 14,5
• Dado máximo, não outlier = 13
Então, o boxplot seria o seguinte gráfico (na vertical):
Figura feita no software R
O pontinho em cima representa o outlier 15.
4.4 No software R
O boxplot da amostra a = {2; 3; 4; 3}
a < – c(2, 3, 4, 3)
boxplot(a)
Obs: o boxplot do R nem sempre usa o fator 1,5 para o cálculo das barreiras.
Depende dos dados do conjunto!
32
Lista de exercícios 4
1- Leia a seguinte notícia, tirada do site 
http://www.portaldoagronegocio.com.br/conteudo.php?
tit=exportacoes_de_arroz_atingiram_118,7_mil_toneladas_em_marco&id=53212 
“Segundo a Equipe de Política Setorial do Instituto Rio Grandense do Arroz (Irga),
dentre os principais destinos das exportações brasileiras de arroz no mês estão:
Nigéria (43,2 mil t), Senegal (26,8 mil t), Benin (14,5 mil t), África do Sul (7,6 mil t),
Bolívia (3,2 mil t), Itália (2,6 mil t), Angola (2,4 mil t) e Colômbia (2,4 mil t).” 
Faça um gráfico Boxplot destes dados e verifique a existência de outliers (valores
destoantes, atípicos).
2- Construa o Boxplot dos dados abaixo, identificando os outliers, caso existam:
{90; 100; 105; 104; 103; 88; 88; 90; 110; 110; 109; 107}
Fazer também no software R.
3- Construa o Boxplot dos dados abaixo, identificando os outliers, caso existam:b)
{4; 12; 14; 12; 10; 13; 8; 11; 12; 5; 6; 7; 6; 25; 14}
4- Encontre os outliers, caso existam, da amostra 6; 3; 4; 10.
5- Encontre os outliers, caso existam, da amostra 6; 3; 4; 19.
6- Encontre os outliers, caso existam, da amostra 6; 3; 4; 30.
7- Encontre os outliers, caso existam, da amostra –6; 0; 4; 10.
8- Encontre os outliers, caso existam, da amostra –6; 0; 4; 40.
33
9- Encontre os outliers, caso existam, da amostra –6; – 5; 4; 10.
10- Encontre os outliers, caso existam, da amostra –6; – 5; 4; 30.
11- Encontre os outliers, caso existam, da amostra –64; – 5; 4; 50.
12- Encontre os outliers, caso existam, da amostra –64; – 5; 4; 150.
13- Encontre os outliers, caso existam, da amostra –64; – 5; 0; 4; 50.
14- Encontre os outliers, caso existam, da amostra –7; – 5; 0; 4; 50.
15- Encontre os outliers, caso existam, da amostra –70; – 5; 0; 4; 5.
Respostas
1-
Resposta
Mínimo = 2,4 mil t;
1° Quartil = 2,55 mil t;
2° Quartil = 5,4 mil t;
3° Quartil = 17,58 mil t;
Máximo = 43,2 mil t.
Barreira esquerda = –19,99 mil t
Barreira direita = 40,11 mil t
Outiler (dado suspeito): 43,2 mil t (Nigéria). Maior dado não outlier: 26,8 mil t:
2-
Primeiro quartil: 90
Mediana: 103,5
Terceiro quartil: 107,5.
Não há outliers.
Agora, só desenhar o boxplot.
3-
Primeiro quartil: 6,5
Mediana: 11
Terceiro quartil: 12,5
Outlier: 25
Agora, só desenhar o boxplot.
34
4- Não há outliers.
5- Outlier: 19
6- Outlier: 30
7- Não há outliers.
8- Outlier: 40
9- Não há outlier.
10- Não há outlier.
11- Outlier: 50
12- Outlier: 150
13- Outliers: –64 e 150
14- Outlier: 50
15- Outlier: – 70 
35
Capítulo 5 – Inclinação; Média calculada a partir de Histograma
5.1 Inclinação
Quando uma amostra possui valores muito abaixo dos demais, dizemos que a
amostra possui uma distorção à esquerda, ou assimetria à esquerda, ou inclinação à
esquerda.
Se, por outro lado, alguns valores forem muito altos em relação aos demais,
então é possível que a amostra possua uma distorção à direita, assimetria à direita
ou inclinação à direita.
Existe uma fórmula que dá exatamente este coeficiente de inclinação (distorção).
Se esse coeficiente é negativo, a amostra possui inclinação (distorção) à esquerda.
Se é positivo, possui inclinação (distorção) à direita. Em uma planilha eletrônica,
como o Excel ou o Broffice, o comando que dá o coeficiente de inclinação é
=distorção(valor 1; valor 2; …; valor n ).
No exemplo abaixo, o que o leitor acha, os valores possuem distorção à esquerda
ou à direita? 
O histograma acusa portanto uma distorção à esquerda, ou assimetria à esquerda
ou inclinação à esquerda, pois há poucos dados à esquerda. Logo, o coeficiente de
inclinação desses dados será negativo.
Por outro lado, se um histograma possui os retângulos menores à direita, a
distorção é à direita (coeficiente de inclinação positiva).
Agora, se um histograma possui retângulos de mesma altura tanto à direita quanto
à esquerda, então não há distorção, o histograma é simétrico (coeficiente de
inclinação igual a zero).
36
a b c d e
0
1
2
3
4
5
6
7
8
9
1
3
5
8
5
5.2 Média a partir de Histograma
No primeiro capítulo, construímos o seguinte histograma, que organiza os 15
membros de uma família de acordo com a massa em quilos (que aliás apresenta
distorção à esquerda, pois os retângulos menores estão à esquerda):
Como calcular a média (aproximada) a partir apenas do Histograma?
Basta encontrar o ponto médio de cada classe, e atribuir este ponto médio aos
pesos dos indivíduos de classe correspondente.
O ponto médio da primeira classe é 
85,790,4
2
=88,05.
Então, vamos dizer que os dois clientes da primeira classe pesam 88,05 kg cada um,
mesmo sabendo que talvez não seja verdade.
O ponto médio da segunda classe é 
90,495,1
2
=92,75 .
Então, vamos dizer que os dois clientes da segunda classe pesam 92,75 quilos cada
um.
Na terceira classe, há seis clientes. O ponto médio da terceira classe é
95,199,8
2
=97,45. Então, vamos dizer que os seis clientes da terceira classe
pesam 97,45 quilos.
Na quarta classe, há cinco clientes. O ponto médio da quarta classe é
99,8104,5
2
=102,15. Então, vamos dizer que os cinco clientes da quarta classe
pesam 102,15 quilos.
Pronto, agora é só calcular a média aproximada: 
37
Entre 85,7 e 90,4
Entre 90,4 e 95,1
Entre 95,1 e 99,8
Entre 99,8 e 104,5
0
1
2
3
4
5
6
7
2 2
6
5
Número de clientes
x=88,05⋅292,75⋅297,45⋅6102,15⋅515
=1.457,05
15
=97,13666... ,
o que dá muito próximo da média real, que, se você se lembrar, era 97,133...
A diferença das duas médias, nesse caso, é de apenas 0,0033... kg, ou
aproximadamente 3 gramas.
38
Lista de exercícios 5
1- Refaça todos os exemplos do texto.
2- Leia a seguinte notícia, tirada do site
http://www.portaldoagronegocio.com.br/conteudo.php?
tit=exportacoes_de_arroz_atingiram_118,7_mil_toneladas_em_marco&id=53212 
“Segundo a Equipe de Política Setorial do Instituto Rio Grandense do Arroz (Irga),
dentre os principais destinos das exportações brasileiras de arroz no mês estão:
Nigéria (43,2 mil t), Senegal (26,8 mil t), Benin (14,5 mil t), África do Sul (7,6 mil t),
Bolívia (3,2 mil t), Itália (2,6 mil t), Angola (2,4 mil t) e Colômbia (2,4 mil t).” 
Use o computador para calcular o coeficiente de inclinação (distorção) e interprete.
Resposta
Coeficiente de Inclinação (distorção, assimetria): 1,5. Interpretação: o valor é
positivo, o que indica a presença de valore(s) muito alto(s) em relação à grande
maioria dos valores. Por isso, a amostra é considerado “assimétrico” à direita.
3- Numa fábrica, foram selecionadas algumas embalagens para serem pesadas, a fim 
de se verificar se as mesmas estão de acordo com as especificações exigidas. Os 
resultados foram (em gramas): {12; 11; 8; 7; 12; 10; 11; 8; 8; 11; 11; 12; 10; 8; 7; 6; 
7; 13; 13; 12; 11; 10; 18}.
a) Encontre a média
b) Construa o histograma (veja o exercício 2 da lista 1)
c) Calcule a média aproximada (a partir do histograma, também chamada média 
ponderada)Resposta
a) 10,26 gramas
b) (falta o gráfico)
Entre 4,5 e 7,5 gramas: frequência de 4 embalagens
entre 7,5 e 10,5 gramas: frequência de 7 embalagens
entre 10,5 e 13,5 gramas: frequência de 11 embalagens
entre 13,5 e 16,5 gramas: sem frequência (nenhuma embalagem)
entre 16,5 e 19,5 gramas: frequência de 1 embalagem
c) 10,30 gramas
4- Encontre a média dos dados agrupados no Histograma da pág. 5.
39
Capítulo 6 – Desvio Padrão, Variância e Coeficiente de Variação
6.1 Desvio Médio
Para medirmos a dispersão de um conjunto, existem algumas medidas que
veremos neste capítulo. Dispersão lembra desconcentração, variabilidade.
Por exemplo, o conjunto de peses A = {2 kg; 2 kg; 3 kg; 4 kg} apresenta mais ou
menos dispersão do que o conjunto de pesos B = {1 kg; 2 kg; 0 kg; 7 kg}?
O conjunto A é menos disperso, pois os valores em A não apresentam grande
variação entre si, já os valores em B apresentam maiores discrepâncias entre si.
A primeira medida de dispersão é o desvio médio. O desvio médio é definido
como a somatória: 
∣x−∣
n , em que x representa cada elemento do conjunto, a
letra grega “mi”  representa a média (também poderia ser x ), e a letra grega
sigma (maiúscula)  indica uma soma, ou somatório.
O módulo serve para que as parcelas da soma não se cancelem.
Como exemplo, vamos calcular o desvio médio do conjunto A acima
exemplificado. Antes, precisamos encontrar a sua média mi:
=2234
4
=11
4
=2,75 kg.
Agora sim, o desvio médio, usando a fórmula acima, é:
∣x−∣
n =
∣2−2,75∣∣2−2,75∣∣3−2,75∣∣4−2,75∣
4 =
0,750,750,251,25
4
= 3
4
=0,75 kg.
Já no conjunto B, primeiro calculamos a média:
=1207
4
=2,5 kg.
O desvio médio:
∣x−∣
n =
∣1−2,5∣∣2−2,5∣∣0−2,5∣∣7−2,5∣
4 =
40
1,50,52,54,5
4
=2,25 kg.
O desvio médio do conjunto B é bem superior ao do conjunto A, demonstrando
que o conjunto B apresenta uma dispersão maior de seus valores em torno da média.
Uma observação: na fórmula do desvio médio, a expressão ∣x−∣ é a
distância (ou desvio) entre cada valor x e a média  , de modo que, somando
essas distâncias (desvios), e dividindo por n, temos exatamente a distância média, ou,
o desvio médio.
Quanto maior for o desvio médio, mais os dados estão dispersos em relação à
média  .
6.2 Variância Populacional
Porém, o desvio médio apresenta em sua fórmula a operação de módulo. O
módulo, matematicamente, não é tão simples de se lidar. Foi criada então a
Variância, trocando o módulo pela operação “ao quadrado”. Portanto, a variância é
definida pela fórmula:  x−
2
n
. Como exemplo, a variância dos pesos do
conjunto A acima é:
  x−
2
n
=2−2,75
22−2,7523−2,7524−2,752
4
=
0,7520,7520,2521,252
4
=2,75
4
≃0,69 kg2 . Novamente, a variância
também mede a dispersão dos dados em relação à média  . Quanto maior a
variância, maior a dispersão dos dados em relação à média  .
6.3 Desvio Padrão Populacional
A Variância, explicada acima, tem unidade de medida ao quadrado, por isso foi criado
o Desvio Padrão, para que a unidade de medida se conserve.
O Desvio Padrão é a raiz quadrada da variância.
Portanto, o Desvio Padrão é:  x−2n . Assim, o desvio padrão dos valores
do conjunto A é  2,754 ≃0,83 kg. 
O desvio padrão tem a vantagem de estar na mesma unidade do conjunto.
Mais uma vez: quanto maior o desvio padrão, mais os valores do conjunto estão
41
dispersos em relação à média  .
A notação (símbolo, expressão reduzida) da variância é 2 (letra grega sigma
minúscula), enquanto que a notação do desvio padrão é  . Assim,
2=
 x−2
n
 e = x−2n . Salienta-se que o “quadrado” no
símbolo 2 é apenas um símbolo, uma notação.
Estas duas fórmulas se referem a dados de todo o público-alvo da pesquisa em
questão, isto é, de toda a população. A variância e o desvio padrão acima descritos
são por isso chamados de variância populacional e desvio padrão populacional.
Aliás, por isso também escrevemos  para a média, que é o símbolo para a
média populacional.
6.4 Variância Amostral e Desvio Padrão Amostral
Porém, se os valores do conjunto forem retirados de uma amostra, isto é, de
apenas uma parte de todo público-alvo da pesquisa, as duas fórmulas acima mudam
para (a mudança é apenas no denominador, observe):
variância amostral s2= x−x 
2
n−1
;
desvio padrão amostral s= x−x2n−1 , onde x é o símbolo da média
amostral.
Note que a notação também muda. O símbolo da variância amostral é s2 , e o
símbolo do desvio padrão amostral é s.
Em estatística, o desvio padrão é a medida de dispersão mais usada. Como um
último exemplo, considere os pesos da seguinte amostra de 6 bois de uma fazenda:
{10@ (arrobas); 8,5@; 13@; 8@; 11@; 8@}. Quanto é o desvio padrão destes
valores (lembre-se que são valores de uma amostra)? Primeiro, calculamos a média
x=
108,5138118
6
=9,75 @ .
O desvio padrão (amostral) é:
s= x−x2n−1 =
42
 10−9,7528,5−9,75213−9,7522⋅8−9,75211−9,7526−1
≃3,98 arrobas ≃1,99 @.
6.5 Coeficiente de Variação
Vimos que o Desvio Padrão mede a variabilidade dos dados. Porém, quando
quisermos comparar a variabilidade entre dois conjuntos de médias distintas, ou
unidades de medida distintas, o ideal é relativizar os desvios padrões de cada um,
em termos de porcentagem, calculando o Coeficiente de Variação CV= .
Exemplo: conjunto A = {1; 2; 5}, representando a quantidade de irmãos de três
funcionário do setor de recurso humanos de uma empresa, isto é, o primeiro
funcionário tem 1 irmão, outro tem 2 e outro tem 5.
B = {1.000; 2.500; 1.000} são os salários destes funcionários, em reais.
Qual conjunto apresenta maior dispersão de seus valores? 
Calculemos a média primeiramente do conjunto A: =1253
=8
3
≃2,67
irmãos. O seu desvio padrão é
= 1−2,6722−2,6725−2,6723 ≃1,7 irmãos.
CV= = 1,7 / 2,67 = 63,67%
A média do conjunto B é =1.0002.5001.000
3
=1.500 reais. O desvio
padrão é 
= 1.000−1.500 22.500−1.500 21.000−1.50023 ≃707,11 reais.
CV = 707,11 / 1500 = 47,14%.
Logo, o conjunto A é mais disperso em torno da média do que B.
6.6 No software R
Variância amostral do conjunto a = {3; 3; 0}
a < – c(3,3,0)
var(a)
43
Variância populacional do conjunto a = {3; 3; 0}
var(a)/length(a)*(length(a) – 1)
Desvio Padrão amostral do conjunto a = {3; 3; 0}
sd(a)
Desvio Padrão populacional do conjunto a = {3; 3; 0}
sd(a)/sqrt(length(a))*sqrt(length(a) – 1)
Coeficiente de variação do conjunto a = {3; 3; 0}
sd(a)/mean(a)
6.7 No software Excel nas células A1 até C1
Desvio Médio do conjunto a = {3; 3; 0}
=desv.médio(A1:C1)
Variância Populacional do conjunto a = {3; 3; 0}
=varp(A1:C21)
Variância Amostral do conjunto a = {3; 3; 0}
=var(A1:C21)
Desvio Padrão Populacional do conjunto a = {3; 3; 0}
=desvpadp(A1:C21)
Desvio Padrão Amostral do conjunto a = {3; 3; 0}
=desvpad(A1:C21)
Coeficiente de Variação do conjunto a = {3; 3; 0}
=desvpad(A1:C21)/média(A1:C1)
44
Lista de exercícios 6
1- Refaça todos os exemplos do texto.
2- Considere o conjunto {3; 3; 3; 3; 3}. Qual é:
a) O desvio médio? 
b) A variância populacional? 
c) O desvio padrão populacional?
d) Fazer os itens anteriores usando o software Excel.
Resposta
a) 0 b) 0 c) 0
3- Os dados abaixo representam a capacidade (em número de fotografias) de uma
amostra de cinco baterias diferentes para câmaras digitais existentes no mercado:
{marca 1 – 300 fotografias; marca 2 – 450 fotografias; marca 3 – 180 fotografias;
marca 4 – 260 fotografias; marca 5 – 110 fotografias}.
a) Calcule o desvio médio 
b) Calcule a variância amostralc) Calcule o desvio padrão amostral
d) Fazer os itens a), b) e c) nos softwares Excel e R.
Resposta
a) 92 fotografias b) 16.650 fotografias² c) 129,03 fotografias
4- Considere os conjuntos A = {0; 3; 4; 4; 5; 7} e B = {40; 45; 45; 46; 46}. Calcule o
Coeficiente de Variação dos dois conjuntos, e decida qual conjunto possui maior
variabilidade.
Resposta 
Coeficiente de Variação do conjunto A = 55%
Coeficiente de Variação do conjunto B = 5%
O conjunto A possui maior dispersão dos seus dados, pois o seu Coeficiente de
Variação é maior.
5- Encontre o desvio médio, a variância amostral, a variância populacional, o desvio
padrão amostral e o desvio padrão populacional dos dados seguintes: {4; 12; 14; 12;
10; 13; 8}
45
6- Prove que a média é o ponto de mínimo da função variância 
f (t)=
∑
i=1
n
(x i−t)
2
n
.
Resposta
Do Cálculo 1, sabemos que o ponto de mínimo é encontrado derivando-se a função e
igualando-a a zero.
f ´ ( t)=
∑
i=1
n
2(x i−t)⋅(−1)
n
.
Igualando a zero, temos:
f ´( t)=0⇔
∑
i=1
n
−2⋅(x i−t)
n
=0⇔
∑
i=1
n
(xi−t)=0⇔∑
i=1
n
x i−∑
i=1
n
t=0⇔∑
xi=1
n
x i−nt=0⇔nt=∑
i=1
n
x i⇔ t=
∑
i=1
n
x i
n
= x¯ ,
como queríamos demonstrar.
46
Capítulo 7 – Noções de Análise Combinatória
7.1 Fatorial
O símbolo “!” indica fatorial, por exemplo: três fatorial é: 3! = 3⋅2⋅1=6 ;
cinco fatorial é: 5 !=5⋅4⋅3⋅2⋅1=120 . Enfim, o fatorial de um número é o
resultado da multiplicação desse número pelos seus antecessores positivos.
Lembremos também:
1! = 1, e 
0! = 1.
7.2 Princípio Fundamental da Contagem – PFC
Fábio tem 4 sapatos e 5 camisas. De quantas formas ele pode escolher um sapato e
uma camisa para se vestir? O Princípio Fundamental da Contagem diz que devemos
multiplicar as possibilidades de cada etapa:
5×4=20 possibilidades de escolher um sapato e uma camisa.
Exemplo: Quero formar uma senha de 8 dígitos com os dez algarismos 0, 1, 2, 3,
…, 8, 9.
Quantas podem ser formadas? Novamente, pelo PFC:
10⋅10⋅10⋅...⋅10⏟
8vezes
=108 senhas possíveis.
Exemplo: Quero formar uma senha de 4 dígitos distintos com os cinco algarismos
pares 0, 2, 4, 6 e 8. Quantas podem ser formadas?
Pelo PFC:
5⋅4⋅3⋅2=5 !=120 senhas possíveis.
7.3 Contando grupos: Arranjo e Combinação
Como você faria para contar grupos? Por exemplo, precisamos criar uma senha
com 5 dígitos distintos, podendo usar os 10 algarismos {0, 1, 2, 3, 4, …, 9}. Quantas
senhas (grupos) podemos formar? Como saber quantas senhas são possíveis de se
formar?
Veja esse outro exemplo: preciso escolher 5 pessoas para formar uma equipe de
vôlei, e disponho de 10 pessoas para fazer essa escolha. Quantos times (grupos) posso
formar? 
Nosso objetivo é, portanto, saber a quantidade de grupos que podemos formar
47
em casos como esses.
Quais as semelhanças e diferenças entre os dois exemplos acima? No primeiro
exemplo, disponho de 10 elementos (dígitos) para fazer as escolhas. No segundo
também: tenho 10 elementos (jogadores) para fazer as escolhas. No primeiro
exemplo, cada grupo (senha) tem 5 elementos (dígitos). No segundo exemplo
também: cada grupo (time) tem 5 elementos (jogadores). Então, qual é a diferença
entre as duas situações? Nos dois casos, temos 10 elementos para escolher
exatamente 5. Mas tem uma diferença...
A diferença é que, por exemplo, a senha 32145 é diferente da senha 23154, pois a
ordem dos elementos altera a senha, o grupo. Já no segundo exemplo, por
exemplo, o time João, Maria, Marcos, Fernando e Joaquina é igual ao time Maria,
João, Marcos, Joaquina e Fernando, pois a ordem dos elementos não altera o time,
o grupo.
Temos, portanto, duas situações aqui: uma na qual a ordem altera o grupo, e outra
na qual a ordem não altera o grupo.
Quando a ordem dos elementos altera o grupo, a quantidade total de grupos
possíveis é:
n×(n−1)×(n−2)×⋯×(n− p+1) , ou,
n!
(n−p)! .
Essa fórmula é chamada Arranjo. Aqui, n é a quantidade total de elementos
disponíveis para formar os grupos, e p é o tamanho do grupo a ser formado. Cada
grupo é chamado de arranjo.
Já quando a ordem dos elementos não altera o grupo, a quantidade de grupos
possíveis é:
n×(n−1)×(n−2)×⋯×(n−p+1)
p ! , ou,
n!
n− p !⋅p! .
Essa fórmula é chamada Combinação. Aqui também, n é a quantidade total de
elementos disponíveis para formar os grupos, e p é o tamanho do grupo a ser
formado. Cada grupo é chamado de combinação.
48
Em resumo, o Arranjo é a fórmula que conta grupos, para o caso em que a ordem
dos elementos altera o grupo. A Combinação é a fórmula que conta grupos, para o
caso em que a ordem dos elementos não altera o grupo.
No nosso primeiro exemplo, a ordem dos elementos altera o grupo, pois trata-
se da formação de uma senha de computador. Então, a quantidade de senhas será
dada pelo Arranjo =
 
n!
n− p !
= 10 !
10−5!
=10⋅9⋅8⋅7⋅6⋅5 !
5 !
=10⋅9⋅8⋅7⋅6⋅5 !
5!
=10⋅9⋅8⋅7⋅6
= 30.240 senhas possíveis.
Já no nosso segundo exemplo, a ordem dos elementos não altera o grupo, pois
trata-se da formação de um time. Então, a quantidade de times possíveis será dada
pela Combinação =
n!
n− p !⋅p!
= 10 !
10−5 !⋅5 !
=10⋅9⋅8⋅7⋅6⋅5 !
5 !⋅5⋅4⋅3⋅2⋅1
=10⋅9⋅8⋅7⋅6
5⋅4⋅3⋅2⋅1
=252 times
possíveis.
Observamos que, em ambos os casos, os elementos de cada grupo formado são
distintos, ou seja, as duas fórmulas só são verdadeiras considerando que cada grupo
(arranjo ou combinação) possui elementos distintos.
7.4 Permutação
Outra observação é que um arranjo no qual n = p tem o nome mudado para
Permutação. Ou seja, a permutação é um arranjo especial: é um arranjo para o
qual n = p. Como a permutação é um arranjo, sua fórmula seria
n!
n− p! . Mas,
como n = p, então fica n!0 !
=n!
1
=n! , logo, Permutação = n!.
É o caso por exemplo de precisarmos formar uma fila com 7 pessoas. Quantas
filas podemos formar com 7 pessoas? Aqui, dispomos de n = 7 pessoas para formar a
fila, e cada possível fila possui p = 7 pessoas. Além disso, a ordem das pessoas muda
a fila, então estamos com um arranjo. Mas, além disso, n = p = 7, de modo que o
problema é de arranjo para o caso n = p. Temos, enfim, uma permutação. Assim, o
número de filas possíveis é 7! = 5.040.
Um gerente precisa estacionar 4 caminhões em fila. De quantas formas ele poderá
fazer isso? Nesse caso, n = p = 4, e a ordem dos caminhões altera a fila. Portanto,
trata-se de uma permutação. Logo, ele poderá formar n! = 4! = 24 filas com os 4
49
caminhões.
Agora, imagine que o estacionamento só possua dois lugares em fila, de modo que
os outros dois caminhões devam ficar do lado de fora. De quantas formas ele poderá
estacionar dois caminhões em fila, podendo escolher dentre os quatro caminhões?
Aqui, a ordem dos caminhões altera a fila, além disso, n = 4 e p = 2. Temos aqui
um Arranjo: n×(n−1)×⋯×(n− p+1)=4×3=12 maneiras possíveis de
estacionar os dois caminhões em fila.
7.5 No software R
Fatorial do número 3
factorial(3)
Combinação de 5 elementos, tomados 3 a 3
choose(5,3) → Para contar as combinações
combn(5,3) → Para listar as combinações, na vertical
7.6 No software Excel
Fatorial do número 3
=fatorial(3)
Combinação de 5 elementos, tomados 3 a 3
=combin(5;3)
Arranjo de 6 elementos, tomados 4 a 4
=permut(6;4)
50
Lista de exercícios 7
1- Vou lançar uma moeda e um dado. Quantas são os resultados possíveis?
2- Tenho 3 filhos. Devo escolher 2 para levar ao mercado, deixando 1 com minha
esposa. De quantas formas posso fazer essa escolha?
Fazer nos softwares Excel e R.
Resposta
3 formas de escolher os filhos.
3- Preciso ligar para 3 amigos. Quantas possíveis ordens existem para eu efetuar as3
ligações? Fazer nos softwares Excel e R.
Resposta
6 ordens para as ligações.
4- Tenho 5 jogos de Playstation II, e preciso escolher 4 para levar para a casa do meu
primo e jogar com ele. Quantas escolhas posso fazer? Fazer nos softwares Excel e R.
Resposta
5 escolhas dos jogos.
5- Tenho que formar uma senha com 6 letras, todas distintas. Se posso usar todas as
26 letras do alfabeto, quantas senhas posso formar? Fazer nos softwares Excel e R.
Resposta
165.765.600 senhas.
6- Eu e meus 3 irmãos vamos formar uma fila para entrarmos no cinema. De quantas
formas podemos formar essa fila?
Resposta
24 formas de formar a fila com as 4 pessoas.
7- Quantos anagramas (palavras com ou sem sentido), de 4 letras distintas, podemos
formar com as letras FUSO?
Resposta
24 anagramas
51
Capítulo 8 – Noções de Probabilidades
8.1 A probabilidade é uma razão
Sabe-se que 20% (= 0,2) dos doces fabricados numa determinada indústria sofrem
deformação durante a produção. Esses 20% (= 0,2) são a proporção de doces
deformados na indústria. Sabendo disso, se escolhermos um doce aleatoriamente,
qual a chance (probabilidade) dele ser deformado? Claramente, a chance de ser
deformado é de 20% (= 0,2), igual à proporção dos doces deformados.
Esse exemplo nos ajuda a entender o seguinte: imagine um conjunto de objetos
qualquer. Vamos escolher aleatoriamente um objeto desse conjunto. Queremos saber
a probabilidade desse objeto escolhido ser de um determinado tipo. A probabilidade
de um objeto aleatoriamente escolhido ser de determinado tipo é exatamente a
proporção (porcentagem) dos objetos desse tipo no conjunto.
Outro exemplo: se, numa sala de aula há 30% (=0,3) de homens, então,
escolhendo aleatoriamente uma pessoa nessa sala, a probabilidade dessa pessoa ser
homem é 30%, ou 0,3.
Podemos aplicar esse princípio também no seguinte caso: numa turma há 5
homens e 12 mulheres, num total de 17 pessoas. Qual é a probabilidade de se
escolher aleatoriamente uma mulher nessa turma? Ora, pelo mesmo princípio acima,
a probabilidade de se escolher uma mulher é exatamente a proporção de mulheres na
turma, que é de 12 em 17, isto é: 
12
17
≃70,59% ou 0,7059.
Num estacionamento, há 12 carros e 13 motos. Escolhendo aleatoriamente um
automóvel aí, qual é a chance de ser moto? A probabilidade será a proporção de
motos no estacionamento, que é de 13 em 25, isto é,
13
25
=52% ou 0,52.
8.2 Probabilidades em Histogramas
Em Histogramas, também podemos falar de probabilidades, veja o histograma
abaixo, que dá o número de clientes de um SPA em cada classe de pesos, em kg.
Tente responder: qual a probabilidade de se escolher aleatoriamente um cliente que
pese entre 90,4kg e 95,1kg?
52
A probabilidade de escolhermos aleatoriamente um cliente na classe entre 90,4kg
e 95,1kg (a segunda classe) é a proporção de clientes dessa classe, que é de 2 em 15,
isto é, 
2
15
≃13,33% , ou 0,13333... Mas essa porcentagem é a frequência relativa
dessa classe. Ou seja, a frequência relativa de uma classe é exatamente a
probabilidade de se escolher um elemento dessa classe.
Em resumo, a probabilidade de se escolher um objeto em uma determinada
classe no Histograma é exatamente a frequência relativa dessa classe.
A probabilidade de se escolher um cliente na última classe, entre 99,8kg e 104,5kg
é 
5
15
≃33,33%=0,33... , que é exatamente a frequência relativa dessa classe.
Considerando ainda o Histograma acima, qual seria a probabilidade de se escolher
um cliente que pese entre 90,4kg e 99,8kg? Aqui, nós somamos as proporções
(probabilidades) das duas classes: 215
 6
15
=0,533...=53,33...% , veja a
figura na abaixo as duas classes com os retângulos pintados cujas frequências
relativas foram somadas:
53
Entre 85,7 e 90,4
Entre 90,4 e 95,1
Entre 95,1 e 99,8
Entre 99,8 e 104,5
0
1
2
3
4
5
6
7
2 2
6
5
Número de clientes
A área pintada (hachurada) acima corresponde a 53,33...% da área total do
Histograma.
8.3 Probabilidades usando Fatoriais
Alguns problemas de probabilidade podem envolver combinações ou arranjos.
Como exemplo, qual é a probabilidade de se ganhar na Mega-Sena, com uma única
aposta de 6 números?
Ora, como podemos escolher 60 números para formar um jogo de 6 números, a
quantidade de jogos possíveis é a combinação
 
60 !
60−6!⋅6 !
= 60!
54!⋅6 !
=50.063.860 jogos possíveis. Usamos a combinação
porque a ordem dos números sorteados não altera o resultado, por exemplo, o
sorteio {3, 22, 24, 30, 39, 55} é o mesmo sorteio {22, 3, 24, 39, 30, 55}.
Assim a probabilidade de se ganhar é de 1 jogo em 50.063.860 possíveis, isto é,
1
50.063.860
≃2⋅10−8=0,00000002=0,000002% . Animador, não?
8.4 Probabilidades entre desvios padrões
Dado um conjunto de valores, uma pergunta possível é: qual a probabilidade de
se escolher um valor entre − e  (entre “média – desvio padrão” e
“média + desvio padrão”)? Ou então entre −2 e 2 ? Ou entre
−3 e 3 .
Considere, por exemplo, o conjunto {2, 2, 3, 4, 7, 7, 8, 8, 8, 8}. Qual a
probabilidade de se escolher aí um valor entre − e  ?
Ora, a média é 5,7, e o desvio padrão populacional é 2,49 aproximadamente.
Queremos então saber a chance de se escolher um valor entre 5,7 – 2,49 e 5,7 + 2,49,
isto é, entre 3,21 e 8,19. Existem sete valores entre 3,21 e 8,19, então a probabilidade
será 
7
10
=70% . Logo, 70% dos valores estão entre − e  .
Agora, qual a probabilidade de se escolher um valor entre −2 e 2 ?
Claramente, a proporção agora deve ser maior. Bom,
−2=5,7−2⋅2,49=0,72 e 2=5,72⋅2,49=10,68. Logo, a
probabilidade é de 100%, pois todos os valores estão entre 0,72 e 10,68.
Obviamente, a chance de se escolher um valor entre −3 e 3 também
será 100%. E se aumentarmos ainda mais o número de desvios padrões, a
probabilidade também será 100%.
54
Logo, à medida que aumentamos os desvios padrões, a proporção (probabilidade)
também aumenta. A quantidade de desvios padrões é chamada de escore padrão,
como já vimos em capítulos anteriores.
8.5 Probabilidades envolvendo dois tipos de objetos
A probabilidade envolvendo dois tipos de objetos é outra situação possível, veja
esse exemplo: numa orquestra, há 50 músicos, dos quais 30 tocam piano e 45 tocam
violão (dois 'objetos': tocadores de piano e de violão). Qual é a probabilidade de se
escolher aleatoriamente um músico que toque apenas piano?
Antes de começar, observe que:
total de músicos = tocam piano + tocam violão – tocam ambos. 
A subtração no final da fórmula segue do fato de que, para contar todos os
músicos, nós somamos os que tocam piano com os que tocam violão, e, para não
contarmos duas vezes aqueles que tocam ambos, subtraímos essa quantidade.
Daí, 50 = 30 + 45 – tocam ambos,
tocam ambos = 75 – 50 = 25.
Daí 30 – 25 = 5 tocam apenas piano, e 45 – 25 = 20 tocam apenas violão. Logo, a
probabilidade de se escolher um músico que toque apenas piano é
5
50
=10=0,1 .
8.6 Eventos Independentes
Eventos Independentes
A chance de dois eventos independentes ocorrerem é o produto das probabilidades
de cada evento ocorrer, por exemplo: a chance de se obter cara no lançamento de uma
moeda, e de se escolher Joana num sorteio dentre quinze pessoas, nesta ordem, é:
1
2
× 1
15
= 1
30
8.7 Probabilidade Condicional
Qual a probabilidade de escolher um número ímpar do conjunto
{1; 2; 4; 5; 6; 8; 9},
55
sabendo (ou dado) que o número é maior do que 3? Isto mesmo, já sei que o número
sorteado é maior do que 3, e quero a chance de ele ser ímpar.
Dados do problema:
• Evento A = sair número ímpar. Quero a chance disto acontecer.• Evento B (a condição) = sair número maior do que 3: isso já ocorreu.
• Evento intersecção: A∩B={5 ;9}
Pergunta-se a probabilidade de A, dado B, que é simbolizada por P(A /B) .
Usamos, para isto, a fórmula da probabilidade condicional: 
P(A /B)=n(A∩B)
n(B)
onde n é o número de elementos do evento.
Então:
P = =25=40% .
A probabilidade condicional também pode ser calculada com esta fórmula:
P(A /B)= P(A∩B)
P(B) .
8.8 Probabilidade da União
A probabilidade da união de dois eventos disjuntos é a soma das probabilidades,
por exemplo: qual a chance de, em dois lançamentos de um dado, saírem um primo e
o número 6, em qualquer ordem, com reposição? Será:
• a chance de sair um primo (com probabilidade 3/6) e depois o número 6 (com
probabilidade 1/6), ou (+):
• a chance de sair o número 6 (com probabilidade 1/6) e depois um primo (com
probabilidade 3/6):
3
6
×1
6
+ 1
6
×3
6
= 6
36
=1
6
Se fosse sem reposição, seria:
3
6
×1
5
+ 1
6
×3
5
= 6
30
=1
5
56
8.9 Problemas Intrigantes de Probabilidade
Problema 1 – O problema dos 22 jogadores e o juiz.
Em um campo de futebol, qual a probabilidade de haver alguma coincidência de
aniversário entre as 23 pessoas, considerando apenas o dia e o mês de nascimento?
Para responder a esta pergunta, vamos inicialmente calcular a chance de não haver
coincidência de aniversário:
P(não haver coincidência) =
nº de distribuições de aniversário entre as 23 pessoas sem repetir datas /
nº total de distribuições de aniversário entre as 23 pessoas =
= 365 ·364 · 363 · 362 · … · 343 / ( 365 · 365 · 365 · … · 365 ) = 49,3%.
Logo, a chance de haver coincidência é, surpreendentemente, de 50,7%.
Problema 2 – Jogo das 3 portas (problema de Monty Hall)
Suponha que o animador de um programa de televisão lhe apresente 3 portas, e
que dentro de uma delas está um prêmio. Ele pede para você escolher uma das portas.
Em seguida, ele abre uma porta vazia, dentre as duas que você não havia escolhido.
Daí, ele lhe pergunta se você deseja continuar com a sua porta, ou trocá-la pela outra
que sobrou.
Pergunta: é vantajoso continuar com a sua porta, é vantajoso trocar, ou tanto faz?
Para respondermos a esta pergunta, pensemos inicialmente que a sua porta possui 1/3
de chance de conter o prêmio. Logo, as duas portas restantes possuem, juntas, 2/3 de
chance de possuir o prêmio. Ao animador do programa abrir uma das portas vazias
das que não haviam sido abertas, a outra porta que sobrou acumula para si os 2/3 de
chance de conter o prêmio, o dobro de 1/3. Logo, é melhor trocar de porta neste caso.
Uma simulação pode ser realizada para se concluir isto.
57
Lista de exercícios 8
1- Refaça todos os exemplos do texto.
2- Numa turma há 20 homens e 13 mulheres. Qual é a probabilidade de se escolher
aleatoriamente um homem nessa turma?
Resposta 20 em 33 ≈ 60,61%
3- Suponha que os dados abaixo representem as expectativas de hectares plantados
em 2011:
6 estados brasileiros esperam plantar entre 10.000 e 30.000 hectares;
12 estados brasileiros esperam plantar entre 30.000 e 50.000 hectares;
8 estados brasileiros esperam plantar entre 50.000 e 70.000 hectares.
Escolhendo um estado brasileiro aleatoriamente, qual é probabilidade de que ele
espere plantar entre 
a) 10.000 e 30.000 hectares?
b) 10.000 e 50.000 hectares?
Resposta
a) 6 em 26 ≈ 23,08% b) 18 em 26 ≈ 69,23%
4- Entre 50 músicos que tocam piano ou violão, 30 tocam violão e 28 tocam piano.
Qual é a probabilidade de se escolher um músico que toque apenas violão?
Resposta 22 em 50 ≈ 44%
5- Será selecionado um grupo de 3 pessoas para compor uma comissão. Há 7 pessoas
disponíveis. Qual é a probabilidade de se escolher o grupo {João, Maria, Telma}?
Resposta 1 em 35 ≈ 2,86%
6- Suponha que a quantidade de sacas por hectare de um certo período seja, em cada
estado brasileiro:
{100, 230, 230, 240, 255, 260, 265, 274, 278, 360, 400, 401, 402, 409, 410, 480, 487,
488, 490, 500, 550, 555, 556, 559, 560, 640}. Encontre a probabilidade de se escolher
um estado que esteja entre:
a) entre “média – desvio padrão” e “média + desvio padrão”
b) entre “média – 2 desvios padrões” e “média + 2 desvios padrões”
Resposta a) 14 em 26 ≈ 53,85% b) 25 em 26 ≈ 96,15%
58
7- Escolhendo-se duas pessoas num grupo de 5, qual a chance de João ser escolhido?
Resposta
As combinações nas quais João faz parte, sobre as todas as combinações:
C 4,1
C 5,2
= 4
10
=40 %
8- Jogando-se uma moeda 5 vezes, qual a chance de todas darem coroa?
Respostas (12)
5
= 1
32
=3,1 %
9- Sabe-se que a chance do produto X vir estragado é de 8%. Qual a chance de que o
produto adquirido X não venha estragado, e de se obter coroa no lançamento de uma
moeda, nesta ordem?
Respostas 0,92×0,5=0,46=46 %
10- Qual a probabilidade de se sortear um número par do conjunto
{1; 3; 4; 5; 6; 7; 8},
dado que o número é menor ou igual a 5?
Resposta
1
4
=25 %
11- Numa escola contendo 50 alunos, 30 são mulheres. Destas, 14 usam óculos.
Escolhendo-se um aluno desta escola, qual a probabilidade deste aluno usar óculos,
sabendo que é uma mulher.
Resposta
14 / 30
12- A probabilidade de chover e de eu sair de casa é de 20%. A probabilidade de eu
sair de casa é de 35%. Qual a probabilidade de chover, dado que eu vou sair?
Resposta
0,2 / 0,35 = 57,14%
13- Numa turma, 30 são homens, dos quais 15 são de menor, e 28 são mulheres das
quais 19 são de menor. Escolhendo-se um aluno desta turma, qual a probabilidade de
ser de menor, dado que é homem?
14- A probabilidade da Argentina disputar a final nas Olimpíadas é de 55%. A chance
do Brasil ganhar e da Argentina disputar a final é de 40%. Qual a probabilidade do
Brasil ganhar, dado que a Argentina disputará a final?
59
15- Numa sala há 4 mulheres e 3 homens. Vou escolher duas pessoas ao acaso. Qual a
probabilidade de saírem:
a) uma mulher e um homem, nesta ordem, com reposição?
b) dois homens, sem reposição?
c) uma mulher e um homem, em qualquer ordem, com reposição?
d) uma mulher e um homem, em qualquer ordem, sem reposição?
Respostas
a) 47×
3
7
= 12
49
b) 37×
2
6
=1
7
c) 47×
3
7
+ 3
7
×4
7
= 24
49
d) 47×
3
6
+ 3
7
×4
6
=24
42
=12
21
=4
7
16- Prove que a probabilidade de cair a face cara em todos os 22 lançamentos
seguidos de uma moeda é maior do que a probabilidade de se ganhar na Mega-Sena.
Resposta
A probabilidade de cair cara em todos os 22 lançamentos de uma moeda é de 
1
222
= 1
4.194 .304
=0,00002 %, maior do que a chance de ganhar na Mega-Sena,
conforme calculado neste capítulo.
60
Capítulo 9 – Distribuição Binomial e Esperança Matemática
9.1 Distribuição Binomial
Quando são realizadas n repetições independentes de um experimento, e em cada
repetição há dois resultados possíveis – sucesso ou fracasso – então, a probabilidade
da ocorrência de s sucessos é:
ps⋅(1−p)n−s⋅Cn , s ,
onde p é a probabilidade de sucesso em cada repetição do experimento.
Por exemplo:
Numa pesquisa realizada em fevereiro de 2011 descobriu-se que p = 34% dos
paulistanos estavam endividados por mais de um ano. Se a partir daí fosse feita uma
outra pesquisa com n = 3 cidadãos, qual seria a probabilidade de:
•nenhum deles estar endividado por mais de um ano? (s = 0)
•um deles estar endividado por mais de um ano? (s = 1)
•dois deles estarem endividados por mais de um ano? (s = 2)
•todos os três estarem endividados por mais de um ano? (s = 3)
Antes dos cálculos, observe que a probabilidade de uma pessoa não estar endividada
é de 66% (= 100% – 34%).
Aplicando a fórmula acima, com p = 0,34 e n = 3, temos:
Probabilidade de nenhum estar endividado (s = 0): 66⋅66⋅66=663 ≈
28,75%.
Probabilidade de um deles estar endividado (s = 1):
34⋅66⋅66⋅ 3 !
3−1!⋅1 ! ≈ 44,43%.

Continue navegando