Buscar

Apostila de Estatística

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 74 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 74 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 74 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Apostila 
de 
Estatística 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Profª MÔNICA DO NASCIMENTO RIBEIRO 
 
2014.2 
 
 
 
 
 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 2 
 
CAPITULO 1 
 
O que é estatística? 
 
É a ciência que fornece métodos para coleta, organização, descrição, análise e 
interpretação dos dados e para utilização dos mesmos na tomada de decisões. 
 
A Estatística trabalha com fenômenos coletivamente típicos, isto é, com fenômenos 
ligados a coletividade e que podem ser repetidos. 
 Fenômenos determinísticos: Já se conhece a priori o resultado. 
Ex.: Preço total a pagar pela aquisição de uma determinada quantidade de um 
produto. 
 Fenômeno aleatório: Conhecemos todos os possíveis resultados, mas não se sabe 
o resultado concreto que irá acontecer. 
Ex.: lançamento de um dado honesto. 
 
A estatística se divide em duas partes: 
 
(1) ESTATÍSTICA DESCRITIVA: Responsável pela coleta, organização e descrição 
dos dados observados. 
 
(2) ESTATÍSTICA INDUTIVA OU INFERENCIAL: Responsável pela análise e 
interpretação dos dados. 
 
A estatística trabalha com fenômenos de natureza aleatória, logo o cálculo das 
probabilidades é essencial para o estudo da Estatística indutiva. 
 
Fases do método estatístico: 
 
 - Coleta dos dados: Feito através de registros – nascimento, casamento, óbitos, 
importação e exportação de mercadoria, banco de dados de empresas, questionários,.... 
 
- Crítica dos dados: Para verificar possíveis erros por parte dos informantes, por 
distração ou má interpretação das perguntas que lhe forem feitas. 
 
- Exposição ou apresentação dos dados: Tabulação e gráficos. 
 
- Análise dos resultados: Conclusão sobre o todo (POPULAÇÃO) a partir de 
informações fornecidas por parte representativa do todo (AMOSTRA). 
 
POPULAÇÃO: é o conjunto de indivíduos ou objetos que apresentam pelo menos uma 
característica comum. 
 
AMOSTRA: é um subconjunto finito de uma população. 
Professora: Mônica Do Nascimento Ribeiro 
 3 
Exemplo: Digamos que a Secretaria Estadual de Educação queira pesquisar o grau de 
satisfação dos alunos no que se refere à qualidade da merenda escolar. 
 
População: Alunos da rede estadual. 
Amostra: Parte do total de alunos que representa o todo (população). 
Variável em estudo: variáveis que possam informar a satisfação dos alunos com a 
merenda escolar. 
 
As variáveis podem ser QUANTITATIVAS ou QUALITATIVAS. 
 
Qualitativas: quando seus valores são expressos por atributos. 
 
Exemplos: População: Candidatos a um exame de vestibular. 
 Variável: sexo (masculino ou feminino). 
 
Quantitativa: Quando seus valores são expressos em números. Podem ser subdivididas 
em discretas (assumem valores enumeráveis, números inteiros não-negativos, contagens) 
e contínuas (assumem valores num certo intervalo, medições). 
 
Exemplos: População: casais residentes em uma cidade. 
 Variáveis: Número de filhos (quantitativa discreta) 
 Idade (quantitativa continua) 
 Peso dos alunos (quantitativa contínua) 
 
Professora: Mônica Do Nascimento Ribeiro 
 4 
EXERCÍCIO DE FIXAÇÃO 
 
1) O que é estatística? 
2) O que é população? 
3) o que é amostra? 
4) A Estatística se divide em duas partes. Cite e explique cada uma delas. 
5) Quais são as fases do método estatístico? 
6) Qual a diferença entre variável qualitativa e quantitativa? 
7) Classifique as variáveis em qualitativas, quantitativas contínuas ou quantitativas 
discreta. 
a) População: Alunos de uma escola. 
 Variável: Cor da pele ___________________________ 
b) População: Casais residentes em um bairro. 
 Variável: Nº de filhos ___________________________ 
 
c) População: Jogadas de um dado. 
 Variável: O ponto obtido em cada jogada______________________ 
d) População: Peças produzidas por certa máquina. 
 Variável: Número de peças produzidas por hora_________________ 
e) População: Aparelho produzido em uma linha de montagem. 
 Variável: Nº de defeitos por unidade__________________________ 
f) População: Pessoas residentes em uma cidade. 
 Variável: Idade ___________________________ 
g) População: Bolsa de valores de São Paulo. 
 Variável: Nº de ações negociadas_________________________ 
h) População: Funcionários de uma empresa. 
 Variável: Salário ___________________________ 
 
i) População: Pregos produzidos por uma máquina. 
 Variável: Comprimento do prego_________________________ 
j) População: Casais residentes em uma cidade. 
 Variável: Sexo dos filhos ___________________________ 
 
8) Dizer quais dos seguintes itens representam dados discretos e quais representam dados 
contínuos. 
 
a) Altura de precipitação da chuva em centímetros, de uma cidade durante vários 
meses do ano.____________________________ 
b) Velocidade de um automóvel em km/h._________________________ 
c) Número de notas de vinte dólares em circulação nos Estados Unidos, em qualquer 
época._________________________________ 
d) Valor total das ações vendidas diariamente na Bolsa de 
Valores.______________________ 
e) Número de estudantes matriculados em uma universidade, em certo número de 
anos._____________________________ 
 
Professora: Mônica Do Nascimento Ribeiro 
 5 
9) Estabelecer quais dos dados seguintes são discretos e quais são contínuos. 
 
a) Temperatura registrada a cada meia hora em um posto de 
meteorologia.______________________ 
b) Vida média das válvulas de televisão produzidas por uma determinada 
companhia.___________________________ 
c) Comprimento de 1000 parafusos produzidos numa fábrica. __________________ 
 
 
GABARITO 
 
7. 
a) QUALITATIVA 
b) QUANT. DISCRETA 
c) QUANT. DISCRETA 
d) QUANT. DISCRETA 
e) QUANT. DISCRETA 
f) QUANT. CONTÍNUA 
g) QUANT. DISCRETA 
h) QUANT. DISCRETA 
i) QUANT. CONTÍNUA 
j) QUALITATIVA 
 
8. 
a) CONTÍNUA 
b) CONTÍNUA 
c) DISCRETA 
d) DISCRETA 
e) DISCRETA 
 
 
9. 
a) CONTÍNUA 
b) CONTÍNUA 
c) CONTÍNUA 
 
Professora: Mônica Do Nascimento Ribeiro 
 6 
CAPITULO 2 
 
O objetivo da estatística é sintetizar os valores que uma ou mais variáveis podem assumir 
e isso ela consegue apresentando esses valores em TABELAS E GRÁFICOS. 
 
TABELAS ESTATÍSTICAS 
 
 TABELA É UM QUADRO QUE RESUME UM CONJUNTO DE 
OBSERVAÇÕES 
 
 
 Produção de café 
 Brasil - 1978-82 
 ANOS 
PRODUÇÃO 
(1.000 T) 
1978 2.535 
1979 2.666 
1980 2.122 
1981 3.750 
1982 2.007 
 Fonte: IBGE 
 
 
 
 
SÉRIES ESTATÍSTICAS 
 
Definição: Série Estatística é toda tabela que apresenta a distribuição de um conjunto de 
dados em função da época, do local ou da espécie. 
 
Classificação das Séries Estatísticas: 
 
 SÉRIE HISTÓRICA, CRONOLÓGICA, TEMPORAIS: Descrevem valores 
da variável, em determinado local, discriminados segundo intervalos de tempo. 
(OS DADOS VARIAM COM O TEMPO). 
 
PRODUÇÃO MEDIA DE SOJA NO 
BRASIL - 2005-2006 
ANOS PRODUÇÃO (1.000 t) 
2005 
2006 
51.138 
52.223 
FONTE: IBGE. 
 
 TÍTULO 
CABEÇALHO 
COLUNA NUMÉRICA 
RODAPÉ 
 COLUNA 
INDICADORA 
LINHAS 
CASA OU CÉLULA 
CORPO 
Professora: Mônica Do Nascimento Ribeiro 
 7 
 
 SÉRIES GEOGRÁFICAS, ESPACIAIS, TERRITORIAIS OU DE 
LOCALIZAÇÃO: Descrevem valoresda variável, em determinado instante, 
discriminados segundo regiões. (OS DADOS VARIAM NO LOCAL). 
 
DURAÇÃO MÉDIA 
DOS ESTUDOS 
SUPERIORES 1994 
PAÍSES 
NÚMERO 
DE ANOS 
Itália 
Alemanha 
França 
Holanda 
 
7,5 
7,0 
7,0 
5,9 
 
FONTE: APA. 
 
 SÉRIES ESPECÍFICAS OU CATEGÓRICAS: Descrevem valores da variável 
em determinado tempo e local, discriminados segundo especificações e categorias 
(OS DADOS VARIAM DE ACORDO COM A ESPÉCIE OU QUALIDADE 
DO FENÔMENO). 
 
 
 
 
 
 
 
 
 
 
 
 
 
 SÉRIES CONJUGADAS, TABELAS DE DUPLA ENTRADA: Quando 
precisamos apresentar em uma única tabela a variação de valores de mais de uma 
variável (OS DADOS SÃO RELATIVOS A 2 OU 3 ASPECTOS 
SIMULTANEAMENTE). 
REGIÕES 1991 1992 1993
NORTE 342.938 375.658 403.494
NORDESTE 1.287.813 1.379.101 1.486.649
SUDESTE 6.234.501 6.729.767 7.231.634
SUL 1.497.315 1.608.989 1.746.232
CENTRO-OESTE 713.357 778.925 884.822
Fonte: Revista Veja.
TERMINAIS TELEFÔNICOS EM SERVIÇOS POR REGIÕES 
1991 - 1993
 
 
EXPORTAÇÃO 
BRASILEIRA2005 
PRODUTOS 
QUANTIDADE 
(em bilhões de 
toneladas) 
Grãos 
Farelo 
Óleo 
20,5 
14,2 
2,4 
FONTE: Companhia Nacional de 
Abastecimento (Conab). 
Professora: Mônica Do Nascimento Ribeiro 
 8 
 
GRÁFICOS ESTATÍSTICOS 
 
O gráfico estatístico é uma forma de apresentar os dados estatísticos, com o objetivo de 
mostrar uma impressão mais rápida do fenômeno em estudo, com simplicidade, clareza e 
veracidade. 
 
 Títulos completos e o mais claro possível; 
 Sempre que possível a escala vertical deve ser escolhida de modo a aparecer na 
linha o valor zero; 
 A escala horizontal deve ser lida da esquerda para direita e a escala vertical deve 
ser lida de baixo para cima. 
Tipos mais comuns de gráficos: 
 
 Gráfico em colunas ou em barras 
 
ANOS QUANTIDADE (1.000 t)
1989 18.196
1990 11.168
1991 10.468
1992 9.241
Fonte: Agropalma.
(GRÁFICO DE COLUNAS) (GRÁFICO EM BARRAS)
PRODUÇÃO BRASILEIRA DE CARVÃO MINERAL 
BRUTO - 1987 - 1992
PRODUÇÃO BRASILEIRA DE CARVÃO 
MINERAL BRUTO - 1989 - 1992
0
5.000
10.000
15.000
20.000
1989 1990 1991 1992
Anos
M
il 
to
ne
la
da
s
Fonte: Ministério da Agricultura.
PRODUÇÃO BRASILEIRA DE 
CARVÃO MINERAL BRUTO - 1989 - 
1992
0 5.000 10.000 15.000 20.000
1989
1990
1991
1992
An
os
Mil toneladas
Fonte: Ministério da Agricultura.
 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 9 
 
 Gráfico de linhas ou em curva 
ANOS QUANTIDADE (1.000 t)
1987 39
1988 53
1989 69
1990 55
1991 42
1992 38
Fonte: Agropalma.
PRODUÇÃO BRASILEIRA DE ÓLEO DE DENDÊ - 
1987 - 1992
Produção Brasileira de Óleo de 
Dendê - 1987 a 1992
0
20
40
60
80
1987 1988 1989 1990 1991 1992
Anos
M
il
 t
o
n
e
la
d
a
s
Fonte: Agropalma.
 
 Gráfico em setores ou de pizza: 
 
 
 
 
 
 
 
 
 
 
 
 
 
Rebanhos Brasileiros 
Brasil - 1988 
Espécie Quantidades 
 (milhões de cabeças) 
Bovinos 140 
Suínos 32 
Ovinos 20 
Caprinos 11 
Total 203 
Fonte: IBGE 
REBANHOS BRASILEIROS
 BRASIL 1988
Bovinos
Suínos
Ovinos
Caprinos
Professora: Mônica Do Nascimento Ribeiro 
 10 
 
EXERCÍCIO DE FIXAÇÃO 
 
1) Construa as tabelas referentes aos dados pesquisados e classifique-as: 
 
a) Dados referentes à produção de borracha natural nos anos de 1991 (29.243 toneladas), 
1992 (30.712 toneladas) e 1993 (40.663 toneladas). Fonte IBGE. 
b) Dados referentes à Avicultura Brasileira no ano de 1992 segundo as seguintes espécies: 
galinhas (204.160 cabeças), Galos, frangos, frangas e pintos (435.465 cabeças) e 
Codornas (2.488 cabeças). Fonte IBGE. 
c) Dados referentes ao total de vacinação contra a Poliomilite no ano de 1993 segundo as 
seguintes regiões: Norte (211.209), Nordeste (631.040), Sudeste (1.119.708), Sul 
(418.785) e Centro-oeste (185.823). Fonte Ministério da saúde. 
 
 
 
 
GABARITO 
 
1. 
a) TEMPORAL 
b) ESPECÍFICA 
c) GEOGRÁFICA 
Professora: Mônica Do Nascimento Ribeiro 
 11 
CAPITULO 3 
 
Após a coleta de dados relativos a um determinado fenômeno em estudo, que compõem 
uma amostra, obtemos um conjunto de dados que será tabulado. 
 
Por exemplo: 
TABELA 1: ALTURA DOS ALUNOS 
 
 
 
 
 
Observe que os dados não estão organizados. Dessa forma ela recebe o nome de DADOS 
BRUTOS. 
 
Precisamos organizar os dados através de uma ordenação crescente ou decrescente. 
 
TABELA 2: ALTURA DOS ALUNOS 
 
 
 
 
 
 
Obteremos uma segunda ordenação que receberá o nome de ROL (seqüência ordenada 
dos dados brutos). 
 
Dessa forma podemos saber com facilidade qual a menor altura (150) e qual a maior 
(173); qual a amplitude de variação (173-150=23cm); qual o ponto médio (160+161)/2 = 
160,5. 
 
Ainda assim, a variável observada (altura dos alunos) será mais facilmente estudada 
quando dispusermos os valores ordenados em uma coluna e ao lado de cada valor o 
número de vezes que aparece repetido. Obtemos dessa forma uma tabela que recebe o 
nome de DISTRIBUIÇÃO DE FREQÜÊNCIA POR PONTO. 
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 162 164 168 172
153 155 156 160 160 161 162 164 168 173
Professora: Mônica Do Nascimento Ribeiro 
 12 
 
 
 
ALTURA (cm) Frequência
150 1
151 1
152 1
153 1
154 1
155 4
156 3
157 1
158 2
160 5
161 4
162 2
163 2
164 3
165 1
166 1
167 1
168 2
169 1
170 1
172 1
173 1
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
 
 
Outra solução aceitável e mais conveniente para diminuir o tamanho da tabela quando o 
número de valores da variável é grande, seria agrupá-los em vários intervalos. Nesse caso 
a tabela passa a ser denominada: DISTRIBUIÇÃO DE FREQÜÊNCIA POR 
INTERVALO DE CLASSE. 
ALTURA (cm) Frequência
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
 
 
Lê-se: 4 alunos têm altura entre 150 e 154 anos (exclusive) – intervalo fechado à 
esquerda. 
 
 
 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 13 
 
Critério para calcular o número de classes a ser utilizado. 
Observação: Não é obrigatório! O bom senso também funciona. 
 
CRITÉRIO DA RAIZ 
 
Se a seqüência estatística contém n elementos e se indicarmos por i o número de classes a 
ser utilizado, então: 
 
ni 
 Onde n = número total de observações. 
 
Amplitude do intervalo de classe que chamaremos de h é determinada por: 
i
AT
h 
, 
onde AT é a Amplitude Total e 
ni 
 
 
Exemplo: 
n = 40 
Então, 
40i
= 6,324, portanto o inteiro mais próximo é 6. 
Devemos trabalhar com o inteiro mais próximo da raiz de n, o inteiro imediatamente 
anterior e o inteiro imediatamente superior. 
Logo, as opções para i são: 5, 6 ou 7. 
Então, a amplitude do intervalo de classe (h) é determinada por: 
4833,3
6
150 - 173(min) l - (Max) L

ii
AT
h
 
 
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA. 
 
(1) CLASSE (i): São intervalos de variação da variável. 
 
 Ex.: Intervalo 150 a 154 define a 1ª classe (i=1), 
 i = 1, 2, 3,......, k 
 i = classe 
 k = número total de classes. 
 
(2)LIMITES DE CLASSE: São os extremos de cada classe. 
 
il
 = Limite inferior 
iL
 = Limite superior 
 
 Ex.: Na primeira classe: 
il
 = 150 e 
iL
 = 154. 
 
Professora: Mônica Do Nascimento Ribeiro 
 14 
(3) AMPLITUDE DE UM INTERVALO DE CLASSE (
ih
): É a medida do intervalo 
que define a classe. Diferença entre o limite superior e inferior da classe. 
 
 Ex.: Na primeira classe: 
il
= 150 e 
iL
 = 154. 
 
ih
 = 
iL
 – 
il
 = 154 – 150 = 4 cm. 
 
(4) AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT): É a diferença entre o Limite 
superior da ultima classe e o Limite inferior da primeira classe. 
 
 AT = L(Max) – l(min) 
 
 Ex.: 174 – 150 = 24 cm 
 
Observe que quando as classes possuem o mesmo intervalo vale a relação: 
 
k
h
AT
i

 24/4 = 6 (6 = Número total de classes) 
 
(5) PONTO MÉDIO DE UMA CLASSE (
ipm
): É o ponto que divide o intervalo de 
classe em duas partes iguais. 
 
 Ex.: Classe 1: (150 + 154)/2 = 152 cm 
 
TIPOS DE FREQÜÊNCIA: 
 
(1) FREQÜÊNCIA SIMPLES OU ABSOLUTA (
if
): É o número de observações 
correspondentes a classe ou a um valor. 
Exemplo: 
ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
if
 
1f
= 4 => freqüência da classe 1 e 
2f
 = 9 => freqüência da classe 2. 
A soma de todas as freqüências será: 



k
i
i nf
1
, n = número total de observações. 
(2) FREQÜÊNCIA ACUMULADA (
iF
): É o total das freqüências de todos os valores 
inferiores ao limite superior do intervalo de classe. 



k
i
iki ffffF
1
21 .....
 
Professora: Mônica Do Nascimento Ribeiro 
 15 
 
Exemplo: 
ALTURA (cm)
150 I-- 154 4 4
154 I-- 158 9 13
158 I-- 162 11 24
162 I-- 166 8 32
166 I-- 170 5 37
170 I-- 174 3 40
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
if i
F
 



3
1
3213 241194
i
iffffF
, ou seja, existem 24 alunos com 
estatura inferior a 162 cm. 
 
(3) FREQÜÊNCIA RELATIVA (
ifr
): É a razões entre a freqüência simples a 
freqüência total. 



k
i
i
i
i
f
f
fr
1
 
 
Exemplo: 
ALTURA (cm)
150 I-- 154 4 4 0,1
154 I-- 158 9 13 0,225
158 I-- 162 11 24 0,275
162 I-- 166 8 32 0,2
166 I-- 170 5 37 0,125
170 I-- 174 3 40 0,075
Total 40 1
Fonte: MEC
ALTURA DOS ALUNOS
if i
F ifr
 
275,0
40
11
40
1
3
3 

i
if
f
fr
 
 
(4) FREQÜÊNCIA ACUMULADA RELATIVA (
iFr
): É a freqüência acumulada da 
classe dividida pela freqüência total da distribuição. 
 



k
i
i
i
i
f
F
Fr
1
 
Professora: Mônica Do Nascimento Ribeiro 
 16 
 
 
ALTURA (cm)
150 I-- 154 4 4 0,1 0,1
154 I-- 158 9 13 0,225 0,325
158 I-- 162 11 24 0,275 0,6
162 I-- 166 8 32 0,2 0,8
166 I-- 170 5 37 0,125 0,925
170 I-- 174 3 40 0,075 1
Total 40 1
Fonte: MEC
ALTURA DOS ALUNOS
if i
F ifr iFr
 
 
 
600,0
40
24
40
1
3
3 

i
if
F
Fr
 
 
REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA. 
Histograma 
 
 Consiste em um conjunto de retângulos, tantos quantos forem às classes de uma 
distribuição. 
 As classes são as bases dos retângulos (tantas partes quantas forem às classes) 
 A escala para marcação dos pontos no eixo Y corresponde às freqüências. 
 
Exemplo: 
ANOS QUANTIDADE (1.000 t)
1989 18.196
1990 11.168
1991 10.468
1992 9.241
Fonte: Agropalma.
(GRÁFICO DE COLUNAS) (GRÁFICO EM BARRAS)
PRODUÇÃO BRASILEIRA DE CARVÃO MINERAL 
BRUTO - 1987 - 1992
PRODUÇÃO BRASILEIRA DE CARVÃO 
MINERAL BRUTO - 1989 - 1992
0
5.000
10.000
15.000
20.000
1989 1990 1991 1992
Anos
M
il 
to
ne
la
da
s
Fonte: Ministério da Agricultura.
PRODUÇÃO BRASILEIRA DE 
CARVÃO MINERAL BRUTO - 1989 - 
1992
0 5.000 10.000 15.000 20.000
1989
1990
1991
1992
An
os
Mil toneladas
Fonte: Ministério da Agricultura.
 
 
 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 17 
Polígono de freqüências 
 
Freqüência Simples: 
 
 
 
 
 
Freqüência Acumulada: As bases dos retângulos vão estar centradas nos pontos médios 
das classes. 
 
Exemplo: 
 
Professora: Mônica Do Nascimento Ribeiro 
 17 
CAPITULO 4 
 
MEDIDAS DE POSIÇÃO: MÉDIA, MODA e MEDIANA; 
 
O estudo sobre a Distribuição de Freqüência permitiu descrever, de um modo geral, os 
valores que uma variável pode assumir. Agora precisamos de um “indicativo” 
generalizado. 
O modo mais comum de se obter esse tipo de informação é através das MEDIDAS DE 
POSIÇÃO, estatística que representa à posição relativa da distribuição em relação ao eixo 
horizontal. 
As medidas de posição mais importantes são as MEDIDAS DE TENDÊNCIA 
CENTRAL – recebem esse nome pelo fato dos dados observados, em geral, se agruparem 
em torno dos valores centrais. 
 
São elas: MÉDIA ARITMÉTICA, MODA, MEDIANA, SEPARATRIZES, QUARTIS e 
PERCENTIS. 
 
Essas medidas quando bem interpretadas, podem fornecer-nos informações muito 
valiosas com respeito às séries estatísticas, ou seja, com estas medidas tenta-se encontrar 
um valor numérico que represente o comportamento típico da série em estudo. 
 
(1) MÉDIAS (Média Aritmética Simples, Média Aritmética Ponderada, Média 
Geométrica e Média Harmônica) 
 
i) MÉDIA ARITMÉTICA SIMPLES (
x
) 
 
MÉDIA PARA DADOS NÃO AGRUPADOS (dados brutos ou rol): Quando 
desejamos conhecer a média dos dados não agrupados, determinamos a média 
aritmética simples. 
 
 
n
x
x
n
i
i
 1 , onde ( x ) é a média aritmética, (
ix
) os valores da variável e (n) o número 
de valores. 
 
 
Exemplo: Produção leiteira diária da vaca A, durante uma semana, foi de 10, 14, 13, 15, 
16, 18 e 12 litros. Qual a produção média da semana. 
 
litrosx 14
7
98
7
12181615131410



 
 
Professora: Mônica Do Nascimento Ribeiro 
 18 
ii) MÉDIA ARITMÉTICA PONDERADA (
x
) 
 
 
MÉDIA PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSE ou POR 
PONTO: 
Nos cálculos envolvendo média aritmética simples, todas as ocorrências têm exatamente 
a mesma importância ou o mesmo peso. Dizemos então que elas têm o mesmo peso 
relativo. No entanto, existem casos onde as ocorrências têm importância relativa 
diferente. Nestes casos, o cálculo da média deve levar em conta esta importância relativa 
ou peso relativo. 
 




n
i
i
n
i
ii
f
fx
x
1
1
, observe que 
if
 é a freqüência simples de cada variável que neste caso 
funciona como fator de ponderação (MÉDIA ARITMÉTICA PONDERADA). 
 
 
EXEMPLO 1: Alcebíades participou de um concurso, onde foram realizadas provas de 
Português, Matemática, Biologia e História. Essas provas tinham peso 3, 3, 2 e 2, 
respectivamente. Sabendo que Alcebíades tirou 8,0 em Português, 7,5 em Matemática, 5,0 em 
Biologia e 4,0 em História, qual foi a média que ele obteve? 
 
p = 
 
 Portanto a média de Alcebíades foi de 6,45. 
 
 
EXEMPLO 2: Um grupo de 64 pessoas, que trabalha (com salário por dia), em uma 
empresa é formado por sub-grupos com as seguintes características: 
 
12 ganham R$ 50,00 
10 ganham R$ 60,00 
20 ganham R$ 25,00 
15 ganham R$ 90,00 
7 ganham R$ 120,00 
 
Para calcular a média salarial (por dia) de todo o grupo devemos usar a média 
ponderada: 
 
 50.12 + 60.10 + 25.20 + 90.15 + 120.7 
MédiaPonderada = -------------------------------------------------- 
 12 + 10 + 20 + 15 + 7 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 19 
 
 3890 
Média Ponderada = -------- 
 64 
 
Média Ponderada = 60,78 
 
Média salarial é por volta de 60,78 
 
 
 
EXEMPLO 3: 
2 2 4
4 3 12
6 3 18
8 2 16
TOTAL 10 50
ifiX ii fX
 5
10
50
4
1
4
1 




i
i
i
ii
f
fx
x 
Exercício: Calcule a Média. 
 
Variável estudada X(idade): 2, 5, 5, 5, 5, 6, 6, 6, 8, 8 Resposta: 5,6 
 
IDADES fi fixi 
2 
5 
6 
8 
Total 
 
 
MÉDIA PARA DADOS AGRUPADOS COM INTERVALO DE CLASSE. 




n
i
i
n
i
ii
f
fx
x
1
1
, 
(
ipm
) é o ponto médio de cada intervalo de classe. 
(
if
) a freqüência simples de cada intervalo de classe. 
 
 
 
 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 20 
EXEMPLO 4: 
 
Classe
0 l-- 2 2 1 2
2 l-- 4 3 3 9
4 l-- 6 2 5 10
6 l-- 8 1 7 7
8 l--10 2 9 18
10 46
if ii
fpm
ipm
 6,4
10
46
5
1
5
1 




i
i
i
ii
f
fpm
x 
 
 
 
 
EXERCÍCIO: Resposta: 161 cm 
 
ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
if
 
 
 
iii) Média Geométrica 
 
A média geométrica de um conjunto de números positivos é definida como o produto de 
todos os membros do conjunto elevado ao inverso do número de membros. 
 
 
 
A média geométrica é muito usada no cálculo da taxa média de retorno de um 
investimento ou no cálculo da taxa equivalente de uma aplicação financeira. 
 
Para calcularmos a média geométrica entre números devemos realizar a multiplicação entre eles 
e, logo em seguida, extrair a raiz com índice igual ao número de fatores utilizados na 
multiplicação. 
 
EXEMPLO 3: Calcular a média geométrica dos números 2, 4 e 6, efetuamos o seguinte cálculo: 
 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 21 
A média geométrica é muito utilizada nas situações envolvendo aumentos sucessivos. 
 
EXEMPLO 4: Vamos considerar um aumento de salário sucessivo de 15% no primeiro mês, 
12% no segundo mês e 21% no terceiro mês. 
 
Vamos determinar a média geométrica dos aumentos, mas para isso as taxas percentuais devem 
ser transformadas em taxa unitárias, observe: 
 
15% = 1,15 
12% = 1,12 
21% = 1,21 
 
 
 
O valor 1,1594 corresponde a taxa média de 15,94% de todos os aumentos sucessivos. Isso indica 
que se aplicarmos três vezes consecutivas a taxa de 15,94% corresponderá ao aumento sucessivo 
dos percentuais de 15%, 12% e 21%. 
 
Suponhamos que o salário reajustado seja de R$ 600,00. Acompanhe os aumentos utilizando as 
duas opções de reajustes: 
 
1ª opção 
 
600,00 + 15% = 690,00 
690,00 + 12% = 772,80 
772,80 + 21% = 935,09 
 
2ª opção 
 
600,00 + 15,94% = 695,64 
695,64 + 15,94% = 806,53 
806,53 + 15,94% = 935,09 
 
 
iii) Média Harmônica 
A média harmônica dos números reais positivos x1,…,xn é definida como sendo o número de 
membros dividido pela soma do inverso dos membros, como segue: 
 
Utilizamos a Média Harmônica quando estamos tratando de observações de grandezas 
inversamente proporcionais como, por exemplo, velocidade e tempo. A média harmônica é 
Professora: Mônica Do Nascimento Ribeiro 
 22 
particularmente recomendada para uma série de valores que são inversamente proporcionais, 
como para o cálculo da velocidade média, custo médio de bens comprados com uma quantia fixa. 
Aplicação: a é utilizado comumente em problemas que envolvem o inverso do 
tempo, por exemplo, em problemas de tempo de percorrimento de distância ou tempo 
de preenchimento de capacidade líquida. Isto porque a velocidade, tanto de 
percorrimento, quanto de preenchimento, é dado por onde representa capacidade 
ou distância. 
 
HIDRÁULICA: Vazão ou Descarga (Q) 
Chama-se vazão numa determinada seção, o volume de liquido que atravessa esta seção 
na unidade de tempo. (unidades: m3/s; l/s; m3/h, l/h) 
 
 
 
FÍSICA: MECÂNICA: Cinemática 
 
 
 
 
Exemplo 1: torneiras, quando agindo isoladas, enchem um tanque em , 
respectivamente. Funcionando todas as torneiras simultâneamente, em quanto tempo o 
tanque vai encher? 
Resolução: convencionando que a capacidade do tanque seja , temos que a 
velocidade total de enchimento é 
 
Como o tempo de enchimento é dado pela capacidade (volume) dividida pela 
velocidade total , temos: 
 
 
 Onde representa a média harmônica dos tempos , ,..., . 
 
Exemplo 2: duas torneiras, quando agindo isoladas, enchem um tanque 
em e . As duas torneiras agindo juntas encherão o tanque em qual 
tempo ? 
Resolução: calcula-se a média harmônica de e : 
 
 
Logo, horas ou e 
Professora: Mônica Do Nascimento Ribeiro 
 23 
 
(2) MODA (Mo) 
 
É o valor que ocorre com maior freqüência em uma série de dados. Quando uma série 
de dados não apresentar moda chamaremos de AMODAL. Dois valores na série, duas 
modas, chamaremos de BIMODAL. 
 
MODA PARA DADOS NÃO AGRUPADOS (dados brutos ou rol) 
Exemplo: 
 
 
 
MODA PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSE. 
 
Basta verificar o valor da variável de maior freqüência. 
 
Nº de meninos na família fi
0 2
1 6
2 10
3 12
4 4
Total 34 
 
Uma vez agrupado os dados basta fixar o valor da variável de MAIOR freqüência. A 
moda nesse caso é 3. 
 
 
 
 
Exercício: Qual a moda e o tipo para os dados agrupados em freqüência: 
 
 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 24 
DADOS AGRUPADOS COM INTERVALO DE CLASSE. 
 
A classe que apresentar a maior freqüência é denominada CLASSE MODAL que servirá 
de base para os seguintes cálculos: 
 
a) Moda de KING: 
** h
ff
f
lMo
posant
pos



 
 
b) Moda de CZUBER: 
*
21
1* h
DD
D
lMo 


 
 
pos
ant
ff
ff
l
Onde


*
2
*
1
*
*
ant
pos
*
D
D
modal classe da intervalo do amplitude a é h
modal classe da simples freqüência a é f
modal classe aanterior classe da simples freqüência a é f
modal classe aposterior classe da simples freqüência a é f
modal classe dainferior limite o é 
:
 
 
Exercício: Calcule a moda utilizando os dois métodos 
 Classe
0 l-- 2 2
2 l-- 4 3
4 l-- 6 10
6 l-- 8 3
8 l--10 2
20
if
 
 
Resposta.: 50 
 
Observação: 
 
1) A moda é utilizada quando desejamos obter uma medida rápida e aproximada de 
posição ou quando o valor da distribuição deve ser o valor mais típico da distribuição. 
 
2) A moda é uma medida de posição, pois indica a região das máximas freqüências. 
 
Professora: Mônica Do Nascimento Ribeiro 
 25 
 
(3) MEDIANA (Md) 
 
É o valor que divide o conjunto de dados ordenados em duas metades, com metade dos 
valores acima da mediana e a metade dos valores abaixo dela. Quando o número de 
observações (n) é ímpar, a mediana é o valor que ocupa a posição central. Quando n for 
par, há duas posições centrais no conjunto, então a mediana é a média aritmética dos dois 
valores que ocupam as posições centrais. 
 
MEDIANA PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSE. 
 
1) Se n for ímpar (n=número de observações),o valor mediano será o de ordem 





 
2
1n , 
ou seja, o valor do elemento que ocupa está posição será a mediana. 
 
2) Se n for par, o rol admite dois termos centrais que ocupam as posições. O de ordem 













1
22
n
 e
n , então, a mediana será a média dos valores que ocupam estas posições. 
 
Exemplos: 
 
 
 
Exemplo: 
 
1) 
 Nº de meninos fi Fi
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
Total 34 A mediana vai ser a média entre o 17º valor e o 18º 
valor da série =>
2
2
22


Md
 meninos. 
 
 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 26 
2) 
 
X fi Fi
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Total 8 
A mediana será a média entre o 4º e o 5º elemento da série => 
5,15
2
1615


Md
 
 
Exercícios: Calcule a mediana. Resposta: 8 
 
 
 
MEDIANA PARA DADOS AGRUPADOS COM INTERVALO DE CLASSE. 
 
*
*
* 2 h
f
F
n
lMd
ant








 
Onde: 
 
mediana a contém que classe de intervalo do amplitude a é h
mediana classe da simples freqüência a é f
mediana classe àanterior classe da acumulada freqüência a é F
série na mediana da posição a é 
2
mediana classe dainferior limite o é 
*
*
ant
*
n
l
 
 
Exemplo: 
 
idade fi Fi 
 3 |--- 6 2 2 
 6 |--- 9 5 7 
 9 |--- 12 7 14 
12 |--- 15 3 17 
15 |--- 18 2 19 
total 19 
*
*
* 2 h
f
F
n
lMd
ant








 =
 
3
7
75,9
9 


=10,1 
Professora: Mônica Do Nascimento Ribeiro 
 24 
Exercício: Calcule a mediana para o caso da distribuição de freqüência abaixo: 
 
Salário fi Fi 
 450 |--- 550 8 
 550 |--- 650 10 
 650 |--- 750 11 
 750 |--- 850 16 
 850 |--- 950 13 
 950 |--- 1.050 5 
 1.050 |-- 1.150 1 
total 64 
 
 
Observação: 
No caso de existir uma freqüência acumulada exatamente igual a 
2
n
, a Mediana será o 
limite superior da classe correspondente. 
 
Por exemplo: 
 
 
*
*
* 2 h
f
F
n
lMd
ant









=  
10
9
413
20 


=30 
 
 
 
 
 
Nota: 
 
1) A mediana pode coincidir ou não com um elemento da série. Vimos que, quando 
tivermos um número de elementos ímpar na série de dados, há coincidência. 
Quanto o número de elementos de uma série é par, na há coincidência. 
2) A mediana depende da posição e não dos valores centrais na série ordenada. 
3) Usamos a mediana quando desejamos obter o ponto que divide a distribuição em 
partes iguais e quando há valores extremos afetando de uma maneira acentuada a 
média. 
 
Classes fi Fi 
 0 |---10 1 1 
 10 |---20 3 4 
 20 |---30 9 13 
 30 |---40 7 20 
 40 |---50 4 24 
 50 |---60 2 26 
total 26 
Professora: Mônica Do Nascimento Ribeiro 
 25 
(4) SEPARATRIZES 
 
As separatrizes, como o próprio nome sugere são medidas que separam a série em partes 
iguais. 
 
QUARTIS: São valores de uma série que a dividem em 4 partes iguais. Assim temos: 
 
1Q
 = 1º quartil: Separa a seqüência ordenada deixando 25% dos valores a sua esquerda e 
75% dos valores a sua direita. 
 
2Q
 = 2º quartil: Separa a seqüência ordenada deixando 50% dos valores a sua esquerda e 
50% dos valores a sua direita. 
 
3Q
 = 3º quartil: Separa a seqüência ordenada deixando 75% dos valores a sua esquerda e 
25% dos valores a sua direita. 
 
Pode-se observar que o 2º quartil e a mediana têm os mesmos valores, pois ambos 
dividem uma série ordenada em duas partes iguais. 
 
!---------!---------!---------!---------! 
 Q1 Q2 Q3 
!-------------------!-------------------! 
 Md 
Cálculo do QUARTIL 
É o mesmo cálculo de mediana sendo que 
2
n
 deve ser substituído por 
4
 if
k
, onde k é o 
número de ordem do quartil. 
 
*
*
*
.
4
f
hF
fk
lQ
ant
i
k











 
 
Exemplo: 
 
1. Calcule o Q1 da seqüência X: 2, 5, 8, 5, 5, 10, 1, 12, 12, 11, 13, 15. 
 
Ordenar a série: X: 1, 2, 5, 5, 5, 8, 10, 11, 13, 15 
 
3
4
12
1
4

 if
k
 
 
Q1 = 5
Monica Ribeiro
Comment on Text
Cálculo do quartil para o rolnullnull1° Passo: Determina-se a posição do Quartil. null2° Passo: Identifica-se a posição mais próxima do rol.null3° Passo: Verifica-se quem está naquela posição.nullnull
Monica Ribeiro
Comment on Text
sequência correta:null1, 2, 5, 5, 5, 8, 10, 11, 12, 12, 13, 15nullnullA posição do quartil é a a terceira (valor 5)
Professora: Mônica Do Nascimento Ribeiro 
 26 
Calcule o Q1 e Q3 
 
 
 
ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
if
 
10
4
40
1
4

 if
k
 (classe 2) 
30
4
40
3
4

 if
k
 (classe4) 
 
 
 
67,1564
9
.410
1541 

Q
  
1654
8
.2430
1623 

Q
 
 
Exercício: Para os dados agrupados em freqüência, encontre o primeiro e segundo quartil. 
 Resposta: 4 e 6 
 
 
QUINTIS: Quando dividimos uma série em 5 partes iguais, cada parte ficará com 20% 
dos elementos da série. Assim temos: 
 
1K
 = 1º quintil – separa a seqüência ordenada deixando 20% dos valores a sua esquerda e 
80% dos valores a sua direita. 
 
2K = 2º quintil – separa a seqüência ordenada deixando 40% dos valores a sua esquerda 
e 60% dos valores a sua direita. 
 
3K = 3º quintil – separa a seqüência ordenada deixando 60% dos valores a sua esquerda e 
40% dos valores a sua direita. 
 
4K = 4º quintil – separa a seqüência ordenada deixando 80% dos valores a sua esquerda e 
20% dos valores a sua direita. 
 
!---------!---------!---------!---------!---------! 
 
1K
 
2K
 
3K
 
4K
 
Professora: Mônica Do Nascimento Ribeiro 
 27 
Cálculo do QUINTIL 
É o mesmo cálculo de mediana sendo que 
2
n
 deve ser substituído por 
5
 if
k
, onde k é o 
número de ordem do quintil. 
 
*
*
*
.
5
f
hF
fk
lK
ant
i
k











 
 
Exemplo: Considerando a tabela de distribuição de freqüência por intervalo de classe, 
calcule K2. 
 
 
ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
if
 
16
5
40
2
5

 if
k
 (classe 3)  
1594
11
.1316
1582 

k
 
 
Exercício: A distribuição de freqüência abaixo representa o consumo por nota de 54 notas 
fiscais emitidas durante um dia em uma loja de departamentos. Calcule o quintil de 
ordem 2. 
 
 
 
 
 
 
 
 
 Resposta: 70,71 
 
Consumo por nota (R$) Nº de notas 
 0 |---- 50 10 
 50 |---- 100 28 
 100 |---- 150 12 
 150 |---- 200 2 
 200 |---- 250 1 
 250 |---- 300 1 
Total 54 
Professora: Mônica Do Nascimento Ribeiro 
 28 
 
DECIS: Quando dividimos uma série em 10 partes iguais, cada parte ficará com 10% dos 
elementos da série. Assim temos: 
 
1D = 1º decil – separa a seqüência ordenada deixando 10% dos valores a sua esquerda e 
90% dos valores a sua direita. 
 
2D = 2º decil – separa a seqüência ordenada deixando 20% dos valores a sua esquerda e 
80% dos valores a suadireita. 
 
3D = 3º decil – separa a seqüência ordenada deixando 30% dos valores a sua esquerda e 
70% dos valores a sua direita. 
. 
. 
. 
8D = 8º decil – separa a seqüência ordenada deixando 80% dos valores a sua esquerda e 
20% dos valores a sua direita. 
 
9D = 9º decil – separa a seqüência ordenada deixando 90% dos valores a sua esquerda e 
10% dos valores a sua direita. 
 
 
!---!---!---!---!---!---!---!---!---!---! 
 D1 D2 D3 D4 D5 D6 D7 D8 D9 
 
Cálculo do DECIL 
É o mesmo cálculo de mediana sendo que 
2
n
 deve ser substituído por 
10
 if
k
, onde k é o 
número de ordem do decil. 
 
*
*
*
.
10
f
hF
fk
lD
ant
i
k











 
Exemplo: Considerando a tabela de distribuição de freqüência por intervalo de classe, 
calcule D3. 
 
 
ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
if
 
12
10
40
3
10

 if
k
 (classe 2) 
 
55,157555,31544
9
.412
1542 

D
 
Professora: Mônica Do Nascimento Ribeiro 
 29 
 
 
Exercício: Uma empresa de aviação observou em seus registros recentes, o tempo de 
mão-de-obra gasto na revisão completa de um motor de jato. O seguinte quadro foi 
obtido. Calcule o decil de ordem 3. Resposta: 9,44 
 
Classe Tempo de mão-de-obra (horas) Nº de motores
1 0I------------4 1
2 4I------------8 5
3 8I-----------12 10
4 12I-----------16 12
5 16I-----------20 4 
 
 
 
PERCENTIS ou CENTIL: São valores de uma série que a dividem em 100 partes 
iguais. Cada parte ficará com 1% dos elementos da série. Assim temos: 
 
1P = 1º percentil: separa a seqüência ordenada deixando 1% dos valores a sua esquerda e 
99% dos valores a sua direita. 
 
2P = 2º percentil: separa a seqüência ordenada deixando 2% dos valores a sua esquerda e 
98% dos valores a sua direita. 
 
3P = 3º percentil: separa a seqüência ordenada deixando 3% dos valores a sua esquerda e 
97% dos valores a sua direita. 
. 
. 
98P = 98º percentil: separa a seqüência ordenada deixando 98% dos valores a sua 
esquerda e 2% dos valores a sua direita. 
99P = 99º percentil: separa a seqüência ordenada deixando 99% dos valores a sua 
esquerda e 1% dos valores a sua direita. 
 
!---!---!---!---!---!---!---!---!---!---! 
 P10 P20 P30 P40 P50 P60 P70 P80 P90 
 
Cálculo do PERCENTIL 
É o mesmo cálculo de mediana sendo que 
2
n
 deve ser substituído por 
100
 if
k
, onde k é o 
número de ordem do percentil. 
 
*
*
*
.
100
f
hF
fk
lP
ant
i
k











 
Professora: Mônica Do Nascimento Ribeiro 
 30 
 
Exemplo: Considerando a tabela de distribuição de freqüência por intervalo de classe, 
calcule P8. 
 
 
ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
if
 
 
2,3
100
40
8
100

 if
k
 (classe 1)  
2,1534
4
.02,3
1508 

P
 
 
 
Podemos notar que os quartis, quintis e decis podem ser expressos em termos dos 
precentis. 
 
Q1=P25 K1=P20 D1=P10 
Q2=P50 K2=P40 D2=P20 
Q3=P75 K3=P60 D3=P30 
 K4=P80 D4=P40 
 D5=P50 
 D6=P60 
 D7=P70 
 D8=P80 
 D9=P90 
 
Professora: Mônica Do Nascimento Ribeiro 
 31 
 
CAPITULO 5: 
 
MEDIDAS DE DISPERSÃO OU VARIABILIDADE 
 
As medidas de dispersão ou variabilidade servem para avaliar o quanto os dados são 
semelhantes, descreve então o quanto os dados distam do valor central. 
 
Dessas medidas, estudaremos as seguintes: 
- Medidas de variação absoluta: Amplitude total, Variância e o Desvio Padrão. 
- Medidas de variação relativa: Coeficiente de Variação. 
 
(1) MEDIDAS DE VARIAÇÃO ABSOLUTA 
 
Amplitude Total: É a diferença entre o maior e o menor valor observado. Tem o 
inconveniente de só levar em conta os dois valores extremos da série, não levando em 
consideração os valores intermediários. Ela é apenas uma indicação aproximada da 
dispersão ou variabilidade. 
 
 AT = L (Max) – l (min) 
 
Variância e Desvio Padrão: A variância e o desvio padrão são medidas que levam em 
consideração a totalidade dos valores da variável em estudo, o que faz delas índices de 
variabilidade bastante estáveis e, por isso mesmo, os mais geralmente empregados. 
 
Cálculo da Variância (
2
x
): A variância é a média aritmética do quadrado dos desvios 
(em relação à média). 
 
)(
 ou 
)(
1
1
2
2
)(
1
2
2
)(








n
i
i
i
n
i
i
x
n
i
i
x
f
fxx
n
xx
 
 
Etapas do cálculo da Variância: 
 
1. - Calcular a média aritmética 
X
 
2. - Subtrair a média 
X
 de cada valor 
ix
 do conjunto 
xxi 
, o que chamamos de 
desvio; 
3. - Elevar cada desvio ao quadrado 
2)( xxi 
 
4. - Somar os quadrados dos desvios 
 
2
1



n
i
i xx
 
5. - Dividir a soma por (n-1) quando se tratar de dados amostrais, ou simplesmente por 
n se os dados representam todos os valores de uma população. 
 
Professora: Mônica Do Nascimento Ribeiro 
 32 
 
 
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em 
unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é 
um inconveniente. 
Por isso mesmo, imaginou-se uma nova medida que tem a interpretação prática, 
denominada desvio padrão, definida como a raiz quadrada da variância. 
Desvio Padrão: 
 2)( xx  
 
 
Observação: 
(1) O desvio padrão sempre será positivo! 
(2) O desvio padrão de uma série indica o quanto os dados estão afastados da média e, 
que se os dados são iguais, o valor da medida é zero. 
 
Exemplo 7: Em uma turma de aluno, verificaram-se através da análise das notas de 15 
alunos (amostra), os seguintes desempenhos: 
 
Alunos Conceito na Prova 
 
 
1 4,3 9,1204 
2 4,5 7,9524 
3 9 2,8224 
4 6 1,7424 
5 8 0,4624 
6 6,7 0,3844 
7 7,5 0,0324 
8 10 7,1824 
9 7,5 0,0324 
10 6,3 1,0404 
11 8 0,4624 
12 5,5 3,3124 
13 9,7 5,6644 
14 9,3 3,9204 
15 7,5 0,0324 
Total 109,8 44,16 
Média 7,32 3,155 Variância 
Desvio Padrão 1,77 
 
 2XXi
 
2n
1i
XXi


Professora: Mônica Do Nascimento Ribeiro 
 33 
 
Observamos no exemplo, que a média das provas, foi estimada em 7,32 com desvio 
padrão em 1,77. Concluímos que a maioria das notas concentrou-se em 9,09 e 5,55. 
Exercício: Calcular a média aritmética e o desvio padrão dos seguintes dados relativos à 
dosagem de hemoglobina verificada numa amostra de 12 animais bovinos (mg). 
15 14 13 11 13 14 13,5 12 16 14,5 12 9 
Resp.: Média = 13,083mg Variância = 3,583mg
2
 Desvio padrão = 1,892mg 
(2) MEDIDAS DE VARIAÇÃO RELATIVA 
O coeficiente de variação: 
x
x
xCV
)(
)(


. É a razão entre o desvio padrão e a média 
aritmética da série dos dados. Pode ser expresso em percentual . Usado 
para comparar a variabilidade de diferentes grupos de dados. 
 
Exercício: Os dados abaixo se referem às medidas da altura de parafusos e do diâmetro de 
rolamentos. Determine o coeficiente de variação, para verificar em relação a qual medida 
(parafuso ou rolamento) a variabilidade é maior, sabendo-se que o desvio padrão dos 
parafusosé de 0,46 cm e dos rolamentos é de 0,27 cm? 
 
Parafusos (cm) 10,2 10,6 9,8 10,0 9,8 10,4 9,2 
Rolamentos (cm) 2,2 2,5 1,8 1,9 2,0 1,7 1,9 
 
Resposta: CVp = 4,6 e CVr = 13,5. Os rolamentos apresentam maior variabilidade. 
 
 
 
 
MEDIDAS DE ASSIMETRIA 
Introdução: As medidas de assimetria possibilitam analisar uma distribuição de acordo 
com as relações entre suas medidas de moda, média e mediana, quando observadas 
graficamente. 
 Uma distribuição com classes é simétrica quando : Média = Mediana = Moda 
Professora: Mônica Do Nascimento Ribeiro 
 34 
 
 
Quando esta igualdade não acontece, temos uma distribuição assimétrica. Se 
considerarmos um eixo de referência, que chamaremos de eixo de simetria, traçado sobre 
o valor da média da distribuição. 
Sempre que a curva da distribuição se afastar do referido eixo, será considerada como 
tendo um certo grau de afastamento, que é considerado como uma assimetria da 
distribuição. 
Ou seja, assimetria é o grau de afastamento que uma distribuição apresenta do seu eixo de 
simetria. Este afastamento pode acontecer do lado esquerdo ou do lado direito da 
distribuição, chamado de assimetria negativa ou positiva respectivamente. 
 Uma distribuição com classes é: 
Assimétrica à esquerda ou negativa quando: Média < Mediana < Moda 
Analogamente quando a cauda da curva da distribuição declina para esquerda, temos uma 
distribuição com curva assimétrica negativa: 
 
 
 
Assimétrica à direita ou positiva quando: Média > Mediana > Moda 
Quando a cauda da curva da distribuição declina para direita, temos uma distribuição com 
curva assimétrica positiva: 
Professora: Mônica Do Nascimento Ribeiro 
 35 
 
 
 
Existem diversos métodos para o cálculo da medida de assimetria. 
Usaremos apenas a fórmula conhecida como o 1° coeficiente de Pearson, 
por ser de simples aplicação. 
 
1° Coeficiente de Pearson 
AS = (X - Mo) / σ para dados populacionais; 
AS = (X - Mo) / S para dados amostrais; 
 
Quando: AS = 0 distribuição simétrica; 
AS > 0 distribuição assimétrica positiva; 
AS < 0 distribuição assimétrica negativa. 
Coeficiente de assimetria: A medida anterior, por ser absoluta, apresenta a 
mesma deficiência do desvio padrão, isto é, não 
permite a possibilidade de comparação entre as 
medidas de duas distribuições. Por esse motivo, 
daremos preferência ao coeficiente de assimetria de 
Person: 
 
 As = 3 ( Média - Mediana ) / Desvio Padrão 
 
Escalas de assimetria: 
| AS | < 0,15  assimetria pequena 
0,15 < | AS | < 1  assimetria moderada 
| AS | > 1  assimetria elevada 
 
Obs: Suponhamos AS = - 0,49  a assimetria é considerada moderada e negativa 
Professora: Mônica Do Nascimento Ribeiro 
 36 
 
Suponhamos AS = 0,75  a assimetria é considerada moderada e positiva 
 
 
MEDIDAS DE CURTOSE 
Introdução: 
 Denominamos CURTOSE o grau de achatamento de uma distribuição em relação 
a uma distribuição padrão, denominada curva normal (curva correspondente a 
uma distribuição teórica de probabilidade). 
 Quando a distribuição apresenta uma curva de freqüência mais fechada que a 
normal (ou mais aguda ou afilada em sua parte superior), ela recebe o nome de 
leptocúrtica. 
 Quando a distribuição apresenta uma curva de freqüência mais aberta que a 
normal (ou mais achatada em sua parte superior), ela recebe o nome de 
platicúrtica. 
 A curva normal, que é a nossa base referencial, recebe o nome de mesocúrtica. 
Coeficiente de curtose 
C1 = (Q3 - Q1) / 2(P90 - P10) 
Onde: 
Professora: Mônica Do Nascimento Ribeiro 
 37 
 
Q3 e Q1 são o terceiro e primeiro quartil 
P10 e P90 são o décimo e nonagésimo 
Este coeficiente é conhecido como percentílico de curtose. 
 Relativamente a curva normal, temos: 
C1 = 0,263  curva mesocúrtica – normal. Nem achatada, nem alongada. 
 
C1 < 0,263  curva leptocúrtica – alongada. 
 
C1 > 0,263  curva platicúrtica – achatada. 
 
 O coeficiente abaixo ( C2 ) será utilizado em nossas análises: 
 
onde S é desvio padrão 
C2 = 3  curva mesocúrtica 
C2 > 3  curva leptocúrtica 
C2 < 3  curva platicúrtica
Professora: Mônica Do Nascimento Ribeiro 
 38 
 
CAPITÚLO 6: 
 
EXPERIMENTO ALEATÓRIO, ESPAÇO AMOSTRAL, EVENTOS E 
PROBABILIDADE. 
 
DEFINIÇÕES: 
EXPERIMENTO ALEATÓRIO: São aqueles que, mesmo repetidos várias vezes sob 
condições semelhantes, apresentam resultados imprevisíveis. 
Ex.: Em uma jogada de futebol, é provável que seu time: perca; que ele ganha; que ele 
empate. 
ESPAÇO AMOSTRAL (S): Cada experimento aleatório corresponde, em geral, a vários 
resultados possíveis. O conjunto desses resultados possíveis recebe o nome de espaço 
amostral ou conjunto universo, representado por S. 
Exemplo: Lançamento de uma moeda: S = {Ca, Co} 
 Lançamento de um dado: S={1, 2, 3, 4, 5, 6} 
Cada um dos elementos de “S” que correspondem a um resultado recebe o nome de 
PONTO AMOSTRAL, por exemplo, 2 

 a S => 2 é um ponto amostral de S (no caso do 
lançamento do dado). 
EVENTOS (A): Chamamos de evento qualquer subconjunto do espaço amostral S de um 
experimento aleatório. 
Exemplo: Lançamento de um dado: 
Espaço amostral: S={1, 2, 3, 4, 5, 6} 
Eventos: 
a) Obter um número par na face superior: 
A={2, 4, 6} => 
SA 
, logo, A é um evento de S. 
Professora: Mônica Do Nascimento Ribeiro 
 39 
 
Seja S o seu espaço amostral. Se todos os elementos de S tem a mesma chance de 
acontecer, então, chamamos de PROBABILIDADE DE UM EVENTO A, 
SA 
, o 
número real P(A), tal que: 
)(
)(
)(
Sn
An
AP  , onde n(A) é o número de elementos de A e n(S) é o número de elementos 
de S. 
Exemplos: Considere o lançamento de uma moeda e o evento A “obter cara”. 
S= {Ca, Co} n(S) = 2 A = {Ca} n(A) = 1 P(A) = 
2
1
 
EVENTOS COMPLEMENTARES 
Exemplo: Pesquisa afirma que de um grupo de 100 pacientes fumantes aparecem as 
seguintes evidências
1
. 
Eventos (evidências): e1 = Normal; e2 = Bronquite; e3 = Câncer no Pulmão; 
e4 = Tuberculose 
Espaço Amostral: = {Normal; Bronquite; Câncer no Pulmão; Tuberculose} 
 
Evidências Normal Bronquite Câncer no Pulmão Tuberculose 
Nº de Pacientes 25 60 10 5 
 
Se a probabilidade de um paciente apresentar tuberculose é de 0,05. Então se abordarmos 
um paciente, ao acaso, qual a probabilidade de que ele tenha tuberculose ausente. 
Resolução: 
 “e4”: paciente tem tuberculose: 
05,0
100
5
)( 4 eP
 
Como: 
1)()( 44  ePeP
 Então, 
95,005,01)(1)( 44  ePeP
 onde 
4e
 significa: 
paciente tem tuberculose ausente. 
Assim, a chance de abordarmos um paciente que tem tuberculose ausente é 95%. 
 
1
 Considere estas evidências as mais comuns entre pacientes. Suponha também que as evidências acima 
sejam exclusivas. 
Professora: Mônica Do Nascimento Ribeiro 
 40 
 
EVENTOS MUTUAMENTE EXCLUSIVOS 
Se os mesmos elementos não podem ocorrer simultaneamente. 
P(AB) = P(A) + P(B), a probabilidade de que um ou outro se realize é igual a soma das 
probabilidades. 
Exemplo: Considerando os dados do exemplo (1). 
 
Evidências Normal Bronquite Câncer no Pulmão Tuberculose 
Nº de Pacientes 25 60 10 5 
 
Se abordarmos um paciente, ao acaso, qual é a probabilidade de que ele tenha câncer de 
pulmão ou tuberculose? 
Resolução: 
15,0
100
15
100
5
100
10
)()()( 4343  ePePeeP
 
 
EVENTOS QUE NÃO SÃO MUTUAMENTE EXCLUSIVOS 
P(AB) = P(A) + P(B) - P(AB) 
 
De um grupo de 80 pessoas considere: 
 
SITUAÇÃO 
EMPREGATÍCIASITUAÇÃO ESCOLAR 
Total 
Até o Nível Médio Nível Superior 
Empregada 10 35 45 
Desempregada 15 20 35 
Total 25 55 80 
 
A probabilidade de uma pessoa estar desempregada ou ter nível superior. 
Resolução: 
8750,0
80
70
80
20
80
55
80
35
)()()()(  SDPSPDPSDP
 
 
EVENTOS INDEPENDENTES 
Dois eventos são independentes quando a ocorrência ou a não ocorrência de um evento 
não tem efeito algum na probabilidade de ocorrência do outro evento. Quando lançamos 
dois dados, o resultado obtido em um deles independe do resultado obtido no outro. 
P(A e B) = P(AB) = P(A)P(B) 
Professora: Mônica Do Nascimento Ribeiro 
 41 
 
Exemplo: Se dois por cento da população apresenta esquizofrenia. A probabilidade de se 
encontrar duas pessoas com esquizofrenia ausente é: 
 
Resolução: 
9604,098,098,0)()()(  niaEsquizofrePniaEsquizofrePniaEsquizofreniaEsquizofreP
 
Ou seja, a chance de ambos apresentarem esquizofrenia é de 96,04%. 
 
EVENTOS DEPENDENTES 
Quando dois eventos são dependentes, o conceito de probabilidade condicional é 
empregado para indicar a probabilidade de ocorrência de um evento relacionado. A 
expressão P(B/A) indica a probabilidade de ocorrer o evento B, dado que tenha ocorrido 
o evento A. Note que “B/A” não é uma fração. 
P(B/A) = 
)(
)(
AP
BeAP
=
)(
)(
AP
ABP 
 
 
Exemplo: Em um grupo de 50 turistas temos as seguintes variáveis descritas abaixo: 
 
NACIONALIDADE 
SEXO 
Total 
M F 
Brasileiro (B) 20 15 35 
Estrangeiro (E) 5 10 15 
Total 25 25 50 
 
Calcule as seguintes probabilidades: 
 
a) O turista ser masculino se é brasileiro. 

35
20
)B/M(P
0,5714 
b) O turista ser masculino se é estrangeiro. 
)/( EMP
 (0,3333) 
c) O turista ser feminino se é brasileiro. 

35
15
)B/F(P
0,4286 
d) O turista ser feminino se é estrangeiro. 
)/( EFP
 (0,6667) 
 
e) O turista ser brasileiro se é masculino. 

25
20
)M/B(P
0,80 
f) O turista ser estrangeiro se é masculino. 
)/( MEP
 (0,20) 
g) O turista ser brasileiro se é feminino. 

25
15
)F/B(P
0,60 
h) O turista ser estrangeiro se é feminino. 
)/( FEP
 (0,40) 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 42 
 
EXERCÍCIO DE FIXAÇÃO 
 
1) Qual a probabilidade de sair ás de ouros quanto retiramos uma carta de um 
baralho de 52 cartas? 
2) Qual a probabilidade de sair um rei quanto retiramos uma carta de um baralho de 
52 cartas? 
3) Um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule? 
a- A probabilidade de essa peça ser defeituosa: 
b- A probabilidade de essa peça não ser defeituosa: 
4) No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5. 
5) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro 
baralho e uma carta do segundo baralho. Qual a probabilidade de a carta do 
primeiro baralho ser um rei e a do segundo baralho ser o 5 de paus? 
6) Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; Uma urna B contém: 5 
bolas brancas, 2 pretas, 1 verde; Uma urna C contém: 2 bolas brancas, 3 pretas e 4 
verdes. Uma bola é retirada de cada urna. Qual a probabilidade de as 3 bolas 
retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca, 
preta e verde? 
7) De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual 
a probabilidade de a primeira carta ser o ás de paus e a segunda ser o rei de paus? 
8) Qual a probabilidade de sair uma figura quando retiramos uma carta de um 
baralho de 52 cartas? 
9) Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos 
uma carta de um baralho de 52 cartas? 
10) No lançamento de um dado, qual a probabilidade de se obter um número não 
inferior a 5? 
 
Professora: Mônica Do Nascimento Ribeiro 
 43 
 
GABARITO 
 
 
1. A = sair ás de ouros P(A)=1/52 
2. A = sair rei P(A)=4/52 
3. 
a) A= a peça ser defeituosa P(A)=4/12 
b) B=a peça ser perfeita P(B)=8/12 
 
4. A= a soma ser 5 A={(1,4), (2,3), (3,2), (4,1)} P(A) = 4/36 
5. A= sair rei 
B= sair 5 de paus 
P(A E B) = P(A)x P(B) = 4/52 x 1/52 = 4/2704 
6. 
A= 3 bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente, 
branca, preta e verde 
P(A)= 3/9 x 2/8 x 4/9 = 24/648 
 
7. C= sair ás de paus e reis de paus 
P(C1 e C2)= P(C1). P(C2/C1) = 1/52 x 1/51 = 1/2652 
8. 
Figuras = valete, dama e rei 
A= sair uma figura 
P(A) = 12/52 
9. A= sair copas ou ouros P(A)=13/52 + 13/52 = 26/52 
 
10. A= número maior que 5 P(A)=1/6 
Professora: Mônica Do Nascimento Ribeiro 
 44 
 
CAPÍTULO 07 
 
DISTRIBUIÇÃO DE PROBABILIDADE 
 
Quando conhecemos todos os valores de uma variável aleatória juntamente com suas 
respectivas probabilidade, temos uma distribuição de probabilidade. 
 
 
Exemplo: Distribuição de probabilidade no número de acidentes aéreos com a GOL, 
dentre sete acidentes. 
 
X p(x)
0 0,210
1 0,367
2 0,275
3 0,115
4 0,029
5 0,004
6 0+
7 0+ 
 
 
A representação gráfica de uma DISTRIBUIÇÃO DE PROBABILIDADES é feita 
através do HISTOGRAMA DE PROBABILIDADES, semelhantes ao HISTOGRAMA 
DE FREQÜÊNCIA, sendo que a escala vertical apresenta probabilidades, em lugar das 
correspondentes freqüências. 
 
Condições para uma DISTRIBUIÇÃO DE PROBABILIDADE: 
 
1) A soma de todas as probabilidades individuais é 1: 
  1 xp
 
 
2) Para qualquer evento A implica que p(x) deve estar entre 0 e 1 para qualquer valor de 
x: 
1)(0  xP
 
 
MÉDIA DE UMA DISTRIBUIÇÃO DE PROBABILIDADE 
   


n
i
ii xpxXE
1

 
VARIÂNCIA DE UMA DISTRIBUIÇÃO DE PROBABILIDADE 
      


n
i
ii xpXExXVAR
1
22
 
 A probabilidade de 0 acidentes com 
a GOL (dentre sete acidentes) é 
0,210; 
 
 Os valores denotados 0+ 
representam probabilidades muito 
pequenas; 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 45 
 
EXERCÍCIO DE FIXAÇÃO 
 
1) Determine se é dada uma distribuição de probabilidade. Nos casos em que não é 
descrita uma distribuição de probabilidade, identifique a condição que não é satisfeita. E 
quando for descrita uma distribuição de probabilidade, determine sua média e desvio 
padrão. 
a) Se sua faculdade contrata os 4 próximos funcionários sem distinção de sexo e o 
conjunto de candidatos é grande, com números iguais de homens e mulheres, a 
tabela a seguir dá a distribuição de probabilidade do número x de mulheres 
contratadas. 
X p(x)
0 0,0625
1 0,2500
2 0,3750
3 0,2500
4 0,0625 Resposta: 2 e 1 
 
b) Ao avaliar riscos de crédito, Jefferson investiga o número de cartões de crédito 
que a pessoa tem. Com x sendo o número de cartões de crédito que os adultos 
possuem a tabela a seguir dá a distribuição de probabilidade para um conjunto de 
solicitantes. 
X p(x)
0 0,26
1 0,16
2 0,12
3 0,09
4 0,07
5 0,09
6 0,07
7 0,14 Resposta: 2,8 e 2,52 
 
2)Seja X uma variável aleatória discreta assumido valores no conjunto {1, 2, 3} e com 
distribuição de probabilidade dada por: 
 
x 1 2 3
P(X=x) 1/3 1/6 1/2 
 
a. Calcule a média de X. (resposta: 2,165) 
b. Calcule a (
 2xP
 (resposta: 0,666) 
c. Calcule a (
 2xP
 (resposta: 0,5) 
 
3)O tempo T, em minutos, necessário para um operário processar certa peça é uma 
variável aleatória com a seguinte distribuiçãode probabilidade: 
 
T 2 3 4 5 6 7
P(T=t) 0,1 0,1 0,3 0,2 0,2 0,1 
Calcule o tempo médio de processamento. Resposta: 4,6 minutos 
 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 46 
 
DISTRIBUIÇÕES ESTATÍSTICAS: DISCRETA E CONTÍNUA 
 
(1) DISTRIBUIÇÃO BINOMIAL (discreta) 
 
Vimos que uma variável aleatória associa um valor numérico a cada resultado de um 
experimento aleatório e uma distribuição de probabilidade associa uma probabilidade a 
cada valor de uma variável aleatória. 
Veremos agora como determinar as probabilidades para uma categoria importante de 
distribuição de probabilidades: OS EXPERIMENTOS BINOMIAIS. 
Os experimentos binomiais têm a característica de apresentarem exatamente dois 
resultados complementares: SUCESSO E FRACASSO. 
Exemplo: Em processos industriais: as peças falham ou não falham. 
 Na medicina: um paciente sobrevive ou morre. 
Em propaganda, um consumidor reconhece um produto ou não. 
 
Definição: 
 
Um experimento binomial é um experimento que satisfaz as seguintes condições: 
1. O experimento deve comportar um número fixo de provas (n). 
2. As provas devem ser independentes (o resultado de qualquer prova não afeta 
as probabilidades das outras provas.) 
3. Cada prova deve ter todos os resultados classificados em duas categorias 
(sucesso e fracasso). 
4. As probabilidades devem permanecer constantes para cada prova. 
 
Quando fazemos um experimento binomial, a distribuição da variável aleatória x é 
chamada uma DISTRIBUIÇÃO BINOMIAL. 
Professora: Mônica Do Nascimento Ribeiro 
 47 
 
Notação: 
p => probabilidade de sucesso 
q => probabilidade de fracasso 
x => denota um número específico de sucessos em n provas, podendo ser qualquer inteiro 
entre 0 e n, inclusive. 
P(x) => denota a probabilidade de obter exatamente x sucessos em n provas. 
Parâmetros da Distribuição Binomial: 
),(~ pnBX
 
Cálculo da Probabilidade de uma Distribuição Binomial: 
 
  xnxnx ppxXP
 )1.().(
 
  xnxxnxxn
xnxn
x qp
xxn
n
ppCppxXP 

 ..
!)!(
!
)1.(.)1.().( ,
 
Para x = 0, 1, 2, .....,n 
 
Média de uma Distribuição Binomial: E(x) = np 
 
Variância da Distribuição Binomial: V(x) = npq 
 
Obs.: lembrando que 0! = 1 (por definição) 
 
Exercício: 
 
1) Aplicando a fórmula da probabilidade binomial, determine a probabilidade de 
obter 3 estudantes canhotos em uma turma de 15 estudantes, dado que 10% da 
população são canhotos. Isto é determine P(3), se n=15, x=3, p=0,1 e 1=0,9. 
Resposta: 0,1285
Professora: Mônica Do Nascimento Ribeiro 
 48 
 
 
EXERCÍCIO DE FIXAÇÃO 
 
 
1) Suponha que em um experimento binomial, uma prova se repita n vezes. 
Determine a probabilidade de x sucessos, dada a probabilidade p de sucesso em 
uma prova: Respostas: 
a) n = 3, x= 2, p=0,9 (0,243) 
b) n=8, x=7, p=0,99 (0,0745) 
c) n=10, x=4, p=0,30 (0,2001) 
d) n=6, x=1, p=0,05 (0,2321) 
 
2) Uma firma afirma que 20% de suas pastilhas de chocolate M&M são vermelhas. 
Determine a probabilidade de que, em 15 pastilhas M&M escolhidas 
aleatoriamente, exatamente 20%, ou seja, 3 pastilhas sejam vermelhas. 
Resposta: 0,250 
3) Acredita-se que 20% dos moradores das proximidades de uma grande indústria 
siderúrgica têm alergia aos poluentes lançados ao ar. Admitindo que este 
percentual de alérgicos é real (correto), calcule a probabilidade de que pelo menos 
4 moradores tenham alergia entre 13 selecionados ao acaso. 
Resposta: 0,252 
4) Três em cada quatro alunos de uma universidade fizeram cursinho antes de prestar 
vestibular. Se 16 alunos são selecionados ao acaso, qual é a probabilidade de que: 
Respostas 
a) Pelo menos 12 tenham feito cursinho? (0,6302) 
b) No máximo 13 tenham feito cursinho? (0,8029) 
c) Exatamente 12 tenham feito cursinho? (0,2252) 
 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 49 
 
Professora: Mônica Do Nascimento Ribeiro 
 50 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 51 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 52 
 
Professora: Mônica Do Nascimento Ribeiro 
 53 
 
 
(2) DISTRIBUIÇÃO NORMAL OU GAUSS (contínua) 
 
Se X é uma variável aleatória contínua, então X assume todos os valores em um intervalo 
de números reais (). 
 
- A distribuição de probabilidade de X é descrita por uma curva de densidade, ou função 
de densidade. 
 
2
2
1
.
2
1 



 

 


x
exf
 
 Π (Pi): (≈ 3,14159) 
 
 e: (≈ 2,71828). 
 
- A probabilidade de qualquer evento é a área sob a curva de densidade entre os valores 
de X que compõe o evento. 
 
- A área total sob qualquer curva de densidade é 1, de modo que a probabilidade de um 
evento varia entre 0 e 1. 
 
 - Parâmetros da Distribuição Normal 
),(~ 2NX
 
 
Média da Distribuição Normal: E(X) =  
Variância da Distribuição Normal: VAR(X) = 
2
 
Algumas propriedades da Distribuição Normal: 
 P(X=x) = f(X) = 0 (pois não existe a probabilidade no ponto e sim na área) 
 f(X) é simétrica ao redor da média, ou seja, a probabilidade de ocorrer valor 
menor do que a média é igual a probabilidade de ocorrer valor menor do que a 
média. 
 A curva normal depende de duas constantes,  e 2: 
-  corresponde ao centro da simetria da curva e 2 graficamente, fornece a 
distância do centro da simetria aos pontos onde a curva muda de sentido. 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 54 
 
 
Distribuição Normal Padrão: 
 
Na prática desejamos calcular probabilidades para diferentes valores de  e . Para isso, 
a variável cuja distribuição é 
),(~ 2NX
 é transformada numa forma padronizada 
com distribuição 
)1,0(~ NX
 (distribuição normal padrão), pois tal distribuição é 
tabelada. A quantidade é dada por: 



X
Z
 
 
Exemplo: 
 
1) Se já X a variável aleatória que representa os diâmetros dos parafusos produzidos por 
certa máquina. Suponha que essa variável tenha Distribuição Normal com média 2cm e 
desvio padrão 0,04cm. 
a) A probabilidade de um parafuso ter um diâmetro com valor entre 2 e 2,05 é: 
3944,0)25,10()
04,0
205,2
04,0
22
()05,22( 





 ZP
X
PXP   
 
b) P(-1,25<Z<0) = 
 
c) P(0,8<Z<1,23) = 
 
d) P(Z>0,6) = 
 
 
Obs.: Quando temos uma variável aleatória com distribuição Normal, nosso principal 
interesse é obter a probabilidade de essa variável aleatória assumir um valor em um 
determinado intervalo. 
Professora: Mônica Do Nascimento Ribeiro 
 55 
 
Tabela: Probabilidades da Distribuição Normal 
 
 
 Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 
0,0 0,000000 0,003989 0,007978 0,011966 0,015953 0,019939 0,023922 0,027903 0,031881 
 
0,035856 
0,1 0,039828 0,043795 0,047758 0,051717 0,055670 0,059618 0,063559 0,067495 0,071424 0,075345 
0,2 0,079260 0,083166 0,087064 0,090954 0,094835 0,098706 0,102568 0,106420 0,110261 0,114092 
0,3 0,117911 0,121720 0,125516 0,129300 0,133072 0,136831 0,140576 0,144309 0,148027 0,151732 
0,4 0,155422 0,159097 0,162757 0,166402 0,170031 0,173645 0,177242 0,180822 0,184386 0,187933 
0,5 0,191462 0,194974 0,198468 0,201944 0,205401 0,208840 0,212260 0,215661 0,219043 0,222405 
0,6 0,225747 0,229069 0,232371 0,235653 0,238914 0,242154 0,245373 0,248571 0,251748 0,254903 
0,7 0,258036 0,261148 0,264238 0,267305 0,270350 0,273373 0,276373 0,279350 0,282305 0,285236 
0,8 0,288145 0,291030 0,293892 0,296731 0,299546 0,302337 0,305105 0,307850 0,310570 0,313267 
0,9 0,315940 0,318589 0,321214 0,323814 0,326391 0,328944 0,331472 0,3339770,336457 0,338913 
1,0 0,341345 0,343752 0,346136 0,348495 0,350830 0,353141 0,355428 0,357690 0,359929 0,362143 
1,1 0,364334 0,366500 0,368643 0,370762 0,372857 0,374928 0,376976 0,379000 0,381000 0,382977 
1,2 0,384930 0,386861 0,388768 0,390651 0,392512 0,394350 0,396165 0,397958 0,399727 0,401475 
1,3 0,403200 0,404902 0,406582 0,408241 0,409877 0,411492 0,413085 0,414657 0,416207 0,417736 
1,4 0,419243 0,420730 0,422196 0,423641 0,425066 0,426471 0,427855 0,429219 0,430563 0,431888 
1,5 0,433193 0,434478 0,435745 0,436992 0,438220 0,439429 0,440620 0,441792 0,442947 0,444083 
1,6 0,445201 0,446301 0,447384 0,448449 0,449497 0,450529 0,451543 0,452540 0,453521 0,454486 
1,7 0,455435 0,456367 0,457284 0,458185 0,459070 0,459941 0,460796 0,461636 0,462462 0,463273 
1,8 0,464070 0,464852 0,465620 0,466375 0,467116 0,467843 0,468557 0,469258 0,469946 0,470621 
1,9 0,471283 0,471933 0,472571 0,473197 0,473810 0,474412 0,475002 0,475581 0,476148 0,476705 
2,0 0,477250 0,477784 0,478308 0,478822 0,479325 0,479818 0,480301 0,480774 0,481237 0,481691 
2,1 0,482136 0,482571 0,482997 0,483414 0,483823 0,484222 0,484614 0,484997 0,485371 0,485738 
2,2 0,486097 0,486447 0,486791 0,487126 0,487455 0,487776 0,488089 0,488396 0,488696 0,488989 
2,3 0,489276 0,489556 0,489830 0,490097 0,490358 0,490613 0,490863 0,491106 0,491344 0,491576 
2,4 0,491802 0,492024 0,492240 0,492451 0,492656 0,492857 0,493053 0,493244 0,493431 0,493613 
2,5 0,493790 0,493963 0,494132 0,494297 0,494457 0,494614 0,494766 0,494915 0,495060 0,495201 
2,6 0,495339 0,495473 0,495604 0,495731 0,495855 0,495975 0,496093 0,496207 0,496319 0,496427 
2,7 0,496533 0,496636 0,496736 0,496833 0,496928 0,497020 0,497110 0,497197 0,497282 0,497365 
2,8 0,497445 0,497523 0,497599 0,497673 0,497744 0,497814 0,497882 0,497948 0,498012 0,498074 
2,9 0,498134 0,498193 0,498250 0,498305 0,498359 0,498411 0,498462 0,498511 0,498559 0,498605 
3,0 0,498650 0,498694 0,498736 0,498777 0,498817 0,498856 0,498893 0,498930 0,498965 0,498999 
3,1 0,499032 0,499065 0,499096 0,499126 0,499155 0,499184 0,499211 0,499238 0,499264 0,499289 
3,2 0,499313 0,499336 0,499359 0,499381 0,499402 0,499423 0,499443 0,499462 0,499481 0,499499 
3,3 0,499517 0,499534 0,499550 0,499566 0,499581 0,499596 0,499610 0,499624 0,499638 0,499651 
3,4 0,499663 0,499675 0,499687 0,499698 0,499709 0,499720 0,499730 0,499740 0,499749 0,499758 
3,5 0,499767 0,499776 0,499784 0,499792 0,499800 0,499807 0,499815 0,499822 0,499828 0,499835 
3,6 0,499841 0,499847 0,499853 0,499858 0,499864 0,499869 0,499874 0,499879 0,499883 0,499888 
3,7 0,499892 0,499896 0,499900 0,499904 0,499908 0,499912 0,499915 0,499918 0,499922 0,499925 
3,8 0,499928 0,499931 0,499933 0,499936 0,499938 0,499941 0,499943 0,499946 0,499948 0,499950 
3,9 0,499952 0,499954 0,499956 0,499958 0,499959 0,499961 0,499963 0,499964 0,499966 0,499967 
4,0 0,499968 0,499970 0,499971 0,499972 0,499973 0,499974 0,499975 0,499976 0,499977 0,499978 
 
Professora: Mônica Do Nascimento Ribeiro 
 56 
 
 
EXERCÍCIO DE FIXAÇÃO 
 
1) Determinar o valor, ou valores, de z em cada um dos casos, nos quais as áreas 
referem-se às limitadas pela curva normal: 
Resposta: 
a) a área entre 0 e z é 0,3770 (z= 1,16) 
b) a área a esquerda de z é 0,8621 (z=1,09) 
 
2) O peso médio de 500 estudantes do sexo masculino de uma determinada 
universidade é 75,5kg e o desvio padrão é de 7,5 kg. Admitindo-se que os pesos 
estão distribuídos normalmente, determinar quantos estudantes pesam: 
Resposta 
a) entre 60 e 77,5kg (P(-2,06<z<0,266)=0,6 => 300 estudantes) 
b) mais do que 92,5kg (P(z>2,26)=0,0119 = > 6 estudantes) 
 
3) A média dos diâmetros internos de uma amostra de 200 arruelas produzidas por 
certa máquina é 0,502 polegadas e o desvio padrão é 0,005 polegadas. A 
finalidade para a qual essas arruelas são fabricadas permite a tolerância máxima, 
para o diâmetro, de 0,496 a 0,508 polegadas; se isso não se verifica, as arruelas 
serão consideradas defeituosas. Determinar a porcentagem de arruelas defeituosas 
produzidas pela máquina, admitindo-se que os diâmetros são distribuídos 
normalmente. Resposta: 23,02% 
 
4) Se z é normalmente distribuída, com média zero e variância 1, determinar: 
Resposta: 
a) P(z>-1,64) = (0,9495) 
b) P(-1,96<z<1,96) = (0,95) 
c) P(0<z<1,44) = (0,4251) 
d) P(-0,85<z<0) = (0,3023) 
e) P(-1,48<z<2,05) = (0,9104) 
f) P(0,72<z<1,86) = (0,2044) 
 
 
Professora: Mônica Do Nascimento Ribeiro 
 57 
 
 
CAPITULO 8 
INTRODUÇÃO 
 
 A REGRESSÃO e a CORRELAÇÃO são técnicas utilizadas para estimar uma 
relação que possa existir na população, enquanto as técnicas anteriormente estudadas 
(Medidas de Tendência Central e de Dispersão: Média, Desvio Padrão, Variância, etc.) 
servem para estimar um único parâmetro populacional. 
 A análise de correlação e regressão compreende a análise de dados amostrais para 
saber se e como duas ou mais variáveis estão relacionadas uma com a outra numa 
população. 
 A correlação mede a força, ou grau, de relacionamento entre duas variáveis; a 
regressão dá a equação que descreve o relacionamento em termos matemáticos. 
 
(1) CORRELAÇÃO 
 
Definição: Quando duas variáveis estão ligadas por uma relação estatística, dizemos que 
existe correlação entre elas. 
Por exemplo: 
 - A circunferência C e o raio r estão perfeitamente correlacionados, porque 2C r. 
 - As variáveis altura e peso de indivíduos revelariam alguma correlação. 
 
Diagrama de dispersão: O diagrama de dispersão é um gráfico onde pontos no espaço 
cartesiano XY são usados para representar simultaneamente os valores de duas variáveis 
quantitativas medidas em um conjunto de dados. 
Professora: Mônica Do Nascimento Ribeiro 
 58 
 
 
Por exemplo: 
Um dos objetivos dos pesquisadores neste estudo é encontrar uma maneira de conhecer o 
peso do urso através de uma medida mais fácil de se obter do que a direta (carregar uma 
balança para o meio da selva e colocar os ursos em cima dela) como, por exemplo, uma 
medida de comprimento (altura, perímetro do tórax, etc.). 
 
O problema estatístico aqui é encontrar uma variável que tenha uma relação forte com o 
peso, de modo que, a partir de seu valor medido, possa ser calculado (estimado) o valor 
peso indiretamente, através de uma equação matemática. 
 
O primeiro passo para encontrar esta variável é fazer o diagrama de dispersão das 
variáveis candidatas (eixo horizontal) versus o peso (eixo vertical), usando os pares de 
informações de todos os ursos. Você pode tentar as variáveis: idade, altura, comprimento 
da cabeça, largura da cabeça, perímetro do pescoço e perímetro do tórax. 
A Figura mostra a relação entre peso e altura e entre peso e perímetro do tórax. 
 
Analisando o gráfico: 
1) Podemos ver que, tanto a altura quanto o perímetro do tórax são fortemente associados 
ao peso do urso, no sentido de que quanto mais alto o urso ou quanto maior a medida de 
seu tórax, mais pesado ele será. 
2) Note que este crescimento é linear para o perímetro do tórax e não-linear para a altura. 
3) Os pontos estão mais dispersos no gráfico da altura, a variável mais adequada para 
estimar o peso é o perímetro do tórax. 
 
Professora: Mônica Do Nascimento Ribeiro 
 59 
 
Observação: A correlação entre duas variáveis pode ser POSITIVA, NULA ou 
NEGATIVA. 
 
-30
-25
-20
-15
-10
-5
0
5
10
0 5 10 15 20 25 30
 
 Gráfico 1 (+) Gráfico 2 (-) 
 
-10
-5
0
5
10
15
0 5 10 15 20 25 30
 
Gráfico 3 (nula) 
 
 
Cálculo do Coeficiente de Correlação Linear

Outros materiais