Probabilidade e Estatística

breadcrumb-separator

PUC-MINAS

em 27/09/2020

Conteúdos escolhidos para você

LIVRO ESTATÍSTICA FÁCIL E BA´SICA (1)

LIVRO ESTATÍSTICA FÁCIL E BA´SICA (1)

ESTÁCIO

modulo1

ACV4-II S ESTATISTICA

ACV4-II S ESTATISTICA

Estatística-Aplicada-às-Finanças-1-P

Estatística-Aplicada-às-Finanças-1-P

UERJ

Probabilidade_e_Estatistica-Sonia Vieira

Probabilidade_e_Estatistica-Sonia Vieira

UECE

Perguntas dessa disciplina

1. Variável é toda característica que, observada em uma unidade da população ou amostra, pode variar de um indivíduo para outro (Callegari-Jacques...

UNILAVRAS

Questão 10/10 - ENSINO DE ESTATÍSTICA E TRATAMENTO DA INFORMAÇÃO NA EDUCAÇÃO BÁSICA Ler em voz alta Considere o excerto de texto a seguir: “As medidas

Uma equipe de auditoria interna está analisando o desempenho de vendas diárias de uma filial específica, que é uma variável contínua. Durante a fas...

Há diferentes formas de tratamento estatístico para variáveis quantitativas, sejam elas contínuas ou discretas. Uma dessas abordagens envolve o uso...

Uma equipe de auditoria interna está analisando o desempenho de vendas diárias de uma filial específica, que é uma variável contínua. Durante a fas...

Material

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-background

right-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Conteúdos escolhidos para você

LIVRO ESTATÍSTICA FÁCIL E BA´SICA (1)

LIVRO ESTATÍSTICA FÁCIL E BA´SICA (1)

ESTÁCIO

modulo1

ACV4-II S ESTATISTICA

ACV4-II S ESTATISTICA

Estatística-Aplicada-às-Finanças-1-P

Estatística-Aplicada-às-Finanças-1-P

UERJ

Probabilidade_e_Estatistica-Sonia Vieira

Probabilidade_e_Estatistica-Sonia Vieira

UECE

Perguntas dessa disciplina

1. Variável é toda característica que, observada em uma unidade da população ou amostra, pode variar de um indivíduo para outro (Callegari-Jacques...

UNILAVRAS

Questão 10/10 - ENSINO DE ESTATÍSTICA E TRATAMENTO DA INFORMAÇÃO NA EDUCAÇÃO BÁSICA Ler em voz alta Considere o excerto de texto a seguir: “As medidas

Uma equipe de auditoria interna está analisando o desempenho de vendas diárias de uma filial específica, que é uma variável contínua. Durante a fas...

Há diferentes formas de tratamento estatístico para variáveis quantitativas, sejam elas contínuas ou discretas. Uma dessas abordagens envolve o uso...

Uma equipe de auditoria interna está analisando o desempenho de vendas diárias de uma filial específica, que é uma variável contínua. Durante a fas...

Prévia do material em texto

Probabilidade e Estatística 
Sonia Maria Barros Barbosa Correa 
4ª Edição 
 
 
 
 
 
 
 
 
 
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS 
Grão Chanceler 
 
Dom Walmor Oliveira de Azevedo 
 
Reitor 
Vice-reitora 
 
Prof. Dom Joaquim Giovani Mol Guimarães 
Prof
a
. Patrícia Bernardes 
 
Pró-reitor de Extensão 
Pró-reitor de Gestão Financeira 
Pró-reitora de Graduação 
Pró-reitor de Logística e Infra-estrutura 
Pró-reitor de Pesquisa e Pós-Graduação 
Pró-reitor de Recursos Humanos 
 
Prof. Wanderley Chieppe Felippe 
Prof. Paulo Sérgio Gontijo do Carmo 
Profª. Maria Inês Martins 
Prof. Rômulo Albertini Rigueira 
Prof. João Francisco de Abreu 
Prof. Alexandre Rezende Guimarães 
 
 
PUC MINAS VIRTUAL 
Diretora de Ensino a Distância Profª. Maria Beatriz Ribeiro de Oliveira Gonçalves 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
© PUCMINAS, 2009 
Autoria e Revisão Equipe Pedagógica e Tecnológica da PUC Minas Virtual 
Design Gráfico e diagramação Profª. Simone Nogueira 
Sílvia Fonseca 
 
 
 
Reprodução proibida. Art. 184 
do Código Penal e Lei 9.610 de 
19 de fevereiro de 1998. 
 
Todos os direitos reservados 
PONTIFÍCIA UNIVERSIDADE 
CATÓLICA DE MINAS GERAIS 
DIRETORIA DE ENSINO A DISTÂNCIA 
 
 
2009 
Impresso no Brasil 
 
ATENDIMENTO E INFORMAÇÕES: 
Telefone: (31) 3238-5656 
www.virtual.pucminas.br/faleconosco
 
 
 
 
 
Sumário 
Apresentação ........................................................................................... 5 
MÓDULO 1 ....................................................................... 6 
Capítulo 1. Natureza e Fundamentos do Método Estatístico .................................. 7 
1.1. Introdução à Estatística.....................................................................................7 
1.2. Importância da Estatística..................................................................................8 
1.3. Grandes áreas da Estatística ...............................................................................9 
1.4. Fases do Método Estatístico.............................................................................. 12 
1.5. Séries Estatísticas .......................................................................................... 14 
1.6. Apresentação de dados – Tabelas e Gráficos: Construção e Interpretação...................... 21 
Capítulo 2. Amostragem.............................................................................30 
2.1. Importância da Amostragem ............................................................................. 30 
2.2. Alguns conceitos e definições............................................................................ 31 
2.3. Amostragem Aleatória Simples .......................................................................... 33 
2.4. Amostragem Aleatória Estratificada.................................................................... 35 
2.5. Amostragem por Conglomerado ......................................................................... 36 
2.6. Amostragem Sistemática ................................................................................. 37 
Capítulo 3. Distribuição de Freqüência...........................................................40 
3.1. Introdução e Definições................................................................................... 40 
3.2. Elementos de uma distribuição de freqüência: Amplitude total, Limites de classe, Amplitude 
do intervalo de classe, Ponto médio da classe, Freqüência absoluta (simples e acumulada), 
Freqüência relativa (simples e acumulada) .......................................................... 43 
3.3. Regras Gerais para a elaboração de uma distribuição de freqüência ............................ 47 
3.4. Gráficos representativos de uma distribuição de freqüência: histograma, polígono de 
freqüência e ogiva......................................................................................... 48 
Capítulo 4. Medidas de Posição ....................................................................51 
4.1. Introdução................................................................................................... 51 
4.2. Média aritmética simples ( )X ........................................................................... 52 
4.3. Moda (Mo) .................................................................................................... 54 
4.4. Mediana (Md) ................................................................................................ 56 
4.5. Média Geométrica (MG) ................................................................................... 60 
4.6. Média Harmônica (Mh) ..................................................................................... 60 
4.7. Separatrizes: Quartis, Decis e Percentis ............................................................... 62 
 
Capítulo 5. Medidas de Dispersão..................................................................65 
5.1. Dispersão .................................................................................................... 65 
5.2. Assimetria ................................................................................................... 67 
5.3. Curtose....................................................................................................... 68 
MÓDULO 2 ......................................................................72 
Capítulo 6. Probabilidade ...........................................................................73 
6.1. Experimento aleatório, espaço amostral e eventos ................................................. 73 
6.2. Probabilidade: Definição Clássica; Probabilidade e freqüência relativa......................... 77 
6.3. Tipos de eventos ........................................................................................... 78 
6.4. Axiomas de Probabilidade ................................................................................ 79 
6.5. Probabilidade Condicional e Independência de Eventos ............................................ 81 
Capítulo 7. Variáveis Aleatórias....................................................................85 
7.1. Conceito de variável aleatória........................................................................... 85 
7.2. Distribuição de probabilidade ........................................................................... 86 
7.3. Função de distribuição acumulada...................................................................... 86 
7.4. Esperança matemática, variância e desvio padrão: propriedades ................................ 86 
7.5. Distribuições Discretas .................................................................................... 86 
7.6. Distribuição contínua...................................................................................... 91 
Capítulo 8. Inferência Estatística ..................................................................98 
8.1. População e amostra; Estatísticas e parâmetros; Distribuições amostrais ...................... 98 
8.2. Estimação ..................................................................................................101 
8.3. Testes de Hipóteses ......................................................................................104 
Capítulo 9. Correlação e Regressão Linear .................................................... 110 
9.1. Diagrama de dispersão ...................................................................................110 
9.2. Correlação Linear .........................................................................................1119.3. Coeficiente de Correlação Linear (r) ..................................................................112 
9.4. Regressão – Reta de regressão (ou reta de mínimos quadrados ou reta de ajuste)..........115 
ANEXOS........................................................................ 118 
Anexo A. TNA – Tabela de Números Aleatórios ...........................................................119 
Anexo B. Tabela da Curva Normal – (Faixa Central) .....................................................120 
Anexo C. Apêndice Matemático..............................................................................121 
Anexo D. Estudo de Caso......................................................................................123 
Glossário.............................................................................................. 138 
Referências Bibliográficas......................................................................... 141 
 
 
Apresentação 
 
 
Este texto foi elaborado para ser um material de referência para o aluno no estudo 
da disciplina Probabilidade e Estatística na modalidade a distância. 
A disciplina será desenvolvida em um semestre letivo e o conteúdo está constituído 
de 9 capítulos, dividido em 2 Módulos. O módulo I contemplará a Estatística Descriti-
va e o módulo II, a Probabilidade e Estatística Inferencial. 
A apresentação, em uma mesma obra, de conteúdos comumente encontrados em vá-
rios livros, visa garantir ao estudante da graduação o acesso a informações, o enten-
dimento delas e sua utilização como instrumento de análises de dados. Instrumentos 
estes que permitam a viabilidade de conclusões por meio de afirmações estatísticas. 
Como material de apoio, a consulta à bibliografia recomendada é essencial para a 
aprendizagem. 
Como sistemática de apresentação, esclareço que, em todos os capítulos, são apre-
sentados exemplos com o objetivo de tornar mais claros os temas tratados. 
Para que o aluno tenha um bom aproveitamento, é importante estudar detalhada-
mente cada unidade do programa, analisar os exemplos e os exercícios resolvidos. 
Será também fundamental solucionar os exercícios propostos. 
No capítulo 2, estaremos utilizando uma TNA (Tabela de Números Aleatórios), neces-
sária para resolução dos exercícios e avaliações. Nos capítulos 7 e 8, faremos uso de 
uma outra tabela, a Tabela da Curva Normal, que devera ser consultada para a reso-
lução dos exercícios e avaliações. Estas duas tabelas são instrumentos de suma im-
portância no estudo da Estatística. Muito simples de serem utilizadas, elas podem ser 
encontradas, como anexos. 
 
 
 
 
Módulo 1 
 
 
 PUC Minas Virtual 7 Probabilidade e Estatística 
Capítulo 1. 
Natureza e Fundamentos do Método Estatístico 
Abordando temas relacionados ao método estatístico, esta unidade tem como objeti-
vos Gerais: 
� Demonstrar a importância da Estatística na vida diária; 
� Mostrar como podemos utilizá-la de forma correta; 
� Ensinar como compor tabelas a partir de dados numéricos; 
� Ensinar como representar dados numéricos em gráficos. 
 
E como objetivos específicos: 
� Oferecer exemplos de tabelas e gráficos que podem representar, de forma sinté-
tica, as informações obtidas através de processos de pesquisa. 
 
1.1. Introdução à Estatística 
A palavra estatística lembra, à maioria das pessoas, recenseamento. Os censos existem há 
milhares de anos e constituem um esforço imenso e caro feito pelos governos, com o objeti-
vo de conhecer seus habitantes, sua condição socioeconômica, sua cultura, religião etc. 
Portanto, associar estatística a censo é perfeitamente correto do ponto de vista histórico, 
sendo interessante salientar que as palavras estatística e estado têm a mesma origem 
latina: status. 
Desde a Antigüidade, há indícios de que 3000 anos A.C., reis e imperadores se preocupa-
vam em obter informações, não só em relação a população mas também às riquezas eco-
nômicas, informações essas que seriam utilizadas para a taxação de impostos e para fins de 
alistamento militar. Por estar desde os primórdios ligada ao governo tem a origem associada 
a palavra status. 
A estatística é também comumente associada às pesquisas de opinião pública, aos vários 
índices governamentais, aos gráficos e às médias publicadas diariamente na imprensa. Na 
realidade, entretanto, a estatística engloba muitos outros aspectos, sendo fundamental na 
análise de dados provenientes de quaisquer processos onde exista variabilidade. 
É possível distinguir duas concepções para a palavra ESTATÍSTICA: no plural (estatísticas), 
indica qualquer coleção de dados numéricos, reunidos com a finalidade de fornecer informa-
ções acerca de uma atividade qualquer. Assim, por exemplo, as estatísticas demográficas 
referem-se aos dados numéricos sobre nascimentos, falecimentos, matrimônios, desquites 
 PUC Minas Virtual 8 Probabilidade e Estatística 
etc. As estatísticas econômicas consistem em dados numéricos relacionados com empre-
go, produção, vendas e com outras atividades ligadas aos vários setores da vida econômica. 
No singular (Estatística), indica a atividade humana especializada ou um corpo de técnicas 
ou ainda uma metodologia desenvolvida para a coleta, a classificação, a apresentação, a 
análise e a interpretação de dados quantitativos e a utilização desses dados para a tomada 
de decisões. 
 
1.2. Importância da Estatística 
O mundo está repleto de problemas. Para resolvermos a maioria deles, necessitamos de 
informações. Mas, que tipo de informação? Que quantidade de informações? Após obtê-las, 
que fazer com elas? A Estatística trabalha com essas informações, associando os dados ao 
problema, descobrindo como e o quê coletar, assim capacitando o profissional a obter con-
clusões a partir dessas informações, de tal forma que possam ser entendidas por outras 
pessoas. 
Recolher e analisar a informação é muito importante no mundo atual, fazer a análise dessas 
informações nos permite tirar conclusões, prever situações e planejar atividades com mais 
segurança. 
Na era da energia nuclear, os estudos estatísticos têm avançado rapidamente e, com seus 
processos e técnicas, têm contribuído para a organização de empresas e utilização dos re-
cursos do mundo moderno. 
Portanto, os métodos estatísticos auxiliam o cientista social, o economista, o engenheiro, o 
agrônomo e muitos outros profissionais a realizarem o seu trabalho com mais eficiência, 
pois está baseada em fatos e dados, eliminando as tentativas e erros. 
 
A Estatística é uma parte da Matemática que utiliza métodos específicos para 
a coleta, organização, descrição, análise e interpretação de dados, viabilizan-
do a utilização dos mesmos na tomada de decisões. 
 
Vejamos alguns exemplos: 
� Os estatísticos do governo conduzem censos de população, moradia, produtos industri-
ais, agricultura e outros. 
� Em instituições, também são feitas compilações sobre vendas, produção, inventário, folha 
de pagamento e outros dados das indústrias e empresas. Essas estatísticas informam ao 
administrador como a sua empresa está crescendo, seu crescimento em relação a outras 
empresas fornecendo-lhes condições de planejar ações futuras. A análise dos dados é 
muito importante para elaboração de programas e planos. 
 PUC Minas Virtual 9 Probabilidade e Estatística 
Em geral, as pessoas, quando se referem ao termo estatística, desconhecem que o aspecto 
essencial é o de proporcionar métodos inferenciais, que permitam conclusões que transcen-
dam os dados obtidos inicialmente. 
 
1.3. Grandes áreas da Estatística 
Para fins de apresentação, é usual se dividir a estatística em três grandes áreas, embora 
não se trate de ramos isolados: 
� Estatística Descritiva e Amostragem – Conjunto de técnicas que objetivam coletar, orga-nizar, apresentar, analisar e sintetizar os dados numéricos de uma população, ou amos-
tra; 
� Estatística Inferencial – Processo de se obter informações sobre uma população a partir 
de resultados observados na amostra; 
� Probabilidade – Modelos matemáticos que explicam os fenômenos estudados pela Esta-
tística em condições normais de experimentação. 
 
Em estatística, utilizamos extensamente os termos: população, amostra, censo, parâmetros, 
estatística, dados discretos, dados contínuos, dados quantitativos e dados qualitativos; que 
estaremos definindo abaixo para maior compreensão: 
� População: é uma coleção completa de todos os elementos a serem estudados. 
� Amostra: é uma subcoleção de elementos extraídos de uma população. 
� Censo: é uma coleção de dados relativos a todos os elementos de uma população. 
� Parâmetro: é uma medida numérica referente a uma característica de uma população. 
� Estatística: é uma medida numérica que descreve uma característica de uma amostra. 
� Dados contínuos: resultam de um número infinito de valores possíveis que podem ser 
associados a pontos em uma escala contínua de tal maneira que não haja lacunas. 
� Dados discretos: resultam de um conjunto finito de valores possíveis, ou de um conjunto 
enumerável de valores. 
� Dados quantitativos: consistem em números que representam contagens ou medidas. 
� Dados qualitativos: podem ser separados em diferentes categorias que se distinguem por 
alguma característica não-numérica. 
 
Amostragem 
É o processo de escolha da amostra. É a parte inicial de qualquer estudo estatístico, e con-
siste na escolha criteriosa dos elementos a serem submetidos ao estudo. Geralmente, as 
 PUC Minas Virtual 10 Probabilidade e Estatística 
pesquisas são realizadas através de estudo dos elementos que compõem uma amostra, 
extraída da população que se pretende analisar. 
 
Exemplo 1.1. Pesquisas sobre tendências de votação 
Em época de eleição, é comum a realização de pesquisas com o objetivo de se conhecer as 
tendências do eleitorado. Para que os resultados sejam de fato representativos, toma-se o 
cuidado de se entrevistar um conjunto de pessoas com características socioeconômicas, 
culturais, religiosas, etc. tão representativas quanto possível da população à qual os resulta-
dos da pesquisa serão estendidos. A escolha da amostra, a redação do questionário, a en-
trevista, a codificação dos dados e a apuração dos resultados são as etapas desse tipo de 
pesquisa. 
 
População e amostra 
O estudo de qualquer fenômeno, seja ele natural, social, econômico ou biológico, exige a 
coleta e a análise de dados estatísticos. A coleta de dados é, pois, a fase inicial de qualquer 
pesquisa. 
É com base nos dados da amostra que se desenvolvem os estudos, visando a fazer inferên-
cias sobre a população. 
 
Exemplo 1.2. Avaliação de um programa de ensino 
Toma-se certo número de pares de turmas: a um conjunto de turmas ensina-se um assunto 
por um novo método e, ao outro, pelo método clássico. Aplica-se uma prova a cada um dos 
grupos. As notas observadas nesses conjuntos de turmas constituem a amostra a ser anali-
sada. Se os resultados do novo método forem melhores, iremos aplicá-lo a todas as turmas, 
isto é, à população. A partir da amostra, estabelecemos o que é conveniente para a popula-
ção, ou seja, fazemos uma inferência para a população. 
 
Exemplo 1.3. Renda média per capita em diversas regiões do país 
Toma-se um conjunto de indivíduos em cada região, escolhidos ao acaso, e sobre esse gru-
po são feitos os estudos. Os indivíduos assim escolhidos constituem a amostra e os resulta-
dos nela observados serão estendidos à população. 
 
Estatística Descritiva 
É a parte mais conhecida. Quem vê o noticiário, na televisão ou nos jornais, sabe quão fre-
qüente é o uso de médias, índices e gráficos nas notícias. 
 PUC Minas Virtual 11 Probabilidade e Estatística 
Exemplo 1.4. INPC (Índice Nacional de Preços ao Consumidor) 
Sua construção envolve a sintetização, em um único número, dos aumentos dos produtos 
de uma cesta básica. 
 
Exemplo 1.5. Anuário Estatístico Brasileiro 
O IBGE publica esse anuário apresentando, em várias tabelas, os mais diversos dados so-
bre o Brasil: educação, saúde, transporte, economia, cultura, etc. Embora simples, fáceis de 
serem entendidas, as tabelas são o produto de um processo demorado e extremamente 
dispendioso de coleta e apuração de dados. 
 
Exemplo 1.6. Anuário Estatístico da Embratur 
A Embratur publica esse anuário apresentando, em várias tabelas e gráficos, os mais diver-
sos dados sobre Turismo Interno e dados sobre entrada de turistas estrangeiros no Brasil. 
 
Estatística Inferencial (ou Indutiva) 
A tomada de decisões sobre a população, com base em estudos feitos sobre os dados da 
amostra, constitui o problema central da inferência estatística. 
 
Exemplo 1.7. 
Suponha que a distribuição das alturas de todos os habitantes de um país possa ser repre-
sentada por uma distribuição normal. Mas não conhecemos de antemão a média da distribu-
ição. Devemos, pois, estimá-la. 
 
Exemplo 1.8. Análise financeira. 
Os analistas financeiros estudam dados sobre a situação da economia, visando explicar 
tendências dos níveis de produção e de consumo, projetando-os para o futuro. 
 
Exemplo 1.9. Ocorrência de terremotos. 
Os geólogos estão continuamente coletando dados sobre a ocorrência de terremotos. Gos-
tariam de inferir quando e onde ocorrerão tremores, e qual a sua intensidade. Trata-se, sem 
dúvida, de uma questão complexa, que exige longa experiência profissional, além de cuida-
dosa aplicação de métodos estatísticos. 
 
 PUC Minas Virtual 12 Probabilidade e Estatística 
Probabilidade 
O processo de generalização, que é característico do método indutivo, está associado a 
uma margem de incerteza. A existência da incerteza deve-se ao fato de que a conclusão, 
que se pretende obter para o conjunto de todos os indivíduos analisados quanto a determi-
nadas características comuns, baseia-se em uma parcela do total das observações. A medi-
da da incerteza é tratada mediante técnicas e métodos que se fundamentam na Teoria da 
Probabilidade. Essa teoria procura quantificar a incerteza existente em determinada situa-
ção. 
 
1.4. Fases do Método Estatístico 
Quando se pretende empreender um estudo estatístico completo, existem diversas fases do 
trabalho que devem ser desenvolvidas para possibilitar que os resultados alcançados sejam 
considerados válidos. As principais fases do método estatístico são as seguintes: 
� Definição do problema 
� Planejamento 
� Coleta de dados 
� Apuração dos dados 
� Apresentação dos dados 
� Análise e Interpretação dos dados 
 
Definição do problema 
Após a escolha do tema, a primeira fase do trabalho consiste em uma definição ou formula-
ção correta do problema a ser estudado. O analista além de considerar detidamente esse 
problema objeto do estudo, deverá examinar outros levantamentos realizados no mesmo 
campo e que sejam análogos. Esses dados podem conter parte da informação de que ne-
cessita. 
 
Planejamento 
O passo seguinte, compreende a fase do planejamento, que consiste em se determinar o 
procedimento necessário para se resolver o problema e, em especial, como levantar infor-
mações sobre o assunto, objeto do estudo. É preciso planejar o trabalho a ser realizado ten-
do em vista o objetivo que se pretende atingir. É nessa fase que será escolhido o tipo de 
levantamento a ser utilizado. Pode-se utilizar de dois tipos de levantamento: 
� Levantamento censitário, quando a contagem for completa, abrangendo todo o universo; 
� Levantamento por amostragem, quando a contagem for parcial. 
 PUC Minas Virtual 13 Probabilidade e Estatística 
Outros elementos importantes quedevem ser tratados nessa mesma fase são: 
� Cronograma das atividades, através do qual são fixados os prazos para as várias fases; 
� Custos envolvidos; 
� Exame das informações disponíveis; 
� Delineamento da amostra, etc. 
 
Coleta dos dados 
O terceiro passo é essencialmente operacional, compreendendo a coleta das informações 
propriamente ditas. Nessa fase do método estatístico, é conveniente estabelecer uma distin-
ção entre duas espécies de dados: 
� Dados primários – quando são publicados ou coletados pelo próprio pesquisador ou or-
ganização que os escolheu; 
� Dados secundários – quando são publicados ou coletados por outra organização. 
 
Um conjunto de dados é, pois, primário ou secundário em relação a alguém. As tabelas do 
Censo Demográfico são fontes primárias. Quando um determinado jornal publica dados es-
tatísticos extraídos de várias fontes e relacionadas com diversos setores industriais, os da-
dos são secundários. Esses dados podem ser utilizados em pesquisas em desenvolvimento. 
A coleta de dados pode ser realizada de duas maneiras: 
� Coleta Direta – quando é obtida diretamente da fonte, como no caso da empresa que 
realiza uma pesquisa para saber a preferência dos consumidores pela sua marca; 
� Coleta Indireta – quando o problema é inferido a partir dos elementos obtidos pela coleta 
direta, ou pelo conhecimento de outros fenômenos relacionados com o fenômeno em 
questão. 
 
Apuração dos dados 
É necessário realizar algum tratamento prévio nos dados obtidos, para torná-los mais signi-
ficativos, antes de iniciar a sua análise. 
A quarta etapa do processo é, então, a da apuração ou sumarização, que consiste em re-
sumir os dados através de sua contagem e agrupamento. Essa apuração pode ser realizada 
manualmente ou pelos processos da eletromecânica ou da eletrônica. 
 
 PUC Minas Virtual 14 Probabilidade e Estatística 
Apresentação dos dados 
Os dados devem ser apresentados sempre de forma adequada, qualquer que seja a finali-
dade, tornando mais preciso o exame do fenômeno que está sendo objeto de tratamento 
estatístico. 
Há duas formas de apresentação ou exposição dos dados observados, que não se excluem 
mutuamente: 
� Apresentação tabular – É a apresentação numérica dos dados. Consiste em dispor os 
dados em linhas e colunas distribuídas de modo ordenado, segundo algumas regras prá-
ticas adotadas pelos diversos sistemas estatísticos. As tabelas têm a vantagem de con-
seguir expor, sinteticamente e em um só local, os resultados sobre determinado assunto, 
de modo a se obter uma visão global daquilo que se pretende analisar. 
� Apresentação gráfica – É a apresentação geométrica dos dados numéricos. Embora a 
apresentação tabular seja de extrema importância no sentido de facilitar a análise numé-
rica dos dados, não permite ao analista obter uma visão tão rápida, fácil e clara do fenô-
meno e sua variação como aquela conseguida através de um gráfico. 
 
Análise e interpretação dos dados 
Nessa última etapa, o interesse maior reside em tirar conclusões que auxiliem o pesquisador 
a resolver seu problema. A análise realizada pelos estatísticos está ligada essencialmente 
ao cálculo de medidas, cuja finalidade principal é descrever o fenômeno. Assim, o conjunto 
de dados a ser analisado pode ser expresso por números-resumo, que evidenciam as carac-
terísticas particulares desse conjunto. O significado exato de cada um dos valores obtidos 
através do cálculo das várias medidas estatísticas disponíveis deve ser bem interpretado. É 
possível, mesmo nessa fase, arriscar algumas generalizações as quais envolverão, como 
mencionado anteriormente, algum grau de incerteza, porque não se pode estar seguro de 
que o que foi constatado para aquele conjunto de dados (a amostra) se verificará igualmente 
para a população. 
 
1.5. Séries Estatísticas 
Define-se série estatística como toda e qualquer coleção de dados estatísticos que se refe-
rem a uma mesma ordem de classificação: quantitativa. 
No sentido mais amplo, série é uma sucessão de números referentes a qualquer variável. 
Se os números expressarem dados estatísticos, a série será chamada de série estatística. 
Em sentido mais restrito, pode-se dizer que uma série estatística é uma sucessão de dados 
estatísticos que se referem a caracteres qualitativos, ao passo que uma sucessão de dados 
estatísticos que dizem respeito a caracteres quantitativos configurará uma Distribuição de 
Freqüência. 
 PUC Minas Virtual 15 Probabilidade e Estatística 
Em outros termos, a palavra série é usada normalmente para designar um conjunto de da-
dos dispostos de acordo com um caráter variável, residindo a qualidade serial na disposição 
desses valores, e não em uma disposição temporal ou espacial de indivíduos. 
Vamos introduzir o conceito, de um instrumento amplamente utilizado pela Estatística a Ta-
bela ” 
 
Tabela é um quadro que resume um conjunto de observações. 
 
Uma tabela compõe-se de: 
� Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estu-
do; 
� Cabeçalho – parte superior da tabela onde é especificado o seu conteúdo; 
� Coluna indicadora – parte da tabela que especifica o conteúdo das linhas; 
� Linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se 
inscrevem nos seus cruzamentos com as colunas; 
� Casa ou célula – espaço destinado a um número; 
� Título – conjunto de informações, as mais completas possíveis, respondendo às pergun-
tas: O quê? – Quando? – Onde? – localizado no topo da tabela. 
� Fonte – referência que indica onde os dados foram obtidos. 
 
Exemplo 1.10 
 
Tabela 1.1. Quantas horas se trabalha em cada País – 2001 
(Revista Veja – Nº 12 – Ano 37 – Edição 1846) 
Países Horas 
Coréia 46,2 
Japão 42,2 
Brasil 41,8 
Estados Unidos 40,5 
Inglaterra 39,6 
França 38,2 
Fonte: Organização Internacional do Trabalho (OIT). 
 PUC Minas Virtual 16 Probabilidade e Estatística 
 
As tabelas servem para apresentar séries estatísticas. Conforme varie um dos elementos da 
série, podemos classificá-la em: 
� Cronológicas – Tempo
 
 (fator temporal ou cronológico) – a que época se refere o fenôme-
no analisado; 
� Geográficas – Local (fator espacial ou geográfico) – onde o fenômeno acontece; 
� Específicas – Fenômeno
 
 (descrição de um fato ou fator) – o que é descrito. 
 
Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação que não 
a contagem ou medida, são chamados dados absolutos. 
Dados Relativos são o resultado de comparações por quociente (razões) que se estabele-
cem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre 
quantidades. 
 
Exemplo 1.11 
Tabela 1.2. Operadora WKX – Vendas por Unidade da Federação – 1995 
Dados Absolutos Dados Relativos Unidades da 
 Federação Vendas 
(em milhares de reais) 
Vendas (%) 
Minas Gerais 4000 12,69 
Paraná 2230 7,08 
Rio Grande do Sul 6470 20,53 
Rio de Janeiro 8300 26,34 
São Paulo 10090 32,02 
Outros 420 1,33 
TOTAL BRASIL 31510 1 
Fonte: Departamento de Análise de Mercado 
 
1.5.1. Tipos de Séries Estatísticas 
 
Simples (ou de uma entrada) 
As séries estatísticas diferenciam-se de acordo com a variação de um dos três elementos: 
tempo, local e fenômeno. 
 PUC Minas Virtual 17 Probabilidade e Estatística 
Série Cronológica 
Também chamada de série temporal, série histórica, série evolutiva ou marcha, identifica-se 
pelo caráter variável do fator cronológico. Assim, deve-se ter: 
Elemento variável: Época 
Elementos Fixos: Local e Fenômeno 
 
Exemplo 1.12 
 
Tabela 1.3. – Operadora WKX – Venda de bilhetes aéreos 
– Mercado Interno – 1995 
Meses 
Vendas 
(em milhares de reais) 
Janeiro2300 
Fevereiro 1800 
Março 2200 
Abril 2210 
Maio 2360 
Junho 2600 
Julho 2690 
Agosto 3050 
Setembro 3500 
Outubro 3440 
Novembro 3100 
Dezembro 2760 
TOTAL ANUAL 31510 
Fonte: Departamento de Análise de Mercado 
 
Série Geográfica 
Também chamada de série territorial, série espacial ou série de localização, identifica-se 
pelo caráter variável do fator geográfico. Assim, deve-se ter: 
Elemento variável: Local 
Elementos Fixos: Época e Fenômeno 
 PUC Minas Virtual 18 Probabilidade e Estatística 
Exemplo 1.13 
Tabela 1.4. Operadora WKX – Vendas por Unidade da Federação – 1995 
Unidades da Federação 
Vendas 
(em milhares de reais) 
Minas Gerais 4000 
Paraná 2230 
Rio Grande do Sul 6470 
Rio de Janeiro 8300 
São Paulo 10090 
Outros 420 
TOTAL BRASIL 31510 
Fonte: Departamento de Análise de Mercado 
 
Série Específica 
Também chamada de série categórica ou série por categoria, identifica-se pelo caráter vari-
ável de fator especificativo. Assim, deve-se ter: 
Elemento variável: Fenômeno 
Elementos Fixos: Local e Época 
 
Exemplos 1.14 
Tabela 1.5. Operadora WKX – Venda de bilhetes aéreos por Linha – 1995 
Linha do Produto 
Vendas 
(em milhares de reais) 
Linha A 6450 
Linha B 9310 
Linha C 15750 
TODAS AS LINHAS 31510 
Fonte: Departamento de Análise de Mercado 
 PUC Minas Virtual 19 Probabilidade e Estatística 
Tabela 1.6. Número de empregados das várias classes de salários no estado de São Paulo – 1998 
Classes de Salários (R$) Número de Empregados 
Até 80 41 326 
De 80 a 119 123 236 
De 120 a 159 428 904 
De 160 a 199 324 437 
De 200 a 399 787 304 
De 400 a 599 266 002 
De 600 a 799 102 375 
De 800 a 999 56 170 
1000 e mais 103 788 
TOTAL 2 233 542 
Fonte: Serviço de Estatística da Previdência e Trabalho (Dados alterados para melhor compreensão) 
 
1.5.2. Tabelas Compostas (ou de dupla entrada) 
As tabelas apresentadas anteriormente são tabelas estatísticas simples, onde apenas uma 
série está representada. É comum, todavia, haver necessidade de apresentar, em uma úni-
ca tabela, mais do que uma série. Quando as séries aparecem conjugadas, tem-se uma 
tabela de dupla entrada. Em uma tabela desse tipo são criadas duas ordens de classifica-
ção: uma horizontal (linha) e uma vertical (coluna). 
 
Exemplos 1.15 
A) Série específico-temporal (Tabela 1.7) 
B) Série geográfico-temporal (Tabela 1.8) 
 
Tabela 1.7. População economicamente ativa por setor de atividades – Brasil 
População (1 000 Hab.) 
Setor 
1940 1950 1960 
Primário 8 968 10 255 12 163 
Secundário 1 414 2 347 2 962 
Terciário 3 620 4 516 7 525 
Fonte: IPEA 
 
 PUC Minas Virtual 20 Probabilidade e Estatística 
Tabela 1.8. População Indígena Brasileira 
Produção Unidades da 
Federação 1937 1938 1939 
Acre 5 007 4 765 4 727 
Amazonas 6 858 5 998 5 631 
Pará 4 945 4 223 4 500 
Mato Grosso 1 327 1 285 1 235 
Outros Estados 333 539 337 
Fonte: Anuário Estatístico do Brasil – IBGE 
– (Dados alterados para melhor compreensão) 
 
Podem existir, se bem que mais raramente, pela dificuldade de representação, séries com-
postas de três ou mais entradas. 
 
Obs.: Nem sempre uma tabela representa uma série estatística. Por vezes, os dados reunidos não 
revelam uniformidade, sendo meramente um aglomerado de informações gerais sobre deter-
minado assunto, as quais, embora úteis, não apresentam a consistência necessária para se 
configurar uma série estatística. 
 
Exemplo 1.16 
Tabela com resumos de dados, mas que não representa uma série estatística. 
 
Tabela 1.9. Situação dos espetáculos cinematográficos no Brasil – 1967 
Especificação Dados Numéricos 
Número de cinemas 2 488 
Lotação dos cinemas 1 722 348 
Sessões por dia 3 933 
Filmes de longa metragem 131 330 488 
Meia-entrada 89 581 234 
Fonte: Anuário Estatístico do Brasil – IBGE 
 
 PUC Minas Virtual 21 Probabilidade e Estatística 
1.6. Apresentação de dados – Tabelas e Gráficos: Construção e Interpretação 
A representação gráfica das séries estatísticas tem por finalidade apresentar os resultados 
obtidos, permitindo que se chegue a conclusões sobre a evolução do fenômeno ou sobre 
como se relacionam os valores da série. A escolha do gráfico mais apropriado ficará a crité-
rio do analista. Contudo, os elementos simplicidade, clareza e veracidade devem ser consi-
derados, quando da elaboração de um gráfico. 
Simplicidade – o gráfico deve ser destituído de detalhes de importância secundária, assim 
como de traços desnecessários que possam levar o observador a uma análise morosa ou 
sujeita a erros. 
� Clareza – o gráfico deve possibilitar uma correta interpretação dos valores representati-
vos do fenômeno em estudo. 
� Veracidade – o gráfico deve expressar a verdade sobre o fenômeno em estudo. 
Diretrizes para a construção de um gráfico: 
� O título do gráfico deve ser o mais claro e completo possível. Quando necessário, deve-
se acrescentar subtítulos; 
� A orientação geral dos gráficos deve ser da esquerda para a direita; 
� As quantidades devem ser representadas por grandezas lineares; 
� Sempre que possível, a escala vertical há de ser escolhida de modo a aparecer a linha 0 
(zero); 
� Só devem ser incluídas no desenho as coordenadas indispensáveis para guiar o olhar do 
leitor ao longo da leitura. Um tracejado muito cerrado dificulta o exame do gráfico; 
� A escala horizontal deve ser lida da esquerda para a direita, e a vertical de baixo para 
cima; 
� Os títulos e marcações do gráfico devem ser dispostos de maneira que sejam facilmente 
lidos, partindo-se da margem horizontal inferior ou da margem esquerda. 
Leitura e interpretação de um gráfico: 
� Declarar qual o fenômeno ou fenômenos representados, a região considerada, o período 
de tempo, a fonte dos dados etc; 
� Examinar o tipo de gráfico escolhido, verificar se é o mais adequado, criticar a sua exe-
cução, no conjunto e nos detalhes; 
� Analisar cada fenômeno separadamente, fazendo notar os pontos mais em evidência, o 
máximo e o mínimo, assim como as mudanças mais bruscas; 
� Investigar se há uma “tendência geral” crescente ou decrescente ou, então, se o fato ex-
posto é estacionário; 
 PUC Minas Virtual 22 Probabilidade e Estatística 
� Procurar descobrir a existência de possíveis ciclos periódicos, qual o período aproxima-
do, etc. 
 
Em seguida são apresentados os tipos mais comuns de gráficos: 
 
Gráfico em Linhas 
Constitui uma aplicação do processo de representação das funções num sistema de coor-
denadas cartesianas. 
 
Exemplo 1.17: Operadora WKX – Venda de bilhetes aéreos – Mercado Interno – 1995 (Ta-
bela 1.3) 
 
Figura 1.1. Operadora WKX – Venda de bilhetes aéreos – Mercado Interno – 1995 
1700
1900
2100
2300
2500
2700
2900
3100
3300
3500
3700
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Meses
Q
u
an
tid
ad
e 
 
Fonte: Departamento de Análise de Mercado. 
 
Obs.: 
� O gráfico acima, e os outros aqui mostrados foram construídos utilizando-se o soft-
ware Excel, é possível utilizar outros softwares. 
� Mas construir gráficos manualmente também é simples basta utilizar uma escala a-
dequada, régua e/ou compasso. 
� Podemos representar também uma tabela composta. Veja o exemplo. 
 PUC Minas Virtual 23 Probabilidade e Estatística 
Exemplo 1.18: População Indígena Brasileira (Tabela 1.8) 
Figura 1.2. População Indígena 
0
1000
2000
3000
4000
5000
6000
7000
1937 1938 1940
Anos 
Qu
an
tid
ad
e Acre
Amazonas
Pará
Mato Grosso
Outros Estados
 
Fonte: Anuário Estatístico do Brasil – IBGE (Dados alterados para melhor compreensão) 
 
Gráfico em ColunasÉ a representação de uma série por meio de retângulos, dispostos verticalmente. 
 
Exemplo 1.19: Ver Tabela 1.1 – Quantas horas se trabalha em cada País – 2001 
Figura 1.3. Horas trabalhadas em alguns países 
 
0
10
20
30
40
50
Ho
ra
s 
Coréia Japão Brasil Estados
Unidos
Inglaterra França
Paises
 
Fonte: Organização Internacional do Trabalho (OIT). 
Obs.: Podemos representar também uma tabela composta. 
 PUC Minas Virtual 24 Probabilidade e Estatística 
 
Exemplo 1.20 
Tabela 1.10. Salários iniciais setor privado e público – Brasil 2004 
Dados obtidos – Revista Veja – Nº 12 – Ano 37 – Edição 1846 
Cargos Privado Público 
Consultor/Auditor 900 5300 
Advogado 1100 5000 
Economista 1200 5000 
Bioquímico 1400 1500 
Fonte: Nelson Marconi, professor de economia FGV 
 
 
Figura 1.4. Salários iniciais – Setores privado e público – Brasil – 2004 
 
0
1000
2000
3000
4000
5000
6000
Sa
lá
rio
s 
Consultor/Auditor Advogado Economista Bioquímico
Cargos 
Privado Público
 
Fonte: Nelson Marconi, professor de economia FGV 
 
Gráfico em Barras 
É semelhante ao gráfico em colunas, porém, os retângulos são dispostos horizontalmente. 
Exemplo 1.21 
Tabela 1.11. Taxa de juros real anual – 2004 
Países Taxa em % 
Brasil 9,2 
Turquia 8,5 
África do Sul 7,7 
Israel 7,0 
Filipinas 5,1 
Rússia 3,2 
Fonte: Revista Veja – Nº 12 – Ano 37 – Edição 1846 
 PUC Minas Virtual 25 Probabilidade e Estatística 
 
Figura 1.5. Taxa de juros real anual – 2004 
0% 2% 4% 6% 8% 10%
Rússia
Filipinas
Israel
África do Sul
Turquia
Brasil
Pa
is
es
Porcentagem 
 
 Fonte: Revista Veja – Nº 12 – Ano 37 – Edição 1846 – 2004 
 
 
Gráfico em Setores 
É a representação gráfica de uma série estatística em círculo, por meio de setores. É utiliza-
do principalmente quando se pretende comparar cada valor da série com o total. 
Exemplo 1.22 
Tabela 1.12. Alunos matriculados no Município X de 2002–2004 
Anos alunos 
2002 900 
2003 1200 
2004 1500 
Total 3600 
Fonte: Secretária da Educação, Município X. 
 
O total é representado pelo círculo, que fica dividido em tantos setores quantas são as par-
tes. As áreas dos setores são respectivamente proporcionais aos dados da série. 
 PUC Minas Virtual 26 Probabilidade e Estatística 
O setor é obtido por meio de uma regra de três simples e direta, ressaltamos que a soma 
total da série corresponde a 360º, que é uma circunferência completa. 
Total -------------- 360º 
Parte ------------- xº 
 
Para 1975: 3600 – 360º Para 1976: 3600 – 360º Para 1977: 3600 – 360º 
 900 – xº 1200 – xº 1500 – xº 
 x = 90º x = 120º x = 150º 
 
Figura 1.6. Alunos matriculados no Município X – 2002-2004 
2002 2003 2004
 
Fonte: Secretária da Educação, Município X 
 
Gráfico Polar 
É o gráfico ideal para representar séries temporais cíclicas, isto é, séries que apresentam 
em seu desenvolvimento determinada periodicidade, como, por exemplo, a variação da pre-
cipitação pluviométrica ao longo do ano, ou da temperatura ao longo do dia, o consumo de 
energia elétrica durante o mês ou o ano etc. 
 PUC Minas Virtual 27 Probabilidade e Estatística 
Exemplo 1.23 
Tabela 1.13. Movimento Mensal de Compras de uma agencia em 2003 
Meses Valores (R$1.000,00) 
Janeiro 12 
Fevereiro 13 
Março 14 
Abril 12 
Maio 15 
Junho 19 
Julho 17 
Agosto 18 
Setembro 14 
Outubro 16 
Novembro 12 
Dezembro 18 
Fonte: Departamento financeiro da Agência (Dados Fictícios) 
 
Figura 1.7. Movimento Mensal de Compras de 
uma agencia em 2003 – Valores (R$ 1.000,00) 
0
5
10
15
20
Janeiro
Fevereiro
Março
Abril
Maio
Junho
Julho
Agosto
Setembro
Outubro
Novembro
Dezembro
 
Fonte: Departamento Financeiro da Agência (Dados Fictícios) 
 
 PUC Minas Virtual 28 Probabilidade e Estatística 
Exercício Resolvido: 
Para a Série abaixo calcule os valores percentuais e represente os dados por meio de um 
gráfico. 
Dados obtidos no site: 
http://www.anp.gov.br/doc/dados_estatisticos/Producao_de_Derivados_m3.xls 
 
Tabela 1.14. Produção de gases combustíveis – 2003 (103 m3) 
Meses Produção 
Janeiro 226.351 
Fevereiro 202.052 
Março 227.291 
Abril 228.004 
Maio 241.135 
Junho 228.004 
Julho 202.179 
Agosto 284.395 
Setembro 202.328 
Outubro 211.278 
Novembro 200.953 
Dezembro 200.867 
Fonte: Ipiranga, Manguinhos e Petrobras. 
 
Solução: Para calcularmos os valores percentuais de cada mês temos que considerar o va-
lor total (100%) como sendo o todo e, aplicando uma regra de 3, chegaremos ao valor per-
centual correspondente. É possível também dividir diretamente o valor da parte (mês consi-
derado) pelo total, e para obtermos a resposta em porcentagem basta multiplicarmos por 
100. 
Podemos escolher qualquer um dos gráficos que estudamos, para representar os dados e 
ou porcentagens, mas como os valores são muito próximos o gráfico em setores e o gráfico 
polar não apresentariam uma visão muito clara. Como estamos falando em volume de pro-
dução devemos optar por um gráfico em colunas que já demonstra uma idéia de volume. 
 
 PUC Minas Virtual 29 Probabilidade e Estatística 
Meses Produção % 
Janeiro 226.351 8,53 
Fevereiro 202.052 7,61 
Março 227.291 8,56 
Abril 228.004 8,59 
Maio 241.135 9,08 
Junho 228.004 8,59 
Julho 202.179 7,62 
Agosto 284.395 10,71 
Setembro 202.328 7,62 
Outubro 211.278 7,96 
Novembro 200.953 7,57 
Dezembro 200.867 7,57 
 
Figura 1.8. Produção de gases combustíveis – 2003 
0,00
2,00
4,00
6,00
8,00
10,00
12,00
po
rc
en
ta
ge
m
 
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Meses
 
Fonte: Ipiranga, Manguinhos e Petrobras. 
 
 PUC Minas Virtual 30 Probabilidade e Estatística 
Capítulo 2. 
Amostragem 
Nesta unidade, veremos quais as técnicas que podemos utilizar para compor uma 
amostra. São objetivos específicos desta unidade: 
� Familiarizar o leitor com a terminologia empregada na pesquisa de um fenômeno; 
� Identificar os fatores que afetam a quantidade de informações de um fenômeno; 
� Explicar como utilizar as Tabelas de Números Aleatórios (TNA) para selecionar 
amostras aleatórias. 
 
2.1. Importância da Amostragem 
Na realização de qualquer estudo, na maioria das vezes não é possível examinar todos os 
elementos da população de interesse. Por exemplo, para determinarmos a vida média dos 
computadores da PUC Minas, como iríamos proceder? Consideremos os seguintes fatores: 
o tempo necessário para fazer este levantamento; custo operacional; manipulação de gran-
de quantidade de dados; erros na coleta e manuseio de dados etc. Para resolver esta situa-
ção podemos retirar uma amostra. 
 
Amostra – é um subconjunto da população 
 
Exemplo 2.1 
Vamos considerar uma situação mais próxima do cotidiano de todos nós. Na cozinha de 
nossa casa a cozinheira para saber se uma panela de arroz esta temperada precisa de co-
mer todo o conteúdo da panela? 
É claro que não!!! Ela simplesmente prova (pega uma amostra) uma pequena quantidade e 
o que sente nesta pequena quantidade generaliza para todo o conteúdo da panela de arroz. 
É um exemplo bem lúdico, mas é com este mesmo principio que vamos trabalhar com a-
mostras. 
Usualmente, trabalhamos apenas com uma parte (amostra) da população. A inferência esta-
tística nos fornece elementos para generalizar, de maneira segura, as conclusões obtidas na 
amostra para a população. Para as inferências serem corretas, é necessário garantir que a 
amostra seja representativa da população, isto é, a amostra deve possuir as mesmas carac-terísticas básicas da população, no que diz respeito ao fenômeno pesquisado. 
 PUC Minas Virtual 31 Probabilidade e Estatística 
É errôneo pensar que, caso tivéssemos acesso a todos os elementos da população, sería-
mos mais precisos. Os erros de coleta e manuseio de um grande número de dados são 
maiores do que as imprecisões a que estamos sujeitos quando generalizamos, via inferên-
cia, as conclusões de uma amostra bem selecionada. 
Em se tratando de amostra, a preocupação central é que ela seja representativa. É preciso 
que a amostra ou as amostras que serão usadas sejam obtidas por processos adequados. 
Para poder obter informações, através de um levantamento amostral, temos que levar em 
consideração dois problemas: 
� Definir cuidadosamente a população de interesse; 
� Selecionar a característica que iremos pesquisar. 
 
Dados coletados de forma descuidada podem ser tão inúteis que nenhum processamento 
estatístico consegue aproveitá-los. 
 
2.2. Alguns conceitos e definições 
O conceito de população é intuitivo; trata-se do conjunto de indivíduos ou objetos que apre-
sentam em comum determinadas características definidas para o estudo. 
� Amostra – é um subconjunto da população. 
� Amostragem – são procedimentos para extração de amostras que representem bem a 
população. 
� Riscos – é a margem de erro motivado pelo fato de investigarmos parcialmente (amos-
tras) o universo (população). 
� População-alvo – é a população sobre a qual vamos fazer inferências baseadas na a-
mostra. 
 
Para que possamos fazer inferências válidas sobre a população a partir de uma amostra, é 
preciso que essa seja representativa. Uma das formas de se conseguir representatividade é 
fazer com que o processo de escolha da amostra seja, de alguma forma, aleatório. Além 
disso, a aleatoriedade permite o cálculo de estimativas dos erros envolvidos no processo de 
inferência. 
 
Quanto à extração dos elementos, as amostras podem ser: 
� Com reposição – quando um elemento sorteado puder ser sorteado novamente; 
� Sem reposição – quando o elemento sorteado só puder figurar uma única vez na amostra. 
 PUC Minas Virtual 32 Probabilidade e Estatística 
Exemplo 2.2 
Amostragem com reposição: 
� Seleção de pessoas para participar de um sorteio; 
� Seleção de itens para testes não destrutíveis; 
Amostragem sem reposição: (maioria dos casos pesquisados e/ou estudados) 
� Seleção de itens para teste destrutíveis como: vida útil de lâmpadas, fusíveis, etc. 
� Pesquisa de opinião pública em uma mesma rodada; 
 
Basicamente, existem dois métodos para composição da amostra: probabilístico e não pro-
babilístico (intencional). 
� O método de amostragem probabilística exige que cada elemento da população possua 
determinada probabilidade de ser selecionado. Normalmente, possuem a mesma proba-
bilidade. Assim, se N for o tamanho da população, a probabilidade de cada elemento será 
1/N. Somente com base em amostragens probabilísticas é possível realizar inferências 
sobre a população, a partir dos parâmetros estudados na amostra. As principais técnicas 
probabilísticas são: 
- Amostragem Aleatória Simples; 
- Amostragem Aleatória Estratificada; 
- Amostragem Sistemática; 
- Amostragem por Conglomerado. 
Por serem as principais técnicas estudas, serão detalhadamente exploradas no item 2.3. 
 
� Os métodos não probabilísticos são amostragens em que há uma escolha deliberada dos 
elementos que compõem a amostra. Não é possível generalizar os resultados das pes-
quisas para a população, uma vez que as amostras não probabilísticas não garantem a 
representatividade da população. São elas: 
- Amostragem Acidental; 
- Amostragem Intencional; 
- Amostragem por Quotas. 
 
Amostragem Acidental – É formada por elementos que vão aparecendo, que são possí-
veis de se obter até completar o número de elementos da amostra. 
Exemplo 2.3: Pesquisa de opinião, em que os entrevistados são acidentalmente escolhi-
dos. 
Amostragem Intencional – É formada por elementos escolhidos por determinado critério, 
 PUC Minas Virtual 33 Probabilidade e Estatística 
ou seja, escolhe-se intencionalmente um grupo de elementos que irão compor a amos-
tra. 
Exemplo 2.4: O pesquisador procura apenas oficinas, para um estudo sobre automóveis, 
 
Amostragem por Cotas – Classificação da população em termos de propriedades que se 
sabe serem relevantes para a característica a ser estudada. Determinação da proporção 
da população para cada característica com base na constituição conhecida, ou estimada, 
da população. 
Exemplo 2.5: Suponhamos que tivéssemos de extrair uma amostra dos estudantes de 
uma universidade, sendo que 47% são mulheres e 53% são homens. Utilizando esse 
método, atribui-se aos pesquisadores uma cota de estudantes de forma que 47% da 
amostra sejam de mulheres e 53% sejam homens. 
 
2.3. Amostragem Aleatória Simples 
A amostragem aleatória simples é um processo para selecionar amostras de tamanho “n” 
dentre as “N” unidades em que foi dividida a população. Sendo a amostragem realizada sem 
reposição, que é o caso mais comum, existem (N, n) possíveis amostras, todas igualmente 
prováveis. 
 
 
 
 
 
 
 
As amostras aleatórias podem ser escolhidas por diversos métodos. Os mais utilizados são: 
tabelas de números aleatórios (TNA) e softwares para gerar números aleatórios. Na prática, 
a amostra aleatória simples é escolhida unidade por unidade. As unidades da população são 
numeradas de 1 a N. Em seguida, escolhe-se, na tabela de números aleatórios (TNA), (ou 
por computador) n números compreendidos entre 1 e N. Esse processo é equivalente a um 
sorteio no qual se colocam todos os números misturados dentro de uma urna. As unidades 
correspondentes aos números escolhidos formarão a amostra. 
 PUC Minas Virtual 34 Probabilidade e Estatística 
Atenção: Neste momento, não estamos preocupados em saber como calcular n (nº de itens 
que farão parte da amostra). O valor de n é dado nos exercícios e avaliações. Para o cálculo 
do tamanho da amostra (n), precisamos de medidas estatísticas mais complexas que não 
são abordadas agora. 
 
Obs.: 
1. Um exemplo de TNA encontra-se no final da unidade 2. 
2. A TNA (Tabela de Números Aleatórios) – consiste em tabelas que apresentam seqüências 
dos dígitos de 0 a 9 distribuídos aleatoriamente nas linhas (horizontais) e colunas (verticais). 
Para obtermos os elementos da amostra usando a TNA, sorteamos uma linha e uma coluna 
qualquer para começarmos a leitura. Por exemplo: escolho 3ª linha 15ª coluna o digito en-
contrado é 5. A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda 
ou vice-versa), verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido 
ascendente ou descendente). A opção, porém, deve ser feita antes de ser iniciado o proces-
so. 
OBS: Como a leitura na TNA é Livre (podemos fazer a leitura em todos os sentidos), vamos adotar 
em nossos exercícios, avaliações e trabalhos, a leitura da TNA na vertical, de cima para baixo, con-
siderando sempre as colunas da esquerda para a direita. 
 
Exemplo 2.6: Utilização da TNA – Como encontrar as amostras. 
Considere a situação abaixo: – Utilize a TNA que esta no final da unidade 2. 
Procure os 10 primeiros números na TNA começando a leitura na 9ª linha e na 5ª coluna 
(lembre-se que cada dígito representa uma coluna). (Resposta: 1, 0, 0, 1, 8, 4, 7, 0, 1, 3) 
Agora considere a situação: 
Para Populações com 10 ou mais itens: 
Para populações com 10 ou mais itens têm que ler na TNA o número de colunas igual ao 
número de dígitos da População. Exemplo: para retirarmos 5 amostras de uma população 
com 300 itens, temos que ler três colunas para conseguirmos valores entre 001 e 300. Se o 
número sorteado superar o número de elementos, abandona-se o númerosorteado, prosse-
guindo-se o processo. 
Por exemplo, se considerarmos a 9ª linha e 5ª coluna temos como resposta: 124, 056, 094, 
143, 014. 
 
Atenção: Foi escolhido ao acaso a 9ª linha e 5ª coluna. Para você realizar qualquer ativida-
de você também pode estar escolhendo ao acaso uma linha e uma coluna pra entrar na 
TNA. Mas para resolver os exercícios, avaliações e atividades estes dados serão fornecidos 
para facilitar a correção. 
 
 PUC Minas Virtual 35 Probabilidade e Estatística 
Exemplo 2.7 
Vamos obter uma amostra representativa de 8 itens para a pesquisa da estatura de noventa 
alunos de uma escola. Utilize a TNA (3ª linha e 8ª Coluna). 
Resolução: 
� Enumeramos os alunos de 01 a 90; 
� Iniciamos o processo de sorteio dos itens da amostra na TNA considerando as colunas 8ª 
e 9ª, pois 90 são dois dígitos; 
� A amostra será composta pelos alunos correspondentes aos números: 46, 28, 16, 51, 88, 
09, 89, 14. 
 
É preferível a utilização de outras técnicas de amostragem que a aleatória simples, pois es-
sas levam em consideração a composição da população, facilitando o trabalho de seleção 
de amostras e aumentando a precisão. 
 
2.4. Amostragem Aleatória Estratificada 
Uma amostra estratificada é obtida separando-se as unidades da população em grupos não 
superpostos, chamados estratos, e selecionando-se independentemente uma amostra alea-
tória simples de cada estrato. Existem dois tipos de amostragem estratificada: 
� De igual tamanho; 
� Proporcional. 
 
No primeiro tipo, sorteia-se igual número de elementos em cada estrato. Esse processo é 
utilizado quando o número de elementos por estrato for aproximadamente o mesmo. 
No outro caso, utiliza-se a amostragem estratificada proporcional, cujo processo de calcular 
o número de amostras por estrato é: 
N → Nº de unidades total da população 
n → Nº de unidades total de amostras 
Na → Nº de unidades que compõem um determinado estrato (A) 
na → Nº itens que serão amostrados do estrato (A) 
aa
aa N
N
n
n
n
n
N
N
.=→=
 
 
Atenção: Quando utilizamos a técnica de amostragem estratificada estamos considerando 
uma população que esta subdividida em partes que para nós são os estratos. Podemos ter 
populações subdivididas em quantos estratos forem precisos. Acima, eu considerei (A) com 
sendo um estrato, mas podemos ter uma população dividida em 5 estratos (estratos A, B, C, 
D e E). Temos que calcular a quantidade de amostras para cada estrato separadamente. 
 PUC Minas Virtual 36 Probabilidade e Estatística 
Exemplo 2.8 
Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam meninos e 36 sejam me-
ninas, vamos obter uma amostra proporcional estratificada de 10%. 
Resolução: 
� São, portanto, dois estratos (um estrato alunos do sexo masculino e outro estrato alunos 
sexo feminino) e queremos uma amostra de 10% da população; 
� Calcula-se o número de amostras de cada estrato. 
Sexo População 10% Número de amostras 
M 54 5,4 5 
F 36 3,6 4 
Total 90 9,0 9 
 
� Para estarmos selecionando quem serão os 9 (nove) alunos vamos enumerar (os alunos) 
de 01 a 90, sendo que de 01 a 54 correspondem ao estrato Masculino e de 55 a 90, ao 
estrato feminino. O próximo passo é o mesmo do exemplo anterior. 
 
2.5. Amostragem por Conglomerado 
Uma amostra por conglomerado é uma amostra aleatória simples na qual cada unidade de 
amostragem é um grupo ou um conglomerado de elementos. 
O primeiro passo na amostragem por conglomerado é especificar conglomerados apropria-
dos. Os elementos em um conglomerado tendem a ter características similares, portanto, o 
fato de novas avaliações serem tomadas num conglomerado não implica necessariamente 
aumento de informação sobre o parâmetro populacional. Como regra geral, o número de 
elementos num conglomerado deverá ser pequeno em relação ao tamanho da popula-
ção e o número de conglomerados deverá ser razoavelmente grande. 
Na amostragem por conglomerado a população é dividida em grupos. E selecionam-se a-
mostras aleatórias simples de grupos e, então, todos os itens dos grupos (conglomerados) 
selecionados farão parte da amostra. 
 
Exemplo 2.9 
Vamos considerar a seguinte situação: Em um levantamento da população de uma cidade, 
podemos dispor do mapa indicando cada quarteirão e não dispor de uma relação atualizada 
dos seus moradores. 
 
 PUC Minas Virtual 37 Probabilidade e Estatística 
Se quisermos saber a população da cidade acima podemos, utilizar a Técnica de Amostra-
gem por Conglomerado. 
Vamos considerar cada quarteirão um conglomerado, e selecionar pela TNA (ou software) 
os quarteirões. E realizamos a contagem completa de todos os que residem naqueles quar-
teirões sorteados. 
 
Atenção: Para sabermos a população total teremos que fazer Inferência, este tema será 
estudado na unidade 8. Neste momento estamos apenas estudando as técnicas para retirar 
amostras. 
 
2.6. Amostragem Sistemática 
Quando os elementos da população já se encontram ordenados, não há necessidade de se 
construir o sistema de referência. Nesses casos, a seleção dos elementos que constituirão a 
amostra pode ser por um sistema imposto pelo pesquisador. 
Em geral, para se obter uma amostra sistemática de n elementos de uma população de ta-
manho N, K deve ser menor ou igual a N/n. Não é possível determinar K, precisamente, 
quando o tamanho da população é desconhecido, mas pode-se supor um valor de k de tal 
modo que seja possível obter uma amostra de tamanho n. No lugar da amostragem aleató-
ria simples, pode-se empregar a amostragem sistemática pelas seguintes razões: 
� a amostragem sistemática é mais fácil de se executar e, por isso, está menos sujeita a 
apresentar erros cometidos pelo entrevistador;. 
� a amostragem sistemática freqüentemente proporciona mais informações por custo unitá-
rio. 
 
Diretrizes para calcular as amostras: 
1º – Estabelecer o intervalo de amostragem K: 
n
NK = 
Obs.: Para valores de K=N/n, arredondar para o valor inteiro inferior. 
 
2º – Iniciar aleatoriamente a composição da amostra. 
b → inicio (nº de ordem inicial sorteado na TNA). 
Obs.: Kb ≤<0 
 
 PUC Minas Virtual 38 Probabilidade e Estatística 
3º – Composição da Amostra: 
1º item → b 
2º item → b + K 
3º item → b + 2k 
4º item → b + 3k 
5º item → b + 4k e assim sucessivamente até o final, ou seja, até conseguir o total de 
elementos da amostra. 
 
Exemplo 2.10 
Suponhamos uma rua contendo quinhentos prédios, dos quais desejamos obter uma amos-
tra formada de vinte prédios. (Vamos considerar para a leitura da TNA, 9ªLinha e 5ª Coluna.) 
Lembre-se que a escolha da linha e coluna é ao acaso, estou simplesmente dando uma 
referência para podermos chegar ao mesmo resultado. 
Solução: Do enunciado temos: N = 500 (população); n=20 (amostra) 
a) Calcular K (intervalo de amostragem) 
b) K=500/20, K=25 
c) b= 12 (valor encontrado na TNA) 
d) Composição da amostra 
1º item → 12 
2º item → 12 + 25 = 37 
3º item → 12 + 2*25 = 62 
20º item → 12 +19*25 = 487 
 
Obs.: Não é preciso fazer nos exercícios todos os itens, o objetivo é o aluno saber utilizar a técnica. 
 PUC Minas Virtual 39 Probabilidade e Estatística 
Tabela de Números Aleatórios 
COLUNA 1 5 9 13 17 21 25 29 33 37 41 45 49 
LINHA 
01 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735 
02 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709 
03 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184 2018 3522 
04 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074 
05 0071 9871 6678 0140 95220995 1735 1248 9807 1910 3155 9878 3359 
 
06 1558 4775 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030 
07 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669 
08 7285 8390 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678 
09 1735 1248 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699 
10 2709 0561 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337 
 
11 3522 0941 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134 
12 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807 
13 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709 0561 4397 
14 6030 4256 3870 5725 2204 2318 8337 3867 6184 2018 3522 0941 5569 
15 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074 1432 0995 
 
16 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359 8244 8952 
17 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030 4256 3870 
18 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669 7423 1768 
19 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522 
20 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555 
 
21 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184 
22 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 8486 
23 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155 
24 8952 0084 1558 4775 1699 1652 2555 4765 2709 0568 4397 1135 6136 
25 3870 5725 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249 
 
26 7425 3566 6151 4731 6489 2491 2765 8525 7849 1488 8833 2597 1333 
27 8961 8175 0879 6945 8029 9119 5990 1063 9444 8320 1740 6131 9907 
28 3298 6173 1741 3874 9321 3748 7507 0170 0568 9112 1275 0924 3054 
29 2276 4898 2394 1098 4063 5393 0226 8144 4778 7471 1764 4939 8063 
30 9557 8114 1576 9767 1486 7161 5606 6295 3503 5050 9549 2500 9666 
 
31 8650 1920 2533 7755 5324 3731 3414 2153 3815 0626 5718 8679 6801 
32 2885 8101 1467 0080 7962 5999 9562 5819 1562 6793 2065 0239 8253 
33 1841 8626 0344 4344 7446 0867 6157 8935 4413 2363 7187 8980 2488 
34 4638 8030 0018 7760 9819 4276 0650 3516 5159 9236 3257 1694 7157 
35 1320 7033 1218 5605 4206 2878 0230 1740 4553 8729 5827 7176 8703 
 
36 1488 5803 6790 9368 0465 4819 0065 7633 3950 2109 7027 5824 5057 
37 4353 4347 8565 2231 8789 4231 2585 0157 2037 7835 1320 8999 9181 
38 7816 5817 9764 8789 7387 2172 0896 1038 6047 9539 3510 1343 8098 
39 8600 9738 5415 8426 7152 8705 5829 0164 8330 9152 6045 8129 2293 
40 1057 1550 8773 3003 4302 4034 2478 1078 0429 7189 0778 3260 5969 
 PUC Minas Virtual 40 Probabilidade e Estatística 
Capítulo 3. 
Distribuição de Freqüência 
Vamos considerar, nesta unidade, o estudo detalhado da distribuição de freqüência, 
que é a forma pela qual podemos descrever os dados estatísticos resultantes de va-
riáveis quantitativas. 
Freqüência é o número de repetições de elementos que estão sendo estudados. Mui-
tas vezes temos que agrupar estes elementos para facilitar o estudo. Este agrupa-
mento é dividido em partes que chamamos de classes, podemos ter classes com in-
tervalos ou sem intervalos (quando um único valor é a classe). 
São objetivos desta unidade: 
� Compor uma distribuição de freqüência com ou sem intervalos de classe; 
� Determinar o quadro de freqüências, eles são úteis para condensar grandes con-
juntos de dados, facilitando a sua utilização; 
� Representar uma distribuição de freqüência através de gráficos como histograma, 
polígono e ogiva. 
 
3.1. Introdução e Definições 
Ao analisarmos um conjunto de dados, devemos determinar se temos uma amostra ou uma 
população. Essa determinação afetará não somente os métodos utilizados, mas também as 
conclusões, pois se estamos trabalhando com uma amostra, os resultados encontrados são 
estimativas para população. 
Nem sempre é possível compreender o significado contido numa amostragem por simples 
inspeção visual dos dados numéricos coletados. Entretanto, entendemos que o sucesso de 
uma decisão dependerá da nossa habilidade em compreender as informações contidas nes-
ses dados. O objetivo desse estudo é mostrar a organização, apresentação e análise gráfica 
de uma série de dados, matéria prima das distribuições de freqüências e dos histogramas 
(gráficos representativos de uma distribuição de freqüência). 
Podemos definir freqüência como o número de vezes que um determinado fenômeno acon-
tece, isto é, quantas vezes ele se repete. 
Os dados podem ser classificados: 













Continuos Dados
 Discretos Dados
 natureza a Quanto
Rol
 Brutos Dados
 oorganizaçã a Quanto
 
 PUC Minas Virtual 41 Probabilidade e Estatística 
Dados brutos – são os dados originais. São os dados que ainda não foram tratados para 
serem utilizados. Não podem ser analisados, por não estarem numericamente organizados. 
(Também são conhecidos como Tabela Primitiva). 
 
Exemplo 3.1 
Tabela 3.1. Número mensal de aparelhos defeituosos na Empresa X. 
 J F M A M J J A S O N D 
1995 6 2 5 1 0 3 2 1 3 5 5 3 
1996 5 4 2 1 3 4 1 4 5 4 0 1 
1997 3 1 2 4 3 1 4 1 0 3 0 2 
1998 2 2 0 3 1 4 2 0 1 1 5 2 
 
Rol – são os dados brutos, organizados em ordem crescente ou decrescente. 
Exemplo 3.2: Considerando o exemplo anterior (Tabela 3.1) temos: 
 
0 0 0 0 0 0 1 1 1 1 1 1 
1 1 1 1 1 2 2 2 2 2 2 2 
2 2 3 3 3 3 3 3 3 3 4 4 
4 4 4 4 4 5 5 5 5 5 5 6 
 
Dados discretos – a variável é discreta quando assume valores em pontos da reta real. (Os 
dados são discretos quando temos um conjunto enumerável de itens). 
Exemplo 3.3 
• Número de erros em um livro: 0,1,2,3,4,.... 
• Número de filhos de vários casais: 1,2,3,4,..... 
• Quantidade de acidentes em determinada rodovia: 4,10,12,15,.... 
 
Dados contínuos – a variável pode assumir, teoricamente, qualquer valor em certo interva-
lo da reta real. (Os dados são contínuos quando temos um conjunto mensurável de itens) 
 PUC Minas Virtual 42 Probabilidade e Estatística 
Exemplo 3.4 
• peso de alunos: 55,5 kg; 61,0 kg; 63,4 kg; 68,1 kg....... 
• distância entre cidades: 35,5 km; 48,6 km; 100,10 km;.... 
Vejamos alguns exemplos de agrupamentos: 
 
Dados agrupados sem intervalo de classes: os valores da variável aparecem individual-
mente. 
Exemplo 3.5 
Considerando os dados da tabela anterior (Tabela 3.1): 
 
Nº de aparelhos 
com defeitos 
Nº de meses 
0 06 
1 11 
2 09 
3 08 
4 08 
5 05 
6 01 
Total 48 
 
Dados agrupados com intervalo de classes: os valores da variável não aparecem indivi-
dualmente, mas agrupados em intervalo nas classes. 
Exemplo 3.6 
Tabela 3.2. Notas de 580 alunos de uma Universidade. 
Notas Nº de alunos 
0 |--- 20 020 
20 |--- 40 065 
40 |--- 60 230 
60 |--- 80 160 
80 |--- 100 025 
Total 580 
 
 PUC Minas Virtual 43 Probabilidadee Estatística 
3.2. Elementos de uma distribuição de freqüência: Amplitude total, Limites de 
classe, Amplitude do intervalo de classe, Ponto médio da classe, 
Freqüência absoluta (simples e acumulada), Freqüência relativa 
(simples e acumulada) 
 
3.2.1. Amplitude total (A) – é a diferença entre o maior e o menor valor do rol. 
A = Xmax – X mim 
Exemplo 3.7: 
Vamos considerar a estatura, em cm, de 40 alunos do Colégio A. (Dados ordenados em 
ordem crescente, por colunas) 
Tabela 3.3. Altura (em cm) de 40 alunos do Colégio A 
150 154 155 157 160 161 162 164 166 169 
151 155 156 158 160 161 162 164 167 170 
152 155 156 158 160 161 163 164 168 172 
153 155 156 160 160 161 163 165 168 173 
A amplitude deste dados é: A = Xmax– Xmim 
A = 173 – 150 = 23 
 
3.2.2. Número de classes (K) e Classe (i) 
Não existe regra fixa para se determinar o número de classes. Podemos utilizar: 
� A Regra de Sturges, que nos dá o número de classes em função do número de valores 
da variável: nK log.3,31+= , onde n é o número de itens que compõe a amostra; 
� Ou 25.n para ,k e 25n para 5K >≅≤= n 
 
Exemplo 3.8 
Considerando o exemplo anterior (tabela 3.3) temos: n=40 
� Pela formula de Sturges: K= 1+3,3log40 = 6,28 → K=6 
� Adotando nK = , temos 40=k =6,3 → K=6 
� Classe i = 1, 2, 3, 4, 5 e 6 
Obs.: A quantidade de classes é um processo de escolha, podemos utilizar qualquer uma das fórmu-
las acima a mais utilizada é: nK ≅ 
 PUC Minas Virtual 44 Probabilidade e Estatística 
3.2.3. Amplitude de um intervalo de classe (h) 
Amplitude de um intervalo de classe ou simplesmente intervalo de classe é a medida do 
intervalo que define a classe. 
h = A / K 
Exemplo 3.9 
Considerando o exemplo anterior (Tabela 3.3): 
h = 23/ 6 = 3,83 → h = 4 
Atenção: h é sempre um número inteiro. E mais prático fazer arredondamento para o núme-
ro inteiro maior. Em muitos casos quando fazemos o arredondamento para o menor inteiro 
pode acontecer de faltar classe para os últimos itens. 
 
3.2.4. Limites de Classe 
Denominamos limites de classe os extremos de cada classe. Assim temos: 
� Limite inferior que é representado por: (linf) 
� Limite superior que é representado por: (Lsup) 
Obs.: Vamos trabalhar com intervalos fechados à esquerda (limite inferior (linf)) e abertos à direita 
(limite superior (Lsup)); isso significa que valores iguais ou superiores ao limite inferior são con-
siderados nessa classe e valores iguais e/ou superiores ao limite superior são considerados na 
classe seguinte. 
 
Exemplo 3.10 
Como montar um quadro de distribuição de Freqüência 
Do exemplo anterior (Tabela 3.3), temos: 
A= 23, K= 6, h=4, e Xmin=150 
Para determinarmos o limite inferior da 1ª classe consideramos o valor de Xmin. 
Portanto o quadro fica assim composto: 
Na 1ª classe: l1 = 150 e L1 = 150 + h = 150 + 4 = 154. 
Na 2ª classe: l2 = 154 e L2 = 154+h = 154+4 = 158. 
Na 3ª classe: l3 = 158 e L3 = 158 + h =158 + 4 = 162 
e assim sucessivamente até a 6ª classe (porque K= 6) 
 PUC Minas Virtual 45 Probabilidade e Estatística 
Tabela 3.4. Quadro de distribuição de freqüências 
 
i Classes ni 
1 150 | 154 4 
2 154 | 158 9 
3 158 | 162 11 
4 162 | 166 8 
5 166 | 170 5 
6 170 | 174 3 
 Σ 40 
 
 
 
Considerando a segunda classe, temos: 
� L2 =158 (Limite superior da segunda classe) 
� l2 = 154 (Limite inferior da segunda classe) 
� n2 = 09 (freqüência absoluta simples da segunda classe). 
 
3.2.5. Ponto Médio da Classe – (xi) 
O ponto médio da classe, que é representado por (xi) é como o próprio nome indica, o ponto 
que divide o intervalo de classe em duas partes iguais. Para obtermos o ponto médio de 
uma classe, calculamos: 
2
supinf Ll
xi
+
=
 
Exemplo 3.11 
Considerando a segunda classe do exemplo anterior, temos: 
156156
2
158154
22 =→=
+
= xx
 
 
Limites inferiores 
Limites superiores 
 Número de classes 
Frequência absoluta simples 
 PUC Minas Virtual 46 Probabilidade e Estatística 
3.2.6. Freqüências 
Vamos trabalhar com Freqüências absolutas (simples e acumulada) e Freqüências relativas 
(simples e acumulada) 













)(F Acumulada
)f ( Simples
Relativa
)(N Acumulada
)(n Simples
Absoluta
 Frequência
i
i
i
i
 
 
Freqüências absoluta simples da classe i (ni) – são os valores que realmente represen-
tam o número de dados de cada classe. A soma das freqüências simples é igual ao número 
total dos dados. 
Exemplo 3.12: Considerando a terceira classe do exemplo anterior, temos: n3 = 11 
 
Freqüências relativas simples (fi) – são os valores das razões entre as freqüências sim-
ples e o número total de dados. 
n
nf ii = 
Exemplo 3.13: 
Considerando a segunda classe do exemplo anterior, temos: f2 = 9/40=0,225. 
Obs.: as freqüências relativas permitem a análise ou facilitam as comparações. 
 
Freqüência absoluta acumulada (Ni) – é o total das freqüências de todos os valores inferi-
ores ao limite superior do intervalo de uma dada classe: 
Exemplo 3.14: 
Considerando a freqüência acumulada da quarta classe (N4), temos: 
N4= n1+n2+n3+n4= 4+9+11+8 = 32 
 
Freqüência relativa acumulada (Fi) – é a freqüência acumulada da classe, dividida pela 
freqüência total da distribuição. 
n
NF ii = 
Exemplo 3.15: Para o exemplo anterior, F4 = 0,8. 
 PUC Minas Virtual 47 Probabilidade e Estatística 
NOTA – Usualmente, denominamos: 
 
Freqüência relativa acumulada crescente da classe i – Fi. 
Obs.: Fi pode ser entendido como sendo a percentagem de observações abaixo do limite superi-
or da classe i. 
 
Freqüência relativa acumulada decrescente da classe i – F’i. 
Obs.: F’i e a porcentagem de observações acima do limite inferior da classe i. 
 
3.3. Regras Gerais para a elaboração de uma distribuição de freqüência 
Os principais estágios na construção de uma distribuição de freqüência para dados amos-
trais ou populacionais são: 
a) Encontrar a amplitude total do conjunto de valores observados; 
b) Escolher o número de classes; 
nnK =+= kou log3,31 
c) Determinar a amplitude do intervalo de classe; 
d) Determinar os limites de classe; 
k
Ah =
 
e) Construir a tabela de freqüências. 
 
Exemplo 3.16 
Vamos considerar a estatura de 50 estudantes do sexo masculino da Universidade XYZ. 
Como podemos agrupar estes dados? Vamos considerar o que acabamos estudar. Vamos 
calcular as freqüências e o ponto médio das classes. 
Tabela 3.5. Alturas de 50 estudantes do sexo masculino da Universidade XYZ 
33 35 35 39 41 41 42 45 47 48 
50 52 53 54 55 55 57 59 60 60 
61 64 65 65 65 66 66 66 67 68 
69 71 73 73 74 74 76 77 77 78 
80 81 84 85 85 88 89 91 94 97 
 
 PUC Minas Virtual 48 Probabilidade e Estatística 
Solução: 
Os dados já estão ordenados, o que já facilita os cálculos! 
Amplitude: A = 97-33 = 64 
Número de Classes: 750 ≅=K 
Intervalo de classe: h =64/7 »10 
 
Tabela 3.6. Quadro de distribuição de Freqüência e Ponto médio 
i Classes ni Ni fi Fi xi 
1 30 | 40 4 4 0,08 0,08 35 
2 40 | 50 6 10 0,12 0,20 45 
3 50 | 60 8 18 0,16 0,36 55 
4 60 | 70 13 31 0,26 0,62 65 
5 70 | 80 9 40 0,18 0,80 75 
6 80 | 90 7 47 0,14 0,94 85 
7 90 |100 3 50 0,06 1,0 95 
 Σ 50 1 
 
Obs.: Não temos somatório de freqüência absoluta acumulada, pois a freqüência acumulada da 
última classe já é o total de itens e também não temos freqüência relativa acumulada pelo 
mesmo motivo. Também não temos o somatório dos pontos médios. 
 
3.4. Gráficos representativos de uma distribuição de freqüência: 
histograma, polígono de freqüência e ogiva 
Uma distribuição de freqüência pode serrepresentativa graficamente pelo histograma, pelo 
polígono de freqüência e pelo polígono de freqüência acumulada (Ogiva de Galton). 
 
Histograma – é formado por um conjunto de retângulos justapostos, cujas bases se locali-
zam sobre o eixo horizontal, de tal modo que seus pontos médios coincidem com os pontos 
médios dos intervalos de classe. 
� As larguras dos retângulos são iguais às amplitudes dos intervalos de classe. 
� As alturas dos retângulos devem ser proporcionais às freqüências das classes, sendo a 
largura igual a amplitude dos intervalos. 
 
 PUC Minas Virtual 49 Probabilidade e Estatística 
Exemplo 3.17 – Histograma. 
Considerando os dados da Tabela 3.6 
Histograma 
 
 
Polígono de freqüência – é um gráfico em linha, sendo as freqüências marcadas sobre 
perpendiculares ao eixo horizontal, e levantadas pelos pontos médios dos intervalos de 
classe. 
Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando 
os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à 
última, da distribuição de freqüência. 
 
Exemplo de um polígono de freqüência 
Considerando os dados da Tabela 3.6 
Polígono de Freqüência 
 
ni 
Ponto médio 35 45 55 65 75 85 95 
4 
8 
12 
4 
8 
12 
30 40 50 60 70 80 90 100 
ni 
Classes 
 PUC Minas Virtual 50 Probabilidade e Estatística 
Polígono de freqüência acumulada – é traçado marcando-se as freqüências acumuladas 
sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limi-
tes superiores dos intervalos de classe. 
 
Exemplo de um polígono de freqüência acumulada 
Considerando os dados da Tabela 3.6 
 
Polígono de Freqüência Acumulada 
 
Obs.: Uma distribuição de freqüência sem intervalos de classe é representada graficamente por um 
diagrama onde cada valor da variável é representado por um segmento de reta vertical e de 
comprimento proporcional à respectiva freqüência. 
 
 
 30 40 50 60 70 80 90 100 
F 
10 
18 
31 
40 
47 
50 
4 
classes 
ni 
xi 1 2 3 4 5 6 
4 
8 
12 
 PUC Minas Virtual 51 Probabilidade e Estatística 
Capítulo 4. 
Medidas de Posição 
Nesta unidade, veremos as tendências características de cada distribuição, desta-
cando as medidas de posição central, que recebem tal denominação pelo fato dos 
dados observados tenderem, de maneira geral, a se agrupar em torno dos valores 
centrais. São objetivos desta unidade: 
� Calcular as medidas de posição central; 
� Diferenciar as medidas – moda, média e mediana; 
� Utilizar as separatrizes para melhor interpretar os resultados. 
 
4.1. Introdução 
Nas seções anteriores, vimos a sintetização dos dados sob a forma de tabelas, gráficos e 
distribuições de freqüências. Agora, vamos destacar o cálculo das medidas que possibilitam 
localizar a maior concentração de valores de uma dada distribuição, isto é, se essa concen-
tração se localiza no início, no meio ou no final de uma distribuição ou, ainda, se há uma 
distribuição uniforme. Tais medidas possibilitam comparações de séries de dados entre si 
pelo confronto desses números. 
Para ressaltar as tendências de cada distribuição, isoladamente, ou em confronto com ou-
tras, necessitamos introduzir os elementos típicos da distribuição, que são: 
� Medidas de posição; 
� Medidas de variabilidade ou dispersão; 
� Medidas de assimetria; 
� Medidas de curtose. 
 
As medidas de posição mais importantes são as medidas de tendência central, que desta-
camos a seguir: 
� A média aritmética; 
� A mediana; 
� A moda. 
 PUC Minas Virtual 52 Probabilidade e Estatística 
As outras medidas de posição são as separatrizes, que englobam: 
� A mediana; 
� Os quartis; 
� Os decis; 
� Os percentis. 
Primeiramente, vamos estudar as principais medidas de tendência central. No segundo 
momento veremos as separatrizes e, na próxima unidade, as medidas de Dispersão, Assi-
metria e Curtose. 
 
4.2. Média aritmética simples ( )X 
A média é o quociente da divisão da soma dos valores da variável pelo número deles. A 
média (aritmética) é, de modo geral, a mais importante de todas as medidas descritivas. 
Como calcular a Média 
 
Dados não agrupados 
n
x
x
n
i
i∑
=
=
1
 
Xi: valor observado 
n: número total de observações 
 
Exemplo 4.1 
Suponha que o tempo de vida útil de 10 aparelhos de telefone são: 
10 29 26 28 15 23 17 25 0 20. 
Qual a vida útil média destes aparelhos? 
 
Solução: 
Como os dados não estão agrupados utilizamos: 
1932002517231528262910
10
1
=+++++++++=∑
=i
ix 
3,19
10
193
10
1
===
∑
=
n
x
x i
i
 (portanto a média de vida útil dos aparelhos é de 19,3 anos) 
 
 PUC Minas Virtual 53 Probabilidade e Estatística 
Dados Agrupados 
 
Sem intervalo de Classe 
n
nx
x
i
n
i
i ×
=
∑
=1
 
Xi: valor encontrado na classe 
ni: n° de observações por classe – freqüência simples 
n: nº total de observações 
 
Exemplo 4.2 
Nos valores abaixo, qual o valor médio? 
Classes 0 1 2 3 4 5 6 Σ 
ni 06 11 09 08 08 05 01 48 
Solução: 
Para o cálculo da média precisamos calcular o produto de x1 por ni. 
Classes 0 1 2 3 4 5 6 Σ 
ni 06 11 09 08 08 05 01 48 
xi . ni 0 11 18 24 32 25 6 116 
Utilizando a fórmula 
n
nx
x
i
n
i
i ×
=
∑
=1
 
42,2 42,2
48
116
=→== XX
 
 
Com intervalo de Classe 
n
nx
X
i
n
i
i ×
=
∑
=1
 
ix : ponto médio da classe 
 ni: n° de observações por classe – freqüência simples 
 
Exemplo 4.3 
Nos valores abaixo, qual o valor médio? 
Classes 0|--- 1 1|--- 2 2|--- 3 3|--- 4 4|--- 5 Σ 
ni 3 10 17 8 5 43 
 
 PUC Minas Virtual 54 Probabilidade e Estatística 
Solução: 
Para o cálculo da média precisamos calcular o produto do ponto médio as classe (xi) por ni. 
Classes 0|--- 1 1|--- 2 2|--- 3 3|--- 4 4|--- 5 Σ 
ni 3 10 17 8 5 43 
xi 0,5 1,5 2,5 3,5 4,5 - 
xi . ni 1,5 15 42,5 28 22,5 109,5 
 
Utilizando a Fórmula: 
n
nx
X
i
n
i
i ×
=
∑
=1
 
55,2X 55,2
43
5,109
=→==X
 
Às vezes, a média pode ser um número diferente de todos os da série de dados que ela 
representa. Veja o Exemplo 4.1. 
 
4.3. Moda (Mo) 
É o valor que ocorre com maior freqüência em um conjunto de dados, e que é denominado 
valor modal. Com base nesse contexto, um conjunto de dados pode apresentar mais de 
uma moda, e nesse caso, dizemos que são multimodais; caso contrário, quando não existe 
um valor predominante, dizemos que é amodal. 
 
Para Calcular a Moda temos que verificar se estamos trabalhando com: 








 
Classe de intervalo Com
 intervalo Sem
agrupados Dados
 agrupados não Dados
 
 
Dados não agrupados 
O valor modal é o valor predominante na distribuição. 
Exemplo 4.4: Nos valores abaixo, qual o valor modal? 
3 4 4 5 6 7 8 9 9 9 10 11 12 13 
 Solução: Mo= 9 (pois 9 é encontrado 3 vezes) 
 PUC Minas Virtual 55 Probabilidade e Estatística 
Dados agrupados 
 
Sem intervalo de Classe: 
O valor modal é o valor que possuir maior freqüência. 
Exemplo 4.5 
Nos valores abaixo, qual o valor modal? 
Classes 0 1 2 3 4 5 6 Σ 
ni 06 11 09 08 08 05 01 48 
Solução: o valor predominante é o número 1, como podemos verificar na Tabela do exemplo 
4.5, pois a freqüência de 1 é 11 o que significa que 1 ocorreu 11 vezes. Temos, portanto, 
Mo=1. 
 
Com intervalo de classe: 
Tratando-se de dados agrupados com intervalode classe, a moda não é percebida tão fa-
cilmente como nos casos anteriores. Para calcular o valor modal nesses casos, podemos 
utilizar os seguintes processos: 
1º Processo: Fórmula de Czuber: )()(inf postmoantmo
antmo
Mo
nnnn
nnhlMo
−+−
−
+=
 
onde constatamos: 
Classe Modal: Classe de maior freqüência 
n mo: freqüência simples da classe modal 
nant: freqüência simples anterior à classe modal 
npost: freqüência simples posterior à classe modal 
linf: limite inferior da classe modal 
hMo: intervalo de classe modal 
 
2º Processo: Fórmula de Pearson: XMdM o 23 −= 
onde constatamos: 
Md = Mediana (vamos estudar a seguir) 
X
 = Média 
 PUC Minas Virtual 56 Probabilidade e Estatística 
Exemplo 4.6 
Determinar a moda para a distribuição: 
Classes 0|--- 1 1|--- 2 2|--- 3 3|--- 4 4|--- 5 Σ 
ni 3 10 17 8 5 43 
 
Solução: 
Como os dados estão agrupados em intervalos de classe vamos utilizar a fórmula de Czuber 
� a classe modal é a classe 2|----3 (classe com maior freqüência) 
� linf = 2 
� hMo = 1 
� nMo = 17 
� nant = 10 
� npost =8 
Substituindo esses valores na fórmula, temos: 






−+−
−
+= )817()1017(
101712Mo 
Mo= 2,44 
 
4.4. Mediana (Md) 
A mediana é uma medida de posição. É, também, uma separatriz, pois divide o conjunto em 
duas partes iguais, com o mesmo número de elementos. O valor da mediana encontra-se no 
centro da série estatística organizada, de tal forma que o número de elementos situados 
antes desse valor central (mediana) é igual ao número de elementos que se encontram após 
esse mesmo valor (mediana). 
 
Para Calcular a Mediana temos que verificar se estamos trabalhando com: 








 
Classe de intervalo Com
 intervalo Sem
agrupados Dados
 agrupados não Dados
 
 
 PUC Minas Virtual 57 Probabilidade e Estatística 
)(EMdXMd =
Dados não agrupados 
Para uma série com número ímpar de itens: a mediana corresponde ao valor central. 
EMd – elemento mediano: indica a posição da mediana. 
 
 
 
 
A mediana será o termo de ordem (n+1)/2. 
Para uma série com número par de itens: não há termo central único, mas, sim, dois termos 
centrais. A mediana será dada por: 
 
 
 
 
A mediana será a média aritmética entre os termos centrais. 
Exemplo 4.7 
Nos valores abaixo, qual o valor mediano? 
3 4 4 5 6 7 8 9 9 9 10 11 12 13 
 
Solução: 
Como os dados não estão agrupados temos verificar se os elementos estão em ordem 
(crescente ou decrescente), no nosso exemplo os elementos já estão ordenados. 
O total de itens é 14, portanto n é par. 
 
Emd= n/2 = 14/2= 7 (vamos verificar qual o elemento que ocupa a 7ª posição) 
 
1ª 2ª 3ª 4ª 5ª 6ª 7ª 
3 4 4 5 6 7 8 9 9 9 10 11 12 13 
 
Portanto a Md = (8 + 9)/2 → Md = 8,5 
2
XX
Md 1)(E)(E MdMd +
+
=
n ímpar 
 EMd = (n+1)/2 
n par 
 EMd = n/2 
 PUC Minas Virtual 58 Probabilidade e Estatística 
Dados agrupados 
Neste caso, o problema consiste em determinar o ponto do intervalo em que está compre-
endida a mediana. 
 
Sem intervalo de classe: 
Devemos, primeiro, obter a localização da mediana na série através do termo de ordem: 
2
nEMD = 
Uma vez localizada a posição da mediana, devemos verificar o valor numérico da variável 
correspondente a essa posição. 
 
Com intervalo de classe: 
Localizada a classe mediana, calculamos o valor da mediana pela fórmula: 
Md
ant
inf
n
N
2
n
Md
−
+=
∑
Mdhl 
onde temos: 
linf: limite inferior da classe mediana. 
hMo: intervalo de classe mediana. 
nMd: freqüência simples absoluta na classe mediana. 
Nant: freqüência acumulada absoluta anterior à classe mediana. 
Classe Mediana: classe onde está o elemento mediano. 
 
Exemplo 4.8 
Nos valores abaixo, qual o valor mediano? 
Classes 0 1 2 3 4 5 6 Σ 
ni 06 11 09 08 08 05 01 48 
Solução: 
Como os dados estão agrupados sem intervalo de classe vamos utilizar: 2
nEMD = 
Emd= 48/2 = 24 (não precisamos verificar se n é par ou ímpar, temos que fazer esta verificação so-
mente para dados não agrupados!!!) 
 PUC Minas Virtual 59 Probabilidade e Estatística 
Pela freqüência acumulada verificamos a que classe corresponde. 
 1ª 2ª 3ª 
Classes 0 1 2 3 4 5 6 Σ 
ni 06 11 09 08 08 05 01 48 
Ni 06 17 26 34 42 47 48 – 
 
O elemento que ocupa a 24ª posição esta na 3ª classe ou seja o valor da Md = 2 
(valor do elemento mediano foi igual a 24, então temos que encontrar até que classe temos 
24 elementos, até a 2ª classe temos 17 (N2= 17) elementos, até a 3ª classe temos 26 (N3) 
elementos, portanto o 24 º elemento esta na 3ª classe, que corresponde ao valor 2) 
 
Exemplo 4.9 
Determinar a mediana para a distribuição: 
Classes 0|--- 1 1|--- 2 2|--- 3 3|--- 4 4|--- 5 Σ 
ni 3 10 17 8 5 43 
 
Solução: Como os dados estão agrupados com intervalo de classe vamos utilizar: 
Md
ant
inf
n
N
2
n
Md
−
+=
∑
Mdhl 
 
Emd= 43/2 = 21,5 (não precisamos verificar se n é par ou ímpar!!!) 
Pela freqüência acumulada verificamos qual a classe mediana 
 1ª 2ª 3ª 
Classes 0|--- 1 1|--- 2 2|--- 3 3|--- 4 4|--- 5 Σ 
ni 3 10 17 8 5 43 
Ni 3 13 30 38 43 – 
 
A classe mediana é a 3ª classe que compreende o intervalo de 2|--- 3. Agora retiramos as 
variáveis utilizadas na fórmula. 
 PUC Minas Virtual 60 Probabilidade e Estatística 
linf: limite inferior da classe mediana. → linf =2 
hMo: intervalo de classe mediana. → hMo = 1 
nMd: freqüência simples absoluta na classe mediana. → n3=17 
Nant: freqüência acumulada absoluta anterior à classe mediana. → N2=13 
 
 
 
Portanto o valor mediano da distribuição é 2,5 
 
 
4.5. Média Geométrica (MG) 
 
Dados não agrupados 
A média geométrica de um conjunto de n números x1, x2,x3,......xn é a raiz de ordem n do 
produto desses números: 
 
 
 
Dados agrupados 
Sem intervalo de classe: 
 
 
Com intervalo de classe: 
 
 
 
4.6. Média Harmônica (Mh) 
Sejam x1, x2, x3,......xn, valores de x, associados às freqüências absolutas n1, n2, n3,......nn, 
respectivamente. 
Md
ant
n
N
2
n
Md
−
+=
∑
Mdhlinf 5,217
135,2112 =




 −
+=DM
Xi: valor observado 
ni: n° de observações da classe 
n: nº total de itens 
 
ix : ponto médio 
ni: n° de observações 
n: nº total de itens 
 
n 
n G x x x x M ..... . . 3 21 = 
n n 
n
n n n 
G 
n x x x x M .... 321 3 2 1 = 
n n 
n 
n n n
G 
nx x x x M .... 321 3 2 1 = 
 PUC Minas Virtual 61 Probabilidade e Estatística 
A média harmônica de X é definida por: 
∑
=
=
++++
=
n
i i
i
n
n
x
n
n
x
n
x
n
x
n
x
n
nMh
13
3
2
2
1
1
........
 
 
 
� Para dados não agrupados n = 1. 
� Para dados agrupados sem intervalo de classe xi é o valor da variável. 
� Para dados agrupados com intervalo de classe xi é o ponto médio da classe. 
 
Exemplo 4.10 
Utilizando o exemplo 4.9 qual o valor encontrado para a Média Harmônica e Média Geomé-
trica? 
Solução: 
Cálculo da Média Geométrica – utilizando a fórmula 
 
 
Classes 0|--- 1 1|--- 2 2|--- 3 3|--- 4 4|--- 5 Σ 
ni 3 10 17 8 5 43 
Ni 3 13 30 38 43 – 
xi 0,5 1,5 2,5 3,5 4,5 
 
26,25,4.5,3.5,2.5,1.5,043 5817103 ==GM 
Cálculo da Média Harmônica – utilizando a fórmula 
∑
=
=
++++
=
n
i i
i
n
n
x
n
n
x
n
x
n
x
n
x
n
nMh
13
3
2
2
1
1
........
 
88,1
5,4
5
5,3
8
5,2
17
5,1
10
5,0
3
43
=
++++
=hM 
 
n n 
n 
n n n 
G 
n x x x x M .... 321 3 2 1 =
 PUCMinas Virtual 62 Probabilidade e Estatística 
4.7. Separatrizes: Quartis, Decis e Percentis 
São valores que ocupam determinados lugares de uma distribuição de freqüência. Podemos 
classificá-las em: 
 
Quartis: dividem a distribuição em 4 partes iguais 
Qi = quartil i=1,2,3 
� Q1 = 1º quartil, valor situado de tal modo na série que uma quarta parte (25%) dos dados 
é menor que ele e as três quartas partes restantes (75%) são maiores. 
� Q2 = 2º quartil, evidentemente, coincide com a Mediana (Q2 = Md). 
� Q3 = 3º quartil, valor situado de tal modo que as três quartas partes (75%) dos termos são 
menores que ele e uma quarta parte 25% é maior. 
 
� 1º Passo: Calcula-se em que classe esta o Qk que queremos. 
� 2º Passo: Identifica-se a classe QK, pela Nac; 
� 3º Passo: Aplica-se a fórmula: 
h
n
Nn
lQ
Q
ant
Q .
4
1
11






−
+=
 
 
Onde temos: 
n: tamanho da amostra 
linf: limite inferior da classe do quartil considerado 
hQ: intervalo de classe do quartil considerado 
nQ: freqüência simples absoluta do quartil considerado 
Nant: freqüência acumulada anterior à classe do quartil considerado 
Decis: dividem a distribuição em 10 partes iguais 
Di = decil i=1,2,3, …, 9 
 
� 1º Passo: Calcula-se em que classe esta o Dk que queremos. 
� 2º Passo: Identifica-se a classe DK, pela Nac; 
� 3º Passo: Aplica-se a fórmula: 
h
n
NKN
lD
K
K
D
ant
DK






−
+=
)(10
 
lDK: limite inferior da Classe Dk 
n: tamanho da amostra 
h: amplitude da classe 
nDK: freqüência da classe 
N(ant): freqüência acumulada da classe anterior 
h 
n 
Nn 
lQ
Q 
ant 
Q . 
4 
3 
3
3 3 
 
 
 
 
 
 
−
+=
 PUC Minas Virtual 63 Probabilidade e Estatística 
Percentis:: dividem a distribuição em 100 partes iguais. 
Pk = centil i=1,2,3, …, 99 
� 1º Passo: Calcula-se em que classe esta o Pk que queremos 
� 2º Passo: Pela Nac identifica-se a classe Pk 
� 3º Passo: Aplica-se a fórmula 
 
 
lPK: limite inferior da classe 
em que, K = 1,2,3,...,98,99. 
n: tamanho da amostra 
N(ant): freqüência acumulada anterior à classe 
h: amplitude da classe 
nPK: freqüência da classe 
 
Exemplo 4. 11 
Num acampamento infantil, foram obtidas as seguintes estaturas: 
Estaturas 120|--- 128 128|---136 136|--- 144 144|--- 152 152|--- 160 
freqüência 6 12 16 13 7 
Calcule: 
a) O 1º Quartil (Q1); 
b) O 4º Decil (D4); 
 
Solução: 
Primeiro vamos estruturar a tabela de distribuição de Freqüências, como estamos traba-
lhando com intervalos de classe, temos que calcular os pontos médios de cada classe. De-
pois iremos utilizar as fórmulas para cada item que queremos calcular. 
 
i 
Estaturas (cm) 
(Classes) 
ni Ni Xi (Ponto médio) 
1 120|--- 128 6 6 124 
2 128 |--- 136 12 18 132 
3 136 |--- 144 16 34 138 
4 144 |--- 152 13 47 148 
5 152 |--- 160 7 54 156 
 Total 54 - - 
 
h 
n 
N Kn 
l P 
K 
K 
P 
ant 
P K 
 
 
 
 
 
 
−
+= 
) ( 100
 PUC Minas Virtual 64 Probabilidade e Estatística 
a) Cálculo de Q1, 
Para calcular Q1, temos que primeiro identificar a classe em que está o valor, para isso 
consideramos que: 
5,13
4
54
4
==
N
, primeiramente vamos arredondar o resultado para 14, pela freqüência 
acumulada procuramos a classe onde se encontra o 14º elemento. O 14º elemento esta 
na 2ª classe com limites de 128 |--- 136. 
Agora usaremos a fórmula para calcular Q1 
 
h
n
Nn
lQ
Q
ant
Q .
4
1
11






−
+=
 
Onde: 
linf: limite inferior da classe do quartil considerado = 128 
hQ: intervalo de classe do quartil considerado = 8 
nQ: freqüência simples absoluta do quartil considerado = 12 
Nant: freqüência acumulada anterior à classe do quartil considerado =6 
 
Substituindo estes valores na expressão acima temos: 
( ) 1338*
12
65,131281 =
−
+=Q
 
 
b) Cálculo de D4 
Primeiramente identificamos a classe onde está localizado o valor que será utilizado, 
276,21
10
54 . 4
10
===
Kn
, através da freqüência acumulada identificamos a classe que 
encontra o 27º, que é a 3ª classe com limites de 136 |--- 144 
Agora usaremos a fórmula 
 onde: 
lDK: limite inferior da Classe Dk = 136 
n: tamanho da amostra = 54 
h: amplitude da classe = 8 
nDK: freqüência da classe = 16 
N(ant): freqüência acumulada da classe anterior = 18 
 
Substituindo estes valores na expressão acima temos: 
( ) 8,1378*
16
186,211364 =
−
+=D
 
h 
n 
N Kn 
l D 
K 
K 
D 
ant 
D K 
 
 
 
 
 
 
− 
+ = 
) ( 1
 PUC Minas Virtual 65 Probabilidade e Estatística 
Capítulo 5. 
Medidas de Dispersão 
A interpretação de dados estatísticos requer que se realize um grande estudo de da-
dos, além das medidas de posição. Nesta unidade, veremos que as medidas de dis-
persão servem para verificar a representatividade das medidas de posição, que é o 
nosso principal objetivo. 
 
5.1. Dispersão 
Medidas de dispersão são medidas estatísticas utilizadas para avaliar o grau de variabilida-
de, ou dispersão, dos valores obtidos em torno do valor médio. Servem para medir a repre-
sentatividade da média. 
















 (CV) variaçãode eCoeficientRelativa
 
(S) Padrão Desvio
)(S Variância
(A) Amplitude
 Absoluta
Dispersão de Medidas
2
 
 
Amplitude Total (A) 
A amplitude é a diferença entre o maior e o menor dos valores da série. A utilização da am-
plitude total como medida de dispersão é muito limitada, pois sendo uma medida que de-
pende apenas dos valores extremos, é instável, não sendo afetada pela dispersão dos valo-
res internos. 
 
Variância (S2) 
A variância inclui na sua medida os valores extremos e os valores intermediários, isto é, 
expressa melhor os resultados obtidos. Na variância são estabelecidas relações dos desvios 
em torno da média, isto é, a variância é a média aritmética dos quadrados dos desvios. 
 PUC Minas Virtual 66 Probabilidade e Estatística 
Para Dados Amostrais, temos as seguintes fórmulas para o cálculo da variância: 
Dados Não Agrupados Dados Agrupados 
1
)( 2
_
12
−
−∑
=
=
n
xx
S
i
n
i
 
( )








−
−
= ∑ ∑
n
nx
nx
n
S iiii
2
22 .
.
1
1
 
Onde temos que: 
� Para dados agrupados sem intervalo de classe, xi é o valor da variável. 
� Para dados agrupados com intervalo de classe, xi é o ponto médio da classe. 
� Para Dados Populacionais temos as seguintes fórmulas para o cálculo da variância: 
 
Dados Não Agrupados Dados Agrupados 
 
( )








−= ∑ ∑
n
nx
nx
n
S iiii
2
22 .
.
1
 
Onde temos que: 
� Para dados agrupados sem intervalo de classe, xi é o valor da variável. 
� Para dados agrupados com intervalo de classe, xi é o ponto médio da classe. 
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em uni-
dade quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um 
inconveniente; por isso, tem pouca utilidade na estatística descritiva, mas é extremamente 
importante na inferência estatística e em combinações de amostras. 
 
Desvio Padrão (S) 
O desvio-padrão é a medida mais usada na comparação de diferenças entre conjuntos de 
dados, por ter grande precisão. O desvio-padrão determina a dispersão dos valores em re-
lação à média e é calculado por meio da raiz quadrada da variância. 
2SS =
 
) ( 2 
_ 
1 2 
− ∑ 
= 
= 
n 
x x 
S 
i 
n 
i 
 PUC Minas Virtual 67 Probabilidade e Estatística 
Coeficiente de Variação (CV)Coeficiente de variação é uma medida relativa de dispersão útil para a comparação em ter-
mos relativos do grau de concentração. O coeficiente de variação é a relação entre o desvio 
padrão (S) e a média x .. 
x
SCV =
 
 
Diz-se que uma distribuição pode ter: 
Baixa dispersão: CV ≤ 15% 
Média dispersão: 15%< CV<30% 
Alta dispersão: CV ≥ 30% 
 
5.2. Assimetria 
Denomina-se assimetria o grau de afastamento de uma distribuição da unidade de simetria. 
As medidas de assimetria referem-se à forma da curva de uma distribuição de freqüência, 
mais especificamente do polígono de freqüência ou do histograma. 
� Em uma distribuição simétrica, tem-se igualdade dos valores da média, mediana e moda. 
Simetria 
 
Toda distribuição deformada é sempre assimétrica. Entretanto, a assimetria pode dar-se na 
cauda esquerda ou na direita da curva de freqüências. 
 
� Em uma distribuição assimétrica positiva, ou assimétrica à direita, tem-se: XMdMo << 
Assimetria à direita (ou positiva) 
 
 
 
 
 
MdMoX ==
Mo Md X
 PUC Minas Virtual 68 Probabilidade e Estatística 
� Em uma distribuição assimétrica negativa, ou assimétrica à esquerda, tem-se: 
MoMdX <<
 
Assimetria à esquerda (ou negativa) 
 
 
 
 
 
Existem várias fórmulas para o cálculo do coeficiente de assimetria. As mais utilizadas são: 
 
� 1º Coeficiente de Pearson: 
S
MoxAS −= 
 
� 2º coeficiente de Pearson: 
13
31 2
QQ
MdQQAS
−
−+
= 
 
Quando: 
AS = 0, diz-se que a distribuição é simétrica. 
AS > 0, diz-se que a distribuição é assimétrica positiva (à direita) 
AS < 0, diz-se que a distribuição é assimétrica negativa (à esquerda). 
 
5.3. Curtose 
Curtose é o grau de achatamento (ou afilamento) de uma distribuição em comparação com 
uma distribuição padrão (chamada curva normal). De acordo com o grau de curtose, classi-
ficamos três tipos de curvas de freqüência: 
Mesocúrtica: é uma curva básica de referência chamada curva padrão ou curva normal; 
 
 
 
 
 
 
 
Mo: valor modal (moda) 
S: Desvio padrão 
X : Média 
Q1: valor do 1º Quartil 
Q3: valor do 3º Quartil 
Md: valor da Mediana 
 
X Md Mo
 PUC Minas Virtual 69 Probabilidade e Estatística 
Platicúrtica: é uma curva mais achatada (ou mais aberta) que a curva normal; 
 
 
 
 
 
 
Leptocúrtica: é uma curva mais afilada que a curva normal; 
 
 
 
 
 
 
Para medir o grau de curtose utiliza-se o coeficiente: 
 
)(2 1090
13
PP
QQK
−
−
= 
 
� Se K= 0,263, diz-se que a curva correspondente à distribuição de freqüência é mesocúr-
tica. 
� Se K > 0,263, diz-se que a curva correspondente à distribuição de freqüência é platicúrti-
ca. 
� Se K < 0,263, diz-se que a curva correspondente à distribuição de freqüência é leptocúr-
tica. 
 
Exercício Resolvido 5.1 
Num acampamento infantil, foram retiradas uma amostra das estaturas de crianças. Os da-
dos amostrais estão abaixo: 
 
Estaturas 120|--- 128 128|---136 136|--- 144 144|--- 152 152|--- 160 
freqüência 6 12 16 13 7 
 
Q1: valor do 1º Quartil 
Q3: valor do 3º Quartil 
P10: valor do Percentil 10 
P90: valor do Percentil 90 
 PUC Minas Virtual 70 Probabilidade e Estatística 
Para estes dados, calcule: 
a) Variância 
b) Desvio Padrão 
c) Coeficiente de Variação 
d) Coeficiente de Assimetria 
 
Resolução: 
a) Cálculo da Variância 
Como estamos trabalhando com dados agrupados com intervalo de classes temos que 
calcular o ponto médio de cada classe. 
 
Estaturas 120|--- 128 128|---136 136|--- 144 144|--- 152 152|--- 160 Σ 
ni 6 12 16 13 7 54 
xi 124 132 140 148 156 - 
xi.ni 744 1584 2240 1924 1092 7584 
xi
2. ni 92256 209088 313600 284752 170352 1070048 
 
Utilizando a fórmula para dados amostrais 
( ) ( ) 78,92
54
75841070048
154
1.
.
1
1 2
2
22
=







−
−
=








−
−
= ∑ ∑
n
nx
nx
n
S iiii 
 
b) Cálculo do Desvio padrão. 
01,718,9222 === SS 
01,718,922 === SS
 
01,718,92 === SS 
63,978,922 === SS 
 
 
 PUC Minas Virtual 71 Probabilidade e Estatística 
44,140
54
75841
==
×
=
∑
=
n
nx
X
i
n
i
i
c) Cálculo do Coeficiente de Variação (temos que Calcular a Média da distribuição) 
 
 
 
%8,6068,0
44,140
63,9
====
X
SCV 
 
d) Cálculo do Coeficiente de Assimetria – utilizando a formula do 1º coeficiente. (temos 
que calcular a Moda) 
( ) ( ) 57,14013161216
12168136)()(inf =−+−
−
+=
−+−
−
+=
postmoantmo
antmo
Mo
nnnn
nnhlMo
 
013,0
63,9
57,14044,140
−=
−
=
−
=
S
MoxAS
 
(Assimetria negativa ou a esquerda)
 
Módulo 2 
 
 
 
 PUC Minas Virtual 73 Probabilidade e Estatística 
Capítulo 6. 
Probabilidade 
Nesta unidade, veremos probabilidade expressa por meio de valores numéricos e as 
possibilidades da ocorrência dos resultados de um fenômeno. São objetivos desta 
unidade: 
� Definir e determinar os possíveis espaços amostrais de fenômenos; 
� Determinar a probabilidade de ocorrência de um determinado fenômeno. 
� Formar um conhecimento sólido sobre os valores probabilísticos que serão utiliza-
dos nas próximas unidades. 
 
6.1. Experimento aleatório, espaço amostral e eventos 
 
Introdução 
Todas as vezes que se estudam fenômenos que podem ser observados, é imprescindível 
distinguir o próprio fenômeno e o modelo matemático (determinístico ou probabilístico) que 
melhor o explique. 
Os fenômenos estudados pela estatística são fenômenos cujo resultado, mesmo em condi-
ções normais de experimentação, variam de uma observação para outra, dificultando a pre-
visão de um resultado. 
A observação de um fenômeno casual é recurso poderoso para se entender a variabilidade 
do mesmo. Entretanto, com suposições adequadas e sem observar diretamente o fenôme-
no, podemos criar um modelo teórico que reproduza de forma bastante satisfatória a distri-
buição das freqüências, como se o fenômeno estivesse sendo observado diretamente. Tais 
modelos são os chamados modelos de probabilidades. 
Os fenômenos determinísticos são previsíveis, e conduzem sempre a um mesmo resultado 
quando as condições são as mesmas. Ex: tempo de queda livre de um corpo. Mantidas as 
mesmas condições, as variações obtidas para o valor do tempo de queda livre de um corpo 
são extremamente pequenas (em alguns casos, desprezíveis). 
Os fenômenos aleatórios são imprevisíveis e podem conduzir a diferentes resultados mes-
mo quando as condições são as mesmas. Ex: lançamento de um dado. 
 
 PUC Minas Virtual 74 Probabilidade e Estatística 
Experimento Aleatório 
Podemos considerar os seguintes experimentos aleatórios como fenômenos produzidos 
pelo homem. 
� Lançamento de uma moeda honesta; 
� Lançamento de um dado; 
� Lançamento de duas moedas; 
� Retirada de uma carta de um baralho completo, de 52 cartas; 
� Determinação da vida útil de um componente eletrônico. 
A análise desses experimentos revela que: 
� Cada experimento poderá ser repetido indefinidamente sob as mesmas condições; 
� Não se sabe a priori o resultado do experimento, porém pode-se descrever todos os pos-
síveis resultados a serem obtidos, isto é, as possibilidades; 
� Quando o experimento é repetido um grande número de vezes, surgirá uma regularidade. 
Para a explicação desses fenômenos (fenômenos aleatórios), adota-se um modelo matemá-
tico probabilístico. 
 
Espaço Amostral 
Um dos conceitos matemáticos fundamentais utilizados no estudo das probabilidades é o de 
conjunto. Um conjunto é uma coleção de objetos ou itens que possuem característica(s) 
comum(ns). É importante definir cuidadosamenteo que constitui o conjunto em que estamos 
interessados, a fim de podermos decidir se determinado elemento é ou não membro do con-
junto. 
 
Conjunto é uma coleção bem definida de objetos ou itens. 
 
A probabilidade só tem sentido no contexto de um espaço amostral, que é o conjunto de 
todos os resultados possíveis de um “experimento”. O termo “experimento” sugere a incerte-
za do resultado antes de fazermos as observações. Denominamos os resultados de um ex-
perimento (ex: a ocorrência de um raio, de uma viagem etc.) de eventos. 
 
Espaço Amostral – É representado pela letra (S) – O espaço amostral de um experimento 
aleatório é o conjunto de todos os possíveis resultados desse experimento. 
 PUC Minas Virtual 75 Probabilidade e Estatística 
Exemplo 6.1: Espaços Amostrais 
Seja os experimentos: 
A – Lançar uma moeda o Espaço amostral será: 
S = {c, r} 
B – Lançar um dado o Espaço amostral será: 
S = {1, 2, 3, 4, 5, 6} 
C – Lançar 2 moedas o Espaço amostral será: 
S = {(c, r), (c, c), (r, c), (r, r)} 
Pode-se inferir que se o nº de pontos (elementos do espaço amostral) amostrais de um es-
paço amostral finito é n, então o número de eventos é dado por: 2n. 
 
Exemplo 6.2 
No lançamento de 5 moedas, o número de pontos amostrais (resultados possíveis) é 25 = 
32. Portanto, S= 32. 
 
Evento 
Evento Aleatório – É representado pela letra (E) – O evento aleatório é qualquer subconjun-
to de um espaço amostral. É também o resultado obtido de cada experimento aleatório, não 
é previsível. 
O complemento de um evento é constituído de todos os resultados obtidos no espaço amos-
tral que não façam parte do evento. 
Os eventos são mutuamente excludentes, quando não têm elemento em comum, ou se não 
podem ocorrer simultaneamente. 
 
Exemplo 6.3 
Na extração de uma só carta de baralho, os eventos “a carta é de copas” e a “carta é de 
ouros” são mutuamente excludentes, porque uma carta não pode ser ao mesmo tempo de 
copas e de ouros. 
Já os eventos “a carta é de copas” e “a carta é uma figura” não são mutuamente excluden-
tes, porque algumas cartas de copas são também figuras. 
Muitas vezes, é útil representar graficamente um espaço amostral, porque isso torna mais 
fácil visualização dos elementos. 
 
 PUC Minas Virtual 76 Probabilidade e Estatística 
Vejamos alguns exemplos de representação gráfica de eventos e espaços amostrais. 
A) Quando temos eventos complementares 
Os eventos A e A’ são complementares 
 
 
B) Quando temos eventos mutuamente excludentes 
Os eventos A e B são mutuamente 
excludentes porque não se interceptam. 
 
C) Quando temos eventos não mutuamente excludentes 
Os eventos A e B não são mutuamente excludentes, 
pois têm alguns elementos em comum. 
 
Operações com Eventos Aleatórios 
Consideremos um espaço amostral finito: 
{ }nS ∈∈∈∈= ....,, 321 
 
Sejam A e B dois eventos de S, as seguintes operações podem ser efetuadas e são defini-
das e representadas a seguir: 
A) Reunião – A ∪ B – O evento reunião é formado pelos pontos amostrais que pertencem 
a pelo menos um dos eventos. 
{ }BouASBA ∈∈∈∈∈∈=∪ 111 /)( 
 
É o evento que ocorre se 
A ocorre ou B ocorre, 
ou ambos ocorrem. 
 
 
B) Interseção – A ∩ B – O evento interseção é formado pelos pontos amostrais que perten-
cem simultaneamente aos eventos A e B. 
{ }BeASBA iii ∈∈∈∈∈∈=∩ 
AA BB 
S 
AA BB 
S 
AA’’ 
AA 
S 
BB 
AA 
 PUC Minas Virtual 77 Probabilidade e Estatística 
 
É o evento que ocorre 
se A e B ocorrem 
 
 
 
Obs.: Se A ∩∩∩∩ B = ∅∅∅∅, A e B são eventos mutuamente exclusivos. 
 
C) Complementação → S – A = A” → É o evento que ocorre se o evento A não ocorre. 
{ }ASA ii ∉∈∈∈=' 
 
6.2. Probabilidade: Definição Clássica; Probabilidade e freqüência relativa 
Primeiramente o conceito de probabilidade estava, associado a freqüência de um aconteci-
mento ou seja quando o experimento é repetido um grande número de vezes, surgirá uma 
regularidade. 
Mas esta definição é muito vaga, pois o que é um grande número de repetições? 
Abaixo temos uma definição mais clássica do que é probabilidade. 
Chamamos de probabilidade de um evento A (A ⊂ S) o número real definido por P(A), tal 
que: 
NTC
NCF(A)
Casos de TotalNúmero
A) ( Favoráveis Casos de Número
P(A) ==
 
 
Dado um experimento aleatório, E e S o espaço amostral, probabilidade de um evento A – 
P(A) – é uma função definida em S que associa a cada evento um número real, satisfazendo 
os seguintes axiomas: 
� 1)(0 ≤≤ AP 
� P(S) = 1 (Probabilidade do espaço amostral) 
� Se A e B forem eventos mutuamente exclusivos, (A ∩ B=Ø), então: 
� P (A ∪ B)=P(A)+P(B) 
 
BB AA 
SS 
A ∩ B 
 PUC Minas Virtual 78 Probabilidade e Estatística 
6.3. Tipos de eventos 
Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento alea-
tório. 
Assim, qualquer que seja E, se E ⊂ S (E está contido em S), então E é um evento de S. 
 
Evento Certo – é aquele que ocorre em qualquer realização do experimento aleatório. 
Se E = S, E é chamado evento certo. 
 
Evento Elementar – é aquele formado por um único elemento do espaço amostral. 
Se E ⊂ S e E é um conjunto unitário, E é chamado evento elementar. 
 
Evento Impossível – é aquele que não ocorre em nenhuma realização de um experimento 
aleatório. 
Se E = ∅, E é chamado evento impossível. 
 
Evento Complementar – seja um evento A qualquer, o evento A’ (chamado de complemen-
tar de A), tal que A’=S-A, ou seja, é um outro conjunto formado pelos elementos que perten-
cem a S e não pertencem a A. 
 
Eventos Equiprováveis 
No estudo de probabilidade (definição clássica) quando se associa a cada ponto amostral a 
mesma probabilidade, o espaço amostral chama-se equiprovável ou uniforme. Os eventos 
Ei,i=1,2,3......n são equiprováveis quando P(Ei)=P(E2)=P(En)= P, isto é, quando todos têm a 
mesma probabilidade de ocorrer: P=1/n. Todo o nosso estudo estará baseado neste concei-
to 
Se os n pontos amostrais (eventos) são equiprováveis, a probabilidade de cada um dos pon-
tos amostrais é 1/n. 
n
rAP
n
rAP =∴





= )(1)(
 
 
Exemplo 6.4 
Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um 
rei ou uma carta de espadas? 
 PUC Minas Virtual 79 Probabilidade e Estatística 
Solução: 
Probabilidade de Carta de espadas →P(A) = 13/52 
Probabilidade de Rei → P(B) = 4/52 
Probabilidade de P(A ∩ B)= 1/52 portanto 
Eventos mutuamente exclusivos 
13
4
52
16
52
1
52
4
52
13)(
)()()()(
==−+=∪
∩−+=∪
BAP
BAPBPAPBAP
 
Dois eventos A e B são denominados mutuamente exclusivos se eles não puderem ocorrer 
simultaneamente, isto é, A ∩ B = Ø. 
Evento impossível 
 
Exemplo 6.5 
E = Jogar um dado e observar o resultado. 
{ }6,5,4,3,2,1=S
 
Sejam os eventos A= ocorrer nº par e B= ocorrer nº ímpar. 
Então, A e B são mutuamente exclusivos, pois a ocorrência de um número par e ímpar não 
pode ser verificada na mesma experiência. 
 
6.4. Axiomas de Probabilidade 
Probabilidade é um conceito matemático que permite a quantificação da incerteza, permitin-
do que ela seja aferida, analisada e usada para a realização de previsões. Alguns dos seus 
princípios mais importantes são: 
1. Se temos um conjunto vazio (representado por Ø) a Probabilidade é igual a 0. 
Se Ø → P(Ø) = 0. 
2. Teorema do evento complementar: Se A’ (lê-se: evento A complementar) é o comple-
mento do evento A, então a Probabilidade do evento complementar é: 
P(A’) = 1 – P(A) 
3. Teorema da soma: Se A e B são dois eventos quaisquer, então temos que a Probabili-
dade da união dos eventos A e B é: 
P(A ∪ B) = P (A) + P (B) – P (A ∩ B) 
 
 PUC Minas Virtual80 Probabilidade e Estatística 
Se tomássemos apenas P(A ∪ B) = P (A) + P (B), estaríamos, considerando duas vezes a 
probabilidade de interseção, estamos trabalhando com eventos equiprováveis ou seja todos 
os eventos tem a mesma probabilidade de acontecer. (ver definição em 6.3) 
 
Teoria da Contagem 
Dados dois eventos, o primeiro dos quais pode ocorrer de m maneiras distintas e o segundo 
pode ocorrer de n maneiras distintas, então os dois eventos conjuntamente podem ocorrer 
de m.n maneiras distintas. O cálculo da probabilidade de um evento reduz-se a um proble-
ma de contagem. Assim é que a Análise Combinatória tem fundamental importância para se 
contar o nº de casos favoráveis e o total de casos. Para problemas simples ou com poucos 
elementos, pode-se contar o número de resultados de forma direta, sem necessidade de 
recorrer às fórmulas matemáticas da análise combinatória. Para problemas mais complexos, 
recorre-se às combinações e arranjos para determinar o número de casos. 
� Combinação 
São agrupamentos de r elementos, de forma que os r elementos sejam distintos entre si 
apenas pela espécie. A posição dos elementos não importa. 
� O Número de combinações de r elementos combinados p a p sendo p<r é calculado por: 
 
)!(!
!
, prp
r
p
r
C pr
−
=





=
 
 
Nota: O Símbolo fatorial! denota o produto dos inteiros positivos em ordem decrescente. 
Por exemplo, 6! = 6.5.4.3.2.1= 720. Por definição, 0! = 1. 
 
Exemplo 6.6 
Quantas comissões de três pessoas podem ser formadas com um grupo de dez pessoas? 
Solução: Como a ordem das três pessoas na comissão não importa (não gera outra comis-
são), temos que trabalhar com combinação. 
r= 10, p=3 substituindo estes valores na fórmula temos: 
 
 
 
120
!7.1.2.3
!7.8.9.10
)!310(!3
!10
3
10
3,10 ==





−
=





=C
 PUC Minas Virtual 81 Probabilidade e Estatística 
Podemos ter 120 comissões diferentes compostas por 3 pessoas. 
� Arranjos 
São agrupamentos formados com r elementos, de forma que os r elementos sejam dis-
tintos entre si pela ordem ou pela espécie. 
� O número de arranjos de r elementos é calculado por: 
)!(
!
, pr
rA pr
−
=
 
 
Exemplo 6.7 
Considerando um grupo de dez pessoas, quantas chapas diferentes podemos ter para uma 
eleição de presidente, tesoureiro e secretário? 
Solução: Como a ordem das três pessoas na comissão gera outro resultado,, temos que 
trabalhar com Arranjos. 
r= 10, p=3 substituindo estes valores na fórmula temos: 
 
7208.9.10
!7
!7. 8. 9. 10
7!
.1 .2 3 . 4 . 5 . 6 . 7 . .8 9 . 10
)!310(
!10
3,10 ====
−
=A
 
 
Podemos ter 720 chapas diferentes. 
Obs.: Quando queremos selecionar r elementos de um conjunto de n elementos distintos sem levar 
em conta a ordem, estamos considerando combinações, quando contamos separadamente or-
denações diferentes dos mesmos elementos temos arranjos. 
 
6.5. Probabilidade Condicional e Independência de Eventos 
Probabilidade Condicional 
Podemos ter a probabilidade da ocorrência de um evento (B) dependendo da ocorrência de 
outro (A), nestes casos, teremos a probabilidade de B condicionada a A, que é definida por 
P(B\A) (lê-se Probabilidade de B dado A). 
O evento em que ambos, A e B, ocorrem é chamado A interseção B; portanto, a probabili-
dade do evento B ocorrer, dado que A ocorreu, é de: 
)(
)()(
AP
BAPABP ∩=
 
 
 PUC Minas Virtual 82 Probabilidade e Estatística 
Isso significa que a probabilidade de B ocorrer, dado que A ocorreu, é igual à probabilidade 
de ocorrência simultânea de A e B dividida pela probabilidade de ocorrência de A. (Note-se 
que essa definição não se aplica quando P(A)=0, porque então estaríamos dividindo por 
zero). 
 
Exemplo 6.8 
Dois dados são lançados. Consideremos os eventos 
A={(x1,x2) / x1+x2=10} e B={(x1,x2) / x1 > x2}, onde x1 é o resultado do dado 1 e x2 é o resulta-
do do dado 2. Avaliar P(A); P(B); P(A/B) e P(B/A). 
Solução: 
P(A)= 3/36 =1/12 
P(B) =15/36 =5/12 
P(A/B)=1/15 
P(B/A)=1/3 
 
Teorema do Produto 
“A probabilidade da ocorrência simultânea de dois eventos, A e B, do mesmo espaço amos-
tral, é igual ao produto da probabilidade de um deles pela probabilidade condicional do ou-
tro, dado o primeiro”. 
)(
)()(
BP
BAPBAP ∩=
 )(
)()(
AP
BAPABP ∩=
 
 
Independência Estatística 
Um evento A é considerado independente de um outro evento B se a probabilidade de A é 
igual à probabilidade condicional de A dado B. 
 
Exemplo 6.9 
Em um lote de 12 peças, 4 são defeituosas, 2 peças são retiradas uma após a outra, sem 
reposição. Qual a probabilidade de que ambas sejam boas? 
A = {a 1ª peça é boa} 
B = {a 2ª peça é boa} 
P(A ∩ B) = P(A). P(B/A) = 8/12.7/11 = 14/33 
Isto é, se P(A) = P(A/B) «É evidente que, se A é independente de B, B é independente de A; 
P(B) = P(B/A). Se A e B são independentes, então temos que 
P(A ∩ B) = P(A).P(B) 
 PUC Minas Virtual 83 Probabilidade e Estatística 
Regra de Bayes 
Sejam A1, A2, A3,......An, n eventos mutuamente exclusivos tais que A1 ∪ A2 ∪ An = S. 
Sejam P(Ai) as probabilidades conhecidas dos vários eventos e B um evento qualquer de S, 
tal que são conhecidas todas as probabilidades condicionais P(B/Ai). 
)/().(......)/().()/().(
)/().()/(
2211 nn
ii
i ABPAPABPAPABPAP
ABPAPBAP
+++
=
 
 
Obs.: O Teorema de Bayes é também chamado de Teorema da Probabilidade a Posteriori. Ele rela-
ciona uma das parcelas da probabilidade total com a própria probabilidade total. 
O teorema de Bayes é uma generalização da probabilidade condicional no caso de mais de 
dois eventos. 
 
Exemplo 6.10 
1. Sendo P(A) = 1/3, P(B) = ¾ e P(A ∪ B) = 11/12, calcular P(A/B). 
Solução: 
Como )(
)()/(
BP
BAPBAP ∩= )/(BP
BAPBAP=, devemos calcular P(A ∩ B). 
Como P(A ∪ B) = P(A) + P(B) – P(A ∩ B), 
temos: 11/12 = 1/3 + ¾ – P(A ∩ B) 
∴ P(A ∩ B) = 2/12 = 1/6 logo, P(A/B) = 9
2
4/3
6/1
=
 
 
2. Em certo colégio, 5% dos homens e 2% das mulheres têm mais de 1,80 m de altura. Por 
outro lado, 60% dos estudantes são homens. Se um estudante é selecionado aleatoria-
mente e tem mais de 1,80m de altura, qual a probabilidade de que o estudante seja mu-
lher? 
Solução: 
Temos que: 
P(Ma/H) = 0,05 (Probabilidade de Homem ter mais de 1,80 m) 
P(Ma/M) = 0,02 (Probabilidade de Mulher ter mais de 1,80 m) 
P(H) = 0,6 (Probabilidade de ser homem) 
P(M) = 0,4 (Probabilidade de ser mulher) 
P(M/Ma)= ? (Probabilidade de ser mulher e que tenha mais que 1,80 m) 
 PUC Minas Virtual 84 Probabilidade e Estatística 
Utilizando a Regra de Bayes temos: 
%2121,0
038,0
008,0)/(
)05,0*6,0()02,0*4,0(
02,0*4,0
)/(*)()/(*)(
)/(*)()/(
===
+
=
+
=
MaMP
HMaPHPMMaPMP
MMaPMPMaMP
 
 
3. Três máquinas, A, B e C produzem respectivamente 40%, 50% e 10% do total de peças 
de uma fábrica. As porcentagens de peças defeituosas nas respectivas máquinas são 
3%, 5% e 2%. Uma peça é sorteada ao acaso e verifica-se que é defeituosa. Qual a pro-
babilidade de que a peça tenha vindo da máquina B? E da máquina A? 
Solução: Temos que: 
P(A) = 0,4 
P(B) = 0,5 
P(C)= 0,10 
P(D/A) = 0,03 
P(D/B) = 0,05 
P(D/C) = 0,02 
P(B/D) = ? 
 
 
 
Utilizando a Regra de Bayes temos: 
%1,64641,0
039,0
025,0)/(
02,0*1,005,0*5,003,0*4,0
05,0*5,0)/(
)/(*)()/(*)()/(*)(
)/(*)()/(
===
++
=
++
=
DBP
DBP
CDPCPBDPBPADPAP
BDPBPDBP
 
 
 
 PUC Minas Virtual 85 Probabilidade e Estatística 
Capítulo 7. 
Variáveis Aleatórias 
Muitos experimentos aleatórios produzem resultados não-numéricos. Antes de ana-
lisá-los, é conveniente transformar os seus resultados em números, esta transfor-
mação é realizada por meio de uma variável aleatória.Variável aleatória é uma re-
gra de associação de um valor numérico a cada ponto do espaço amostral. Portan-
to, variáveis aleatórias são variáveis numéricas às quais iremos associar modelos 
probabilísticos. Veremos que uma variável aleatória tem um número para cada re-
sultado de um experimento e que uma distribuição de probabilidades associa uma 
probabilidade a cada resultado numérico de um experimento. 
 
7.1. Conceito de variável aleatória 
Sejam E um experimento e S o espaço associado ao experimento. Uma função X, que as-
socie a cada elemento s ∈ S um número real X(s), é denominada variável aleatória. 
 
 
 
 
 
Exemplo: 
E: lançamento de duas moedas; 
X: nº de caras obtidas nas duas moedas; 
S = {(c,c), (c,r), (r,c),(r,r)} 
X = 0 → corresponde ao evento (r,r) com probabilidade ¼ 
X = 1 → corresponde ao evento (r,c), (c,r) com probabilidade 2/4 
X = 2 → corresponde ao evento (c,c) com probabilidade ¼. 
 
Empregamos a termo variável aleatória para descrever o valor que corresponde ao resulta-
do de determinado experimento. 
As variáveis aleatórias também podem ser discretas ou continuas veja as definições: 
 
X 
Variável 
Aleatória 
s 
X(s) 
S 
R 
 PUC Minas Virtual 86 Probabilidade e Estatística 
Variáveis Aleatórias Discretas – Admite um número finito de valores, ou seja, têm uma quan-
tidade enumerável de valores. 
Variáveis Aleatórias Contínuas – pode tomar um número infinito de valores, e esses valores 
podem ser associados a mensurações em uma escala contínua. 
 
7.2. Distribuição de probabilidade 
Uma vez definida a variável aleatória, existe interesse no cálculo dos valores das probabili-
dades correspondentes. 
O conjunto das variáveis e das probabilidades correspondentes é denominado distribuição 
de probabilidades, isto é: 
{(xi,p(xi), i=1,2,….n} 
Obs.: A soma das probabilidades dos valores possíveis de X é igual a 1 (um) 
 
7.3. Função de distribuição acumulada 
É a função que descreve a probabilidade de ocorrer um valor até x assumido pela variável 
aleatória, isto é: 
)()( xXPXF ≤=
 
 
7.4. Esperança matemática, variância e desvio padrão: propriedades 
Existem características numéricas que são muito importantes em uma distribuição de pro-
babilidades de uma variável aleatória discreta. São os parâmetros das distribuições, a saber: 
� Esperança matemática (ou simplesmente média) – E (x) – é um número real, é também 
uma média aritmética; 
� Variância – VAR (x) – é a medida que dá o grau de dispersão (ou de concentração) de 
probabilidade em torno da média. O fato de conhecermos a média de uma distribuição 
de probabilidades já nos ajuda bastante, porém, precisamos de uma medida que nos dê 
o grau de dispersão de probabilidade em torno dessa média. 
� Desvio Padrão – DP(X) – é a raiz quadrada da variância. 
 
7.5. Distribuições Discretas 
Uma função X, definida sobre o espaço amostral e assumindo valores num conjunto enume-
rável de pontos do conjunto real, é dita uma variável aleatória discreta. 
 
 PUC Minas Virtual 87 Probabilidade e Estatística 
Uma variável aleatória X do tipo discreto estará bem caracterizada se indicarmos os possí-
veis valores x1, x2, …, xk que ela pode assumir e as respectivas probabilidades p(x1), p(x2), 
…, p(xk), ou seja, se conhecermos a sua função de probabilidade (x; p(x)), onde 
p(x) = P(X = x) 
 
Dada a variável aleatória discreta X, assumindo os valores x1, x2, …, xk, chamamos espe-
rança matemática de X ao valor: 
∑ ⋅= )()( xpxXE 
Chamamos variância de X ao valor: 
∑ ⋅=
−=
)()(
)]([)()(
22
22
xpxXE
onde
XEXEXVar
 
E de desvio padrão de X a 
)()( XVarXDP = 
 
 
Principais Distribuições Discretas de Probabilidade 
Vamos estudar alguns modelos probabilísticos, que podem ser usados em várias situações. 
Ressaltamos, em cada situação, devemos identificar qual modelo é o mais adequado. 
 
1. Distribuição de Bernoulli 
Dado um experimento aleatório E realizado repetidas vezes, sempre nas mesmas condi-
ções, de tal forma que o resultado pode ser um Sucesso (s) (se acontecer o evento espe-
rado) ou um Fracasso (f) (se o evento não se realizar). 
 
Seja X a variável aleatória: Sucesso ou Fracasso 
p)P(xqxP
qpp
xX
====
=−==→
==→
1 e )0(
1)p(x )p(xP(X)
(fracasso) 0ou x (sucesso) 1
21
21
 
 
Essas condições caracterizam um conjunto de Provas de Bernoulli ou um experimento de 
Bernoulli, e sua função probabilidade é dada por: 
xx qpxXP −== 1.)(
 
 PUC Minas Virtual 88 Probabilidade e Estatística 
Principais características da Distribuição de Bernoulli: 
Média: 
ppqxPxXE i
i
i =+== ∑
=
.1.0)()(
1
0
 
 
Variância: 
pqppppXVar
ppqxPxXE
XEXEXVar
i
i
i
=−=−=
=+==
−=
∑
=
)1()(
10)()(
)]([)()(
2
22
1
0
22
22
 
 
2. Distribuição Binomial 
Uma variável aleatória tem distribuição binomial quando o experimento ao qual está rela-
cionada pode apresentar apenas dois resultados (sucesso ou fracasso). Este modelo fun-
damenta-se nas seguintes hipóteses: 
� n provas independentes e do mesmo tipo são realizadas; 
� cada prova admite dois resultados – Sucesso ou Fracasso; 
� a probabilidade de sucesso em cada prova é p e de fracasso 1 – p = q 
(porque p+q= 1) 
 
Define-se a Variável X que conta o número de sucesso nas n realizações do experimento. 
(X pode assumir os valores 0, 1, 2, 3,......., n.) 
 
Fazendo sucesso corresponder a 1 e fracasso, a 0, temos: 
� Para X = 0, uma seqüência de n zeros: 000000....000. 
� qqXP==.)0( nqqqqqqqXP === .........)0( 
� Para X = 1, uma seqüência do tipo: 1000....0; 01000....0; 001000...0; serão n seqüên-
cias, cada uma com um único sucesso e n–1 fracassos: 
� 
1
..)1( −== nqpnXP 
 PUC Minas Virtual 89 Probabilidade e Estatística 
� Para X= x, tem-se x sucessos e (n–x) fracassos, correspondendo às seqüências com x 
algarismos 1 e n–x zeros. Cada seqüência terá probabilidade xnx qp − e como há 





x
n
 
seqüências distintas, tem-se: 
xnx qp
x
n
xXP −





== )(
 
 
 
Principais características da Distribuição Binomial: 
� Média: pnXE .)( = 
� Variância: pXVar)( qpnXVar ..)( = 
 
Exemplo 7.1 
Uma moeda não viciada é lançada 8 vezes. Encontre a probabilidade de: 
a) dar 5 caras; 
b) pelo menos uma cara; 
c) no máximo 2 caras. 
Solução: Utilizando o modela da distribuição binomial temos: 
a) x = sair cara, p = 0,5 (probabilidade do sucesso de X), q = 0,5 (probabilidade do fracasso 
de X0, n = 8 (número de repetições do evento). 
%88,2121875,05,0.
6.120
403205,0.5,0.)!58(!5
!8)5( 8585 ===
−
==
−XP
 
b) P(x ≥ 1) = 1 – { P(X = 0)} = 1–{ qn} = 1 – 0,58 = 0,9960 = 99,6% 
c) P(X ≤ 2) = P(X = 0) + P(x = 1) + P(X = 2), utilizando as fórmulas dos itens anteriores cal-
culam-se as probabilidades. 
 
3. Distribuição de Poisson 
Consideremos a probabilidade de ocorrência de sucessos em um determinado intervalo 
(pode ser de tempo, de espaço físico, depende do experimento). A probabilidade da ocor-
rência de um sucesso no intervalo é proporcional ao intervalo. A probabilidade de mais de 
um sucesso nesse intervalo é bastante pequena em relação à probabilidade de um su-
cesso. 
Expressão geral da 
distribuição Binomial 
 PUC Minas Virtual 90 Probabilidade e Estatística 
Seja X o número de sucessos no intervalo; temos, então: 
!
.)(
k
ekXP
kλλ−
== média. a é onde λ 
 
A variável X assim definida tem distribuição de Poisson. 
A distribuição de Poisson é uma medida muito usada no cálculo da probabilidade de: 
� Carros que passam por um cruzamento por minuto, durante uma certa hora do dia;� Erros tipográficos por página, em um material impresso; 
� Defeitos por unidade (m³, m², m, etc.,,) por peça fabricada; 
� Colônias de bactérias numa dada cultura por 0,01mm², numa plaqueta de microscópio; 
� Mortes por ataque de coração por ano, numa cidade; 
� Problemas de filas de espera em geral, e outros. 
 
Principais características da distribuição de Poisson: 
� Média: λ=)(XE 
� Variância: λ=)(XVar 
Obs.: Muitas vezes, no uso da distribuição binomial, acontece que n é muito grande e p é muito 
pequeno. Podemos, então, fazer uma aproximação de binomial pela distribuição de Pois-
son, da seguinte forma: 
np=λ
 
 
Exemplo 7.2 
Em média, são feitas 2 chamadas por hora para certo telefone. Calcular a probabilidade de 
se receber no máximo 3 chamadas em 2 horas e a probabilidade de nenhuma chamada em 
90 minutos. 
 
Solução: No exemplo acima temos uma média de acontecimento por intervalo de tempo, por 
isto vamos utilizar a Distribuição de Poisson para calcular a Probabilidade pedida. 
λ = 2 por hora, para 2 horas λ= 4 (é proporcional ou seja se λ= 2 para uma hora, para 2 ho-
ras λ = 4) 
x= número de chamadas 
Pede-se para calcular a probabilidade de no máximo 3 chamadas, ou seja estamos queren-
do os valores de x menores que 3 
 PUC Minas Virtual 91 Probabilidade e Estatística 
P(X ≤ 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) ∴ 
P(X ≤ 3) = 
!3
.
!2
.
!1
.
!0
.
3210 λλλλ λλλλ −−−−
+++
eeee
∴ 
P(X ≤ 3) =
6
4.
2
4.
1
4.
1
4. 34241404 −−−−
+++
eeee
∴ 
P(X ≤ 3) = %34,434334,066,23666,1084 44444 ===+++ −−−−− eeeee 
Agora para 90 minutos λ = 3 (1 hora (60 minutos) λ = 2) 
P(X = 0) = 3
03
1
3.
−
−
= e
e
= 0,0498 = 4,98 % 
 
7.6. Distribuição contínua 
Uma variável aleatória, cujos valores são expressos em uma escala contínua, é chamada de 
variável aleatória contínua. 
Podemos construir modelos teóricos para v.a.’s contínuas, escolhendo adequadamente a 
função de densidade de probabilidade (f.d.p.), que é uma função indicadora da probabilida-
de nos possíveis valores de X. 
Assim, a área sob a f.d.p. entre dois pontos a e b nos dá a probabilidade da variável assumir 
valores entre a e b, conforme ilustrado na figura 7.1, apresentada a seguir. 
Figura 7.1. Probabilidade como área sob a curva entre dois pontos 
a b
P(a<X<b)
 
 
Portanto, podemos escrever: 
Da relação entre a probabilidade e a área sob a função, a inclusão, ou não, dos extremos a 
e b na expressão acima não afetará os resultados. Assim, iremos admitir: 
∫=<<
b
a
dxxfbXaP )()( 
)()()()( bXaPbXaPbXaPbXaP ≤≤=≤<=<≤=<< 
 PUC Minas Virtual 92 Probabilidade e Estatística 
Teoricamente, qualquer função f(x) que seja não negativa e cuja área total sob a curva seja 
igual à unidade, isto é, 
∫ = 1)( dxxf 
caracterizará uma v.a. contínua. 
 
Dada a v.a. contínua X, assumindo os valores no intervalo entre a e b, chamamos valor mé-
dio ou esperança matemática de X ao valor 
∫ ⋅=
b
a
dxxfxXE )()( 
 
Chamamos variância de X ao valor 
∫ ⋅=
−=
b
a
dxxfxXE
onde
XEXEXVar
)()(
)]([)()(
22
22
 
 
e de desvio padrão de X a 
)()( XVarXDP = 
 
Se X é uma v.a. contínua com f.d.p. f(x), definimos a sua função de distribuição acumulada 
F(x) como: 
 
Principais Modelos Contínuos de Probabilidade 
1. Distribuição Normal 
A distribuição normal é a mais importante das distribuições de probabilidades. Conhecida 
como a “curva em forma de sino”, a distribuição normal tem sua origem associada aos er-
ros de mensuração. É sabido que quando se efetuam repetidas mensurações de determi-
nada grandeza com um aparelho equilibrado, não se chega ao mesmo resultado todas as 
vezes; obtém-se, ao contrário, um conjunto de valores que oscilam, de modo aproxima-
damente simétrico, em torno do verdadeiro valor. Construindo-se o histograma desses va-
lores, obtém-se uma figura com forma aproximadamente simétrica. Gauss deduziu mate-
maticamente a distribuição normal como distribuição de probabilidade dos erros de obser-
vação, denominando-a então “lei normal dos erros”. 
 PUC Minas Virtual 93 Probabilidade e Estatística 
Supunha-se inicialmente que todos os fenômenos da vida real devessem se ajustar a uma 
curva em forma de sino; em caso contrário, suspeitava-se de alguma anormalidade no 
processo de coleta de dados. Daí a designação de curva normal. 
A observação cuidadosa subseqüente mostrou, entretanto, que essa pretensa universali-
dade da curva, ou distribuição normal, não correspondia à realidade. De fato, não são 
poucos os exemplos de fenômenos da vida real representados por distribuições não nor-
mais, curvas assimétricas, por exemplo. Mesmo assim, a distribuição normal desempenha 
papel preponderante na estatística, e os processos de inferência nela baseados têm larga 
aplicação. 
A distribuição normal tem sua função de densidade de probabilidade dada por 
f(x) = 
( )1
2 2
2
2σ pi
µ
σ
exp −
−








x
 
− < <∞ ∞x
 
Como se pode observar por meio da equação acima, a distribuição normal inclui os parâ-
metros µ e σ, os quais possuem os seguintes significados: 
µ: posição central da distribuição (média, µx) 
σ: dispersão da distribuição (desvio padrão, σx) 
Se uma variável aleatória X tem distribuição normal com média µ e variância σ2, escre-
vemos: X ∼ N(µ,σ2) 
A figura 7.2 ilustra uma curva normal típica, com seus parâmetros descritos graficamente. 
Figura 7.2. Curva normal típica 
µµµµ
σσσσ
µ: média
σ: desvio padrão
x
f(x)
 
 
Propriedades da distribuição normal: 
Para uma mesma média µ e diferentes desvios padrão σ, a distribuição que tem maior des-
vio padrão se apresenta mais achatada, acusando maior dispersão em torno da média. A 
que tem menor desvio padrão apresenta “pico” mais acentuado e maior concentração em 
 PUC Minas Virtual 94 Probabilidade e Estatística 
torno da média. A figura 7.3 compara três curvas normais, com a mesma média, porém, com 
desvios padrão diferentes. A curva A se apresenta mais dispersa que a curva B, que por sua 
vez se apresenta mais dispersa que a curva C. Nesse caso, σA > σB > σC. 
Distribuições normais com o mesmo desvio padrão e médias diferentes possuem a mesma 
dispersão, mas diferem quanto à localização. Quanto maior a média, mais à direita está a 
curva. A figura 7.4 ilustra o fato, onde a curva A possui média maior que a curva B(µA > µB). 
 
Figura 7.3. Distribuições normais com mesma média e desvios padrão diferentes 
µ
A
B
C
 
 
Figura 7.4. Distribuições normais com mesmo desvio padrão e médias diferentes 
µAµB
B A
 
 
Como descrito anteriormente, a probabilidade de uma variável assumir valores entre a e b é 
igual à área sob a curva entre esses dois pontos. A determinação dessas probabilidades é 
realizada matematicamente através da integração da função de densidade de probabilidade 
entre os pontos a e b de interesse. No caso da normal, a integral não pode ser calculada 
exatamente e a probabilidade entre dois pontos só pode ser obtida de forma aproximada, 
por métodos numéricos. Essa tarefa é facilitada através do uso da distribuição normal pa-
drão definida a seguir no próximo item.. 
 PUC Minas Virtual 95 Probabilidade e Estatística 
No caso da distribuição normal, algumas dessas áreas – com os pontos a e b, função da 
média µ e do desvio padrão σ −  são bastante difundidas e estão representadas na figura 
7.5: 
Figura 7.5. Probabilidades da distribuição normal 
68.26 %
99.73 %
µ µ+σ µ+3σ
µ+2σ
µ-σ
µ-2σ
µ-3σ
95.46 %
 
Portanto, 68,26% dos valores populacionais caem entre os limites definidos como média 
mais ou menos um desvio padrão (µ ± 1σ); 95,46% dos valores caem entre médiamais ou 
menos dois desvios padrão (µ ± 2σ); e 99,73% dos valores caem entre média mais ou me-
nos três desvios padrão (µ ± 3σ). 
 
A distribuição normal padrão: 
A distribuição normal particular com média 0 e desvio padrão 1 é chamada de distribuição 
normal padrão e costuma ser denotada por Z. 
Se X ∼ N(µ,σ2), então, a variável aleatória definida por 
Z = 
X − µ
σ 
 
terá uma distribuição N(0,1). Essa transformação é ilustrada pela figura 7.6: 
 
 PUC Minas Virtual 96 Probabilidade e Estatística 
Figura 7.6. Transformação de uma N(µ,σ2) para uma N(0,1) 
µ µ+σ µ+3σ
µ+2σ
µ-σ
µ-2σ
µ-3σ
X
X - µ
 σ
0 1 2 3-1-2-3
Z
 
 
A área à esquerda de um valor especificado da N(0,1) encontra-se tabelada. Utilizando-se a 
transformação acima, podemos obter as probabilidades para qualquer N(µ,σ2). O procedi-
mento é ilustrado através do exemplo abaixo. 
 
Exemplo 7.3 
Extrudados tubulares possuem tensão de escoamento (tensão a partir da qual o material se 
deforma plasticamente), que segue uma distribuição normal com média de 210 MPa com 
desvio padrão de 5 MPa. Em notação estatística, X ∼ N(210,52). É desejado que tais extru-
dados tenham tensão de escoamento de pelo menos 200 MPa. Portanto, a probabilidade do 
extrudado não atingir a especificação desejada é: 
 
Solução: P(X < 200) = P Z <
−





200 210
5 = P(Z < –2). 
A figura 7.7 mostra a transformação realizada e a área desejada. 
 
 PUC Minas Virtual 97 Probabilidade e Estatística 
Figura 7.7. Probabilidade do extrudado não atingir a especificação desejada 
180 190 200 210 220 230 240
X
-6 -4 -2 0 2 4 6
Z
P(X<200)
P(Z<-2)
 
 
Para cálculo dessa probabilidade, utilizamos a tabela de distribuição normal padronizada 
(que se encontra no apêndice do livro indicado na bibliografia básica). Observe que a tabela 
traz apenas a P(Z<z) para z não negativo (z ≥ 0). As propriedades que se seguem podem 
ser deduzidas a partir da simetria da densidade em relação à média 0, e são úteis na obten-
ção de outras áreas não tabuladas. 
� P(Z>z) = 1 – P(Z<z) 
� P(Z<–z) = P(Z>z) 
� P(Z>–z) = P(Z<z) 
Figura 7.8. Áreas correspondentes na distribuição normal 
-z z
1 - P(Z < z)P(Z < -z)
 
Utilizando as relações apresentadas acima, a probabilidade do extrudado não atender à 
especificação é 
P(X < 200) = P(Z < –2) = P(Z > 2) = 1 – P(Z < 2) 
que, através da tabela da N(0,1) é igual a 
P (X < 200) = 1 – 0,97725 = 0,02275 = 2,275% 
 PUC Minas Virtual 98 Probabilidade e Estatística 
Capítulo 8. 
Inferência Estatística 
A Inferência Estatística é o processo de obter informações sobre uma população a 
partir de resultados observados na amostra. 
De modo geral, tem-se uma população com grande número de elementos e deseja-
se, a partir de uma amostra dessa população, conhecer “o mais próximo possível” 
algumas características da população. 
Toda conclusão tirada por uma amostragem, quando generalizada para a população, 
virá acompanhada de um grau de incerteza ou risco. Ex: pesquisas realizadas pelo 
Data Folha, Vox Populi, Pesquisa eleitoral. 
Ao conjunto de técnicas e procedimentos que permite dar ao pesquisador um grau 
de confiabilidade, de confiança nas afirmações que faz para a população, baseadas 
nos resultados das amostras, damos o nome de Inferência Estatística. 
O problema fundamental da Inferência Estatística, portanto, é medir o grau de incer-
teza ou risco dessas generalizações. Os instrumentos da Inferência Estatística per-
mitem a viabilidade das conclusões por meio de afirmações estatísticas. 
 
8.1. População e amostra; Estatísticas e parâmetros; Distribuições amostrais 
Se um conjunto de dados consiste de todas as observações possíveis (concebíveis ou hipo-
téticas), é chamado uma população; se um conjunto de dados consiste apenas de uma par-
te dessas observações, é chamado uma amostra. 
Um dos principais objetivos da maioria dos estudos, análises ou pesquisas estatísticas é 
fazer generalizações seguras – com base em amostras – em relação às populações das 
quais se extraíram as amostras. 
Definições 
Parâmetro: é a medida usada para descrever uma característica numérica populacional. 
Genericamente é representado por θ. A média (µ), a variância (σ2) e o coeficiente de cor-
relação (ρ) são alguns exemplos de parâmetros populacionais. 
Estimador: também denominado estatística de um parâmetro populacional. É uma caracte-
rística numérica determinada na amostra, uma função de seus elementos. Genericamente, é 
representado por θ’. A média amostral (x) e a variância amostral (s2) são alguns dos exem-
plos de estimadores. 
 
 PUC Minas Virtual 99 Probabilidade e Estatística 
 
 
 
 
 
 
 
Distribuição Amostral 
Considere todas as possíveis amostras de tamanho n que podem ser extraídas de determi-
nada população. Se para cada uma delas se calcular um valor do estimador, tem-se uma 
distribuição amostral desse estimador. Como o estimador é uma variável aleatória, pode-se 
determinar suas características, isto é, encontrar sua média, variância, desvio-padrão. 
As distribuições amostrais são fundamentais para o processo de inferência estatística. 
 
Distribuição Amostral da Média 
Sabe-se que 
n
x
x
i∑
='
 (média aritmética) é um estimador da média populacional µ. O esti-
mador x’ é uma variável aleatória; portanto, busca-se conhecer sua distribuição de probabili-
dade. 
 
Teorema 1 – A média da distribuição amostral das médias, denotada por µ(x’), é igual à 
média populacional µ. 
 
 
Assim, é provado que a média das médias amostrais é igual à média populacional. 
 
Teorema 2 – Se a população é infinita, ou se a amostragem é com reposição, então a vari-
ância da distribuição amostral das médias, denotada por σ2(x’), é dada por: 
2
2
'
)'(
n
xVAR x
σ
σ ==
 
POPULAÇÃO 
AMOSTRAS ESTIMADORES: θθθθ’ 
PARÂMETROS: θθθθ 
E (x’) = µ(x’) = µ 
 PUC Minas Virtual 100 Probabilidade e Estatística 
Teorema 3 – Se a população é finita, ou se a amostragem é sem preposição, então a vari-
ância da distribuição amostral das médias é dada por: 






−
−
=
1
)'(
2
2
N
nN
n
x
σ
σ 
E o desvio padrão 1' −
−
=
N
nN
n
x
σ
σ 
Sendo que: µ (x’) = µ 
 
Teorema 4 – Se a população tem ou não distribuição normal com média µ e variância σ2, 
então a distribuição das médias amostrais será normalmente distribuída com média µ e va-
riância 
n
2σ
. 
Esses quatro teoremas provam que a média amostral (x’) tem distribuição normal com mé-
dia igual à média da população (µ) e variância dada por 
n
2σ
 para populações infinitas, as-
sim como 





−
−
1
2
N
nN
n
σ para populações finitas. Ou, ainda: 






≈
n
Nx
2
;'
σµ
 ou 











−
−
≈
1
;'
2
N
nN
n
Nx σµ







≈;'
N
NNxσµ
 
com distribuições padronizadas dadas por: 
n
x
Z ii σ
µ−
=
 ou 






−
−
−
=
1N
nN
n
xZ ii
σ
µ
 
 
 
Exemplo 8.1 
Temos uma população de 5000 alunos de uma faculdade. Sabemos que a altura média dos 
alunos é de 175 cm e o desvio padrão, de 5 cm. Retiramos uma amostra sem reposição, de 
tamanho n = 100. Qual o valor do desvio padrão amostral? 
Para população infinita Para população finita 
 PUC Minas Virtual 101 Probabilidade e Estatística 
Solução: 
X: N (175, 25 cm) 



=
=
cm
cm
5
175
σ
µ
 
4950,0
15000
1005000
10
5
1
=
−
−
=
−
−
=
N
nN
n
x
σ
σ 
 
 
8.2. Estimação 
Há dois tipos fundamentais de estimação: por ponto e por intervalo.Estimação pontual 
O problema da estimação pontual surge quando estamos interessados em alguma caracte-
rística numérica de uma distribuição desconhecida (ex: média, variância) e desejamos calcu-
lar, a partir de observações, um número que inferimos que seja uma aproximação da carac-
terística numérica em questão. 
Para ilustrar alguns dos problemas com os quais nos deparamos quando estimamos a mé-
dia de uma população com base em dados amostrais, vamos recorrer a um estudo em que 
planejadores industriais procuraram determinar o tempo médio que um adulto leva para 
montar um robô “fácil de montar”. Com uma amostra aleatória obtém-se os seguintes dados 
(em minutos) para 36 pessoas que montaram o robô: 
 
17 13 18 19 17 21 29 22 16 28 
21 15 26 23 24 20 8 17 17 21 
32 18 25 22 16 10 20 22 19 14 
30 22 12 24 28 11 
 
A média desta amostra é x’ = 19,9 minutos. Na ausência de qualquer outra informação, po-
demos tomar esta cifra como uma estimativa de µ, o “verdadeiro” tempo médio que um adul-
to leva para montar o robô. 
Esse tipo de estimativa é chamada estimativa pontual, pois consiste de um único número, 
ou um único ponto na escala dos números reais. Embora se trate da forma mais comum de 
expressar estimativas, ela deixa margem para não poucas questões. Por exemplo, não nos 
diz em quantas informações a estimativa se baseia, nem tampouco nos informa sobre o ta-
manho possível do erro. 
 PUC Minas Virtual 102 Probabilidade e Estatística 
Estimação por intervalo 
A estimação por pontos de um parâmetro não possui uma medida do possível erro cometido 
na estimação, daí surge a idéia de construir os intervalos de confiança, que são baseados 
na distribuição amostral do estimador pontual. 
Uma maneira de expressar a precisão da estimação é estabelecer limites que, com certa 
probabilidade, incluam o verdadeiro valor do parâmetro da população. Esses limites são 
chamados “limites de confiança”: determinam um intervalo de confiança, no qual deverá 
estar o verdadeiro valor do parâmetro. Logo, a estimação por intervalo consiste na fixação 
de dois valores tais que (1 – α) seja a probabilidade de que o intervalo, por eles determina-
do, contenha o verdadeiro valor do parâmetro. 
 
α: nível de incerteza ou grau de desconfiança 
1 – α: coeficiente de confiança ou nível de confiabilidade. 
 
Portanto, α nos dá a medida da incerteza dessa inferência (nível de significância). Logo, a 
partir das informações de amostra, devemos calcular os limites de um intervalo, valores crí-
ticos que em (1 – α)% dos casos inclua o valor do parâmetro a estimar e em α% dos casos 
não inclua o valor do parâmetro. 
 
Intervalo de confiança (IC) para a média populacional (µµµµ) quando a Variância (σσσσ2) é 
conhecida. 
Como se sabe, o estimador de µ é x’. Também é conhecida a distribuição de probabilidade 
de x’: 






≈
n
Nx
2
;'
σµ
 para as populações infinitas, 












−
−
≈
1
;'
2
N
nN
n
Nx σµ
 para as populações finitas. 
 
Assim, para o caso de populações infinitas, a variável padronizada de x’ será: 
n
xZ
σ
µ−
=
'
 
 
 PUC Minas Virtual 103 Probabilidade e Estatística 
Fixando-se um nível de confiança 1 – α, tem-se: 
 
 
Ou seja: ααα −=






≤≤− 1
22
ZZZP 
Substituindo-se o valor de Z, tem-se: α
σ
µ
αα −=












≤
−
≤− 1'
22
Z
n
xZP 
 
Resolvendo-se as duas inequações para µ, tem-se o intervalo de confiança para a média 
populacional (µ) quando a variância (σ2) é conhecida: 
 
α
σµσ αα −=






+≤≤− 1''
22 n
Zx
n
ZxP 
 
Como poderá ser verificado, a aplicação da fórmula é extremamente simples. Fixa-se o valor 
de 1 – α, ou (1 – α)100= %, e observa-se na tabela de distribuição normal padrão o valor 
das abscissas que deixam α/2 em cada uma das caudas. Com os valores de x’ (média a-
mostral), σ=desvio padrão da população, que neste caso é conhecido, e n (tamanho da a-
mostra), constrói-se o intervalo. 
Para o caso de populações finitas, usa-se a seguinte fórmula: 
 
α
σµσ αα −=






−
−
+≤≤
−
−
− 1
1
'
1
'
22 N
nN
n
Zx
N
nN
n
ZxP 
 
 PUC Minas Virtual 104 Probabilidade e Estatística 
Exemplo 8.2 
A duração da vida de uma peça de equipamento é tal que σ =5 horas. Foram amostradas 
100 dessas peças, obtendo-se a média de 500 horas. Deseja-se construir um intervalo de 
confiança para a verdadeira duração média da peça com um nível de 95%. 
 
Solução: 
σ = 5; n = 100 x’ = 500 (1 – α)100=95% 
o gráfico da distribuição normal padrão será: 
 
lembre-se que para descobrir a abscissa 1,96, entrou-se na tabela de distribuição normal 
padronizada com o valor 0,475 = 47,5, já que a tabela é de faixa central. 
 
Substituindo na fórmula: 
α
σµσ αα −=






+≤≤− 1''
22 n
Zx
n
ZxP 
%95
100
596,1500
100
596,1500 =





+≤≤− µP
 
 
Efetuando os cálculos temos: 
P(499,02 ≤ µ ≤ 500,98) = 95% 
 
 
8.3. Testes de Hipóteses 
Trata-se de uma técnica para se fazer inferência estatística. Ou seja, a partir de um teste de 
hipóteses realizado com os dados amostrais, pode-se fazer inferências sobre a população. 
 
95% 
2,5% 
2,5% 
-1,96 1,96 
 PUC Minas Virtual 105 Probabilidade e Estatística 
Principais conceitos 
Hipóteses Estatística – Trata-se de uma suposição quanto ao valor de um parâmetro popu-
lacional, ou quanto à natureza da distribuição de probabilidade de uma variável populacio-
nal. São exemplos de hipóteses estatísticas: 
a) Os chips da marca A têm vida média H: µ = µ0; 
b) O nível de inteligência de uma população de universitários é H: µ = µ; 
c) O aço produzido pelo processo A é mais duro que o aço produzido pelo processo B: µA > 
µB; 
d) A altura média da população brasileira é de 1,65m, isto é: H: µ=1,65m; 
e) A variância populacional dos salários vale R$ 5.0002, isto é: H: σ2=5.0002; 
f) A proporção de paulistas com a doença X é de 40 %, ou seja: H: p=0,40; 
g) A distribuição dos pesos dos alunos da nossa faculdade é normal; 
h) A chegada de navios ao porto de Santos é descrita por uma distribuição de Poisson. 
 
Formulamos duas hipóteses básicas: 
� Ho: hipótese nula ou da existência; 
� H1: hipótese alternativa. 
 
Testamos hipóteses para tomarmos uma decisão entre duas alternativas. Por essa razão, o 
Teste de Hipótese é um Processo de Decisão Estatística. 
Tipos de Hipótese – Designa-se por H0, chamada hipótese nula, a hipótese estatística a ser 
testada, e por H1 a hipótese alternativa. A hipótese nula expressa uma igualdade, enquanto 
a hipótese alternativa é dada por uma desigualdade. 
 
Exemplo 8.3 
bicaudal) testeum a origem (dá bilaterais testespara 
65,1:
65,1:
1
0



≠
=
mH
mH
µ
µ
 
direita) à unilateral testeum a origem (dá direita à sunilaterai testespara 
65,1:
65,1:
1
0



>
=
mH
mH
µ
µ
 
esquerda) à unicaudal testeum a origem (dá esquerda à sunilaterai testespara 
65,1:
65,1:
1
0



<
=
mH
mH
µ
µ
 
 PUC Minas Virtual 106 Probabilidade e Estatística 
O procedimento padrão para a realização de um Teste de Hipóteses é o seguinte: 
� Definem-se as hipóteses do teste: nula e alternativa; 
� Fixa-se um nível de significância α; 
� Levanta-se uma amostra de tamanho n e calcula-se uma estimativa θ’0 do parâmetro θ; 
� Usa-se para cada tipo de teste uma variável cuja distribuição amostral do estimador dos 
parâmetros seja a mais concentrada em torno do verdadeiro valor do parâmetro; 
� Calcula-se com o valor do parâmetro θ0, dadopor H0, o valor crítico, valor observado na 
amostra ou valor calculado (Vcalc); 
� Fixa-se duas regiões: uma de não rejeição de H0 (RNR) e uma de rejeição de H0 ou críti-
ca (RC) para o valor calculado, ao nível de risco dado; 
� Se o valor observado (Vcalc) ∈ Região de Não Rejeição, a decisão é a de não rejeitar H0; 
� Se Vcalc ∈ Região Crítica, a decisão é a de rejeitar H0. 
 
Devemos observar que quando se fixa α, determinamos para os testes bilaterais, por exem-
plo, valores críticos (tabelados), Vα, tais que: 
P(|Vcalc|< Vα)=1 – α → RNR 
P(|Vcalc| ≥ Vα)= α → RC 
 
Testes de Hipóteses para a Média de Populações normais com variâncias (σσσσ2) 
conhecidas 
Exemplo 8.4 – Testes Bilaterais 
De uma população normal com variância 36, toma–se uma amostra casual de tamanho 16, 
obtendo-se x’=43. Ao nível de 10%, testar as hipóteses: 



≠
=
45
45
1
0
µ
µ
:
:
H
H
 
Solução: Como o teste é para média de populações normais com variância conhecida, usa-
remos a variável Z: N(0,1) como critério. 
σ2=36 x’=43 n=16 
'
'
x
HxZ
σ
µ 0−
=
´ n
x
σ
σ =
'
 
 PUC Minas Virtual 107 Probabilidade e Estatística 
Como o teste é bilateral e α =10%, a Região de Não Rejeição, (RNR), é: 
P(|Z|< Zα)=1 – α → P(|Z|<1,64)=0,90 
Zα=Z5%=1,64 
E a Região de Rejeição (RC) é dada por: 
( ) 100641 ,),( =≥→=≥ ZPZZP αα
 
 
Como Zcalc=–1,33 
Temos que Zcalc ∈ RNR 
Logo, a decisão é não rejeitarmos H0, isto é, a média é de 45, com 10% de risco de não re-
jeitarmos uma hipótese falsa. 
 
Exemplo 8.5 – Testes Unilateral (Monocaudal) à Esquerda 
Uma fábrica anuncia que o índice de nicotina dos cigarros da marca X apresenta-se abaixo 
de 26 mg por cigarro. Um laboratório realiza 10 análises do índice obtendo: 26, 24, 23, 22, 
28, 25, 27, 26, 28, 24. Sabe-se que o índice de nicotina dos cigarros da marca X se distribui 
normalmente com variância 5,36 mg2. Pode-se aceitar a afirmação do fabricante, ao nível 
de 5%? 



<
=
26
26
1
0
µ
µ
:
:
H
H
 
 
 
 PUC Minas Virtual 108 Probabilidade e Estatística 
∴RNR= (–1,64; +∞) 
∴RC = (–∞; –1,64] 
∴Zcalc ∈ RNR 
Não se rejeita H0, isto é, ao nível de 5% podemos concluir que a afirmação do fabricante é 
falsa. 
 
Exemplos 8.6 – Testes Unilateral (Monocaudal) à Direita 
Um fabricante de lajotas de cerâmica introduz um novo material em sua fabricação e acredi-
ta que aumentará a resistência média, que é de 206 kg. A resistência das lajotas tem distri-
buição normal, com desvio padrão de 12 kg. Retira-se uma amostra de 30 lajotas, obtendo-
se X’ =210 kg. Ao nível de 10%, pode o fabricante aceitar que a resistência média de suas 
lajotas tenha aumentado? 



>
=
206
206
1
0
µ
µ
:
:
H
H
 
 
 
∴RNR=(–∞; 1,28) 
∴RC = [1,28; +∞) 
∴Zcalc ∈ RC 
Como Zcalc > Zα, rejeita-se H0, isto é, ao nível de 10% o fabricante pode concluir que a resis-
tência média de suas lajotas aumentou. 
 
Erros de Decisão 
Tipos de Erro – Há dois tipos possíveis de erro ao testar uma hipótese estatística. Pode-se 
rejeitar uma hipótese quando ela é, de fato, verdadeira, ou aceitar uma hipótese quando ela 
é, de fato, falsa. A rejeição de uma hipótese verdadeira é chamada “erro tipo I”. A aceitação 
de uma hipótese falsa constitui um “erro tipo II”. 
As probabilidades desses dois tipos de erros são designadas, respectivamente, por α e β. 
A probabilidade α do erro tipo I é denominada “nível de significância” do teste. 
 PUC Minas Virtual 109 Probabilidade e Estatística 
Resumindo: 
 
Realidade 
 
H0 verdadeira H0 falsa 
Aceitar H0 Decisão Correta (1–α) Erro tipo II (β) 
Decisão 
Rejeitar H0 Erro tipo I (α) Decisão Correta (1 – β) 
 
Observe que o erro tipo I só poderá ser cometido se, se rejeitar H0; e o erro do tipo II, quan-
do se aceitar H0. 
O objetivo, obviamente, é reduzir ao mínimo as probabilidades dos dois tipos de erros. Infe-
lizmente, essa é uma tarefa difícil porque, para uma amostra de determinado tamanho, a 
probabilidade de se incorrer em um erro tipo II aumenta à medida que diminui a probabilida-
de do erro I. E vice-versa. A redução simultânea dos erros poderá ser alcançada pelo au-
mento do tamanho da amostra. 
 
 
 PUC Minas Virtual 110 Probabilidade e Estatística 
Capítulo 9. 
Correlação e Regressão Linear 
Em muitas situações, torna-se interessante e útil estabelecer uma relação entre duas 
ou mais variáveis. A matemática estabelece vários tipos de relações entre variáveis, 
por exemplo, as relações funcionais e as correlações. 
 
Relações Funcionais 
São relações matemáticas expressas por sentenças matemáticas, cujos exemplos apresen-
tamos a seguir: 
� Área do retângulo (A=a.b) é a relação entre os lados do retângulo; 
� Densidade de massa (dm= m/v) é a relação entre a massa e o volume de um corpo; 
� Perímetro de uma circunferência (C=2piR) é a relação entre o comprimento da circunfe-
rência e o valor do raio. 
 
Relações Estatísticas e Correlações 
São relações estabelecidas após uma pesquisa. Com base nos resultados da pesquisa, são 
feitas comparações que eventualmente podem conduzir (ou não) à ligação entre as variá-
veis. 
 
Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe 
social de uma pessoa e o número de viagens por ela realizado. 
No estudo estatístico, a relação entre duas ou mais variáveis denomina-se correlação. A 
utilidade e importância das correlações entre duas variáveis podem conduzir à descoberta 
de novos métodos, cujas estimativas são vitais em tomadas de decisões. 
 
9.1. Diagrama de dispersão 
O diagrama de dispersão é um gráfico cartesiano em que cada um dos eixos corresponde 
às variáveis correlacionadas. A variável dependente (Y) situa-se no eixo vertical e o eixo das 
abscissas é reservado para a variável independente (X). Os pares ordenados formam uma 
nuvem de pontos. 
 PUC Minas Virtual 111 Probabilidade e Estatística 
A configuração geométrica do diagrama de dispersão pode estar associada a uma linha reta 
(correlação linear), uma linha curva (correlação curvilínea) ou, ainda, ter os pontos dispersos 
de maneira que não definam nenhuma configuração linear; nessa última situação, não há 
correlação. 
Figura 9.1. Diagramas de dispersão 
0
10
20
30
40
50
60
70
80
90
100
0 1 2 3 4 5 6
 
Correlação Linear 
0
2
4
6
8
10
12
14
16
18
0 1 2 3 4 5
 
Correlação Curvilínea 
 
9.2. Correlação Linear 
Correlação linear é uma correlação entre duas variáveis, cujo gráfico aproxima-se de uma 
linha. É uma linha de tendência, porque procura acompanhar a tendência da distribuição de 
pontos, que pode corresponder a uma reta ou a uma curva. Por outro lado, é, também, uma 
linha média, porque procura deixar a mesma quantidade de pontos abaixo e acima da linha. 
 
Figura 9.2. Diagramas de dispersão de diversos tipos de correlação. 
0
5
10
15
20
25
0 1 2 3 4 5 6
 
Correlação linear negativa 
0
10
20
30
40
50
60
70
80
90
100
0 1 2 3 4 5 6
 
Correlação linear positiva 
5
5,5
6
6,5
7
7,5
8
8,5
0 2 4 6 8 10 12 14
 
Não há correlação 
0
2
4
6
8
10
12
14
16
18
0 1 2 3 4 5
Correlação curvilínea direta 
 PUC Minas Virtual 112 Probabilidade e Estatística 
Para definir se a correlação entre as variáveis corresponde a uma linha reta ou a uma curva, 
pode-se utilizar modos qualitativos ou quantitativos. 
No modo qualitativo, vai imperar o “bom senso” do pesquisador para verificar qual o grau de 
intensidade na correlação entre as variáveis; isso significa o estabelecimento de uma rela-
ção numérica que medirá o nível da correlação. 
 
9.3. Coeficiente de Correlação Linear(r) 
O coeficiente de correlação linear pode ser apresentado como uma medida de correlação, 
pois tem como objetivo indicar o nível de intensidade que ocorre na correlação entre as vari-
áveis. O coeficiente de correlação linear pode ser positivo ou negativo. O sinal positivo do 
coeficiente de correlação linear indica que o sentido da correlação corresponde a uma reta 
de inclinação descendente, e o sinal negativo corresponde a uma reta de inclinação ascen-
dente. Uma das formas de se medir o coeficiente de correlação linear foi desenvolvido por 
Pearson e recebe o nome de coeficiente de correlação de Pearson. O coeficiente de corre-
lação de Pearson mede o grau de ajustamento dos valores em torno de uma reta. 
 
Coeficiente de Correlação de Pearson (r): 
( )( )
( )[ ] ( )[ ]∑ ∑∑ ∑
∑ ∑∑
−−
−
=
2222
* iiii
iiii
yynxxn
yxyxn
r
 
Temos 
r = o coeficiente de Pearson 
n = o número de observações 
xi = variável independente 
yi =variável dependente 
 
O valor do coeficiente de correlação r tem a variação entre +1 e –1, ou seja, está limitado 
entre os valores do Intervalo [–1,+1]. 
� r = +1 (correlação positiva entre as variáveis); 
� r = – 1 (correlação perfeita negativa entre as variáveis); 
� r = 0 (não há correlação entre as variáveis ou, ainda, a correlação não é linear, caso exis-
ta). 
Quanto mais próximo o valor de r estiver do valor “1”, mais forte a correlação linear. 
Quanto mais próximo o valor de r estiver do valor “0”, mais fraca a correlação linear. 
 PUC Minas Virtual 113 Probabilidade e Estatística 
Em geral, multiplica-se o valor de r por 100; dessa forma, o resultado passa a ser expresso 
em porcentagem. Na prática, estabelecem-se critérios para verificar os diversos níveis do 
fraco ao forte, chegando até o perfeito: 
� 0< |r| <0,3: a correlação é fraca e fica difícil estabelecer relação entre as variáveis. Em 
porcentagem: 0< |r| < 30%; 
� 0,3 ≤ |r| < 0,6: a correlação é fraca, porém, podemos considerar a existência de relativa 
correlação entre as variáveis. Em porcentagem: 30% ≤ |r| < 60%; 
� 0,6 ≤ |r| <1: a correlação é de média para forte; a relação entre as variáveis é significati-
va, o que permite coerência com poucos conflitos na obtenção das conclusões. Em por-
centagem: 60% ≤ |r| ≤ 100 %. 
 
Exemplo 9.1 
Uma pesquisa pretende verificar se há correlação significativa entre o peso total do lixo des-
cartado, por dia, numa empresa com o peso do papel contido nesse lixo. 
 
Hotel H1 H2 H3 H4 H5 H6 H7 H8 H9 H10 
Peso total 10,47 19,85 21,25 24,36 27,38 58,09 33,61 35,75 38,33 49,14 
Peso do papel 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43 
 
De acordo com os dados, fazemos a representação gráfica. Os pares ordenados formam o 
diagrama de dispersão. 
Figura 9.3. Correlação entre o peso total do lixo descartado 
e o peso do papel contido nesse lixo 
0
2
4
6
8
10
12
14
10 20 30 40 50 60 70
Peso total do lixo
Pe
so
 
do
 
pa
pe
l
 
 PUC Minas Virtual 114 Probabilidade e Estatística 
Para se verificar o grau de correlação entre as variáveis, calcula-se o coeficiente de correla-
ção linear pela fórmula do coeficiente de correlação de Pearson: 
( )( )
( )[ ] ( )[ ]∑ ∑∑ ∑
∑ ∑
−−
−
=
2222
* iiii
iiii
yynxxn
yxyxn
r
 
 
 Peso total (xi) Peso papel (yi) xi yi xi
2 yi
2 
H1 10,47 2,43 25,44 109,62 5,90 
H2 19,85 5,12 101,63 394,02 26,21 
H3 21,25 6,88 146,20 451,56 47,33 
H4 24,36 6,22 151,52 593,41 38,69 
H5 27,38 8,84 242,04 749,66 78,15 
H6 28,09 8,76 246,07 789,05 76,74 
H7 33,61 7,54 253,42 1129,63 56,85 
H8 35,73 8,47 302,63 1276,63 71,74 
H9 38,33 9,55 366,05 1469,19 91,20 
H10 49,14 11,43 561,67 2414,74 130,64 
∑ 288,21 75,24 2396,68 9377,52 623,47 
 
( )( )
( )[ ] ( )[ ]∑ ∑∑ ∑
∑ ∑∑
−−
−
=
2222
* iiii
iiii
yynxxn
yxyxn
r
 
])24,75(47,623*10[*])21,288(52,9377*10[
24,75*21,28868,2396*10
22
−−
−
=r
 
9206,0
57,2478
83,2281
573,59* 710,21 10
2281,83
 
]5661,1 - 7,6234[*]83065 2,93775[
9,216848,23966
===
−
−
=r 
 %1,92 ou 921,0 == rr
 
 
Observamos, assim: 1 6,0 ≤≤ r . Esse resultado indica que há uma forte correlação entre 
as variáveis ou, ainda, que a correlação entre as duas variáveis é bastante significativa. 
Nesse caso, podemos concluir haver coerência na afirmação de que existe correlação entre 
o peso total do lixo descartado e o peso do papel contido nesse lixo. 
 PUC Minas Virtual 115 Probabilidade e Estatística 
9.4. Regressão – Reta de regressão 
(ou reta de mínimos quadrados ou reta de ajuste) 
A correlação linear é uma correlação entre duas variáveis, cujo gráfico aproxima-se de uma 
linha. O gráfico cartesiano que representa essa linha é denominado diagrama de dispersão. 
Para poder avaliar melhor a correlação entre as variáveis, é interessante obter a equação da 
reta; essa reta é chamada de reta de regressão e a equação que a representa é a equação 
de regressão. O diagrama de dispersão é construído de acordo com os dados amostrais de 
n observações e a equação de regressão é dada pela expressão: 
Y= aX + b → Y’ = aX + b 
 
X é a variável independente 
Y → Y” é a variável dependente; na verdade, é a variável correlacionada com a variável X e 
sobre a qual se obtém um valor estimado. 
Esse tipo de notação, de Y para Y’, caracteriza que não se trata de uma relação funcional 
para a determinação da reta, e sim de uma relação estatística, em que a distribuição está 
baseada em estimativas de dados colhidos por amostragem. 
Sendo a e b os parâmetros de equação da reta, esses podem ser calculados por meio das 
fórmulas: 
 
xayb
xxn
yxyxn
a
ii
iiii
−=
−
−
=
∑∑
∑ ∑∑
 )(
*
22 
Sendo: 
n = número de observações dos dados amostrais 
y
 = valor médio da variável y; o cálculo faz-se pela expressão 
n
y
y i∑=
 
x = valor médio da variável x; o cálculo faz-se pela expressão 
n
x
x
i∑
=
 
 
Exemplo 9.2 
Determine a equação da reta de regressão do exemplo anterior, que trata de uma pesquisa 
entre o peso total do lixo descartado por dia com o peso do papel contido nesse lixo. 
Para a obtenção da equação da reta de regressão, elabora-se inicialmente uma tabela con-
tendo nas colunas as variáveis dependentes (yi), as independentes (xi) e os produtos xiyi e 
xi
2
. 
 PUC Minas Virtual 116 Probabilidade e Estatística 
Cálculo do parâmetro a da equação da reta: 
83065-93775,2
21684,9-23996,8
 )21,288(52,9377*10
24,75*28868,2396*10
)(
*
222 =
−
−
=
−
−
=
∑ ∑
∑ ∑∑
ii
iiii
xxn
yxyxn
a
 
213,0
2,10710
83,2281
==a
 
 
Cálculo do parâmetro b da equação da reta: 
 82,28
10
21,288
 e 52,7
10
24,75
==== xy 
1,38 6,14 - 7,52 28,82 * 0,213 - 7,52 ===−= xayb 
 
Uma vez calculados os parâmetros a e b, pode-se escrever a equação da reta: 
Y’ = 0,213 X + 1,38 
Para o traçado de uma reta, basta que se conheça dois de seus pontos. Assim, com base 
na equação da reta acima, pode-se estabelecer dois pontos para X e Y’. 
� Para X = 0, temos Y’ = 1,38 
� Para X = 50, temos Y’ = 12,03 
De acordo com os pontos P1(0;1,38) e P2(50;12,03), pode-se traçar a reta de regressão. 
 
Figura 9.4. Correlação entre o peso total do lixo descartado 
e o peso do papel contido nesse lixo 
y = 0,2131x + 1,3836
0
2
4
6
8
10
12
14
0 10 20 30 40 50 60
 
 
 PUC Minas Virtual 117 Probabilidade e Estatística 
Com base no conhecimento da equação da reta, pode-se interpolar e extrapolar valores. 
� Interpolação: a interpolação ocorre quandoo valor considerado pertence ao intervalo da 
tabela, porém, não figura entre os dados coletados. 
Supondo-se o valor 15 kg para o peso total do lixo descartado, pode-se estimar o peso 
de papel contido nesse lixo. Uma vez que 15 kg não é um dado coletado e, conseqüen-
temente, não pertence à tabela de dados, utiliza-se a equação da reta para determinar o 
valor correspondente ao peso do papel. 
Para 15 kg de lixo descartado, estima-se que haja 4,58 kg de papel contido nesse lixo. 
Este resultado foi obtido utilizando a equação da reta Y’ = 0,213 X + 1,38, substituído o 
valor de x = 15. 
 
� Extrapolação: a extrapolação ocorre quando o valor considerado não pertence ao interva-
lo da tabela, e também não figura entre os dados coletados. 
Suponha que o peso do lixo descartado seja de 60 kg. Esse valor não é um dado coleta-
do e nem se encontra dentro do intervalo [10,47, 49,14]. Essa situação é semelhante à 
anterior e utiliza-se a equação de reta para determinar o peso do papel. 
Para 60 kg de lixo descartado, estima-se, por extrapolação, que haja 14,16 kg de papel 
contido nesse lixo. 
 
 
Anexos 
 
 
 
 
 PUC Minas Virtual 119 Probabilidade e Estatística 
Anexo A. 
TNA – Tabela de Números Aleatórios 
 
COLUNA 1 5 9 13 17 21 25 29 33 37 41 45 49 
LINHA 
01 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735 
02 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709 
03 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184 2018 3522 
04 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074 
05 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359 
 
06 1558 4775 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030 
07 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669 
08 7285 8390 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678 
09 1735 1248 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699 
10 2709 0561 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337 
 
11 3522 0941 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134 
12 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807 
13 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709 0561 4397 
14 6030 4256 3870 5725 2204 2318 8337 3867 6184 2018 3522 0941 5569 
15 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074 1432 0995 
 
16 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359 8244 8952 
17 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030 4256 3870 
18 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669 7423 1768 
19 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522 
20 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555 
 
21 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184 
22 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 8486 
23 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155 
24 8952 0084 1558 4775 1699 1652 2555 4765 2709 0568 4397 1135 6136 
25 3870 5725 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249 
 
26 7425 3566 6151 4731 6489 2491 2765 8525 7849 1488 8833 2597 1333 
27 8961 8175 0879 6945 8029 9119 5990 1063 9444 8320 1740 6131 9907 
28 3298 6173 1741 3874 9321 3748 7507 0170 0568 9112 1275 0924 3054 
29 2276 4898 2394 1098 4063 5393 0226 8144 4778 7471 1764 4939 8063 
30 9557 8114 1576 9767 1486 7161 5606 6295 3503 5050 9549 2500 9666 
 
31 8650 1920 2533 7755 5324 3731 3414 2153 3815 0626 5718 8679 6801 
32 2885 8101 1467 0080 7962 5999 9562 5819 1562 6793 2065 0239 8253 
33 1841 8626 0344 4344 7446 0867 6157 8935 4413 2363 7187 8980 2488 
34 4638 8030 0018 7760 9819 4276 0650 3516 5159 9236 3257 1694 7157 
35 1320 7033 1218 5605 4206 2878 0230 1740 4553 8729 5827 7176 8703 
 
36 1488 5803 6790 9368 0465 4819 0065 7633 3950 2109 7027 5824 5057 
37 4353 4347 8565 2231 8789 4231 2585 0157 2037 7835 1320 8999 9181 
38 7816 5817 9764 8789 7387 2172 0896 1038 6047 9539 3510 1343 8098 
39 8600 9738 5415 8426 7152 8705 5829 0164 8330 9152 6045 8129 2293 
40 1057 1550 8773 3003 4302 4034 2478 1078 0429 7189 0778 3260 5969 
 PUC Minas Virtual 120 Probabilidade e Estatística 
Anexo B. 
Tabela da Curva Normal – (Faixa Central) 
 
Distribuição Normal 
Z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 
0,00 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 
0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 
0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 
0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 
0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 
0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 
0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 
0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 
0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 
0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 
1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 
1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 
1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 
1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 
1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 
1,50 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 
1,60 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 
1,70 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 
1,80 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 
1,90 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 
2,00 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 
2,10 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 
2,20 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 
2,30 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 
2,40 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 
2,50 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 
2,60 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 
2,70 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 
2,80 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 
2,90 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 
3,00 0,4987 0,4987 0,4987 0,4988 0,49880,4989 0,4989 0,4989 0,4990 0,4990 
3,10 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993 
3,20 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 
3,30 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997 
3,40 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 
3,50 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 
3,60 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 
3,70 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 
3,80 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 
3,90 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 
 
 
 
 
 PUC Minas Virtual 121 Probabilidade e Estatística 
Anexo C. 
Apêndice Matemático 
 
1. Números aproximados e Arredondamento de dados: 
A Associação Brasileira de Normas técnicas (ABNT) estabelece regras fixas de arredonda-
mento na numeração decimal, em uso na atualidade. Essas regras estão de acordo com a 
Resolução 886/66 do IBGE. 
1.1. Quando o primeiro algarismo a ser abandonado é 0,1,2,3 ou 4, fica inalterado o último 
algarismo a permanecer. 
Ex: 83,34 passa a 83,3 ; 44,13 passa a 44,1 
 
1.2. Quando o primeiro algarismo a ser abandonado é 6,7,8, ou 9, aumenta-se de uma uni-
dade ao algarismo a permanecer. 
Ex: 43,67 passa a 53,7 ; 63,19 passa a 63,2 ; 87,99 passa a 88,0 
 
1.3. Quando o primeiro algarismo a ser abandonado é 5, há duas soluções: 
a) Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma 
unidade ao algarismo a permanecer. 
Ex: 2,352 passa a 2,4 ; 25,6501 passa a 25,7 ; 26,250002 passa a 26,3 
 
b) Se o 5 for o último algarismo ou se ao 5 só se seguirem zeros, o último algarismo a 
ser conservado só será aumentando de uma unidade se for ímpar. 
Exemplos: 
� 24,75 passa a 24,8 
� 24,65 passa a 24,6 
� 24,75000 passa 24,8 
� 24,6500 passa a 24,6 
 
Obs.: Não devemos nunca fazer arredondamento sucessivos. Exemplo: 17,3452 passa a 
17,3 e não para 17,35 e depois para 17,4. 
 
 
 PUC Minas Virtual 122 Probabilidade e Estatística 
2. Cálculo de Porcentagem 
Porcentagem são razões em que um valor total está associado a uma quantidade de 100% 
e, pro meio de uma regra de três, podemos estabelecer a correspondência entre uma parce-
la do valor total e seu valor percentual. 
 
Total → 100 % 
Parcela → x % 
 
Exemplo: a afirmação de que ente os principais mercados emissores de turistas para o Bra-
sil (em 1998) encontra-se a Argentina, com 31%, significa que a cada 100 turistas que en-
tram no Brasil 31 são argentinos. Se entrarem 1200 turistas no Brasil, qual a estimativa so-
bre a quantidade de argentinos? 
 
Consideremos o valor 100 para base de comparação. 
100% → 1200 
31% → X ∴ X = 372 argentinos 
 
 
 PUC Minas Virtual 123 Probabilidade e Estatística 
Anexo D. 
Estudo de Caso 
 
Cenário 
Joana trabalha em uma companhia aérea. Por responder pelo SAC (suporte de atendimento 
ao consumidor), o diretor de sua área solicitou-lhe que elaborasse um estudo comparativo 
dos serviços prestados pela empresa com os similares da concorrência. Joana decidiu in-
vestigar os passageiros de três companhias aéreas – usuários de vôos locais desembarca-
dos em Guarulhos. Para definir e levantar as informações mais relevantes para seu estudo, 
ela compõe um questionário no qual indaga sobre a qualidade de alguns dos serviços ofere-
cidos pelas empresas de aviação em geral – como alimentação de bordo, atendimento no 
check-in, trabalho das comissárias, pontualidade de vôo etc. Os entrevistados expressaram 
seu grau de satisfação com as empresas pelas quais viajaram conferindo-lhes notas entre 0 
e 10. Os 132 passageiros entrevistados (36 da Cia. A, 57 da B e 39 da C) atribuíram às res-
pectivas empresas os graus de satisfação expressos no Quadro 3.1. 
 
Quadro 1. Notas atribuídas às companhias por seus passageiros 
4,4 4,5 4,6 4,7 4,8 4,8 4,9 4,9 5,0 5,0 5,1 5,1 
5,2 5,2 5,2 5,3 5,3 5,3 5,3 5,3 5,4 5,4 5,4 5,4 
 
Cia. A 
5,5 5,5 5,6 5,6 5,7 5,8 5,8 5,9 6,0 6,1 6,2 6,3 
 
 
3,1 3,1 3,2 3,2 3,3 3,3 3,4 3,5 3,5 3,6 3,6 3,7 
3,7 3,8 3,8 3,9 3,9 3,9 4,0 4,0 4,0 4,0 4,1 4,1 
4,1 4,2 4,2 4,3 4,3 4,4 4,4 4,5 4,5 4,5 4,6 4,6 
4,6 4,7 4,7 4,7 4,7 4,8 4,8 4,9 4,9 5,0 5,0 5,1 
 
 
Cia. B 
5,1 5,2 5,2 5,3 5,3 5,4 5,5 5,6 5,7 
 
 
3,7 3,8 3,9 3,9 4,0 4,0 4,1 4,1 4,2 4,2 4,3 4,3 
4,3 4,4 4,4 4,4 4,5 4,5 4,5 4,6 4,6 4,6 4,7 4,7 
4,7 4,7 4,8 4,8 4,8 4,8 4,8 4,9 4,9 4,9 4,9 5,0 
 
Cia. C 
5,0 5,0 5,1 
 
Joana precisa resumir esses dados antes de apresentá-los à sua diretoria. O resumo deve 
lhe dar o máximo de informação e possibilitar-lhe a comparação das empresas. Primeiro 
Joana pode resumir as notas em tabelas de distribuição de freqüências simples e acumula-
 PUC Minas Virtual 124 Probabilidade e Estatística 
das. Dessas tabelas ela pode construir diversos gráficos, como os histogramas, os polígo-
nos de freqüências e as ogivas. Joana pode determinar uma série de medidas que lhe darão 
informações complementares a essas. 
 
Descrevendo Dados 
Apesar de em geral uma imagem valer por mil palavras, também é útil encontrar números 
que descrevam os conjuntos de dados, uma vez que os gráficos podem ser afetados pela 
escala adotada e, ainda que permitam boa visualização do conjunto de dados, sua interpre-
tação tende a ser quase sempre subjetiva. Além disso, alguns descritores numéricos deter-
minados de dados amostrais permitem inferir propriedades e parâmetros populacionais. 
Os dados são coletados da própria população ou de suas amostras. As medidas descritivas 
calculadas a partir daí são chamadas respectivamente estatísticas ou parâmetros. 
 
Estatística é uma medida derivada de dados amostrais. 
 
Parâmetro é uma medida proveniente de dados populacionais. 
 
Geralmente as estatísticas amostrais são representadas por letras latinas e os parâmetros 
populacionais, por letras gregas. 
Existem várias medidas descritivas. As mais comuns são as medidas de centro e as medi-
das de dispersão. Dito de modo geral, as medidas de centro apontam o meio da distribuição 
dos dados, e as de dispersão, o espalhamento dos valores individuais em torno do centro. 
Exemplos típicos de medidas centro são a média, a mediana e a moda. Como indicativas da 
dispersão têm-se a amplitude, a variância e o desvio-padrão. 
Para estimar o grau da satisfação de usuários, a empresa pode adotar o centro dos graus 
expressos por clientes individuais. Se quiser avaliar a regularidade dos serviços que presta, 
pode usar a dispersão em torno da média da satisfação dos mesmos clientes. Digamos que 
o grau médio de satisfação dos usuários da companhia em que Joana trabalha é 5,0. Se o 
cliente mais satisfeito deu à empresa a nota 4,5 e o mais satisfeito, nota 5,5, então as notas, 
por estarem bem concentradas em torno do centro, são sinal de atendimento bem regular. 
No entanto, se o cliente mais insatisfeito tiver dado uma nota 1,0 e o mais satisfeito, uma 
nota 9,0, o alto espalhamento das notas em torno do centro será indício de atendimento 
muito irregular, dirá que a empresa tanto tem funcionários eficientes e prestativos quanto 
ineficientes e grosseiros. 
 
 PUC Minas Virtual 125 Probabilidade e Estatística 
Medidas de Centro 
Para a maioria das situações verificadas no cotidiano de uma empresa bastam, como medi-
das de centro, a média aritmética, a mediana e a moda. 
 
Média Aritmética 
Para fins de cálculo, entende-se média aritmética como a soma dos valores de um conjunto 
de dados dividida pelo número de itens avaliados. 
A média aritmética é indicada por µ ou por x , conforme se refira a dados populacionais ou a 
valores amostrais.Apesar dessa diferença de notação, o cálculo é feito sempre do mesmo 
modo, conforme mostra abaixo. 
 
Form. 1. Média aritmética populacional e amostral 
Populacional Amostral 
N
x∑
=µ 
n
x
x
∑
= 
 
em que x é um elemento qualquer do conjunto considerado, N é o total de elementos da 
população e n, o total de itens da amostra avaliada. 
O arranjo a seguir facilita a obtenção da média de X. Construída a tabela – que lista na pri-
meira coluna os valores dos quais se quer calcular a média aritmética, na segunda, as res-
pectivas freqüências (absolutas ou relativas) e na terceira, o produto dos valores individuais 
pelas respectivas freqüências – a média será dada pela divisão do total da última coluna 
pelo total da penúltima. 
 
 
x f xf 
. 
. 
. 
. 
. 
. 
. 
. 
. 
Total Nf =∑ (ou n) xf∑ 
 
 PUC Minas Virtual 126 Probabilidade e Estatística 
Exemplo 1 
Determine os graus de satisfação médios das empresas A, B e C. 
Agrupando os dados, tem-se: 
 
Empresa A Empresa B Empresa C 
x f xf x f xf x f xf 
4,4 1 4,4 3,1 2 6,2 3,7 1 3,7 
4,5 1 4,5 3,2 2 6,4 3,8 1 3,8 
4,6 1 4,6 3,3 2 6,6 3,9 2 7,8 
4,7 1 4,7 3,4 1 3,4 4,0 2 8,0 
4,8 2 9,6 3,5 2 7,0 4,1 2 8,2 
4,9 2 9,8 3,6 2 7,2 4,2 2 8,4 
5,0 2 10,0 3,7 2 7,4 4,3 3 12,9 
5,1 2 10,2 3,8 2 7,6 4,4 3 13,2 
5,2 3 15,6 3,9 3 11,7 4,5 3 13,5 
5,3 5 26,5 4,0 4 16,0 4,6 3 13,8 
5,4 4 21,6 4,1 3 12,3 4,7 4 18,8 
5,5 2 11,0 4,2 2 8,4 4,8 5 24,0 
5,6 2 11,2 4,3 2 8,6 4,9 4 19,6 
5,7 1 5,7 4,4 2 8,8 5,0 3 15,0 
5,8 2 11,6 4,5 3 13,5 5,1 1 5,1 
5,9 1 5,9 4,6 3 13,8 Total 39 175,8 
6,0 1 6,0 4,7 4 18,8 
6,1 1 6,1 4,8 2 9,6 
6,2 1 6,2 4,9 2 9,8 
6,3 1 6,3 5,0 2 10,0 
Total 36 191,5 5,1 2 10,2 
 5,2 2 10,4 
 5,3 2 10,6 
 5,4 1 5,4 
 5,5 1 5,5 
 5,6 1 5,6 
 5,7 1 5,7 
 Total 57 246,5 
 
 
Dos totais obtidos resultam as médias: 
 
Ax = 36
5,191
=5,3194; Bx = 57
5,246
=4,3246; Cx = 39
8,175
=4,5077 
 
Uma conclusão possível de se extrair das notas médias atribuídas às companhias é que o 
atendimento que a Cia. A presta a seus clientes parece ser melhor que os das empresas B e 
C. 
 
 PUC Minas Virtual 127 Probabilidade e Estatística 
Exemplo 2 
Um hotel fez um estudo para gerenciar a quantidade de quartos necessários para atender 
bem seus clientes. Para estimar o tempo médio de ocupação dos quartos, mediu-se a per-
manência efetiva de uma amostra de dez clientes. Esses tempos anotados foram: 
 
Cliente A B C D E F G H I J 
Tempo (min) 59,3 58,6 62,7 65,4 59,0 67,3 62,8 68,1 59,4 63,7 
 
Dos valores registrados infere-se o tempo médio de ocupação dos quartos. A média é dada 
por: 
 
63,62
10
7,634,591,688,623,670,594,657,626,583,59
=
+++++++++
=x
 
 
Tal resultado indica que em média os clientes ocupam os quartos por pouco mais de uma 
hora. Disso pode-se inferir facilmente que, se o hotel tem 20 quartos, e se cada um for ocu-
pado em média por duas pessoas, ele atenderá pouco menos de 40 pessoas por hora. Se a 
despesa média por pessoa for de R$15,00, seu faturamento por hora estará um pouco abai-
xo de R$600,00. 
 
 
Exemplo 3 
O que ocorria com o tempo médio do hotel mencionado no Exemplo 2 se o cliente denotado 
B tivesse ocupado o quarto por apenas dez minutos? 
Calculando o tempo médio para a nova condição, tem-se: 
 
77,57
10
7,634,591,688,623,670,594,657,620,103,59
=
+++++++++
=x
 
 
A suposta “pressa” do cliente B faria a média cair de 62,63 minutos para 57,77. Grosso mo-
do, pode-se dizer que, nessa condição, a expressão um pouco abaixo teria de ser substituí-
da por um pouco acima! 
Os resultados dos Exemplos 2 e 3 revelam uma propriedade da média aritmética que é: a 
média aritmética sempre é afetada por todos os valores computados. 
 
 PUC Minas Virtual 128 Probabilidade e Estatística 
Exemplo 4 
Construa os polígonos de freqüências de satisfação das três companhias aéreas e localize 
as respectivas médias. 
Cia. Aérea A 
0
1
2
3
4
5
6
4,4 4,5 4,6 4,7 4,8 4,9 5 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 6 6,1 6,2
 
 
Figura 1. Polígono de freqüências do grau de satisfação da Cia. A. 
 
Cia. Aérea B 
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
3,
1
3,
3
3,
5
3,
7
3,
9
4,
1
4,
3
4,
5
4,
7
4,
9
5,
1
5,
3
5,
5
5,
7
 
Figura 2. Polígono de freqüências do grau de satisfação da Cia. B. 
 
 
média = 4,325 
média = 5,319 
 PUC Minas Virtual 129 Probabilidade e Estatística 
Cia. Aérea C 
0
1
2
3
4
5
6
3,7 3,8 3,9 4 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5 5,1
 
 
Figura 3. Polígono de freqüências do grau de satisfação da Cia. C. 
 
Mediana 
Como mostram os exemplos 2 e 3, a média é influenciada por todos os valores da distribui-
ção, e mais fortemente pelos díspares (muito altos ou muito baixos). Mas nem todas as me-
didas são tão sensíveis assim à mudança de valores do conjunto de dados. Uma das medi-
das de centro nessas condições é a mediana. 
A mediana simbolizada por md, é o valor central de medidas ordenadas. Naturalmente, para 
se obter o centro, ou a mediana, de um conjunto de valores, deve-se ordenar os elementos, 
de modo crescente ou decrescente. E, por ser medida de centro do dados, metade dos valo-
res computados é menor que a mediana, e metade é maior. Outra propriedade relevante da 
mediana é ela não ser afetada pelos extremos do conjunto de dados, seja lá quais forem os 
seus valores. A determinação do centro de uma lista de dados ordenados depende de o 
número de itens ser par ou ímpar. 
A mediana de um número ímpar de medidas é o valor que cai no meio da distribuição. Pode-
se determinar qual é esse valor dividindo por dois o total de elementos mais um. Por exem-
plo, em um conjunto de 11 valores, a mediana é o sexto elemento ((11+1)/2=6). 
A mediana de um número par de medidas é a média aritmética dos valores centrais (neste 
caso também se diz que ela é o ponto central entre duas contagens medianas). Para se 
saber quais são esses valores divide-se por dois o total de elementos. A mediana é a média 
do elemento apontado por esse quociente e o seguinte a ele. Por exemplo, em um conjunto 
de 12 valores, a mediana é a média entre o sexto (metade de 12) e o sétimo elemento. 
 
média = 4,508 
 PUC Minas Virtual 130 Probabilidade e Estatística 
Exemplo 5 
Determine as medianas das seguintes distribuições (ordenadas): 
 
a. 32 32 35 36 36 37 38 
 
 
 
39 39 39 40 40 45 46 
 
 
 
b. 32 35 36 36 37 38 
 
 
 
39 39 40 40 42 45 
 
 
 
A primeira distribuição compõe-se de 15 medidas. A mediana é o valor colocado na oitava 
posição ((15+1)/2=8). Por sinal, os dados foram propositalmente dispostos de forma a facili-
tar a observação de que, das 15 medidas apresentadas, sete estão abaixo da mediana, e 
sete estão acima. Logo, a mediana do conjunto A é md = 38. 
A segunda distribuição compõe-se de 14 medidas. A mediana é a média dos valores situa-
dos na 7ª (14/2=7) e na 8ª posição. Nessas condições, para os valores fornecidos, tem-se: 
 
md = 2
3938 +
= 38,5 
 
No item b, a disposição gráfica dos dados também permite visualizar que metade dos dados 
é inferior à mediana, e metade, superiores a ela, isto é, metade dos valores é menor que 
38,5, e metade é maior que 38,5. 
Conforme mencionado, amediana não é afetada pelos extremos do conjunto de dados. As-
sim, no item b do Exemplo 5, a eventual troca de 45 por 95 e de 32 por 13 não modifica a 
mediana, que continua sendo md=38,5. 
De suas análises, Joana constata que as medianas de satisfação das companhias A e B 
estão próximas às respectivas médias de satisfação (5,3 e 4,3, respectivamente). Quanto à 
mediana de satisfação da Cia. C, a figura 4 mostra estar ligeiramente acima da média (mé-
dia de 4,5 contra uma mediana de 4,6). 
 
 
 
38 
 
38 
 
39 
 PUC Minas Virtual 131 Probabilidade e Estatística 
Cia. Aérea C
0
1
2
3
4
5
6
3,7 3,8 3,9 4 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5 5,1
 
 
 
 
Figura 4. Posições da média e mediana da Cia. C. 
 
Moda 
A moda, simbolizada por mo, é a mas simples das medidas de centro: é o valor mais fre-
qüente em uma distribuição, sendo simplesmente o que aparece em maior números de ve-
zes. Seu conceito está muito próximo da idéia de moda da linguagem vulgar, em que estar 
na moda significa essencialmente vestir-se como a maioria. 
 
Exemplo 6 
Determine a moda da seguinte distribuição: 
 
32 32 35 36 37 38 38 39 39 39 40 40 42 45 
 
O valor que mais ocorre na distribuição é o 39 (aparece três vezes). Logo, a moda é igual a 
39. 
Por corresponder ao ponto mais alto, a moda é instantaneamente revelada pelos histogra-
mas e polígonos de freqüência das distribuições de dados. 
 
média = 4,508 mediana = 4,6 
 PUC Minas Virtual 132 Probabilidade e Estatística 
Exemplo 7 
Ache a moda das notas atribuídas à Cia. A 
 
Cia. Aérea A 
0
1
2
3
4
5
6
4,4 4,5 4,6 4,7 4,8 4,9 5 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 6 6,1 6,2
 
 
Figura 5. Moda do grau de satisfação da Cia. A. 
 
Em geral, a moda é fácil de identificar. A dificuldade possível é que, para ela, vale tudo: po-
de não existir, pode ser única e pode ser múltipla. Inexiste quando ninguém se destaca, 
quando todos os valores são igualmente comuns; é única quando há um elemento de des-
taque, o mais freqüente; é múltipla quando duas ou mais medidas se destacam igualmente, 
mas de modo mais acentuado que as demais. Distribuições sem moda alguma são denomi-
nadas retangulares; as com uma moda apenas, unimodais, e as com várias modas, polimo-
dais. 
 
Exemplo 8 
Determine a moda da seguinte distribuição: 
32 32 32 36 37 38 38 39 39 39 40 40 42 45 
 
Há duas modas, 32 e 39 (esses valores ocorrem três vezes, e mais vezes que quaisquer 
outros). 
moda = 5,3 
 PUC Minas Virtual 133 Probabilidade e Estatística 
Exemplo 9: Determine a moda das notas atribuídas à Cia. B. 
 
Cia. Aérea B 
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
3,
1
3,
3
3,
5
3,
7
3,
9
4,
1
4,
3
4,
5
4,
7
4,
9
5,
1
5,
3
5,
5
5,
7
 
 
Figura 6. Distribuição bimodal do grau de satisfação da Cia. B. 
 
Na distribuição das notas da Cia. B há duas modas, 4,0 e 4,7 (essas notas ocorrem quatro 
vezes). Ou seja, essa distribuição, assim como a do Exemplo 8, é bimodal. 
 
Exemplo 10 
Tome a distribuição do Exemplo 9, mude o último valor de 45 para 55 e determine a moda e 
a mediana. 
32 32 35 36 37 38 38 39 39 39 40 40 42 55 
A moda e a mediana do conjunto de dados assim composto são: mo = 39 e md = 38,5 (média 
entre o sétimo e o oitavo elemento). Como a mudança proposta não alterou tais medidas de 
centro, pode-se dizer que a moda e a mediana nem sempre são sensíveis a mudanças nos 
valores individuais ou nos extremos da distribuição (a mediana é afetada quando se mudam 
os termos centrais da distribuição; a moda se altera quando mudam as freqüências dos va-
lores que a definem). 
A moda tem algumas propriedades úteis. Exemplo, sua determinação é rápida e fácil. É que, 
como basta achar o valor mais freqüente, ela independe da ordenação dos valores, dos ex-
tremos da distribuição e de quaisquer de seus valores intermediários. 
A média, a mediana e a moda trazem diferentes informações a respeito do centro dos con-
juntos de dados. Em relação à simetria da distribuição, sabe-se que: 
� nas distribuições simétricas, a média, a mediana e a moda apontam o mesmo valor; 
bimodal 
 PUC Minas Virtual 134 Probabilidade e Estatística 
� nas distribuições assimétricas, a média, a mediana e a moda apontam valores distintos 
(quanto mais assimétrica a distribuição, mais distantes os valores estão): 
- nas assimétricas à esquerda, a moda é maior que a mediana, e a mediana é maior 
que a média, isto é, média < mediana < moda; 
- nas assimétricas à direita, a moda é menor que a mediana, e a mediana é menor que 
a média, isto é, moda < mediana < média. 
 
As figuras 7 a 9 retratam essas condições. 
 
 
Figura 7. Assimetria à esquerda: µ < md < mo. 
 
 
 
 
Figura 8. Simetria: µ = md = mo 
 
 
 
 
Figura 9. Assimetria à direita: mo < md < µ 
 
Média 
Mediana 
Moda 
Média = Mediana = Moda 
Moda
Mediana
Média
 PUC Minas Virtual 135 Probabilidade e Estatística 
Comparando as medidas de centro, Joana observa que a Cia. A tem distribuição quase si-
métrica (a média, a mediana e a moda praticamente coincidem) e a C apresenta distribuição 
assimétrica à esquerda, fato que sugere ser relativamente alto o grau de satisfação de seus 
clientes. 
 
Medidas de Variabilidade 
Embora dêem boa idéia das características dos dados sob análise, as medidas de tendência 
central não informam completamente sobre o comportamento dos conjuntos de medidas. 
Além de um número que tipifique o centro da distribuição, é importante ter alguma noção da 
variabilidade ou flutuação das medidas. 
Existem várias medidas que apontam o espalhamento dos dados em torno de determinado 
valor. Para muitos propósitos bastam três medidas de dispersão: Amplitude, Variância e o 
Desvio-Padrão. 
� Amplitude 
 
Uma medida simples de dispersão é o intervalo ou amplitude dos dados. Por correspon-
der à diferença entre o maior e o menor valor observado, pode-se escrever: 
 
 
Amplitude = Maior valor – Menor valor 
 
A amplitude informa a distância entre os extremos dos dados ou de sua distribuição – ra-
zão pela qual costuma ser apresentada citando-se simplesmente o piso e o teto dos da-
dos. Medidas com essa característica têm a virtude de ser de fácil computação: não é 
preciso tecer considerações sobre quaisquer outros elementos, está-se desobrigado de 
determinar quem são eles, como se distribuem, qual o grau de concentração em torno de 
algum ponto; o defeito natural dessa facilidade é abrir mão de informações relevantes, 
como sobre o grau concentração ou espalhamento dos dados em torno de algum ponto. 
Mas há casos particulares em que ela informa alguma coisa até sobre isso. Para distribu-
ições simétricas, por exemplo, a semiamplitude indica a distância máxima dos dados em 
relação ao respectivo centro. 
A amplitude cumpre bem seu papel quando aplicada a informações cujo fator relevante é 
exatamente o extremo, como no caso das temperaturas diárias (mínima: 19 ºC; máxima: 
27 ºC), de marés (baixa-mar: 0,1; preamar:1,6), durações dos dias (nascente: 06h46min; 
poente: 19h54min) e estações do ano (verão: de 21-12 a 20-3; inverno: de 21-6 a 21-9). 
Mas toda avaliação do espalhamento dos dados é útil, ao menos em uma primeira com-
paração de distintos conjuntos de dados. A comparação das amplitudes das companhias 
aéreas avaliadas por Joana – Cia. A: 1,9; Cia. B:2,6; Cia. C:1,4 – sugere que o grau de 
satisfação dos usuários da Cia. B é um pouco mais disperso que o apresentado pelos cli-
entes das demais empresas. Seu defeito é não levar em conta o número de observações. 
 PUC Minas Virtual 136 Probabilidadee Estatística 
Exemplo 11 
Uma loja deseja saber se as reclamações sobre o tempo de espera no atendimento 
telefônico de clientes são justificáveis ou não. Uma maostra de 15 chamadas registra os 
seguintes tempos de espera: 
 
Cliente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 
Tempo (min) 5,5 10,3 6,6 6,8 9,5 6,7 0,5 9,2 7,6 10,7 9,2 2,9 6,0 8,6 4,5 
 
 
A amplitude dos tempos é: A = 10,7 – 0,5 = 10,2. 
 
À primeira vista, pode-se supor que, sendo a dispersão do tempo de espera da ordem de 
dez minutos, e sendo o maior valor igual a 10,7 minutos, os dados estão bem dispersos, que 
o tempo de espera é bem variado. Todavia, um olhar mais atento mostra que há poucos 
pequenos tempos de espera e que o piso dos dados está longe do segundo valor, ou seja, 
0,5 fica muito afastado de 2,9. Na verdade, a maioria dos tempos de espera está entre cinco 
e dez minutos., para um tempo médio de espera em torno de sete minutos. 
Um modo razoável de medir a variabilidade dos dados é associá-la a alguma medida de 
centro. Pode-se querer saber quanto em média os dados distam de um valor central típico. 
Medidas com essa característica são a variância e o desvio-padrão. 
 
� Variância 
A variância de um conjunto qualquer de dados é determinada pelo formulário a seguir: 
Form. 2. Variância populacional e amostral 
Populacional Amostral 
 
em que x é um elemento qualquer do conjunto considerado, µ (ou x ) é a média do con-
junto de dados e N (ou n), o total de elementos computados (da população ou amostra). 
Uma parte essencial das expressões dadas no Form. 2 é a diferença entre cada valor e a 
média aritmética do conjunto. O problema é a soma das diferenças em relação à média 
do conjunto ser sempre zero. É para contornar esse resultado monótono e inexpressivo 
que a variância considera os desvios elevados ao quadrado. 
 PUC Minas Virtual 137 Probabilidade e Estatística 
Desenvolvendo os quadrados expressos no Form. 2 obtêm-se as expressões alternativas 
apresentadas no Form. 3 a seguir: 
 
Form. 3. Variância populacional e amostral 
Populacional Amostral 
 
 
Nas fórmulas constantes do Form. 3, a variância só depende do somatório dos valores 
computados. Assim, ela é obtida de modo mais rápido e às vezes até mais preciso 
(quando o cálculo da média exigir algum arredondamento). 
 
� Desvio-Padrão 
A variância é uma medida com magnitude distinta da dos dados originais. Para que a 
variabilidade seja comparável com os dados que a originam, deve-se expressá-la na 
mesma unidade de medida. Isso resulta em uma nova medida de dispersão, dada pela 
raiz quadrada positiva da variância. Essa nova medida, denominada desvio-padrão, é 
assim definida: 
 
Form. 4. Desvio-padrão populacional e amostral 
 
Populacional Amostral 
 
 
em que x é um elemento qualquer do conjunto considerado, µ (ou x ) é a média do 
conjunto de dados e N (ou n), o total de elementos considerados (tamanho da população 
ou amostra). 
 
 PUC Minas Virtual 138 Probabilidade e Estatística 
Glossário 
 
Amostra: é uma subcoleção de elementos extraídos de uma população. 
Amostra Com reposição – quando um elemento sorteado puder ser sorteado nova-
mente. 
Amostra Sem reposição – quando o elemento sorteado só puder figurar uma única vez 
na amostra. 
Amostragem – É o processo de escolha da amostra. 
Amostragem Aleatória – método de amostragem em que qualquer elemento da popu-
lação tem a mesma chance de ser escolhido para compor a amostra. 
Amostragem Aleatória Simples – é um processo para selecionar amostras de tama-
nho “n” dentre as “N” unidades em que foi dividida a população. 
Amostra Estratificada – é obtida separando-se as unidades da população em grupos 
não superpostos, chamados estratos, e selecionando-se independentemente uma amos-
tra aleatória simples de cada estrato. 
Amostragem Intencional – é formada por elementos escolhidos por determinado 
critério, ou seja, escolhe-se intencionalmente um grupo de elementos que irão compor a 
amostra. 
Amostragem não Aleatória – método de amostragem em que os diversos membros da 
população não têm a mesma chance de figurar na amostra. 
Amostra por Conglomerado – é uma amostra aleatória simples na qual cada unidade 
de amostragem é um grupo, ou um conglomerado de elementos. 
Amostragem por Cotas – classificação da população em termos de propriedades que 
se sabe serem relevantes para a característica a ser estudada. 
Amostra Sistemática – é mais fácil de executar e, por isso, está menos sujeita a apre-
sentar erros cometidos pelo entrevistador, freqüentemente proporciona mais informações 
por custo unitário. 
Amplitude total (A) – é a diferença entre o maior e o menor valor da tabela de distri-
buição. 
Área sob a Curva Normal – Área que está entre a curva e a reta-base contendo 100% 
ou todos os casos em qualquer distribuição normal dada. 
Assimetria – Afastamento da simetria. 
Coeficiente de Correlação – Variando em geral entre -1,00 e +1,00, é um número que 
expressa tanto a intensidade como a direção da correlação. 
Coeficiente de Correlação de Pearson – Coeficiente de correlação para dados interva-
lares. 
Correlação – A intensidade e a direção do relacionamento entre duas variáveis. 
Correlação Curvilínea – Relação entre X e Y que começa como positiva (ou negativa) e 
 PUC Minas Virtual 139 Probabilidade e Estatística 
inverte a direção. 
Correlação Linear – Correlação positiva ou negativa, tal que os pontos em um diagra-
ma de dispersão tendem a formar uma linha reta passando pelo centro do gráfico. 
Curtose – Forma do pico de uma distribuição. 
Curva Normal – Distribuição suave, simétrica, em forma de sino e unimodal. 
Decis – dividem a distribuição em 10 partes iguais. 
Desvio Padrão – Raiz quadrada da média dos quadrados dos desvios em relação à mé-
dia de uma distribuição. Medida de variabilidade que reflete o desvio típico a contar da 
média. 
Estatística: é uma medida numérica que descreve uma característica de uma amostra. 
Freqüência Absoluta Acumulada (Ni) – é o total das freqüências de todos os valores 
inferiores ao limite superior do intervalo de uma dada classe. 
Freqüência Absoluta Simples da Classe i (ni) – são os valores que realmente 
representam o número de dados de cada classe. 
Freqüência Relativa Acumulada (Fi) – é a freqüência acumulada da classe, 
dividida pela freqüência total da distribuição. 
Freqüências Relativas Simples (fi) – são os valores das razões entre as freqüências 
simples e o número total de dados. 
Freqüência Relativa Acumulada Crescente (Classe i – Fi) – Fi pode ser entendido 
como sendo a percentagem de observações abaixo do limite superior da classe i. 
Freqüência Relativa Acumulada Decrescente (classe i – F’i) – F’é a porcentagem de 
observações acima do limite inferior da classe i. 
Intervalo de 95% de Confiança – Intervalo de valores da média (proporções) dentro 
do qual há 95 chances em 100 de a verdadeira média (proporção) populacional se situar. 
Intervalo de 99% de confiança – Intervalo de valores da média (proporções) dentro 
do qual há 99 chances em 100 de a verdadeira média (proporção) populacional se situar. 
Intervalo de Classe – Categoria em uma distribuição agrupada contendo mais de um 
valor. 
Intervalo de Confiança – Intervalo de valores de médias (proporções) dentro do qual a 
verdadeira média (proporção) populacional tem probabilidade de se situar. 
Limite de Classe – Ponto a meio caminho entre intervalos de classe adjacentes que 
serve para preencher a lacuna entre eles. 
Média – Soma de um conjunto de escores dividida pelo número total no conjunto. É uma 
medida de tendência central. 
 PUC Minas Virtual 140 Probabilidade e Estatística 
Mediana – Ponto mais central em uma distribuição de freqüências. Uma medida de ten-
dência central.Moda – Valor mais freqüente, típico ou comum em uma distribuição. 
Percentis – dividem a distribuição em 100 partes iguais. 
Polígono de freqüência – é um gráfico em linha, sendo as freqüências marcadas 
sobre perpendiculares ao eixo horizontal, e levantadas pelos pontos médios dos 
intervalos de classe. 
Polígono de freqüência acumulada – é traçado marcando-se as freqüências acumula-
das sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos 
limites superiores dos intervalos de classe. 
Ponto Médio – o próprio nome indica, o ponto que divide o intervalo de classe em duas 
partes iguais. 
População – Qualquer conjunto de indivíduos que compartilham de ao menos uma ca-
racterística. 
Probabilidade – Modelos matemáticos que explicam os fenômenos estudados pela Esta-
tística em condições normais de experimentação. 
Quartis – dividem a distribuição em 4 partes iguais. 
TNA – tabelas de números aleatórios. 
Variância – Média dos quadrados dos desvios em relação a média de uma distribuição. 
Medida de variabilidade em uma distribuição. 
 PUC Minas Virtual 141 Probabilidade e Estatística 
Referências Bibliográficas 
 
TRIOLA, Mario F. Introdução a Estatística, Rio de Janeiro: LTC, 1999. 
BUSSAB, W.O. e Morettin, P.A. Estatística Básica. São Paulo: Atual, 1987. 
FONSECA, J.S. e Martins, G.A. Curso de Estatística. São Paulo: Atlas, 1993. 
LAPPONI, J.C. Estatística usando Excel 5 e 6. São Paulo: Lapponi Treinamento e Editora, 1997. 
MORETTIN, L.G. Estatística Básica – Vol. 2 – Inferência. São Paulo: Makron Books, 1999. 
MORETTIN, L.G. Estatística Básica – Vol.1 – Probabilidade. São Paulo: Makron Books, 1999. 
STEVENSON,W.J. Estatística Aplicada à Administração. São Paulo: Harbra, 1996. 
TIBONI,C.G. R. Estatística Básica para o curso de Turismo. São Paulo: Atlas, 2002. 
TOLEDO, G. L. e Ovalle, I.I. Estatística Básica. São Paulo: Atlas, 1985. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Belo Horizonte, 
agosto de 2009
 
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS 
DIRETORIA DE ENSINO A DISTÂNCIA 
Rua Espírito Santo, 1059 - 12º andar – Centro 
30160-031 - Belo Horizonte – MG 
Telefone: (0xx31) 3238-5600 - Fax: (0xx31) 3238-5605 
http://www.virtual.pucminas.br 
 
ATENDIMENTO E INFORMAÇÕES: 
Telefone: (0xx31) 3238-5656 
www.virtual.pucminas.br/faleconosco