Introdução a Estatística

•
UEM

Paulo Cordeiro
19.11.2013
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 112 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 112 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 112 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Estatística I

56.831 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
1
 
 2
 
SEBASTIÃO GAZOLA é professor lotado no 
Departamento de Estatística da Universidade Estadual 
de Maringá – UEM. Mestre em Engenharia de 
Produção pela UFSC e doutor em Agronomia pela 
UEM. Ministra disciplinas de estatística nos diversos 
cursos de graduação da UEM. 
 
 
IVANI APARECIDA BASSO DA SILVA é professora 
lotada no Departamento de Estatística da Universidade 
Estadual de Maringá – UEM. Mestre em Estatística 
pela UEL. Ministra disciplinas de estatística nos 
diversos cursos de graduação da UEM. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 3
Apresentação do livro 
 
Este livro de Introdução à Estatística tem o objetivo de servir como apoio didático 
aos alunos iniciantes no estudo de estatística. Consideramos que o texto pode ser usado de 
maneira eficaz como um curso básico para qualquer estudante interessado nas aplicações 
dos métodos estatísticos. 
A leitura do texto não exige conhecimento de matemática além do nível dos cursos 
do ensino médio. 
Estruturalmente, iniciamos o livro com alguns conceitos básicos no capítulo 1 e 
com uma introdução às técnicas de amostragem no capítulo 2. Prosseguimos o texto com a 
análise descritiva dos dados realizada por meio da apresentação dos dados no capítulo 3 e 
das medidas descritivas no capitulo 4. 
Uma introdução à teoria de probabilidade e alguns modelos probabilísticos, que são 
necessários para o desenvolvimento dos capítulos posteriores, são apresentados no capitulo 
5. 
Para um conhecimento inicial da inferência estatística apresentamos as 
distribuições amostrais e a estimação de parâmetros no capitulo 6 e no capítulo 7 alguns 
testes de hipóteses. 
Ao final foram citadas as referências utilizadas para o desenvolvimento deste 
material as quais recomendamos como complementação do conteúdo apresentado. 
No anexo estão algumas tabelas necessárias para as aplicações da metodologia. 
 
 
 
 
 
 
 
 
 
 
 
 
 4
Sumário 
 
Capítulo 1: Introdução .......................................................................... 
1.1 Conceitos Básicos .............................................................................. 
 
Capítulo 2: Técnicas de Amostragem ................................................... 
2.1 Amostragem Probabilística ................................................................ 
2.1.1 Amostragem Aleatória Simples .................................................. 
2.1.2 Amostragem Aleatória Sistemática ............................................ 
2.1.3 Amostragem Aleatória Estratificada .......................................... 
2.2 Amostragem Não-Probabilística ................................................... 
 
Capítulo 3: Apresentação de Dados ...................................................... 
3.1 Tabelas e Gráficos de dados Qualitativos ......................................... 
3.2 Tabelas e Gráficos de dados Quantitativos ....................................... 
 
Capítulo 4: Medidas Descritivas .......................................................... 
4.1 Medidas de Posição ou Tendência Central ....................................... 
4.2 Medidas de Dispersão ........................................................................ 
4.3 Medidas de Simetria ........................................................................... 
 
Capítulo 5: Noções de Probabilidade E Principais Distribuições ...... 
5.1 Definições Básicas ............................................................................. 
5.2 Introdução à Probabilidade ................................................................ 
5.3 Distribuições Teóricas de Probabilidade ............................................ 
5.3.1 Variáveis Aleatórias ................................................................... 
5.3.2 Distribuições de Probabilidade ................................................... 
5.3.3 Distribuição Binomial ................................................................ 
5.3.4 Distribuição de Poisson .............................................................. 
5.3.5 Distribuição Normal ................................................................... 
 
Capítulo 6: Distribuições Amostrais e Estimação de Parâmetros .... 
6.1 Distribuições Amostrais ..................................................................... 
00 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 5
6.1.1 Distribuição Amostral da Média ................................................ 
6.1.2 Distribuição Amostral da Diferença de Médias ......................... 
6.1.3 Distribuição Amostral da Proporção .......................................... 
6.2 Estimação por Ponto .......................................................................... 
 
6.3 Estimação por Intervalo ..................................................................... 
6.3.1 Intervalos de Confiança para a Proporção (p) Populacional .... 
6.3.2 Intervalos de Confiança para a Média Populacional com Variância Conhecida 
................................................................ 
6.3.3 Intervalos de Confiança para a Média Populacional com Variância 
Desconhecida ........................................................... 
 
Capítulo 7: Testes de Hipóteses ............................................................ 
7.1 Construção de um Teste de Hipóteses para o Parâmetro µ ............... 
7.2 Construção de um Teste de Hipóteses para o Parâmetro P ............... 
7.3 Teste para Comparação de Variâncias de duas Populações ............. 
7.4 Teste para a Comparação de duas Médias Populacionais para Amostras 
Independentes .................................................................. 
7.5 Teste para a Comparação de duas Médias Populacionais para Dados Emparelhados 
(Amostras Dependentes) ........................................... 
7.6 Teste de Associação Qui-quadrado ................................................... 
 
Anexos: 
Tabela de Números Aleatórios 
Tabelas de distribuições de probabilidade 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 6
Capítulo 1 
 
 
 
 
 
 
 
 
 
INTRODUÇÃO 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 7
A estatística tem grande aplicação na maioria das áreas do conhecimento humano, 
como por exemplo, área de Ciências Biológicas, Ciências da Saúde, Ciências Sociais 
Aplicadas, Ciências Agrárias e outras. Quando necessitamos tomar decisões com base em 
conjuntos de dados, a estatística ensina como coletar, organizar, analisar e interpretar esses 
dados para tirar conclusões adequadas. Dentre as diversas definições de estatística, 
citamos: 
 
Estatística é uma parte da Matemática Aplicada que fornece métodos 
para a coleta, a organização, a descrição, a análise e a interpretação de 
dados, visando a tomada de decisões (CRESPO, 1995, p. 13). 
 
Estatística é a ciência dos dados. Envolve a coleta, a classificação, o 
resumo, a organização, a análise e a interpretação da informação 
numérica. (VIEIRA, 1999). 
 
A Estatística envolve técnicas para coletar, organizar, descrever, analisar 
e interpretar dados, ou provenientes de experimentos, ou vindo de 
estudos observacionais (BARBETTA; REIS; BÓRNIA, 2004 p. 11). 
 
A Estatística pode ser didaticamente classificada em duas áreas: a estatística 
descritiva e a inferencial. 
A estatística descritiva é a parte da estatística que tem por objetivo coletar, 
descrever e analisar dados de determinada população, sem pretender conclusões de caráterextensivo. Utiliza métodos numéricos e gráficos para resumir e mostrar o comportamento 
dos dados. 
A estatística inferencial, fundamentada na teoria matemática das probabilidades, é a 
parte da estatística que, baseando-se em resultados obtidos na análise de amostras da 
população, procura inferir ou estimar leis de comportamento da população da qual a 
amostra foi retirada. 
 
 
 
 
 
 8
1.1 CONCEITOS BÁSICOS 
 
População: É o conjunto de elementos sobre o qual desejamos obter informações. A 
população pode ser FINITA ou INFINITA. Representamos por “N” o número de 
elementos da população. 
 
Censo: É o processo utilizado para levantar as características observáveis, abordando todos 
os elementos de uma população. Exemplo: Desejamos conhecer a faixa-etária dos alunos 
do curso de Ciências Biológicas – Ensino a Distância. Qual é a população de interesse? 
Todos os alunos matriculados no curso de Ciências Biológicas a Distância. 
 
Parâmetros: São características numéricas obtidas da população. Exemplo: média da 
altura dos alunos do Curso de Ciências Biológicas – Educação a Distância. 
 
Amostra: É um subconjunto retirado de uma população, obtido através de técnicas de 
amostragem. O número de elementos da amostra representamos por “n”. Exemplo: Em 
uma pesquisa de opinião para saber o resultado das eleições para presidente do Brasil, qual 
a população de interesse? Qual seria a amostra? A população é constituída de todos os 
eleitores do Brasil. A amostra seria um subconjunto (por exemplo, de n=2.000 eleitores) da 
população. 
 
Amostragem: É o processo de se extrair ou obter amostras. 
 
Estatísticas: São características numéricas obtidas da amostra. Exemplo: média da altura 
obtida de uma amostra dos alunos do Curso de Ciências Biológicas – Educação a 
Distância. 
 
Variável: É a característica que está sendo analisada em cada elemento de uma população. 
Exemplo: Na população de alunos do Curso de Ciências Biológicas – Educação a 
Distância, podemos estudar as variáveis peso, idade, sexo, etc. As variáveis podem ser 
classificadas conforme o quadro 1. 
 
 
 
 9
Quadro 1: Classificação das variáveis 
Qualitativas: Quando seus valores são expressos por atributos (não numéricas). 
Podem ser: 
- Nominais (sexo, estado civil, etc.) 
- Ordinais (Grau de escolaridade) 
Quantitativas: São as inerentemente numéricas. Podem ser: 
- Contínuas: Quando podem assumir valores num intervalo. (peso, altura, 
etc.) 
- Discretas: Quando assumem valores pontuais, geralmente de números 
inteiros. (número de filhos de um casal, número de aparelhos 
de TV vendidos no mês, etc.) 
Em geral, as medições dão origem às variáveis contínuas e as contagens ou 
enumerações, as variáveis discretas. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 10
Capítulo 2 
 
 
 
 
 
 
 
 
 
TÉCNICAS DE AMOSTRAGEM 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 11
Para que um conjunto de dados produza resultados úteis é necessário fazer um 
planejamento para a coleta destes dados. As decisões do dia-a-dia estão direta ou 
indiretamente baseadas em dados observados. Os dados observados devem produzir 
informações que atendam nossas indagações e que sejam confiáveis. Para tal, a coleta dos 
dados e a análise devem ser realizadas com critérios. 
Em geral, os parâmetros de uma população são desconhecidos, pois na prática nem 
sempre é possível observar toda a população. Então, é muito comum observarmos apenas 
uma amostra de seus elementos e, a partir dos resultados dessa amostra, obter valores 
aproximados, ou estimativas, para as características populacionais de interesse. Este tipo de 
pesquisa é usualmente chamado de levantamento por amostragem. 
Num levantamento por amostragem, a seleção dos elementos que serão observados 
deve ser feita sob uma metodologia adequada, de tal forma que os resultados da amostra 
sejam informativos para avaliar características de toda a população. Assim, antes de 
selecionarmos uma amostra, é preciso conhecermos as técnicas de amostragem. 
As amostras devem ser tão grandes quanto possível, pois quanto maior o tamanho 
da amostra, maior é a confiança nos resultados. As amostras muito pequenas, em geral, não 
dão boas estimativas. Como se determina o tamanho da amostra será ensinado no capítulo 
de inferência. 
 
Quadro 2.1 Vantagens em realizar o censo e a amostragem. 
Censo Amostragem 
- População pequena 
- Tamanho da amostra grande em relação 
à população 
- Exigência de precisão completa 
- População infinita 
- Tempo limitado 
- Teste destrutivo 
- Custo muito alto 
 
CÁLCULO DO NÚMERO DE AMOSTRAS: Dada uma população qualquer de N 
elementos, o número de amostras de tamanho n, possíveis, é dado por: 
 
Nn - Quando é feita a reposição do elemento sorteado, amostragem com reposição. 






n
N
 - Quando não é feita a reposição do elemento sorteado, amostragem sem reposição. 
Exemplo: Considere a população {1,2,3,4,5,6}. O número de amostras possíveis de 
tamanho n=2, é: 
 12
Com reposição: Nn = 62 = 36 - Sem reposição: 





n
N
 = 





2
6
 = 15 
 
TAMANHO DA AMOSTRA: As amostras devem ser tão grandes quanto possível, pois 
quanto maior o tamanho da amostra, maior é a confiança que se tem nos resultados. As 
amostras muito pequenas, em geral, não dão boas estimativas. Por outro lado, amostras 
muito grande, porém mal feitas, são piores porque dão idéia de conter uma verdade que 
não contem. Como se determina o tamanho da amostra será ensinado no capítulo 6. 
 
2.1. AMOSTRAGEM PROBABILÍSTICA 
 
A amostragem probabilística ou aleatória é aquela em que cada elemento da 
população tem a mesma probabilidade p (dada por n/N) conhecida, 0<p<1, de pertencer à 
amostra. 
2.1.1 Amostragem Aleatória Simples 
 
Esta amostragem é feita através de sucessivos sorteios. Para selecionarmos uma 
amostra aleatória simples é necessário termos uma lista de todos os elementos da 
população. A amostra pode ser realizada com reposição (quando o elemento sorteado volta 
para a população, ou seja, pode ser sorteado de novo) ou sem reposição (quando o 
elemento sorteado não pode ser sorteado de novo). 
Para populações pequenas numeramos todos os elementos da população e 
efetuamos sucessivos sorteios, sem reposição, até completarmos o tamanho da amostra. 
Para populações grandes, usamos a tabela de números aleatórios (Tabela 1 do 
anexo) ou os números aleatórios fornecidos por uma calculadora ou um software 
computacional. 
 
Exemplo 2.1 Com o interesse de conhecermos algumas características dos alunos de uma 
turma de graduação com 45 alunos, vamos extrair uma amostra aleatória de 6 alunos. 
 
a) Numeramos todos os elementos da população. Os números devem ter a mesma quantia 
de algarismos. Assim temos: 
01 Ariane, 02 Bernardo, ..., 45 Viviane. 
 13
b) Tomamos n=6 números aleatórios do conjunto {01, 02, ... , 45}, desprezando os 
números que estão fora do conjunto e os que se repetem. Os números podem ser 
tomados da tabela de números aleatórios, de uma calculadora que contenha a função 
números aleatórios ou ainda usando um software computacional. 
c) Verificamos quais os alunos que correspondem aos números selecionados 
aleatoriamente. Estes são os alunos que formam a amostra aleatória simples. 
 
2.1.2 Amostragem Aleatória sistemática 
 
O processo consiste em sortearmos o primeiro elemento de um intervalo 
denominado “intervalo de amostragem” e selecionarmos sistematicamente os demais. É 
mais utilizada quando os elementos da população estão numerados. Para selecionarmos os 
elementos sistematicamente é preciso: 
a) Calculamoso intervalo de amostragem, dado por, K=N/n, desprezando as decimais (K 
deve ser arredondado para cima). 
b) Sorteamos um número entre os números 1,2, ...,K. 
c) Selecionamos o elemento de cada intervalo de amostragem, correspondente ao número 
sorteado. 
 
Exemplo 2.2 Vamos supor uma população de 800 alunos de certa Faculdade, já 
numerados, de onde se quer extrair uma amostra de 50 alunos. 
a) Determinamos o intervalo de amostragem: 
K=N/n=800/50=16 
b) Selecionamos 1 (um) número aleatório de 1 a 16, usando uma calculadora ou a tabela de 
números aleatórios. Tomamos os números da posição correspondente ao número sorteado a 
cada intervalo de amostragem de 16 elementos. Supomos que o número sorteado seja 7. Os 
números que farão parte da amostra são: 7, 23, 39, 55, ..., 775, 791. 
c) Verificamos quais os alunos correspondentes a estes números e então temos a amostra. 
 
2.1.3 Amostragem Aleatória Estratificada 
 
Consiste em dividir uma população heterogênea em subpopulações (ou subgrupos) 
mais ou menos homogêneas. As subpopulações são chamadas de “estratos”, dos quais são 
extraídas amostras do tipo aleatória simples ou sistemática, independentes de estrato para 
 14
estrato. A amostra final é obtida através da união das amostras de cada estrato. Geralmente, 
os estratos são de tamanhos diferentes em função de buscarmos a homogeneidade dentro 
de cada estrato com relação à característica em estudo. Assim, a amostragem estratificada 
pode ser obtida de duas formas: 
 
Amostragem Estratificada Proporcional: O tamanho da amostra de cada estrato é 
proporcional ao tamanho de cada estrato em relação à população. Desta forma, cada 
elemento da população tem a mesma probabilidade de pertencer à amostra. 
 
Exemplo 2.3 Desejamos fazer um estudo dos alunos do ensino médio de uma escola 
pública para investigar o uso de bebidas alcoólicas. A escola tem três turmas de 1ª série 
(125 alunos), duas de 2ª (75 alunos) e uma de 3ª série (50 alunos) num total de 250 alunos. 
Desejamos realizar um levantamento por amostragem, de tamanho n=50 alunos. 
 
a) Determinamos os estratos por série e o tamanho da amostra proporcional a cada estrato. 
 
Tabela 2.1 Cálculo do tamanho proporcional da amostra por estrato. 
 
Estrato A 
(1ª série) 
Estrato B 
(2ª série) 
Estrato C 
(3ª série) 
N. de alunos NA=125 NB=75 NC=50 
Proporção pA=125/250=0,5 pB=75/250=0,3 pC=50/250=0,2 
Amostra nA==0,5.(50)=25 nB=0,3.(50)=15 nC=0,2.(50)=10 
 
b) Para cada estrato selecionamos a amostra usando a amostragem aleatória simples ou a 
sistemática. Não é necessário utilizar a mesma técnica em todos os estratos. 
c) A amostra final é composta pelas amostras dos três estratos. 
 
Amostragem Estratificada Uniforme: O tamanho da amostra de cada estrato é o mesmo. 
E usada quando desejamos comparar os diversos estratos. No exemplo 2.1, para obtermos 
uma amostra aleatória estratificada uniforme de tamanho n=30, devemos selecionar 10 
alunos de cada estrato. 
 
 
 
 15
2.1.4 Amostragem de Conglomerados 
 
Conglomerado é um agrupamento de elementos da população. Por exemplo, num 
carregamento de laranjas, as caixas de laranjas são os conglomerados. A amostragem 
consiste em selecionarmos aleatoriamente algumas caixas de laranja e analisarmos toda a 
caixa ou ainda, fazer uma nova seleção aleatória de elementos (laranjas) de cada caixa. 
 
2.2. AMOSTRAGEM NÃO-PROBABILÍSTICA 
 
A amostragem não-probabilística é aquela em que os elementos da população não 
têm todos a mesma probabilidade de pertencer à amostra. Isto pode ocorrer em situações 
tais como a inacessibilidade a toda a população, população formada por material contínuo 
(líquido ou sólido). Em tais situações é mais adequada uma amostragem não-aleatória. 
Porém procuramos gerar amostras que representam razoavelmente bem a população. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 16
EXERCÍCIOS 
 
1) Uma clínica veterinária possui os registros dos animais que atende organizados em um 
arquivo. Descreva o procedimento para obter uma amostra aleatória sistemática de 
tamanho igual a 1/3 do total de animais atendidos. 
 
2) Um pesquisador tem 5 gaiolas que contém, cada uma, 4 ratos. Descreva a maneira de 
selecionar 1 rato de cada gaiola, para compor uma amostra de tamanho n=5. 
 
3) Dada uma população de 10 alunos {Aline, Beatriz, Carlos, Darlei, Eliane, Fabíola, 
Geraldo, Hélio, Isabela e João}. Obtenha todas as possíveis amostras distintas, do tipo 
sistemática, de 5 elementos. 
 
4) Dada uma população de 125 alunos, estabeleça uma forma de obter uma amostra casual 
simples de 10 alunos. 
 
5) Os dados abaixo se referem aos pesos (em gramas) de animais de laboratório. 
250 272 276 257 363 298 281 260 
276 295 285 277 261 299 310 318 
295 320 312 255 281 315 306 296 
310 275 312 265 315 288 305 265 
269 276 284 291 273 294 288 299 
306 318 291 267 298 305 286 257 
305 290 291 275 260 271 259 289 
281 295 297 313 290 298 265 271 
260 305 312 303 293 285 288 255 
274 283 296 302 318 320 251 262 
 
a) Selecione uma amostra aleatória de tamanho n=8, através de uma amostragem aleatória 
simples. 
b) Selecione uma amostra aleatória de tamanho n=8, através de uma amostragem aleatória 
sistemática. 
c) Divida a população em dois estratos: Estrato A: pesos menores que 300 gramas e Estrato 
B: pesos maiores ou iguais a 300 gramas. Selecione uma amostra estratificada proporcional 
de tamanho n=16, através de uma amostragem sistemática, considerando os estratos. 
 
 
 17
Capítulo 3 
 
 
 
 
 
 
 
 
 
APRESENTAÇÃO DE DADOS 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 18
A apresentação de dados estatísticos pode ser feita por meio de tabelas ou gráficos. 
A tabela é o resumo de um conjunto de observações, dispostos ordenadamente em 
linhas e colunas. As tabelas são constituídas por: 
Cabeçalho: é a parte superior da tabela, apresentando as variáveis envolvidas e indicando 
as respostas numéricas. 
Corpo da tabela: é a distribuição numérica das observações em relação à variável. 
Coluna indicadora: é a coluna da variável principal e suas variações. As respostas são 
colocadas em ordem alfabética e apenas a primeira letra maiúscula. 
Total: é optativo, mas quando utilizado deve aparecer em destaque, ou seja, deixar um 
espaço de uma variável antes de inserir o total. 
 
Quanto às informações: 
Título: é a indicação que precede a tabela e que contém a designação do fato observado, o 
local e a época em que foi registrado. (o que? onde? quando?). 
Fonte: a indicação da entidade responsável pelo fornecimento dos dados ou pela sua 
elaboração. 
Notas: são informações de natureza geral, destinados a conceituar ou esclarecer o 
conteúdo das tabelas, ou a indicar a metodologia utilizada no levantamento ou na 
elaboração dos dados. 
Chamadas: são informações de natureza específica sobre determinada parte da tabela, 
destinadas a conceituar ou esclarecer dados. 
 
Quanto à sua divisão: 
Traços horizontais: separam o cabeçalho e aparece no final da tabela. Salientamos ainda 
que o primeiro traço e o último devem ser mais fortes ou duplos. 
 
Traços verticais: só aparecem para destacar a coluna indicadora do corpo da tabela. Os 
demais traços verticais se necessário devem ser feitos apenas no cabeçalho. 
O gráfico estatístico produz, no público em geral, uma impressão rápida e viva do 
fenômeno em estudo. Os gráficos são constituídos por: 
Título: acima do gráfico, completo, claro e conciso; 
Fonte: abaixo do gráfico; 
Legenda: não deve prejudicar a leitura do gráfico. 
 19
Forma: a altura do gráfico deve ter, aproximadamente, 75% da largura, de modo que, 
incluindo o título, legenda e o rodapé, a moldura do gráficoassuma mais ou menos, a 
forma quadrada. 
 
Tipos de gráficos: Os gráficos mais utilizados na estatística são os diagramas e 
esteriogramas. Daremos maior enfoque ao aprendizado dos diagramas, dentre os quais se 
destacam: 
 
Gráficos de Colunas: É a representação de dados por meio de retângulos, dispostos 
verticalmente. 
Gráficos em Barras: É a representação de dados por meio de retângulos, dispostos 
horizontalmente. 
Gráficos de Linhas: É a representação de dados por meio de uma linha. 
Gráficos de Setores: É a representação de dados com base em um círculo, e é empregado 
sempre que se deseja ressaltar a participação de uma parte em relação ao total. 
Gráficos Comparativos: É a representação de mais de uma variável em um mesmo 
gráfico. 
 
3.1 TABELAS E GRÁFICOS DE DADOS QUALITATIVOS 
 
As variáveis qualitativas são aquelas em que seus valores são expressos por 
atributos (não numéricas), por exemplo, sexo, estado civil, graus de escolaridade, etc. 
Temos dois tipos de tabelas: 
a) Tabela simples: É a representação de valores de uma única variável. 
 
Tabela 3.1: Grau de escolaridade de uma amostra de moradores do Bairro Sanenge, 
Maringá – PR, 2004. 
Grau de escolaridade Número Percentual 
1ª a 4ª série 23 22,5 
5ª a 8ª série 22 21,6 
2º grau 44 43,1 
3º grau 6 5,9 
Sem escolaridade 7 6,9 
Total geral 102 100,0 
Fonte: Alunos do ensino médio do Colégio Estadual Silvio M. Barros. 
 20
22,5
21,6
43,1
5,9
6,9
0,0 5,0 10,0 15,0 20,0 25,0 30,0 35,0 40,0 45,0 50,0
1ª a 4ª série
5ª a 8ª série
2º grau
3º grau
Sem escolaridade
Percentagem
 
Figura 3.1 Grau de escolaridade de uma amostra dos moradores do Bairro Sanenge, 
Maringá – PR, 2004. 
 
b) Tabela de dupla entrada ou de contingência: É a representação, em uma única tabela, 
de valores de mais de uma variável, isto é, a conjugação de duas tabelas. 
Tabela 3.2 Grau de escolaridade versus sexo de uma amostra de moradores do bairro 
Sanenge, Maringá - PR, 2004. 
Grau de escolaridade Sexo 
1ª a 4ª s. 5ª a 8ª s. 2º grau 3º grau Sem esc. 
Total 
Masculino 10 5 10 3 1 29 
Feminino 13 17 34 3 6 73 
Total 23 22 44 6 7 102 
Fonte: Alunos do ensino médio do Colégio Estadual Silvio M. Barros. 
 
10
5
10
3
1
13
17
34
3
6
0
5
10
15
20
25
30
35
40
1ª a 4ª série 5ª a 8ª série 2º grau 3º grau Sem esc.
Fr
eq
u
ên
ci
a
Masculino
Feminino
 
Figura 3.2 Grau de escolaridade versus sexo dos moradores do bairro Sanenge, Maringá - 
PR, 2004. 
 
 21
3.2 TABELAS E GRÁFICOS DE DADOS QUANTITATIVOS 
 
Muitas vezes, nós trabalhamos com variáveis quantitativas com muitos valores 
distintos, de forma que sua análise fica cansativa e não é possível visualizar a distribuição 
dos dados. 
As tabelas para variáveis quantitativas discretas ou contínuas são construídas 
levando em consideração a frequência com que os dados aparecem no conjunto, ou seja, o 
número de vezes em que ele se repete. Estas tabelas são chamadas de distribuição de 
frequências. Há dois tipos de tabelas de distribuição de frequências: de variável discreta e 
de variável contínua. 
 
3.2.1 Distribuição de Frequências para Variáveis Discretas 
Quando temos poucos resultados diferentes para a variável fazemos a contagem 
dos dados para cada valor. 
 
Exemplo 3.1: Vamos supor que foram contados os filhos de 138 famílias da cidade de 
Maringá, em 2004. A tabela de distribuição de frequências (Tabela 3.3) do número de 
filhos das famílias é construído através da contagem das repetições dos resultados 
observados. 
 
Tabela 3.3 Distribuição de frequências do número de filhos de 138 famílias que residem 
em Maringá, 2004. 
N0 de Filhos N0 de Famílias 
0 5 
1 30 
2 55 
3 30 
 4 10 
5 5 
6 3 
Total 138 
Fonte: Dados fictícios 
 
A representação gráfica pode ser feita de duas maneiras, por hastes verticais sobre 
os valores observados (Figura 3.3) ou retângulos justapostos e com a mesma largura 
(Figura 3.4). 
 
 22
5
30
55
30
10
5 3
0
10
20
30
40
50
60
0 1 2 3 4 5 6
Número de filhos
N
úm
er
o
 
de
 
fa
m
íli
as
 
Figura 3.3 Distribuição de frequências do número de filhos de 138 famílias que residem 
em Maringá-PR, 2004. 
 
5
30
55
30
10
5 3
0
10
20
30
40
50
60
0 1 2 3 4 5 6
Número de filhos
N
úm
er
o
 
de
 
fa
m
íli
as
 
Figura 3.4 Distribuição de frequências do número de filhos de 138 famílias que residem 
em Maringá-PR, 2004. 
 
Quando temos muitos valores diferentes da variável devemos criar classes de 
valores de ocorrência de modo análogo ao que é feito para variáveis contínuas que veremos 
a seguir. 
 
3.2.2 Distribuição de Frequências para Variáveis Contínuas 
 
 23
Quando a variável é do tipo contínua, os valores observados dificilmente se 
repetem, então, a forma apropriada de resumir os dados é através da distribuição de 
frequências em classes ou intervalos. 
Exemplo 3.2: Supõe-se que foram coletados os pesos de 100 alunos. A tabela de 
distribuição de frequências (Tabela 3.4) do peso dos alunos é construída através da 
contagem dos valores observados em cada intervalo. 
 
Tabela 3.4 Distribuição de frequências dos pesos dos alunos da disciplina de estatística 
da UEM, 2004. 
Peso em kg Freqüência 
50 ├─── 55 
55 ├─── 60 
60 ├─── 65 
65 ├─── 70 
70 ├─── 75 
75 ├─── 80 
80 ├─── 85 
85 ├─── 90 
90 ├─── 95 
95 ├─── 100 
2 
3 
10 
14 
30 
18 
11 
7 
4 
1 
TOTAL 100 
Fonte: Dados fictícios 
 
Construção da Tabela de Distribuição de Frequências em Classes. 
a) Crítica dos dados: É a verificação que se deve fazer nos dados, após sua coleta, a 
procura de possíveis falhas, imperfeições e erros. 
b) Dados brutos (xI): É o conjunto de dados numéricos obtidos após a crítica dos valores 
coletados x1, ..., xn (se amostrais) e x1, ..., xN (se populacionais). 
c) Rol: É o arranjo dos dados brutos em ordem crescente ou decrescente. 
d) Amplitude total (AT): É a diferença entre o maior e o menor valor dos dados 
observados. AT = xmáx-xmín. 
e) Número de Classes (k): A sintetização dos dados em tabelas nos leva a separá-los em 
subconjuntos segundo “k “ classes de valores. Existem diversas maneiras para se encontrar 
o número de classes (k), uma delas é a raiz quadrada do número de elementos 
( k n= ou k = N ). Na realidade, a prática do pesquisador é que vai determinar se o 
número de classes é razoável, levando em conta a amplitude total (AT) e o número de 
elementos (n ou N). Recomendamos (5 ≤ k ≤ 12). 
 24
f) Amplitude das classes (h): É o intervalo de valores estabelecido para cada classe, que é 
dado por h = AT/k. h tem que ter o mesmo número de casas decimais que os escores e deve 
ser arredondado somente para um valor maior. 
g) Limites de classes (li ou Li): São os valores extremos de cada intervalo de classe 
representados por: li = limite inferior e Li = limite superior 
Notações entre os limites de classes: 
├──┤ inclui os dois limites na classe. ├── inclui somente o limite inferior. 
 ──┤ inclui somente o limite superior. ─── não inclui nenhum do limites. 
h) Frequências absolutas de classes (FI ): É o número de dados cujos valores pertencem a 
cada classe. O limite superior da última classe pode ser obtido por: LK = l1 + h.K 
 
Colunas complementares na tabela de distribuição de frequências 
i) Ponto médio de classe ( xi ): É o valor que representa os elementos de uma classe dado 
por: xi=(Li+li)/2 
j) Frequências absolutas acumuladas (Fai): Consiste em acumular o número de dados de 
uma dada classe acrescido de todos os dados das classes anteriores. 
k) Frequências relativas (fiou fi %): É a proporção ou percentual de dados em cada 
classe, dada pela expressão: fi=Fi/n ou fi%=(Fi/n).100 
l) Frequências absolutas acumuladas percentuais (Fai %): Traduzem a percentagem de 
dados acumulados até a classe “ i ”: Fai%=(Fai/n).100 
 
Exemplo 3.3 Vamos construir a tabela de distribuição de frequências para os pesos (kg) de 
28 alunos de certa universidade. 
58 49 65 79 73 84 81 
76 67 63 52 61 48 55 
63 75 81 52 66 68 74 
70 69 72 58 67 67 60 
 
a) Colocamos os dados em ordem crescente (rol). 
48 55 61 66 68 73 79 
49 58 63 67 69 74 81 
52 58 63 67 70 75 81 
52 60 65 67 72 76 84 
 
b) Calculamos a amplitude total (AT): AT = xmáx-xmín=84-48=36 kg 
c) Definimos o número de classes (k): k n 28 5,29= = = . 
 25
Podemos considerar 5 ou 6 classes. Vamos usar 6 classes. 
d) Determinamos o tamanho da classe (h): h = AT/k=36/6=6. 
e) Construímos a tabela de distribuição de frequências e determinamos as frequências 
absolutas de classes (FI): Por exemplo, na primeira classe existem 4 valores: 48, 49, 52, 52. 
 
Tabela 3.5 Distribuição de frequências para os pesos (kg) de 28 alunos de uma certa 
universidade. 
Peso em kg Frequência (FI) 
48 ├─── 54 
54 ├─── 60 
60 ├─── 66 
66 ├─── 72 
72 ├─── 78 
78 ├───┤84 
4 
3 
5 
7 
5 
4 
Total 28 
 
Colunas complementares na tabela de distribuição de frequências: 
 
f) Calculamos o ponto médio de cada classe (xi): x1=(L1+l1)/2=(54+48)/2=51. Assim, 
procedemos para cada classe. 
g) Calculamos as frequências absolutas acumuladas (Fai): o valor acumulado da primeira 
classe consiste no valor da frequência absoluta, o valor acumulado da segunda classe é a 
soma dos valores das frequências absolutas da primeira e segunda, e, assim, 
sucessivamente se acumula o número de dados de uma dada classe acrescido de todos os 
dados das classes anteriores. 
 
Tabela 3.6 Distribuição de frequências e colunas complementares para os pesos (kg) de 
28 alunos de uma certa universidade. 
Peso em kg Frequência (FI) 
Ponto 
Médio (xi) Fai fi fi% Fai% 
48 ├─── 54 
54 ├─── 60 
60 ├─── 66 
66 ├─── 72 
72 ├─── 78 
78 ├───┤84 
4 
3 
5 
7 
5 
4 
51 
57 
63 
69 
75 
81 
4 
7 
12 
19 
24 
28 
0,143 
0,107 
0,179 
0,250 
0,179 
0,143 
14,3 
10,7 
17,9 
25,0 
17,9 
14,3 
14,3 
25,0 
42,9 
67,9 
85,8 
100,0 
Total 28 1,000 100,0 
 
 26
h) Calculamos as frequências relativas (fi ou fi %): f1=F1/n=4/28=0,143, ... 
f6=F6/n=4/28=0,143. Em percentual, multiplicamos por 100 a fi. 
i) Calculamos as frequências absolutas acumuladas percentuais (Fai%): 
Fa1%=(Fa1/n)100=(4/28)100=14,3% ... Fa6%=(Fa6/n)100=100,0% 
 
Construção de Gráficos de Distribuição de Frequências em Classes. 
 
A representação gráfica é feita de três formas: 
Histogramas: As classes da distribuição de frequências são representadas por colunas 
justapostas, cujas alturas são definidas pelas respectivas frequências absolutas (Fi). O 
histograma é construído sobre os intervalos de classe e as áreas dos retângulos que o 
compõem representam proporcionalmente os dados cujos valores ocorrem em cada classe. 
 
Polígonos de frequências: É um gráfico de área construído unindo-se os pontos (xi ; Fi) 
onde xi são os pontos médios dos intervalos de classe e Fi são as frequências absolutas das 
classes. Cria-se no eixo das abcissas um ponto médio aquém do menor valor de xi e outro 
além do maior valor de xi, para que o polígono fique definido e tenha equivalência de área 
com o histograma da mesma distribuição. Suavizando a linha poligonal que define o 
polígono obtém-se uma curva que visualiza a tendência de variação dos dados. 
 
Polígonos de frequências acumuladas ou ogivas: As ogivas (mais utilizadas) são 
construídas unindo os pontos (Li ; Fai) ou (Li ; Fai%), onde Li são os extremos superiores 
dos intervalos de cada classe. 
 
Para a tabela 3.4 os gráficos são apresentados nas Figuras 3.5, 3.6 e 3.7. 
2 3
10
15
29
18
11
7
4
1
0
5
10
15
20
25
30
35
50 55 60 65 70 75 80 85 90 95 100
Peso em kg
Fr
eq
üê
n
ci
a
 
 27
Figura 3.5 Histograma de frequências dos pesos dos alunos da disciplina 
de estatística da UEM, 2004. 
 
0
5
10
15
20
25
30
35
47
,
5
52
,
5
57
,
5
62
,
5
67
,
5
72
,
5
77
,
5
82
,
5
87
,
5
92
,
5
97
,
5
10
2,
5
Peso em kg
Fr
eq
u
en
ci
a
 
Figura 3.6 Polígono de frequências dos pesos dos alunos da disciplina de 
estatística da UEM, 2004. 
 
0 2 5
15
29
59
77
88 95
99 100
0
20
40
60
80
100
120
50 55 60 65 70 75 80 85 90 95 100
Peso em kg
Fr
eq
u
ên
ci
a
 
Figura 3.7 Polígono de frequências acumuladas dos pesos dos alunos da 
disciplina de estatística da UEM, 2004. 
 
 
 
 
 
 
 
 
 
 
 
 28
EXERCÍCIOS 
 
1) Numa pesquisa por amostragem, realizada com 25 pessoas em um supermercado, 
levantaram-se as seguintes informações: 
Aluno Número de 
pessoas na 
família 
Sexo Grau de 
escolaridade 
Idade Renda 
familiar 
(R$) 
1 3 M Fundamental 32 1200 
2 2 F Médio 45 1500 
3 4 F Fundamental 38 1000 
4 3 M Fundamental 35 950 
5 5 M Médio 41 750 
6 2 M Superior 40 1800 
7 1 F Superior 39 2200 
8 1 F Superior 33 1100 
9 2 M Médio 36 1600 
10 2 F Fundamental 35 2000 
11 5 M Superior 33 1250 
12 3 F Fundamental 40 1400 
13 7 M Médio 42 1800 
14 4 M Superior 45 1700 
15 6 F Fundamental 36 1700 
16 6 M Médio 40 1500 
17 5 F Médio 36 2000 
18 4 F Superior 38 1700 
19 2 M Superior 43 1800 
20 3 F Fundamental 38 2100 
21 3 F Médio 41 2000 
22 3 M Superior 35 1300 
23 4 M Médio 40 1500 
24 3 F Superior 34 1200 
25 4 F Médio 41 1500 
 
a) Classificar o tipo de cada variável. 
b) Construir uma tabela de distribuição de frequências adequada para cada variável. 
b) Construir os gráficos adequados para cada variável. 
 
 
 
 
 
 
 29
Capítulo 4 
 
 
 
 
 
 
 
 
 
ANÁLISE DE DADOS 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 30
4.1 MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL 
 
São medidas que objetivam representar, através de um só número, características 
quantitativas dos dados. São elas: a média, a mediana e a moda. 
 
a) Média. Representa o ponto de equilíbrio de um conjunto de dados. Seja (x1,...,xn ) um 
conjunto de dados. 
Média da amostra: 
n
x
x
i∑
= e Média da população: 
N
x
µ
i∑
= 
Para obtemos a média em tabelas de distribuição de frequências usamos a seguinte 
expressão: 
∑
∑
=
i
ii
F
F x
x . 
- Para tabelas sem intervalos de classe, xi são os valores da variável. 
- Para tabelas com intervalos de classe, xi corresponde ao ponto médio do intervalo. 
Algumas propriedades da média: 
1) A soma algébrica dos desvios (di) tomados em relação a média é nula. 
di = xi - x e ∑
=
k
1i
di = 0 
2) Somando ou subtraindo uma constante (c) a todos os valores de uma variável, a média 
do conjunto fica aumentada ou diminuída dessa constante. 
yi = xi ± c ⇒ y = x ± c 
3) Multiplicando ou dividindo todos os valores de uma variável por uma constante (c), a 
média do conjunto fica multiplicada ou dividida por essa constante. 
yi = xi . c ⇒ y = x . c e 
c
xy
c
xy ii =⇒= 
 
b) Moda. É o valor que ocorre com maior frequência em um conjunto de dados. Existem 
séries em que nenhum valor aparece mais vezes que outros (séries amodais). Em outros 
casos, pode aparecer dois (bimodal), três (trimodal), ou mais valores de concentração. 
Para localizar o valor da moda, usamos os dados em rol. 
A moda de dados de tabelas de distribuição de frequênciasé apurada, geralmente, 
pela expressão de Czuber. 
 31
)F(F)F(F
)Fh.(FlM
1ii1ii
1ii
io
+−
−
−+−
−
+=
 (i representa a classe de maior frequência). 
 
c) Mediana. A mediana de um conjunto de valores ordenados segundo uma ordem de 
grandeza é a medida que ocupa a posição central do conjunto de dados, ou seja, ela divide 
o conjunto em duas partes iguais, 50% dos valores estão abaixo e 50% estão acima do 
valor da mediana. 
Se a série tiver um número ímpar de termos, a Md é o valor que está no centro da 
série. Neste caso, determina-se a mediana da seguinte forma: 
Md = xp onde p=(n+1)/2 é a posição do elemento central. 
Se a série tiver um número par de termos, temos dois elementos ocupando o centro 
da série, então, a mediana é a média aritmética destes elementos, calculada da seguinte 
forma: 
p p+1
d
x + x
M 
2
= (p=n/2 é a posição do primeiro elemento central da série). 
A mediana de dados de tabelas de distribuição de frequências em classes é 
calculada por: 
i
1i
id F
)Fah.(plM −−+= . ( p n / 2= e i representa a classe que contém o menor valor de Fai , 
para o qual Fai≥n/2). 
 
A mediana divide um conjunto de dados em duas partes iguais, assim, a mediana é 
uma medida separatriz. Existem outras separatrizes, que não são medidas de tendência 
central, mas tem similaridade com a mediana. Uma medida separatriz que muitas vezes é 
de interesse do pesquisador é o “Quartil”. 
Quartis (Qi): Denominamos quartis os valores de uma série que a divide em quatro 
partes iguais. O primeiro quartil (Q1) delimita os 25% menores valores, o terceiro quartil 
(Q3) delimita os 25% maiores valores e o segundo quartil é a própria mediana que separa 
os 50% menores dos 50% maiores valores. 
 
Para calcularmos os quartis, organizamos os dados em ordem crescente. 
Obtemos a mediana, que é o segundo quartil. 
 32
Obtemos o primeiro quartil, procedendo como se fosse calcular a mediana dos 
dados menores que a mediana já calculada. 
 
Obtemos o terceiro quartil, procedendo como se fosse calcular a mediana dos dados 
maiores que a mediana já calculada. 
 
Os quartis para dados de tabelas de distribuição de frequências em classes são 
calculadas da seguinte forma: 
k
i-1
i
i
h.(p-Fa )Q =l +
F
 
Onde: - i é a classe que contém o quartil ( Q1 , Q2 , Q3 ) 
-K é a ordem do quartil: K = 1, 2, 3 
-p é a posição do quartil desejado e é calculado pela expressão: 
np= .K
4
 
 
Exemplo 4.1 Obtenha as medidas de posição para os dados do exemplo 3.3. 
 
a) média: 
n
x
x
i∑
= = (48+49+ ... +84)/28=66,179 kg 
O peso médio dos alunos é de 66,179 kg, que representa o ponto de equilíbrio do 
conjunto de dados. 
 
b) moda: A moda é o valor da série que ocorre com maior frequência. O valor 67 kg 
ocorreu três vezes, é a moda da série. Mo=67 kg. 
 
c) mediana: Como a série tem número par de termos, temos dois elementos ocupando o 
centro da série. Então, a mediana é a média aritmética destes elementos, calculada da 
seguinte forma: 
p=n/2=28/2=14, assim: p p+1 14 15d
x + x x + x 67 + 67M = 67
2 2 2
= = = 
Logo, 50% dos alunos têm peso abaixo de 67 kg. 
 
d) quartis: 
Primeiro quartil: i=1/4(28+1)=7,25 , temos então que o primeiro quartil é: 
 33
Q1=x7,25= x7+0,25(x8-x7)=58+0,25(60-58)=58,5 
Terceiro quartil: i=3/4(28+1)=21,75 , temos então que o terceiro quartil é: 
Q3=x21,75= x21+0,75(x22-x21 )=73+0,75(74-73)=73,75 
 
Exemplo 4.2 Obtenha as medidas de posição dos dados da tabela 3.5 de distribuição de 
frequências. 
 
a) média: 
∑
∑
=
i
ii
F
F x
x = (51.4+ ... +81.4)/28=66,857 kg 
O peso médio dos alunos obtido da distribuição de frequências é de 66,857 kg. 
 
b) moda: )F(F)F(F
)Fh.(FlM
1ii1ii
1ii
io
+−
−
−+−
−
+=
 (i representa a classe de maior frequência). 
A classe de maior frequência absoluta é i=4. Assim, temos: 
4 4 1
o 4
4 4 1 4 4 1
h.(F F ) 6.(7 5)M l 66 69(F F ) (F F ) (7 5) (7 5)
−
− +
− −
= + = + =
− + − − + −
 
A moda obtida da distribuição de frequências é de 69 kg. 
 
c) mediana: 
i
1i
id F
)Fah.(plM −−+= . (p=28/2=14 e i=4 representa a classe que contém o 
menor valor de Fai=19>14). 
Assim: i 1 4 1d i 4
i 4
h.(p Fa ) h.(p Fa ) 6.(14 12)M l l 66 67,714
F F 7
− −
− − −
= + = + = + = 
A mediana obtida da distribuição de frequências é de 67,714 kg. 
 
d) quartis: 
Primeiro quartil: 
Posição: p=(n/4).k =28/4.1=7. A posição do quartil desejado e é a classe 2. 
k
i-1 2-1
i 2
i 2
h.(p-Fa ) h.(p-Fa ) 6.(7-4)Q =l + l + 54+ 60
F F 3
= = = 
Terceiro quartil: 
Posição: p=(n/4).k =28/4.3=21. A posição do quartil desejado e é a classe 5. 
k
5-1i-1
i 5
i 5
h.(p-Fa )h.(p-Fa ) 6.(21-19)Q =l + l + 72+ 74,4
F F 5
= = = 
 34
4.2 MEDIDAS DE DISPERSÃO 
 
São medidas estatísticas que visam fornecer o grau de variabilidade ou dispersão 
dos dados pesquisados, utilizando como referência uma medida de tendência central 
(geralmente utilizamos a média). As medidas de dispersão são importantes em termos de 
análise, pois dois ou mais conjuntos de dados podem estar centrados em um mesmo valor 
(medidas de tendência central), mas seus valores poderão estar muito mais dispersos num 
conjunto do que no outro. As medidas de dispersão que nos interessam são: a amplitude 
total, a variância, o desvio-padrão e o coeficiente de variação. 
 
a) Variância e desvio padrão. A variância e o desvio padrão são medidas que avaliam a 
dispersão dos dados de forma a complementar as informações contidas na média. 
 
A variância é a medida que fornece o grau de variabilidade ou dispersão dos dados em 
torno da média, na unidade quadrática. 
 
 
 Dados originais Distribuição de frequências 
Amostral ( )
1n
xx
s
2
i2
−
−
=
∑
 
( )
1n
Fxx
s
i
2
i2
−
−
=
∑
 
Populacional ( )
N
µx
σ
2
i2 ∑ −
= 
( )
N
Fµx
σ
i
2
i2 ∑ −
= 
 
O desvio-padrão é a medida que fornece o grau de variabilidade ou dispersão dos dados em 
torno da média na unidade dos dados. 
 
Amostral Populacional 
2ss = 2σσ = 
 
b) Coeficiente de variação. O coeficiente de variação (CV) mede a variação ou dispersão 
dos dados em termos relativos, pois ao dividir o desvio-padrão pela média, a unidade de 
medida é cancelada. Assim, o coeficiente de variação é muito útil quando se quer comparar 
as variações de diferentes unidades de medida. Quanto mais próximo de 0 ou 0%, menor a 
 35
variabilidade dos dados. Para valores do cv ≤ 50%, a média é representativa dos dados. 
Quanto mais próximo de 1 ou 100%, maior a variabilidade dos dados. Neste caso, cv > 
50%, a média não representa bem o conjunto de dados. 
Amostral: CV%=(s/ x ).100 Populacional; CV%=(σ/µ).100 
 
Exemplo 4.3 Obtenha as medidas de dispersão para os dados do exemplo 3.3. 
a) variância: ( )
1n
xx
s
2
i2
−
−
=
∑
 
( ) ( )2 2 2 2i2 x x 48 66,179 (49 66,179) ... (84 66,179)s 97,707
n 1 28 1
−
− + − + + −
= = =
− −
∑ ∑
 
É a dispersão dos dados em relação a média, na unidade quadrática. 
 
b) desvio padrão: 2ss = 
2s s 97,707 9,885= = = 
É a dispersão dos dados em relação a média na unidade original. 
 
c) coeficiente de variação: CV%=(s/ x ).100=(9,885/66,179).100=14,94%. 
Como o valor do CV<50%, a média é representativa do conjunto de dados. 
 
Exemplo 4.4 Obtenha as medidas de dispersão para os dados da tabela 3.5. 
 
a) variância é: 
( ) ( )2 2 2i i2 x x F 51 66,857 .4 ... (81 66,857) .4s 93,901
n 1 28 1
−
− + + −
= = =
− −
∑ ∑
 
b) desvio padrão: 2s s 93,901 9,690= = = 
c) coeficiente de variação: CV%=(s/ x ).100=(9,690/66,857).100=14,49%.4.3 MEDIDAS DE SIMETRIA 
 
Tem por objetivo básico medir o quanto uma distribuição se afasta da condição de 
simetria. Pode ser: 
 36
a) Simétrica: Quando a média e a mediana coincidem. 
b) Assimétrica negativa: Quando a média é menor que a mediana. 
c) Assimétrica positiva: Quando a média é maior que a mediana. 
 
 
Uma medida possível para quantificar a assimetria de uma distribuição é a dada 
pelo primeiro coeficiente de assimetria de Pearson. 
 
Populacional:: A Ms o=
−µ
σ
 e Amostral: A x M
s
s
o
=
−
 
Onde: As = 0 ( distribuição simétrica ). 
As > 0 ( assimétrica positiva ). 
As < 0 ( assimétrica negativa ). 
 
Exemplo 4.5 Analisar a simetria para os dados do exemplo 3.3. 
 
Temos que: média=66,179<67=moda<67,7=mediana. 
Calculo do coeficiente de assimetria de Pearson: os
x M 66,179 67A 0,083
s 9,885
− −
= = = − = 
Logo, os dados têm assimetria negativa. 
 
Exemplo 4.6 Analisar a simetria dos dados da tabela 3.5 de distribuição de frequências. 
 
Temos que: média=66,643< mediana=67,7<moda=70. 
Calculo do coeficiente de assimetria de Pearson: os
x M 66,643 70A 0,356
s 9,429
− −
= = = − = 
Logo, os dados têm assimetria negativa. 
 
 
 37
EXERCÍCIOS 
 
1) Numa pesquisa realizada com 46 alunos, levantaram-se as seguintes informações: 
Número de filhos nas famílias 0 1 2 3 4 5 
Número de famílias 2 6 17 15 4 2 
 
a) Construir uma tabela de distribuição de frequências. 
b) Construir os gráficos adequados. 
a) Calcular e interpretar as seguintes medidas: média; mediana; moda; variância; desvio 
padrão; coeficiente de variação e coeficiente de assimetria. 
 
2) O quadro abaixo mostra o número de faltas de 30 alunos nas aulas de certa disciplina, 
durante todo o curso. 
Aluno Nº de 
faltas 
Aluno Nº de 
faltas 
Aluno Nº de 
faltas 
1 
2 
3 
4 
5 
6 
7 
8 
9 
10 
3 
1 
8 
1 
5 
1 
4 
3 
2 
6 
11 
12 
13 
14 
15 
16 
17 
18 
19 
20 
1 
2 
2 
1 
5 
7 
1 
5 
6 
1 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
5 
2 
1 
2 
1 
4 
5 
6 
1 
3 
 
a) Construir uma tabela de distribuição de frequências. 
b) Calcular e interpretar as seguintes medidas: média; mediana; moda; variância; desvio 
padrão; coeficiente de variação e coeficiente de assimetria. 
 
3) Para os dados da variável “número de pessoas na família” do exercício 1 do capítulo 3, 
calcule as seguintes medidas: média; mediana; moda; variância; desvio padrão; coeficiente 
de variação e coeficiente de assimetria. 
 
4) Para os dados da variável “idade” e “renda familiar” do exercício 1 do capítulo 3, 
calcule: 
a) nos dados em rol: média; mediana; moda; variância; desvio padrão; coeficiente de 
variação e coeficiente de assimetria. 
 38
b) nos dados da tabela de distribuição de frequências: média; mediana; moda; variância; 
desvio padrão; coeficiente de variação e coeficiente de assimetria. 
 
5) A tabela abaixo mostra a distribuição de frequências das notas de 40 alunos. 
Nota do aluno Freqüência Ponto médio 
0├─── 2 
2├─── 4 
4├─── 6 
6├─── 8 
8├─── 10 
2 
4 
9 
15 
10 
1,0 
3,0 
5,0 
7,0 
9,0 
Total 40 ---- 
 
Calcular e interpretar as seguintes medidas descritivas: média; mediana; moda; variância; 
desvio padrão e coeficiente de variação. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 39
Capítulo 5 
 
 
 
 
 
 
 
 
 
NOÇÕES DE PROBABILIDADE 
E 
PRINCIPAIS DISTRIBUIÇÕES 
 
 
 
 
 
 
 
 
 
 
 
 40
Em suas origens, a estatística teve por função principal a organização e a 
apresentação de dados coletados empiricamente. 
O desenvolvimento da teoria das probabilidades permitiu à estatística, a criação de 
técnicas mais adequadas de amostragem e formas de relacionar as amostras e as 
populações de onde provieram essas amostras. 
Nos tópicos anteriores, foi visto que a distribuição das frequências das observações 
de um fenômeno é recurso poderoso para entender a variabilidade do mesmo. Com a teoria 
da probabilidade pode-se criar um modelo teórico que reproduza muito bem a distribuição 
das frequências quando o fenômeno é observado diretamente. Tais modelos são chamados 
modelos de probabilidades ou distribuições de probabilidades e são consideradas a 
espinha dorsal da teoria estatística, pois todos os processos inferenciais são aplicações de 
tais modelos ou distribuições. 
 
 
5.1 DEFINIÇÕES BÁSICAS 
 
Experimento Probabilístico: É todo experimento em que verificamos as condições: 
a) Podemos repetir indefinidamente, sempre nas mesmas condições; 
b) Antes de realizá-lo não podemos prever o resultado que será obtido; 
c) O resultado obtido pertence a um conjunto conhecido de possíveis resultados. 
 
Espaço Amostral: É o conjunto de todos os resultados possíveis de um experimento 
probabilístico e é, geralmente, representado por S. 
 
Exemplo 5.1 Como exemplo consideremos os experimentos: 
a) “Jogar um dado e observar o número mostrado na face de cima”. 
b) “Jogar uma moeda e observar a face voltada para cima”. 
c) “Escolher um aluno de uma escola e verificar seu tipo sanguíneo” 
Para esses experimentos, temos, respectivamente, os seguintes espaços amostrais: 
a) S={1, 2, 3, 4, 5, 6} 
b) S={c , k}, onde c denota cara e k denota coroa. 
c) S={A, B, O, AB} 
O espaço amostral de um experimento probabilístico pode ser finito ou infinito. 
 
 41
Evento: É qualquer subconjunto de resultados possíveis, ou seja, qualquer subconjunto do 
espaço amostral. 
 
Exemplo 5.2 Para o exemplo 5.1 acima, podemos definir os eventos: 
a) A={2,4,6}={ocorre número par} ; B={5,6}={ocorre número maior que 4} 
b) A={c}={ocorre cara} ; B={k}={ocorre coroa} 
c) A={O}={aluno com sangue tipo O} 
 
O próprio S, espaço amostral, é um evento chamado evento certo, o conjunto vazio 
também é um evento, chamado evento impossível. Eventos com apenas um elemento do 
espaço amostral é chamado evento simples. 
 
Dois eventos A e B são mutuamente exclusivos se não possuem elementos 
comuns, ou seja, A∩ B=∅ . 
 
Operações Com Eventos: Seja S um espaço amostral e sejam A e B subconjuntos ou 
eventos de S. Assim temos: 
a) União: O evento A ∪ B é formado pelos pontos do espaço amostral que pertence a pelo 
menos um dos eventos, ou seja, A ∪ B ocorre quando ou A, ou B, ou ambos ocorrem. 
b) Intersecção: O evento A ∩ B é formado pelos pontos do espaço amostral que 
pertencem simultaneamente aos dois eventos, ou seja, A ∩ B ocorre quando A e B 
ocorrem simultaneamente. 
c) Complementação: O evento complementar Ac é formado pelos pontos do espaço 
amostral que não pertencem ao evento A, ou seja, Ac é o evento que ocorre se A não 
ocorre. 
 
Exemplo 5.3 No lançamento de duas moedas, sejam, A={saída de faces iguais} e 
B={saída de cara na primeira moeda}. Então: 
O espaço amostral é S={(c , c) , (c , k) , (k , c), (k , k)} 
A = {(c , c) , (k , k)} e B = {(c , c) , (c , k)} 
A ∪ B = {(c , c) , (c , k) , (k , k)}, A ∩ B = {(c , c)} e Ac = {(c , k) , (k , c)} 
 
 
 42
5.2 INTRODUÇÃO À PROBABILIDADE 
 
Definição: A cada evento A de um espaço amostral S, associamos um número real P(A) 
denominado probabilidade de A, tal que: 
 
0≤P(A)≤1 e P(S)=1 
 
Esta definição não nos diz como calcular P(A). Apenas nos dá algumas 
propriedades gerais que P(A) deve ter. Antes de aprendermos como calcular P(A), vejamos 
outras propriedades: 
 
Propriedades: 
a) P(∅)=0 
b) P(Ac)=1-P(A) 
c) P(A ∪ B)=P(A)+P(B)-P(A∩B). Se A e B forem mutuamente excludentes então P(A ∪ 
B)=P(A)+P(B) 
d) Se S for finito, então a soma das probabilidades de todos osresultados possíveis é igual 
a 1. 
e) P(Ac∪Bc)=P((A∩B)c) =1 – P(A∩B). 
 
Resultados Igualmente Prováveis (Definição clássica): Seja A um evento qualquer de 
um espaço amostral S. Se os eventos simples de S têm todos a mesma probabilidade de 
ocorrência, ou seja, são equiprováveis, podemos calcular a probabilidade do evento A 
como: 
N(A)P(A)=
N(S) , 
onde N(A), é o número de elementos de A e N(S) é o número de elementos de S. 
 
Exemplo 5.4 Consideremos o exemplo em que um dado é lançado e o evento B que 
ocorrerá se, e somente se, um número maior que 4 aparecer, isto é, B={5,6}. 
Consequentemente, P(B)=2/6=1/3 já que S={1,2,3,4,5,6} é um espaço equiprovável. 
 
 43
Exemplo 5.5 Para o experimento do lançamento de uma moeda o espaço amostral S 
também é equiprovável. Assim, para os eventos A={c} e B={k}, temos P(A) = P(B) = ½. 
 
Frequência Relativa como Aproximação da Probabilidade (Definição frequentista): 
Na maioria das situações práticas, os eventos simples do espaço amostral não são 
equiprováveis e não podemos calcular probabilidades usando a definição clássica. Uma 
forma de lidar com essas situações é obter alguns dados empíricos na tentativa de estimar 
as probabilidades. Para isso, usamos o conceito de frequência relativa como estimativa de 
probabilidade da seguinte forma: 
Seja E um experimento e A um evento. Se após n realizações do experimento E, 
com n suficientemente grande, forem observados x resultados favoráveis ao evento A, 
então um estimativa da probabilidade P(A), é dada pela frequência relativa: 
fA=x/n, ou seja, P(A) ~ fA 
É muito importante saber que fA e P(A) não são a mesma coisa. Nós apenas 
utilizaremos fA para aproximar P(A), ou seja, se nós identificarmos fA com P(A), 
deveremos compreender que estaremos tão somente substituindo o valor de P(A) por uma 
aproximação obtida experimentalmente. A qualidade desta estimativa depende do número 
de repetições do experimento. Quanto maior o número de repetições, a estimativa mais se 
aproxima do verdadeiro valor da probabilidade, ou seja, 
A
n
P(A)= lim f
→∞
 
 
Exemplo 5.6 Uma amostra de 6800 pessoas de uma determinada população foi 
classificada quanto à cor dos olhos e à cor dos cabelos conforme tabela a seguir. 
 
Tabela 5.1 Distribuição conjunta de frequências da cor dos olhos e dos cabelos. 
Cor dos cabelos 
Cor dos olhos 
Loiro Castanho Preto Ruivo 
TOTAL 
Azul 1768 807 189 47 2811 
Verde 937 1139 485 53 2614 
Castanho 115 438 288 16 857 
Preto 9 248 261 - 518 
TOTAL 2829 2632 1223 116 6800 
 
 44
Consideremos o sorteio de uma pessoa dessa amostra e suponhamos que os eventos 
de interesse sejam: 
A={a pessoa tem olhos azuis}; C={a pessoa tem cabelos castanhos}. 
 
Assumindo que o número de repetições do experimento é grande, podemos usar a 
frequência relativa como aproximação da probabilidade desses eventos ocorrerem, ou seja: 
P(A) = 
amostra na pessoas de número
azuis olhos de pessoas de número
= 
6800
2811
 = 0,4134 
P(C) = 
amostra na pessoas de número
castanhos cabelos de pessoas de número
 = 
6800
2632
 = 0,3871 
Vamos supor agora que queremos saber a probabilidade da pessoa ter olhos azuis e 
cabelos castanhos. 
O evento {a pessoa tem olhos azuis e cabelos castanhos} é chamado de evento 
interseção e é representado por A∩C. Assim, 
P(A∩C) = 
6800
807
= 0,1187 
O evento {a pessoa tem olhos azuis ou cabelos castanhos} é chamado de evento 
união e é representado por A∪C. A probabilidade do evento união nesse caso será. 
P(A∪C)=P(A)+P(C)-P(A∩C) = 0,4134 + 0,3871 - 0,1187 = 0,6818 
A probabilidade do evento {a pessoa não tem olhos azuis} é a probabilidade do 
evento Ac: 
P(Ac)=1-P(A) = 1 - 0,4134 = 0,5866 
 
Exemplo 5.7 Supomos que em uma universidade 50% dos alunos falam inglês, 20% falam 
espanhol e 5% falam os dois idiomas. Qual a probabilidade de um aluno falar pelo menos 
um desses idiomas? 
Consideremos os eventos A={o aluno fala inglês}, B={o aluno fala espanhol} e 
A∩B={o aluno fala inglês e espanhol}. 
Temos que P(A)=0,5, P(B)=0,2 e P(A ∩ C)=0,05. 
O evento {o aluno fala pelo menos um desses idiomas} corresponde ao evento A ou 
B, ou seja, A∪B. 
Logo P(A∪B)=P(A)+P(B)-P(A∩B) = 0,5 + 0,2 - 0,05 = 0,65. 
Assim, a probabilidade de o aluno falar pelo menos um desses idiomas é de 65%. 
 45
 
Probabilidade Condicional e Independência: A probabilidade de um evento A ocorrer, 
sabendo que um outro evento B já ocorreu, é chamada de “probabilidade condicional de A 
dado B”. Essa probabilidade é representada por P(A/B) e calculada por: 
P(A/B) = )B(P
)BA(P ∩
 
Esta expressão pode ser reescrita na forma chamada “regra do produto”: 
P(A ∩ B) = P(A/B)P(B). 
Dois eventos são independentes quando a ocorrência de um não interfere na 
probabilidade de ocorrência do outro, ou seja, 
P(A/B)=P(A). 
Assim, se A e B são independentes, da regra do produto temos: 
P(A∩B)=P(A)P(B) 
A probabilidade de um evento Ac ocorrer, sabendo que um outro evento B já 
ocorreu, isto é, P(Ac/B) e calculada por: 
P(Ac/B) = 1 - P(A/B) 
 
Exemplo 5.8 Para o exemplo 5.6 a probabilidade do evento {a pessoa tem olhos azuis 
sabendo que possui cabelos castanhos}, é: 
P(A/C) = )C(P
)CA(P ∩
 = 
3871,0
1187,0
 = 0,3066 
Por outro lado, a probabilidade do evento {a pessoa não tem olhos azuis sabendo 
que possui cabelos castanhos}, é: 
P(Ac/C) = 1 - P(A/C) = 1 - 0,3066 = 0,6934 
 
Exemplo 5.9 Um casal deseja ter 2 filhos. Qual a probabilidade de ambos serem do sexo 
masculino? 
Os eventos M={nascer uma criança do sexo masculino} e F={nascer uma criança 
do sexo feminino} são equiprováveis. Logo, P(M) = P(F) = ½. 
Por outro lado, a ocorrência do evento A={o primeiro filho é do sexo masculino} 
não altera a probabilidade de ocorrência do evento B={o segundo filho é do sexo 
masculino}. Assim, A e B são independentes e a probabilidade do evento A∩B={o 
primeiro filho é do sexo masculino e o segundo filho é do sexo masculino} será dada por: 
P(A∩B)=P(A)P(B)=(1/2)(1/2)=1/4 
 46
Teorema da Probabilidade Total: Considere um espaço amostral particionado em k 
eventos, C1, C2, ... Ck e satisfazendo as seguintes propriedades: 
a) Cj∩Cj) ≠ φ para todo i ≠ j; 
b) C1∪C2 ... ∪ Ck = Ω e 
c) P(Cj) > 0 para todo i. 
Seja E um evento de interesse do espaço amostral. Então: 
F=(F∩C1)∪(F∩C2)∪ ... ∪(F∩Ck). Onde os eventos (F∩Ci) (i=1,...,n) são mutuamente 
exclusivos entre si. 
A probabilidade de ocorrer o evento B é dada por: P(F)=∑
=
k
1i
ii )).P(F/CP(C 
 
Exemplo 5.10: Supomos que uma caixa 1 tem duas bolas brancas e duas bolas pretas, a 
caixa 2 tem duas bolas brancas e uma bola preta e a caixa 3 tem uma bola branca e três bolas 
pretas. Se selecionarmos ao acaso uma bola, qual é a probabilidade de ela ser branca? 
 
 
 
 
 
Se soubermos de qual caixa é a bola selecionada, a resposta seria simples. Como 
você não sabe qual é a caixa, o teorema da probabilidade total permite solucionarmos esse 
problema. 
Sejam os eventos C1 , C2 e C3 (representando as caixas) e o evento B 
(representando bola branca). 
Os eventos Ci são mutuamente exclusivos. 
O evento B tem intersecção com todos os Ci. 
 
Supomos a mesma probabilidade para todas as caixas: P(C1)= P(C2)= P(C3)=1/3. 
A probabilidade de bola branca para cada caixa é: P(B/C1)=1/2, P(B/C2)=2/3 e 
P(B/C3)=1/4. 
A probabilidade de bola branca é dada por: P(B)= P(C1) e P(B/C1) ou P(C2) e 
P(B/C2) ou P(C3) e P(B/C3) = P(C1).P(B/C1) + P(C2).P(B/C2) + P(C3).P(B/C3)= 1/3.1/2 + 
1/3.2/3+1/3.1/4=1/6+2/9+1/12=17/36. 
 
 47
Teorema da Bayes. O teorema de Bayes está relacionado com teorema da Probabilidade 
Total. As condições são as mesmas, eventos mutuamente exclusivos e exaustivos e um 
evento qualquer. 
O teorema deBayes permite obter a probabilidade de um evento ocorrer sabendo-se 
que um outro evento ocorreu. 
Para o caso das três caixas é possível calcular: Qual a probabilidade da bola ser da 
caixa B sabendo-se que ela é branca? 
Usando a expressão da probabilidade condicional P(A/B) = P A B
P B
( )
( )
∩
 e a regra do 
produto P(A∩B) = P(B).P(A/B), pode-se escrever o teorema de Bayes: 
P(CI/F) = P(F)
)).P(F/CP(C II
 
Onde P(F)=∑
=
k
1i
ii )).P(F/CP(C 
Exemplo: Sabendo-se que a bola é branca, qual a probabilidade dela ser da caixa 2? 
Temos, calculado no exemplo anterior, que a probabilidade da bola ser branca é: 
P(B)= P(C1) e P(B/C1) ou P(C2) e P(B/C2) ou P(C3) e P(B/C3) = P(C1).P(B/C1) + 
P(C2).P(B/C2) + P(C3).P(B/C3)= 1/3.1/2 + 1/3.2/3+1/3.1/4=1/6+2/9+1/12=17/36. 
Suponha a mesma probabilidade para todas as caixas, P(C1)= P(C2)= P(C3)=1/3. 
A probabilidade de bola branca para a caixa 2 é P(B/C2)=2/3. 
Então P(C2/B) = P(B)
)).P(B/CP(C 22
=
17/36
1/3.2/3
=2/9.36/17=8/17 
 
 
5.3 DISTRIBUIÇÕES TEÓRICAS DE PROBABILIDADE 
 
Uma distribuição de probabilidade é um modelo probabilístico aplicável aos 
fenômenos cujos resultados exatos em cada experimento futuro são imprevisíveis. O 
estudo de tais modelos é o objetivo da teoria de probabilidade e sua aplicação só é possível 
nas situações em que há incerteza quanto à ocorrência ou não dos eventos estudados. Em 
todo modelo matemático é essencial o conceito de variável, assim também é no modelo 
probabilístico que por estar associado a fenômenos aleatórios sua variável recebe o nome 
especial de “variável aleatória”. 
 
 48
5.3.1 Variáveis Aleatórias 
 
É uma função definida no espaço amostral S, que costuma ser representada por X, e 
cujo valor é um número real determinado pelo resultado de uma experiência aleatória. As 
variáveis aleatórias podem ser de dois tipos: 
a) Discretas: quando assume valores num conjunto finito ou infinito, mas numerável. 
b) Contínuas: quando assume qualquer valor real num conjunto infinito não enumerável. 
 
Exemplo 5.11: São exemplos de variáveis aleatórias: 
a) No de caras no jogo de duas moedas. 
b) Nº de glóbulos brancos por unidade de volume de sangue humano 
c) Peso dos alunos de certa universidade. 
 
5.3.2 Distribuição de Probabilidade 
 
Quando associamos a cada ponto do espaço amostral a correspondente 
probabilidade de ocorrência do evento, obtemos a distribuição das probabilidades do 
experimento. Se além disso, associamos a esses mesmos pontos uma variável aleatória 
indicadora obtemos uma distribuição que pode ser entendida como a distribuição das 
probabilidades das variáveis aleatórias associadas aos pontos do espaço amostral. A 
distribuição assim obtida nos mostra como a probabilidade total se divide pelos diversos 
resultados possíveis do experimento. 
 
Distribuição ou Função de Probabilidade Discreta: É a função P(X=x)=p(x) que atribui 
a cada valor da variável aleatória a sua probabilidade de ocorrência e que satisfaz as 
seguintes condições: 
a) p(x) ≥ 0 , ∀ x e b) ∑ =
i
i 1)x(p 
Se X é uma variável discreta e x1, x2, ... , são seus valores, a distribuição de X pode 
também ser representada pela tabela abaixo: 
 
Valores de X x1 x2 ... Total 
P(X=xi) p(x1) p(x2) ... 1 
 
 49
Exemplo 5.12 Na jogada de duas moedas, o espaço amostral é S = { cc, ck, kc, kk }, onde 
c=cara e k = coroa. Seja X a variável aleatória que represente o número de caras. A 
distribuição de probabilidade de X é: 
 
Valores de X 0 1 2 Total 
P(X=xi) 0,25 0,5 0,25 1,0 
 
Distribuição ou Função Densidade de Probabilidade Contínua: É a função f(x) que 
satisfaz as seguintes condições: 
a) f(x) ≥ 0 , ∀ x ∈R e b) 1dx)x(f =∫
∞
∞−
 
c) P(a≤X≤b) = P(a≤X<b) = P(a<X≤b) = P(a<X<b) = ∫
b
a
dx)x(f 
Note que P(a ≤ X ≤ b) é igual à área sob a curva f(x) do segmento horizontal (a , b): 
P(X=a) = ∫
a
a
dx)x(f = 0 
 
Média e Variância de uma Variável Aleatória: Tal como a distribuição de frequências 
de uma variável qualquer, também uma distribuição de probabilidade pode ser descrita 
usando uma medida de tendência central e uma medida de dispersão. 
A média ou valor esperado de uma variável aleatória é uma medida do centro de 
uma distribuição, representada por E(X) e dada por: 
a) E(X) = ∑ )x(px ii para variáveis aleatórias discretas 
b) E(X) = ∫ dx)x(xf para variáveis aleatórias contínuas 
Uma medida de dispersão em relação ao valor médio, é dada pela variância que 
pode ser representada por σ2 ou Var(X): 
σ
2
 = Var(X) = E[(X-E(X))2] = E(X2) - [E(X)]2 . 
O desvio padrão é dado por: 2σ= σ =DP(x)= Var(x) 
Onde: 
i
2 2
iE(X ) x p(x )=∑ para variável discreta. 
2 2E(X ) x f (x)dx= ∫ para variável contínua. 
 50
Exemplo 5.13 Para o experimento do exemplo 5.12, a média ou valor esperado é: 
Média: E(X) = ∑ )x(px ii =0.0,25+1.0,5+2.0,25=1,0. 
Variância: E(X2) = 
i
2
ix p(x )∑ =02.0,25+12.0,5+22.0,25=1, 5. 
σ
2
 = Var(X) = E(X2) - [E(X)]2 =1,5 – (1)2=0,5. 
Desvio padrão: 2σ= σ = Var(x) = 0,5=0,707 . 
 
Quadro 5.1 Propriedades da média e da variância. 
média variância 
a) E(a)=a 
b) E(a+bX)=a+bE(X) 
c) E(X+Y)=E(X)+E(Y) 
d) Se X e Y forem independentes 
E(XY)=E(X).E(Y) 
a) Var(X)≥0 
b) Var(a) = 0 
c) Var(aX+b)=(a)2Var(X) 
d) Se X e Y forem independentes 
Var(X+Y)=Var(X)+Var(Y) 
 
 
5.3.3 Distribuição Binomial 
 
Uma das mais importantes distribuições (ou modelos) de probabilidades para 
variáveis aleatórias discretas é a distribuição Binomial. 
O modelo Binomial se aplica a toda situação em que um conjunto de provas 
repetidas satisfaz as seguintes condições: 
a) As diversas provas se realizam sob condições idênticas; 
b) Cada prova comporta apenas dois resultados possíveis, mutuamente exclusivos, 
designados por sucesso (representado por 1) e falha (representado por 0); 
c) A probabilidade de sucesso, representada por p é a mesma em cada prova, e 
permanece constante durante todo o experimento. A probabilidade de falha representada 
por q é também constante, e q=(1-p), de modo que (p+q)=1. 
d) As provas são independentes umas das outras. O conhecimento do sucesso (ou 
falha) de uma delas não modifica a probabilidade de sucesso (ou falha) nas provas 
subsequentes. 
Uma variável que comporta somente uma única repetição do experimento e dois 
resultados possíveis como na condição (b) acima se chama variável de Bernoulli. 
 51
Seja então um experimento que consiste em um número fixo n de repetições 
independentes de Bernoulli, com probabilidade p (constante) de sucesso em cada repetição. 
X será a variável aleatória que dá o número x de sucessos em n ensaios. 
A distribuição de probabilidade da variável aleatória X é chamada distribuição 
binomial com n repetições e probabilidade p de sucesso. Designa-se por b(n,p), onde n e 
p são os parâmetros da distribuição. Naturalmente, os valores possíveis da variável 
aleatória X são os inteiros 0, 1, 2, ... n. 
Como cada repetição só comporta dois resultados distintos - sucesso ou falha - 
mutuamente exclusivos, a ocorrência de k sucessos em n ensaios deve ser acompanhada 
de n-k falhas. Sendo p a probabilidade de sucesso e (1-p)=q a probabilidade de falha, 
temos que a probabilidade de ocorrência de k sucessos e n-k falhas, numa dada ordem, é, 
pelo princípio fundamental da contagem, pkqn-k . 
Mas como só interessa o número de sucesso e falhas, e não a ordem que ocorrerem, 
há 





k
n
 disposições possíveis daquelas ocorrências. 
Finalmente, a função de probabilidade de X é: 
P(X=k)= 





k
n
 pkqn-k , k= 0, 1, ... , n.Média e Variância da Distribuição Binomial: Se X é a variável aleatória com 
distribuição binomial e parâmetros n e p, então: 
E(X)=np e Var (X)=npq 
 
Exemplo 5.13 Determine a probabilidade de obtermos um único 6 em três jogadas de um 
dado. Em dezoito jogadas quantas vezes podemos esperar que saia o número 6? 
Neste caso, sucesso é obter o número 6 e como n=3, os valores possíveis de X 
serão: 0, 1, 2, 3. Além disso, a probabilidade de sucesso em cada jogada é p=1/6 e como 
queremos a probabilidade de se obter apenas um (1) sucesso, temos: 
P(X=1) = ( )31 16 56 0 352    = , . 
O número médio ou esperado de ocorrência do número 6 em n=18 jogadas é: 
E(X)=np=18.1/6=3 
 
 52
Exemplo 5.14 Em uma prova com 10 questões do tipo verdadeiro ou falso, qual a 
probabilidade de um aluno acertar “por palpite” ao menos oito? 
Neste caso, a probabilidade do aluno acertar (sucesso) é igual à probabilidade de 
errar (falha), ou seja, p = q = 0,5. 
Além disso, n=10 e os valores possíveis de X são: 0, 1, 2,...,10. 
A probabilidade do aluno acertar ao menos oito questões é a soma das 
probabilidades de acertar 8, 9 ou 10 questões. 
P( X≥8)= P(X=8) + P(X=9) + P(X=10) 
8 10-8 9 10-9 10 10-1010 10 10P(x 8) 0,5 .0,5 + 0,5 .0,5 + 0,5 .0,5 =0,0547
8 9 10
     
≥ =      
     
 
A probabilidade de um aluno acertar ao menos oito questões é de 5,47%. 
 
5.3.4 Distribuição de Poisson 
 
Esta distribuição é muito usada quando desejamos obter a probabilidade de 
ocorrência de eventos em intervalos de tempo, ou superfície, ou volume, tais como: 
a) número de chamadas telefônicas durante um intervalo de tempo. 
b) número de falhas de um computador em um dia. 
c) número de acidentes de trabalho em uma empresa num determinado mês. 
 
De modo geral, dizemos que a variável aleatória X tem uma distribuição de Poisson 
com parâmetro λ>0 se: 
P(X = k) = 
!k
e kλλ−
, k = 0, 1, 2, ... . 
 
Média e Variância da Distribuição de Poisson: Podemos facilmente demonstrar que: 
E(X) = VAR(X) = λ 
Assim, λ representa o número médio de tais eventos ocorrendo no intervalo 
considerado. 
 
Exemplo 5.15 Suponhamos que 10.000 bactérias movam-se independente e aleatoriamente 
em um volume de 20000 cm3. a) Qual a probabilidade de um cm3 escolhido ao acaso não 
conter bactérias? b) Qual a probabilidade de um cm3 escolhido ao acaso conter mais de 
 53
uma bactéria? Ou ainda, c) qual a probabilidade de dois cm3 escolhidos ao acaso conterem 
duas bactérias? 
 
Se X é a v.a. que representa o número de bactérias presentes em um cm3, temos: 
a) O número médio de bactérias por cm3 é: E(X) = λ = (10000/20000) = 0,5 
P(X = 0) = 
-0,5 0e .(0,5)
0!
 = 
5,0e−
 = 0,6065. Assim, a probabilidade de um cm3 escolhido ao 
acaso não conter bactérias é 60,65%. 
b) P(X > 1) = 1 – (P(X = 0) + P(X = 1)) = 1 – (0,6065 + 
-0,5 1e (0,5)
1!
) = 1 – 0,9097 = 0,0903. 
Assim, a probabilidade de um cm3 escolhido ao acaso conter mais de uma bactéria é 
9,03%. 
Se Y é a v.a. que representa o número de bactérias presentes em dois cm3, temos: 
c) O número médio de bactérias por 2cm3 é: E(Y) = λ = 2(0,5) = 1 e, portanto: 
P(Y = 2) = 
!2
)1(e 21−
 = 0,1839. Assim, a probabilidade de dois cm3 escolhidos ao acaso 
conterem duas bactéria é 18,39%. 
 
Aproximação da Binomial pela Poisson 
 
Para n grande e p pequeno, podemos aproximar a distribuição Binomial pela 
distribuição de Poisson. Ou seja, se X tem distribuição binomial, b(n,p), tal que np≤7, 
então: 
P(X = k) ≈ 
!k
)np(e knp−
 
 
Exemplo 5.16: Se a probabilidade de um indivíduo sofrer uma reação nociva, resultante da 
injeção de um determinado soro é 0,001, determinar a probabilidade de, entre 2000 
indivíduos, exatamente 3 sofrerem essa reação. 
Se X é a variável que representa o número de indivíduos que sofrem a reação, 
temos: n = 2000; p = 0,001; np = 2. Assim, a aproximação pela Poisson pode ser usada: 
P(X = 3) = 
-2 3e (2)
3!
 = 0,1804. Assim, a probabilidade de, entre 2000 indivíduos, 
exatamente 3 sofrerem essa reação é 18,04%. 
 54
5.3.5 Distribuição Normal 
 
A distribuição normal surgiu no século XVIII ligada ao estudo de erros de 
medições repetidas de uma mesma quantidade. As suas propriedades matemáticas foram 
estudadas por DeMoivre, Laplace e Gauss, sendo por este fato, conhecida por distribuição 
de Gauss. As principais razões da sua importância se devem ao fato de muitas variáveis 
biométricas serem aproximadamente normais e à possibilidade de que mesmo as variáveis 
não normais possam ser aproximadas pela normal. 
A distribuição normal tem sua função de densidade dada por: 
21 x-µ
-
2 σ1f(x)= e
σ 2π
 
 
 
, 
onde µ e σ são os parâmetros da distribuição e -∝<x<∝. 
 
 
 
 
 
 
Figura 5.1 Curva normal típica: 
 
A função f(x) possui as seguintes características: 
A média da distribuição é µ e o desvio padrão é σ. 
A curva é simétrica em relação a um eixo vertical passando por x=µ. 
A moda ocorre em x = µ. 
A curva tem inflexões nos pontos x = µ ± σ. 
A curva normal é assintótica ao eixo horizontal em ambas as direções. 
A área total sob a curva e acima do eixo x é 1. 
 
Para mesma média µ e diferentes desvios padrão σ , a distribuição apresenta-se 
mais achatada para quem possui maior desvio padrão e pico mais acentuado e maior 
concentração em torno da média para quem tem menor desvio padrão. 
 
 
µ µ - σ. µ + σ. 
 55
 
 
Para médias µ diferentes e mesmo desvio padrão σ , a distribuição apresenta-se a 
mesma, mas muda a localização, quanto maior a média, mais à direita está a curva. 
 
 
 
 
 
 
 
 
 
 
Verificação da Adequação do Modelo 
 
A maneira mais simples de verificarmos através de uma amostra se a variável em 
estudo pode ser adequadamente descrita pelo modelo normal consiste em examinarmos 
graficamente a distribuição dos dados, por exemplo, através do histograma. Se o gráfico 
apresentar razoável simetria e forma aproximada da curva normal, temos indicação de 
adequacidade do modelo aos dados. 
Além disso, é importante verificarmos as proporções de observações em 
determinados intervalos que envolvam a média. Para uma distribuição normal com média 
µ e desvio padrão σ, os intervalos (µ -σ ; µ + σ), (µ -2σ ; µ + 2σ), (µ -3σ ; µ +3 σ), 
compreendem respectivamente 68,3%, 95,4% e 99,7% da distribuição. Em geral, tanto µ 
quanto σ são desconhecidos, mas com uma amostra razoavelmente grande, digamos n ≥ 
30, é de se esperar que a média amostral x esteja próxima de µ e que o desvio padrão s 
esteja próximo de σ. Podemos então, com base nos dados amostrais, calcular x e s , e 
contar o número de observações nos intervalos ( x - s ; x + s), ( x - 2s ; x +2 s), ( x - 3s ; 
x +3 s). Dividindo essas contagens por n, obtemos as frequências relativas observadas que 
devem ser comparadas com as probabilidades teóricas (0,683; 0,954 e 0,997). Grandes 
discrepâncias entre as frequências relativas observadas e as probabilidades acima indicam 
uma possível falta de adequação ao modelo normal. 
 
µ = 1 0 σ= 5 µ = 2 0 σ = 5 
 56
Existem outros critérios mais precisos para se verificar se há uma boa aderência ao 
modelo normal. Um deles é o gráfico denominado Q-Q plot, disponível nos programas de 
computador. É construído de tal forma que se há boa aderência dos dados ao modelo 
normal, as observações estarão alinhadas em torno de uma reta. 
 
Exemplo 5.17 Os alunos de uma turma de 60 estudantes do sexo masculino mediram a 
pressão sistólica (mmHg), uns dos outros, obtendo os resultados abaixo. 
 
142 142 134 110 98 130 136 120 146 122 130 118 
128 114 138 104 116 110 100 128 116 132 112 128 
152 118 140 128 116