Buscar

Apostila estatística (1)

Prévia do material em texto

Estatística 
 
 
 
 
 
 
 
 
 
 
 
 
Agosto 
2020 
UFU 
Prof. Dr. Quintiliano Siqueira Schroden Nomelini 
 
 
 2 
1 - ESTATÍSTICA DESCRITIVA 
 
1.1 - A NATUREZA DA ESTATÍSTICA 
 
 COMO SURGIU A ESTATÍSTICA????? 
 A Matemática surge do convívio social, da contagem, das trocas. Como a Estatística 
é um ramo da Matemática Aplicada, ela também surge da experiência com o homem. 
 Na Antigüidade: registros do nº de habitantes, nascimentos, óbitos, impostos, etc. 
Idade Média: registros bélicos e tributários as principais manipulações quantitativas. 
 Sec. XVI: começa a surgir análises de casamentos, batizados, gerando as primeiras 
tábuas e tabelas. 
 No sec. XVIII: o estudo desses registros numéricos assume um caráter mais 
científico. 
A Estatística foi batizada por Godofredo Archenwall nessa época. 
Antonio A. Crespo define Estatística como: 
Estatística é uma parte da matemática aplicada que fornece métodos para a 
coleta, a organização, a descrição, a análise e a interpretação de dados 
quantitativos e qualitativos, e a utilização desses dados para a tomada de 
decisão. 
 
 Conceitos de Estatística e porque estudar Estatística 
 A Estatística estuda então os fenômenos com um conjunto muito numeroso de 
indivíduos, com pelo menos uma característica comum. 
A partir da análise quantitativa de uma determinada experiência ou de um determinado 
grupo de indivíduos, se for observado certa regularidade nessa característica, 
provavelmente existirá a mesma regularidade numa classe maior de experiências ou 
indivíduos. Esse é um processo de generalização. 
 Por que estudar Estatística: 
 O raciocínio estatístico é muito utilizado no governo e na administração: emprego. 
 O conhecimento estatístico serve para bem tomar decisões e não ser iludido. 
 Os próximos cursos usam a Estatística. 
 As revistas profissionais e artigos científicos se referem a estudos estatísticos. 
 Usar a interpretação estatística nos artigos da imprensa e no cotidiano. 
 
 3 
 Os ramos da Estatística 
 A Estatística pode ser dividida em duas partes: 
 Estatística Descritiva: tem como objetivo a observação de fenômenos de mesma 
natureza, a coleta de dados numéricos relativos a esses fenômenos, a organização e a 
classificação desses dados observados e a sua apresentação através de gráficos e tabelas, 
além da descrição desses dados através do cálculo de coeficientes. 
Exemplos: taxa de desemprego, custo de vida, índice pluviométrico, quilometragem 
média por litro de combustível, volume de vendas mensais de um produto, etc. 
 Estatística Inferencial ou Dedutiva: tem como objetivo a análise e interpretação 
dos dados amostrais. Refere-se a um processo de generalização a partir de resultados 
particulares. Esse processo de generalização está associado a uma margem de incerteza, 
pois a conclusão a respeito da característica comum de uma população é obtida 
analisando-se uma parcela dessa população. Para medir essa incerteza, usa-se técnicas e 
métodos da Teoria da Probabilidade. 
Exemplos: Para calcular a voltagem necessária para que um dispositivo elétrico chegue 
a falhar, submete-se uma amostra de tais dispositivos a voltagens cada vez mais 
elevadas, até falhar cada dispositivo da amostra. Com base nos resultados, pode-se 
estimar a probabilidade de falha nos dispositivos, a cada voltagem. 
 O método Estatístico e suas fases 
Na Antigüidade, os conhecimentos eram adquiridos ao acaso ou por necessidades 
práticas. Atualmente, pode-se adquiri-los através de processos científicos de observação 
e estudo. 
 
O método estatístico, diante da impossibilidade de manter as causas constantes, 
admite todas as causas presentes variando-as, registrando essas variações e 
procurando determinar, no resultado final, que influências cabem a cada uma 
delas. 
Dados são números que exprimem a observação de elementos com uma 
característica comum. Exemplo: os homens de uma comunidade. 
 
 Para se fazer um estudo estatístico, deve-se dividi-lo em fases: 
As fases são: 
Coletas de dados: é a obtenção, reunião e registro sistemático de dados, com um 
objetivo determinado. 
 4 
 
• Direta: quando é obtida diretamente da fonte e pode ser: 
Contínua : Obtida ininterruptamente: Registro de nascimentos, etc. 
Periódica : em períodos curtos: Censos 
Ocasional : esporadicamente : Surto epidêmico 
• Indireta: Quando é inferida ( deduzida ) a partir dos elementos conseguidos pela 
coleta direta 
 - Mortalidade infantil 
 Crítica dos dados: devem ser criticados à procura de erros grosseiros ou de certos 
vultos, que possam influir sensivelmente nos resultados como: 
 - Externa: Informante 
 - Interna: dados da coleta 
Apuração dos dados: é a soma e o processamento dos dados obtidos e a disposição 
mediante critérios de classificação. 
Exposição dos dados: devem ser apresentados sob forma de tabelas ou gráficos 
tornando mais fácil e compreensão do objeto de tratamento estatístico 
Análise dos resultados: É o estudo dos resultados com o objetivo de tirar conclusões sobre o 
todo (população), a partir de informações fornecidas por parte representativa do todo (amostra). 
 
a) A FIGURA A SEGUIR ILUSTRA O PRINCIPIO FUNDAMENTAL 
DA ESTATÍSTICA 
 
 
 
Onde: População: é o conjunto de entes portadores de, pelo menos, uma característica comum; 
Amostra :é um subconjunto finito de uma população. 
 5 
1.2 – FERRAMENTAS NECESSÁRIAS AO CÁLCULO ESTATÍSTICO 
Talvez alguns assuntos tratados neste capítulo sejam apenas uma revisão para a 
grande maioria de vocês. Todavia seu conhecimento será de extrema validade, não 
só para o acompanhamento do curso como também para o aprendizado de vários 
tópicos. 
1 – Frações – par de números naturais em que o segundo representa um certo número de 
partes em que p inteiro está dividido, e o primeiro representa uma ou mais dessas partes 
iguais.Assim, 2/5 é uma fração onde 2 é o numerador e 5 o denominador. 
 Simplificação – Para simplificar frações devemos dividir o numerador e o denominador 
pelo mesmo número, obtendo uma fração equivalente à fração dada. Assim:
5
2
15
6
 , 
que é conhecida como fração irredutível. 
2 – Somatório. 
REVISÃO: 
1 Desenvolva cada uma das seguintes expressões, colocando-as na sua forma mais 
simples possível: 
a) 
5
1
i
i
x

 ; 
b) 
5
2
1
i i
i
z x

 ; 
c) 
6
1
i i
i
x y

 ; 
d) 
4
1
i
i
x x

 ; 
e)  
26
1
i
i
x x

 . 
 
2. Escreva em notação sigma (somatório): 
a) 1 2 ... nx x x   ; 
b)  
2
1 2 ... nx x x   ; 
c) 1 2 7...x x x   ; 
d) 2 2 2
1 2 ... nx x x   . 
 
3. Calcule para os dados abraixo: 
 
i 1 2 3 4 5 6 
iZ 7 3 8 9 4 3 
iX 9 13 15 21 25 29 
 
 6 
 
a) 
3
1
i
i
X

 ; 
b) 
6
3
i
i
X

 ; 
c) 
6
1
i
i
X

 ; 
d) 
6
2
1
i
i
X

 ; 
e) 
6
1
i
i
Z

 ; 
f) 
6
1
i i
i
Z X

 ; 
g) 
6
2
1
i i
i
Z X

 . 
 
4. Sejam os conjuntos de dados:  4,3,0,1X  ,  3,0,1,3Y  . Obtenha os 
seguintes somatórios: 
a) 
4
1
i
i
X

 ; 
b) 
4
2
1
i
i
X

 ; 
c) 
4
1
i i
i
Y X

 ; 
d) 
2
4
1
i
i
X

 
 
 
 .
 
 7 
 
1.3 – SÉRIES ESTATÍSTICAS 
 Definição: Uma vez coletados os dados, o conjunto de valores é extenso e desorganizado e, no 
seu exame, há o perigo de se perder a visão global do fenômeno analisado. Por isso, reunimos os 
valores em tabelas compactas, que permitem uma visão mais sintética do fenômeno, sem tirar-lhe a 
precisão primitiva. Essa condensação dos valores permite ainda a representação gráfica, uma forma 
mais sutil e elegante de apresentação da característica estudada. 
Uma tabela é um quadro que resume as observações de alguma variável. 
 
 
Uma série estatística é toda tabela que apresenta a distribuição de um conjunto de dados 
estatísticos em função da época, do local ou da espécie. 
 
 Classificação das Séries Estatísticas 
Podemosclassificar uma série estatística de acordo com os seus três fatores: tempo, espaço e 
espécie. 
 
1.Séries históricas (ou temporais, cronológicas, marchas): descrevem os valores da variável em 
determinado local segundo intervalos de tempo variáveis. 
Exemplo: O diretor de marketing de uma empresa, fabricante de componentes eletrônicos, deseja 
examinar a evolução de suas vendas em 2000, mês a mês. 
 
 
 
 
 
Título 
Cabeçalho 
Coluna 
Numérica 
Casa ou 
Célula 
Linhas 
Coluna 
Indicadora 
Corpo 
Rodapé 
Cabeçalho 
 
 8 
GLT S.A. – Indústria de Componentes Eletrônicos, Vendas – Mercado Interno – 2000 
Meses Vendas ($1.000) 
Janeiro 2.300 
Fevereiro 1.800 
Março 2.200 
Abril 2.210 
Maio 2.360 
Junho 2.600 
Julho 2.690 
Agosto 3.050 
Setembro 3.500 
Outubro 3.440 
Novembro 3.100 
Dezembro 2.760 
TOTAL ANUAL 31.510 
Fonte: Departamento de Análise de Mercado. 
2. Séries geográficas (ou espaciais, territoriais, de localização): descrevem os valores da variável 
em determinado instante segundo regiões. 
Exemplo: Se agora o diretor deseja saber o comportamento das vendas dessa empresa nos estados 
do Brasil, no ano 2000. 
GLT S.A. – Indústria de Componentes Eletrônicos, Vendas por Unidade de Federação – 2000 
Unidades de Federação Vendas ($1.000) 
Minas Gerais 4.000 
Paraná 2.230 
Rio Grande do Sul 6.470 
Rio de Janeiro 8.300 
São Paulo 10.090 
Outros 420 
TOTAL – BRASIL 31.510 
Fonte: Departamento de Análise de Mercado. 
3. Séries específicas (ou categóricas): descrevem os valores da variável, em determinado tempo e 
local, segundo especificações ou categorias. 
Exemplo: Suponha que o diretor esteja interessado em conhecer o comportamento das vendas de 
cada um dos produtos, que foram agrupados em três categorias ou linhas. A tabela revela que 
aproximadamente 50% do faturamento da empresa são representados pelos produtos da linha C. 
 
 9 
GLT S.A. – Indústria de Componentes Eletrônicos, Vendas por Linha de Produto – 2000 
Linha do Produto Vendas ($1.000) 
Linha A 6.450 
Linha B 9.310 
Linha C 15.750 
TODOS OS PRODUTOS 31.510 
Fonte: Departamento de Análise de Mercado. 
4. Distribuição de freqüências: neste caso, todos os elementos estão fixos, estando os dados 
agrupados de acordo com a intensidade ou variação quantitativa do fenômeno. O processo de 
construção das tabelas de distribuição de freqüência será feito mais adiante. 
Exemplo: Agrupar as vendas da empresa em classes de faturamento e analisar o número de meses 
em que se verificaram os vários faturamentos. 
GLT S.A. – Indústria de Componentes Eletrônicos, Nº de Meses Segundo o Faturamento 
Vendas ($1.000) Meses 
De 1.800 a 2.199 1 
 2.200 a 2.599 4 
 2.600 a 2.999 3 
 3.000 a 3.399 3 
 3.400 a 3.799 1 
TOTAL DE MESES 12 
Fonte: Departamento de Análise de Mercado. 
Nº de Empregados das Várias Classes de Salários no Estado de São Paulo – 2000 
Classes de Salários (R$) Nº de Empregados 
Até 80 41.326 
De 80 a 119 123.236 
De 120 a 159 428.904 
De 160 a 199 324.437 
De 200 a 399 787.304 
De 400 a 599 266.002 
De 600 a 799 102.375 
De 800 a 999 56.170 
1.000 ou mais 103.788 
TOTAL 2.233.542 
Fonte: Serviço de Estatística da Previdência e Trabalho. 
 
 
 10 
 Séries conjugadas – tabelas de dupla entrada 
Muitas vezes há necessidade de apresentar, em uma única tabela, a variação de valores de mais de 
uma variável, obtendo assim uma tabela de dupla entrada. Nesse tipo de tabela ficam criadas duas 
ordens de classificação: horizontal e vertical. 
Exemplos: 
Série específico-temporal: 
População Economicamente Ativa por Setor de Atividade – Brasil 
Setor População (1000 habitantes) 
1940 1950 1960 
Primário 8.968 10.255 12.163 
Secundário 1.414 2.347 2.962 
Terciário 3.620 4.516 7.525 
 Fonte: IPEA. 
Série geográfico-temporal: 
Produção Brasileira de Borracha 
Unidade de 
Produção 
Produção 
1937 1938 1939 
Acre 5.007 4.765 4.727 
Amazonas 6.858 5.998 5.631 
Pará 4.945 4.223 4.500 
Mato Grosso 1.327 1.285 1.235 
Outros Estados 333 539 337 
 Fonte: Anuário Estatístico do Brasil - IBGE. 
É importante ressaltar que nem toda tabela representa uma série estatística. Algumas vezes, os 
dados não são uniformes, sendo meramente um aglomerado de informações gerais sobre 
determinado assunto. 
Exemplo: 
Situação dos Espetáculos Cinematográficos no Brasil – 1970 
Especificação Dados Numéricos 
Número de cinemas 2.488 
Lotação dos cinemas 1.722.348 
Sessões por dia 3.933 
Filmes de longa metragem 131.330.488 
Meia entrada 89.581.234 
 Fonte: Anuário Estatístico do Brasil - IBGE. 
 
 11 
 Dados absolutos e dados relativos 
Dados absolutos são os dados estatísticos resultantes da coleta direta da fonte, sem manipulação a 
não ser contagem ou medida. Sua leitura é inexpressiva. 
Dados relativos é o resultado de comparações por razões que se estabelecem entre dados absolutos 
e têm por finalidade facilitar as comparações entre quantidades. São as porcentagens, índices, 
coeficientes e taxas. 
1. Porcentagens 
Destaca a participação da parte no todo. São razões que consistem em considerar um total qualquer 
igual a 100% e através de uma regra de três simples, estabelecermos qualquer relação com as 
parcelas que compõe o total. Assim: Total ----- 100% 
 Parcela ---- x% 
Exemplo 1: 
b) MATRÍCULAS NAS ESCOLAS DA CIDADE A - 1995 
Categorias Nº de alunos % 
1º grau 19.286 
2º grau 1.681 
3ºgrau 234 
Total 21.201 
 
Exemplo 2: Quando quisermos analisar a estrutura de um fato, deveremos ratear as porcentagens 
entre os itens que compõem este fato. 
Custo mensal dos ventiladores A e B (10 unidades) 
Despesas Ventilador A Ventilador B 
 Valores (R$) % Valores (R$) % 
Mão-de-obra 1120,00 44,8 2280,00 
Matérias – primas 720,00 28,8 2600,00 
Despesas gerais 320,00 12,8 1360,00 
Propaganda 340,00 13,6 1760,00 
TOTAL 2500,00 100 8000,00 100 
2. Índices 
São razões entre duas grandezas tais que uma não inclui a outra. Exemplo: 
Índices econômicos: 
população
produção da lvalor tota
capitaper Produção  
superfície
população
ademográfic Densidade 
 
 12 
 
 
população
renda
capitaper Renda  
 
população
consumo
capitaper Consumo  
acronológic idade
mental idade
QI  
 
3. Coeficientes 
São razões entre o nº de ocorrências e o nº total. Exemplos: 
 
 totalpopulação
óbitos de nº
emortalidad de eCoeficient  
 
 totalpopulação
snascimento de nº
natalidade de eCoeficient  
 
matrículas de inicial nº
evadidos alunos de nº
escolar evasão de eCoeficient  
 
matrículas de final nº
aprovados alunos de nº
escolar entoaproveitam de eCoeficient  
4. Taxas 
São os coeficientes multiplicados por uma potência de 10n (10, 100, 1000) para tornar o resultado 
mais inteligível. Exemplos: Taxa de mortalidade = coeficiente de mortalidade . 10n 
 Taxa de evasão escolar = coeficiente de evasão escolar . 10n 
Ex.: número de óbitos=80080; população total = 520000 
Coeficiente mortalidade = 154,0
520000
80080
 . Então o coef. de mortalidade é de 0,154 óbito por 
habitante. Porém se multiplicarmos por 1000 teremos: 
 taxa de mortalidade=0,154*1000=154, ou seja, 154 óbitos por mil habitantes. 
 
 
 
 
 
 
 
 
 
 13 
Lista de exercícios sobre Séries e Dados Estatísticos 
1) Considere a série estatística. Complete-a, determinando as porcentagens com uma casa decimal 
e fazendo o arredondamento. 
Séries Alunos 
Matriculados 
% 
1ª 546 
2ª 328 
3ª 280 
4ª 120 
Total 1.274 
 2)Analisar a estrutura do fato abaixo, utilizando porcentagens. 
Especificação Despesa família X Despesa família Y 
Alimentação 5600 1140 
Vestuário 1600 680 
Habilitação 3600 1300 
Outras despesas 1700 880TOTAL 12500 4000 
 
3)Em um magazine, as vendas de certos produtos se processam da seguinte maneira: 
Dias Unidades 
Segunda 47 
Terça 32 
quarta-feira 58 
quinta-feira 66 
sexta-feira 30 
Sábado 47 
Pode-se indicar por meio de porcentagem: 
a)Como se distribuem as vendas diárias com relação ao total da semana? 
b) Qual o desenvolvimento das vendas com relação a 50 unidades (venda considerada base para a 
empresa). 
c) Qual o desenvolvimento das vendas de um dia para o outro? 
 
4) Considerando que Minas Gerais, em 1992, apresentou (dados fornecidos pelo IBGE): 
 População: 15.957,6 mil habitantes Superfície: 586.624 km2 
 Nascimentos: 292.036 Óbitos: 99.281 
 
 14 
Calcule: 
a) o índice da densidade demográfica b) a taxa de natalidade c) a taxa de mortalidade 
5) Um professor preencheu um quadro, enviado pela secretaria da escola, com os seguintes dados: 
Série 
E 
Turm
a 
Nº de 
Aluno
s 
30.03 
Nº de 
Aluno
s 
30.11 
Promovidos 
sem 
Recuperaçã
o 
Retidos 
sem 
Recupe
ração 
Em 
Recupe
ração 
Recupe
rados 
Não-
Recupe
rados 
Total Geral 
Promo
-vidos 
Retido
s 
1º B 49 44 35 03 06 05 01 40 04 
1º C 49 42 42 00 00 00 00 42 00 
1º E 47 35 27 00 08 03 05 30 05 
1º F 47 40 33 06 01 00 01 33 07 
Total 192 161 137 09 15 08 07 145 16 
Calcule: 
a) a taxa de evasão, por turma b) a taxa de evasão total 
c) a taxa de aprovação, por turma d) a taxa de aprovação geral 
e) a taxa de recuperação, por turma f) a taxa de recuperação geral 
g) a taxa de reprovação na recuperação geral h) a taxa de aprovação, sem a recuperação 
h) a taxa de retidos, sem a recuperação. 
 
6)Classifique as séries abaixo: 
a)Produção de fertilizantes Fosfatados – Brasil – 1985 – 1989 
Anos Quantidade (toneladas) 
1985 3570115 
1986 4504201 
1987 5448835 
1988 4373226 
1989 4024813 
 
b) Despesas com viagens dos departamentos das 3 filiais da Empresa 
SETOR FILIAIS 
 RJ MG SP 
Logística R$3000 R$3500 R$4000 
Marketing R$2000 R$2300 R$2800 
RH R$3200 R$1700 R$2200 
 
 15 
 
7- Uma pessoa comprou dois automóveis por R$52500,00. Vendeu o primeiro com 8% de lucro e o 
segundo com 3% de prejuízo. O lucro líquido total foi de R$2000,00. Calcular o preço de compra 
de cada automóvel. 
8 – Em uma inspeção de qualidade verificou-se que tinham 12 peças estragadas, representando 15% 
do total de peças examinadas. Queremos saber quantas peças foram examinadas. 
9 – Um objeto é oferecido por R$600; este preço sofre um desconto de 20% e depois de 15%. O 
novo preço corresponde a que porcentagem de R$600? 
 
1.4 - ORGANIZAÇÃO E APRESENTAÇÃO DOS DADOS 
 
 As observações é o material básico com que o pesquisador trabalha. Estas observações 
podem ser, por exemplo, a produtividade de uma planta, a velocidade de processamento de um 
computador, a resistência à ruptura de determinado cabo, suscetibilidade ou não de indivíduo a 
determinada doença, cor de uma flor, sexo do primeiro filho de um casal, opinião dos alunos quanto 
a didática de um professor, etc. Estas observações apresentam uma característica em comum que é a 
variação ou variabilidade, ou seja assumem diferentes valores de indivíduo para indivíduo. 
 Uma característica que pode assumir diferentes valores de indivíduo para indivíduo é 
denominada variável. Caso contrário é denominado constante. As variáveis são classificadas em: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
VARIÁVEIS 
QUALITATIVAS 
(atributos) 
QUANTITATIVAS 
(numéricas) 
 Sexo; 
 Religião; 
 Naturalidade; 
 Cor dos olhos; 
 Altura de uma planta (baixa, média, alta); 
 Cor de flor; 
 Sabor; 
 
ORDINAL 
Ex: classe social; 
NOMINAL 
Ex: região; 
DISCRETAS CONTÍNUAS 
 Quantidades 
de estudantes 
em uma 
disciplina; 
 Quantidades 
de cômodos 
em uma 
residência; 
 Número de 
filhos; 
 
 Tempo de vôo 
entre cidades; 
 Duração da 
bateria do 
celular; 
 Peso corporal; 
 
Exemplos: 
Exemplos: Exemplos: 
 
 16 
Exercício: Classifique as variáveis apresentadas na tabela abaixo: 
 
 
 Os dados coletados no campo e trazidos para o laboratório (escritório), na forma em que se 
encontram, como apresentados na Tabela 1.1, são denominados dados brutos. Normalmente este 
tipo de dados trás pouca ou nenhuma informação ao leitor, sendo necessário uma elaboração 
(organização) destes dados, a fim de aumentar sua capacidade de informação. 
Tabela 1.1: Dados dos alunos da disciplina MLI54 do curso de Matemática (UFU) em 01/2002. 
Indivíduo Altura Sexo Número de Irmãos 
1 1,87 M 5 
2 1,67 F 2 
3 1,75 F 0 
4 1,80 M 2 
5 1,72 M 4 
6 1,64 F 2 
7 1,73 F 2 
8 1,78 M 1 
9 1,83 M 0 
10 1,78 M 1 
11 1,67 F 3 
12 1,70 F 1 
13 1,65 F 1 
14 1,53 F 1 
15 1,62 M 1 
16 1,56 F 0 
17 1,51 F 1 
18 1,68 F 1 
19 1,72 F 1 
20 1,73 F 1 
21 1,75 F 5 
 
 17 
22 1,67 F 2 
23 1,88 M 1 
24 1,87 M 1 
25 1,75 M 3 
26 1,63 F 6 
27 1,70 M 6 
28 1,88 M 6 
29 1,76 F 3 
30 1,78 M 2 
 
 A mais simples organização numérica é a ordenação dos dados em ordem crescente ou 
decrescente, chamada de ROL. Como pode-se observar na Tabela 1.2, a simples organização dos 
dados em um Rol, aumenta muito a capacidade de informação destes. Pois enquanto a Tabela 1.1 
nos informava apenas que tínhamos 30 alunos, e algumas alturas, sexo e número de irmãos, na 
Tabela 1.2, verificamos que a menor altura observada foi 1,51 m e a maior 1,88 m, o que nos 
fornece uma amplitude total de variação da ordem de 0,37 m. 
maior valor observado - menor valor observado
1,88 1,51 0,37
A
A m m m

  
 
 Pode-se observar ainda que algumas alturas como 1,67m, 1,75m e 1,78m são mais comuns. 
Tabela 1.2: Rol das alturas dos alunos da disciplina MLI54 do curso de Matemática (UFU) em 
01/2002. 
1,51 1,53 1,56 1,62 1,63 1,64 1,65 
1,67 1,67 1,67 1,68 1,70 1,70 1,72 
1,72 1,73 1,73 1,75 1,75 1,75 1,76 
1,78 1,78 1,78 1,80 1,83 1,87 1,87 
1,88 1,88 
 
Tabela 1.3: Rol do nº de irmãos dos alunos da disciplina MLI54 do curso de Matemática (UFU) em 
01/2002. 
0 0 0 1 1 1 1 
1 1 1 1 1 1 1 
1 2 2 2 2 2 2 
3 3 3 4 5 5 6 
6 6 
 
 18 
1.4.1– APRESENTAÇÃO TABULAR 
 
1.4.1.3 VARIÁVEIS QUANTITATIVAS CONTÍNUAS 
 
 DISTRIBUIÇÃO DE FREQÜÊNCIAS 
 Após esta primeira organização dos dados, podemos ainda agrupá-los em classes de menor 
tamanho, a fim de aumentar sua capacidade de informação. 
 Distribuindo-se os dados observados em classes e contando-se o número de indivíduos 
contidos em cada classe, obtém-se a freqüência de classe. A disposição tabular dos dados agrupados 
em classes, juntamente com as freqüências correspondentes denomina-se distribuição de freqüência. 
 Para identificar uma classe, deve-se conhecer os valores dos limites inferior e superior da 
classe, que delimitam o intervalo de classe. Por exemplo, para o caso das alturas dos alunos, pode-
se desejar incluir em uma única classe todos os indivíduos que possuam altura entre 1,70 e 1,75 m 
assim, o intervalo de classe seria de 1,70 m a 1,75 m. 
 Neste ponto surge uma dúvida fundamental. Indivíduos que apresentem alturas exatamente 
iguais a 1,70 m ou a 1,75 m pertencem ou não a esta classe? Deste modo surge a necessidade de 
definir a natureza do intervalo de classe, se é aberto ou fechado. Quando o intervalo de classe é 
aberto, os limites da classe não pertencem a ela, e quando o intervalo é fechado, os limites de classe 
pertencem a classe em questão. Notação: 
 Intervalos abertos: ]1,70 – 1,75[ ou somente, 1,70 – 1,75; 
 Intervalos fechados: [1,70 – 1,75] ou 1,70├┤1,75; 
 Intervalos mistos: [1,70 – 1,75[ ou 1,70├1,75; 
 
CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA: 
 Para montar uma distribuição de freqüência é necessário que primeiramente se determine o 
número de classes (k) em que os dados serão agrupados. Por questões de ordem prática e estética 
sugere-se utilizar de 5 a 20 classes. Na bibliografia pode-se encontrar vários critériospara indicação 
do número de classes a ser utilizado, em função do número de dados (n), os mais utilizados são: 
i) Critério de Oliveira (1994):
, 100
5.log( ), 100
k n n
k n n
  

 
 (iremos adotar este critério); 
ii) Critério de Scott(1979):
3
3,49
A n
k S , 
em que A é amplitude e S o desvio padrão. As estatísticas A e S são definidas nas equações abaixo 
da seguinte forma: 
 
 19 
2
12
( ) (1)
1
1
 e 
1
n
in
i
n i
i
X
A X X S X
n n


  
  
     
 
 
  

 ; 
iii) Critério de Sturges: 1 3,3.log( )k n  . 
 Após determinar o número de classes (k) em que os dados serão agrupados, deve-se então 
determinar o intervalo de classe (c), que é dado pela seguinte expressão: 
1
A
c
k


; 
em que: c é amplitude de classe; 
 A é a amplitude total; 
 k é o número de classes. 
 Conhecida a amplitude de classe, determina-se então os intervalos de classe. Os limites 
inferior e superior das classes devem ser escolhidos de modo que o menor valor observado esteja 
localizado no ponto médio da primeira classe, que é dado por: 
inf sup
2
L L
PM

 , 
em que: infL é o limite inferior da classe; 
 supL é o limite superior da classe. 
 Assim, o limite inferior da primeira classe será: 
inf 1ª menor valor observado
2
c
LI   . 
 E os demais limites são obtidos somando-se c ao limite anterior. A título de ilustração 
agruparemos dos dados referentes às alturas dos alunos em classes. 
Temos que a amplitude total observado na Tabela 1.2 é: 
maior valor observado - menor valor observado 1,88 1,51 0,37A     
 1º Passo) Determinar o número de classe (k): 
 30 100n   30 5,5k   , como o número de classe é inteiro usaremos 6k  ; 
 2º Passo) Determinar a amplitude de classe (c): 
0,37
0,074
1 6 1
A
c
k
  
 
; 
 3º Passo) Determinar o limite inferior da primeira classe: 
inf 1ª
0,074
menor valor observado 1,51 1,473
2 2
c
LI      
4º Passo) Determinar o limite superior da primeira classe: 
 
 20 
sup1ª inf 1ª 1,473 0,074 1,547L L c     ; 
 5º Passo) Montar a distribuição de freqüência: 
Tabela 1.4: Distribuição de freqüência das alturas de30 alunos da disciplina MLI54 do curso de 
Matemática (UFU) em 01/2002. 
Alturas (m) 
af rf rf % PM 
1,473├1,547 2 0,066 6,6 1,51 
1,547├1,621 2 0,066 6,6 1,584 
1,621├1,695 7 0,234 23,4 1,658 
1,695├1,769 10 0,334 33,4 1,732 
1,769├1,843 5 0,166 16,6 1,806 
1,843├1,917 4 0,134 13,4 1,88 
TOTAL 30 1,00 100 
 
em que: af é a freqüência absoluta e indica o número de observações pertencentes a cada classe; 
 rf é a freqüência relativa que é dada por: a
r
f
f
n
 ; 
 n é o número de observações e PM é o ponto médio da classe. 
 Interpretação: Apresentando os dados na forma de distribuição de freqüência, sintetiza-se a 
informação contida nos mesmos, além de facilitar sua visualização. Pois pode-se verificar 
claramente na Tabela 1.4 que as alturas dos 30 alunos apresentam uma amplitude total de 0,37 m. 
Não foi observada nenhuma altura inferior a 1,473 m e nem superior a 1,917 m. Alturas localizadas 
no extremo inferior da distribuição (1,473 a 1,547 m) são menos freqüentes do que as do extremo 
superior (maiores que 1,843 m). Observa-se uma tendência de concentração das alturas na região 
central a superior da distribuição. A apresentação dos dados em forma de distribuição de freqüência 
facilita ainda o cálculo de várias medidas estatísticas de interesse, além de permitir a apresentação 
gráfica dos mesmos. 
 
 APRESENTAÇÃO GRÁFICA 
 As mesmas informações fornecidas pelas distribuições de freqüências podem ser obtidas, e 
mais facilmente visualizada através de gráficos, tais como histograma, polígono de freqüência e 
outros. 
HISTOGRAMAS: são constituídos por um conjunto de retângulos, com as bases assentadas sobre 
um eixo horizontal, tendo o centro da mesma no ponto médio da classe que representa, e cuja altura 
é proporcional à freqüência da classe. Se as amplitudes de classes forem todas iguais, as alturas 
 
 21 
serão numericamente iguais as freqüências das classes. Porem, se os intervalos de classe não 
tiverem todos a mesma amplitude de classe, as alturas dos retângulos deverão ser convenientemente 
ajustadas, afim de que as áreas dos mesmos sejam proporcionais às freqüências das classes e assim 
suas áreas permaneçam fieis à sua freqüência. Esse ajuste pode ser feito através da densidade de 
freqüência, dada por: r
r
f
df
c
 . 
 
Figura 1: Histograma da distribuição de freqüência das alturas de 30 alunos da disciplina MLI54 do 
curso de Matemática (UFU) em 01/2002. 
 
POLÍGONO DE FREQÜÊNCIA: é um gráfico de análise no quais as freqüências das classes são 
localizadas sobre perpendiculares levantadas nos pontos médios das classes. E pode ser obtido pela 
simples união dos pontos médios dos topos dos retângulos de um histograma. Completa-se o 
polígono unindo-se as extremidades da linha que une os pontos representativos das freqüências de 
classe aos pontos médios das classes imediatamente anterior e posterior as classes extremas, que 
têm freqüência nula. 
 
 22 
 
Figura 2: Polígono de freqüência das alturas de 30 alunos da disciplina MLI54 do curso de 
Matemática (UFU) em 01/2002. 
 Além das aplicações já comentadas, os histogramas e polígonos de freqüências podem 
indicar ainda qual é o tipo de distribuição que os dados seguem como pode ser visto a seguir: 
 
 
Figura 7: Distribuição simétrica. 
 
 
Figura 8: Distribuição assimétrica à 
esquerda. 
 
 
Figura 9: Distribuição assimétrica à direita. 
 
 
 
Figura 10: Distribuição jota. 
 
 
 23 
 
Figura 11: Distribuição jota invertido. 
 
 
 
Figura 12: Distribuição bimodal. 
 
 
 
 
Figura 13: Distribuição multimodal. 
 
 
 
 DISTRIBUIÇÕES DE FREQÜÊNCIAS ACUMULADAS 
 Muitas vezes pode-se estar interessado não em saber a quantidade de observações que existe 
numa determinada classe, mas sim a quantidade de observações acima ou abaixo de um 
determinado ponto na distribuição. 
 Deste modo, a soma das freqüências de todos os valores abaixo do limite superior de uma 
determinada classe é definida como freqüência acumulada para baixo deste ponto, assim como a 
soma das freqüências de todos os valores acima do limite inferior de uma classe é denominada 
freqüência acumulada para cima. 
 A título de ilustração, estão apresentadas nas Tabelas 1.5 e 1.6, respectivamente, as 
freqüências acumuladas para cima e para baixo das alturas dos 30 alunos da disciplina MLI54 do 
curso de Matemática (UFU) em 01/2002. 
Tabela 1.5: Distribuição de freqüência acumulada para baixo das alturas de 30 alunos da disciplina 
MLI54 do curso de Matemática (UFU) em 01/2002. 
 Freqüência Acumulada 
Alturas (m) Absoluta ( af ) Relativa % ( rf %) 
Abaixo de 1,473 0 0,0 
Abaixo de 1,547 2 6,6 
Abaixo de 1,621 4 13,3 
 
 24 
Abaixo de 1,695 11 36,6 
Abaixo de 1,769 21 70,0 
Abaixo de 1,843 26 86,6 
Abaixo de 1,917 30 100,0 
 
Tabela 1.6: Distribuição de freqüência acumulada para cima das alturas de 30 alunos da disciplina 
MLI54 do curso de Matemática (UFU) em 01/2002. 
 Freqüência Acumulada 
Alturas (m) Absoluta ( af ) Relativa % ( rf %) 
acima de 1,473 30 100,0 
acima de 1,547 28 93,3 
acima de 1,621 26 86,6 
acima de 1,695 19 63,3 
acima de 1,769 9 30,0 
acima de 1,843 4 13,3 
acima de 1,917 0 0,0 
 
 Para verificar qual a porcentagem de alunos que possuem altura inferior a 1,621 m basta 
consultar diretamente a Tabela 1.5 e verificar a freqüência acumulada abaixo deste valor (13,3%), 
pois o valor 1,621 m é um dos limites de classe apresentados nesta tabela. Mas como proceder para 
obter as freqüências acumuladas para valores intermediários aos apresentados na tabela? Como por 
exemplo a freqüência acumulada acima de 1,70 m? 
 Para este tipo de cálculo, pressupõe-se que as alturas estejam uniformemente distribuídos 
dentro das classes, e procede-sedo seguinte modo: 
 Freqüência acumulada acima, da classe imediatamente inferior a 1,70 (acima de 1,695) é de 
19 alunos. Freqüência acumulada acima, da classe imediatamente superior a 1,70 (acima de 1,769) é 
de 9 alunos. 
 Assim, temos que: Freq. entre 1,695 e 1,769 19 9 10   alunos; temos ainda que de 1,695 
m a 1,769 m são 0,074 m; e de 1,695 m a 1,70 m são 0,005 m; então, 
0,074 10
0,005
0,005 10
0,67
0,074
m alunos
m x
x alunos



 
 
 Como acima de 1,695 m existe 19 alunos, e entre 1,695 e 1,70 m existem 0,67, conclui-se 
que acima de 1,70 m existem 19 0,67 18,33  alunos com alturas acima de 1,70 m. 
 
APRESENTAÇÃO GRÁFICA 
 
 25 
OGIVAS: é o nome dado a um polígono de freqüências acumuladas, nas quais as freqüências 
acumuladas são localizadas sobre perpendiculares levantadas nos limites inferiores ou superiores 
das classes, dependendo se a ogiva representar as freqüências acumuladas abaixo ou acima, 
respectivamente. 
 
Figura 3: Ogivas, acima e abaixo de, da distribuição de freqüências acumuladas das alturas de 30 
alunos da disciplina MLI54 do curso de Matemática (UFU) em 01/2002. 
 
 
 
 
1.4.1.3 VARIÁVEIS QUANTITATIVAS DISCRETAS 
 Para variáveis quantitativas discretas não se faz necessário a distribuição dos dados em 
classes intervalares, pois cada “valor” da variável já apresenta uma classe distinta como pode ser 
observado na Tabela 1.7. A título de ilustração, iremos construir a distribuição de freqüência do 
número de irmãos dos alunos da Tabela 1.1, para isso, devemos primeiro dispor os dados em uma 
tabela de Rol, como segue a Tabela 1.3 abaixo. Logo depois construímos a distribuição de 
freqüência com as classes sendo os próprios valores observados e completar a tabela com as 
freqüências observadas. 
Tabela 1.3: Rol do nº de irmãos dos alunos da disciplina MLI54 do curso de Matemática (UFU) em 
01/2002. 
0 0 0 1 1 1 1 
1 1 1 1 1 1 1 
1 2 2 2 2 2 2 
3 3 3 4 5 5 6 
 
 26 
6 6 
Tabela 1.7: Distribuição de freqüência do nº de irmãos dos alunos da disciplina MLI54 do curso de 
Matemática (UFU) em 01/2002. 
Nº de Irmãos 
af rf (%) aF rF (%) 
0 3 10 3 10 
1 12 40 15 50 
2 6 20 21 70 
3 3 10 24 80 
4 1 3,33 25 83,33 
5 2 6,67 27 90 
6 3 10 30 100 
 
 
TOTAL 30 100 
 
APRESNTAÇÃO GRÁFICA 
GRÁFICO DE BARRAS: é um gráfico formado por barras verticais, cujas alturas são 
proporcionais às freqüências das classes. 
 
Figura 4: Gráfico de Barras da distribuição de freqüência do nº de irmãos dos alunos da disciplina 
MLI54 do curso de Matemática (UFU) em 01/2002. 
 
GRÁFICO DE BARRAS PARA DISTRIBUIÇÕES DE FREQÜÊNCIAS ACUMULADAS: é 
um gráfico formado por barras horizontais, cujas alturas são proporcionais às freqüências 
acumuladas das classes. 
 
 27 
 
Figura 5: Gráfico de Barras da distribuição de freqüência acumulada do nº de vendas. 
 
1.4.1.3 VARIÁVEIS QUALITATIVAS 
 
 Do mesmo modo que as variáveis quantitativas discretas as qualitativas também não 
se faz necessário a distribuição dos dados em classes intervalares. A título de ilustração, iremos 
construir a tabela de distribuição de freqüência para a variável sexo dos alunos observados na 
Tabela 1.1. Então, da mesma forma que fizemos para a variável discreta faremos aqui também. 
Tabela 1.8: Distribuição de freqüência da variável sexo dos alunos da disciplina MLI54 do curso de 
Matemática (UFU) em 01/2002. 
Sexo 
af rf rf (%) 
Feminino 17 0,5667 56,67 
Masculino 13 0,4333 43,33 
TOTAL 30 1,0 100 
APRESNTAÇÃO GRÁFICA 
GRÁFICO DE SETORES (PIZZA): é um gráfico em formato de circulo dividido em setores 
cujas áreas são proporcionais à freqüências da classe. O processo de construção é simples, pois 
sabe-se que setor de circunferência é formado por um ângulo de 360º e equivale a 100% da área da 
circunferência, assim para obter-se o setor cuja área representa uma determinada freqüência, basta 
resolver uma regra de três simples, como a apresentada a seguir: 
 
 28 
%
360º 100
º rx f


 
 Para o exemplo da Tabela 1.8 para o sexo feminino e masculino, respectivamente, temos: 
 
%
360º 100
º 56,67
360 56,67
204,01º
100
F
F
x
x




 
 
%
360º 100
º 43,33
360 43,33
155,99º
100
M
M
x
x




 
; 
ou poderíamos achar o ângulo do sexo masculino pela diferença: 360º 204,01º 155,99ºMx    . 
 Daí temos os ângulos que formarão as áreas do gráfico de setor, como pode ser visto na 
Figura 6. 
 
Figura 6: Gráfico de Setor da distribuição de freqüência da variável sexo dos alunos da disciplina 
MLI54 do curso de Matemática (UFU) em 01/2002. 
 
1.5 - MEDIDAS DE POSIÇÃO E DISPERSÃO 
 
1.5.1 - MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL 
 
 As medidas de posição ou de tendência central constituem uma forma mais sintética de 
apresentar os resultados contidos nos dados observados, pois representam um valor central, em 
torno dos quais os dados se concentram. As medidas de posição mais empregadas são a média, a 
mediana e a moda. 
 
 29 
 
1.5.1.1 – MÉDIA ARITMÉTICA 
 
 È a mais usada das três medidas de posição mencionadas, por ser a mais comum e 
compreensível delas, bem como pela relativa simplicidade do seu cálculo, além de prestar-se bem 
ao tratamento algébrico. 
 A média aritmética ou simplesmente média de um conjunto de n observações, 1 2, ,..., nx x x é 
definida como: 
1
n
i
i
x
x
n


, 
onde n é número de valores observados e 
1 2
1
...
n
i n
i
x x x x

    (soma dos valores observados). 
 Notação: x para amostras e  para populações. 
 Exemplo1: Dados os pesos de cinco recém-nascidos (kg) de certo hospital: 2,750; 3,100; 
2,850; 3,330; 2,240. Temos que o peso médio dos recém-nascidos é: 
5
1 1 2,750 3,100 2,850 3,330 2,240 14,270
2,854
5 5 5
n
i i
i i
x x
x
n
     
    
 
kg. 
 Interpretação: o peso médio dos cinco recém-nascidos foi de 2,854kg, isto quer dizer que 
alguns recém-nascidos pesaram menos de 2,854kg, outros pesaram mais, mas em média, o peso dos 
recém-nascidos foi de 2,854kg. Ou seja, 2,854kg é um valor em torno do qual os pesos dos cinco 
recém-nascidos se concentra. 
 Para os dados da Tabela 1.1 podemos calcular a média das variáveis alturas e número de 
irmãos, respectivamente: 
30
1 1 1,87 ... 1,78
1,72
30 30
n
i i
i i
x x
x m
n
   
   
 
; 
30
1 1 5 ... 2
2 
30 30
n
i i
i i
x x
x irmãos
n
   
   
 
 
 Propriedades da Média: 
Seja o seguinte conjunto de observações: 2,0,5,3. A média desses valores é dada por 
2,5x  . O desvio (d) deles em relação à média é dado por: 
1 1
2 2
3 3
4 4
2 2,5 0,5
0 2,5 2,5
5 2,5 2,5
3 2,5 0,5
d x x
d x x
d x x
d x x
     
     
    
    
 
 
 30 
i. Soma dos desvios de um conjunto de dados em relação a média é nula, ou seja, 
1
0
n
i
i
d

 ; 
Exemplo 2: 
4
1 2 3 4
1
0,5 2,5 2,5 0,5 0i
i
d d d d d

          ; 
 
Prova: 
 
1 1 1 1
1
1 1
1 1
1
0
Logo, 0
n n n n
i i i
i i i i
n
in n
i
i i
i i
n n
i i
i i
n
i
i
d x x x x
x
x nx x n
n
x x
d
   

 
 

    
   

  

   

 
 

 
 
ii. Somando-se ou subtraindo-se uma constante (k) a todas as observações, a média também fica 
somada ou subtraída deste valor, ou seja, *
i ix x k  então 
*
x x k  . 
Exemplo 3: Dados os valores observados igual a    1 2 3 4, , , 2,0,5,3x x x x x  de 2,5x  . Se 
somarmos uma constante ( 3k  ) tem-se a nova variável  * 5,3,8,6x  com média 
*
5,5 2,5 3x x k     . 
Prova: 
 
 
*1
*
*
1 1
1 1
1
1
*
 fazendo tem-se:
1
1
Logo, 
n
i
i
i i
n n
i i n n
i i
i
i i
n
in
i
i
i
x
x x x k
n
x x k
x x k
n n n
x
nk
x nk x k
n n n
x x k

 
 


  

 
     
 
  
      
 
 

 
 


 
 
 
 31iii.Multiplicando ou dividindo todas as observações por uma constante (k) a média também fica 
multiplicada ou dividida por essa constante, ou seja, 
* * ou i
i i i
x
x x k x
k
   então 
* *
 ou 
x
x x k x
k
   . 
Exemplo 4: Dados os valores observados igual a    1 2 3 4, , , 2,0,5,3x x x x x  de 2,5x  . Se 
multiplicarmos por constante ( 3k  ) tem-se a nova variável  * 6,0,15,9x  com média 
*
7,5 2,5 3x x k     . 
Prova: 
 
 
Para o caso de dividir por k, idem ao caso acima. 
Características e importância da Média: 
i. É muito influenciada pelos valores extremos da distribuição; 
ii. Localiza-se, em geral, na classe de maior freqüência; 
iii. Na sua determinação são considerados todos os dados da distribuição; 
iv. A sua precisão está na razão direta do número de observações com que é calculada; 
v. É única para um conjunto de dados; 
vi. Não pode ser calculada para dados agrupados que apresentem limites indeterminados. 
 Cálculo de Médias para Dados Agrupados: 
1) Variável Discreta: 
 1
1
i
i
k
i a
i
k
a
i
x f
x
f





, onde
iaf é a freqüência absoluta da classe i, ix é a classe i e 
1
i
k
a
i
f n

 . 
Exemplo 5: Sejam os dados agrupados abaixo, calcule a média. 
Tabela 1.7: Distribuição de freqüência do nº de irmãos dos alunos da disciplina MLI54 do curso de 
Matemática (UFU) em 01/2002. 
 
 
*1
*
*
1 1 1 1
*
 fazendo tem-se:
Logo, 
n
i
i
i i
n n n n
i i i i
i i i i
x
x x x k
n
x x k k x x
x k k x
n n n n
x k x

   
  

    


   
 
 32 
Nº de Irmãos 
af 
0 3 
1 12 
2 6 
3 3 
4 1 
5 2 
6 3 
TOTAL 30 
1 0 3 1 12 2 6 3 3 4 1 5 2 6 3 65
2
30 30
i
k
i a
i
x f
x irmãos
n
             
   

 
2) Variável Contínua: 
 
 1
1
i
i
k
i a
i
k
a
i
PM f
x
f





, onde iPM é o ponto médio da i-ésima classe. 
Exemplo 6: Sejam os dados agrupados abaixo, calcule a média. 
Tabela 1.4: Distribuição de freqüência das alturas de 30 alunos da disciplina MLI54 do curso de 
Matemática (UFU) em 01/2002. 
Alturas (m) 
af PM 
1,473├1,547 2 1,51 
1,547├1,621 2 1,584 
1,621├1,695 7 1,658 
1,695├1,769 10 1,732 
1,769├1,843 5 1,806 
1,843├1,917 4 1,88 
TOTAL 30 
1 1,51 2 1,584 2 1,658 7 1,732 10 1,806 5 1,88 4
1,722
30
i
k
i a
i
PM f
x m
n
           
  

 
 
 
 
1.5.1.2 – MEDIANA 
 
 33 
 Para um conjunto de dados ordenados (Rol) a mediana é o valor que é precedido e seguido 
pelo mesmo número de dados (observações). Isto é, 50% dos dados são superiores à mediana e 50% 
são inferiores. 
 Cálculo da mediana: 
i. Quando o número de dados (n) for ímpar, a mediana é dada por: 
1
2
n
Md x
 
 
 
 , onde 
1
2
n  
 
 
 é o índice da variável (x). 
Exemplo 1: Seja a variável  0,1,2,3,4X  , calcule a mediana. 
Sabe-se que 5n  , ou seja, n é ímpar logo a mediana é dada por: 31 5 1
2 2
2
n
Md x x x
    
   
   
    . 
ii. Quando o número de dados (n) for par, a mediana é dada por: 
2
2 2
2
n n
x x
Md
   
   
   

 , onde 
2
n 
 
 
 e 
2
2
n  
 
 
 são índices da variável (x). 
Exemplo 2: Seja a variável  0,1,2,3X  , calcule a mediana. 
Sabe-se que 4n  , ou seja, n é par logo a mediana é dada por: 
   
2 4 4 2
2 32 2 2 2 1 2
1,5
2 2 2 2
n n
x x x x
x x
Md
        
       
       
 
 
     
 Cálculo da Mediana para Dados Agrupados: 
1) Variável Discreta: usa-se o mesmo procedimento feito anteriormente para cálculos de mediana. 
Exemplo 3: Seja a Tabela 1.7, dos dados agrupados dos nº de irmãos, calcule a mediana. 
Sabe-se que 30n  , ou seja, n é par logo a mediana é dada por: 
   
2 30 30 2
15 162 2 2 2 1 2
1,5
2 2 2 2
n n
x x x x
x x
Md
        
       
       
 
 
     , 
ou seja, 50% do número de irmãos estão abaixo 1,5 e 50% estão acima. 
2) Variável Contínua: 
inf
2 antMd
Md
Md
a
Md
a
n
F
Md L c
f
 
 
   
 
 
, 
onde: infMd
L é o limite inferior da classe mediana; 
 
antMdaF é a freqüência acumulada da classe anterior à classe mediana; 
 
Mdaf é a freqüência absoluta da classe mediana; 
 
 34 
 Mdc é a amplitude da classe mediana; 
 n é o número de observações ou dados. 
Exemplo 4: Seja a Tabela 1.4, dos dados agrupados das alturas, calcule a mediana. 
Temos que a classe mediana é aquela classe que contém o 15º valor, ou seja, a quarta classe é a 
mediana. Logo a mediana é dada por: 
Alturas (m) 
af aF 
1,473├1,547 2 2 
1,547├1,621 2 4 
1,621├1,695 7 11 
1,695├1,769 10 21 
1,769├1,843 5 26 
1,843├1,917 4 30 
TOTAL 30 
inf
30
11
2 21,695 0,074 1,725
10
antMd
Md
Md
a
Md
a
n
F
Md L c m
f
   
    
         
   
   
 
 Interpretação: A mediana igual a 1,725m indica que 50% das alturas estão abaixo de 1,725m 
e 50% estão acima de 1,725m. 
 Propriedades da Mediana: 
i. Somando-se ou subtraindo-se uma constante (k) a todos as observações, a mediana também fica 
somada ou subtraída deste valor, ou seja, *
i ix x k  então *Md Md k  . 
Exemplo 5: Dados os valores observados igual a    1 2 3 4, , , 2,0,5,3x x x x x  de 2,5Md  . Se 
somarmos uma constante ( 3k  ) tem-se a nova variável  * 5,3,8,6x  com mediana 
* 5,5 2,5 3Md Md k     . 
ii. Multiplicando ou dividindo todas as observações por uma constante (k) a mediana também fica 
multiplicada ou dividida por essa constante, ou seja, 
* * ou i
i i i
x
x x k x
k
   então 
* * ou 
Md
Md Md k Md
k
   . 
Exemplo 6: Dados os valores observados igual a    1 2 3 4, , , 2,0,5,3x x x x x  de 2,5Md  . Se 
multiplicarmos por constante ( 3k  ) tem-se a nova variável  * 6,0,15,9x  com mediana 
* 7,5 2,5 3Md Md k     . 
Classe Mediana 
 
 35 
 Características e Importância da Mediana: 
i. Pode ser obtida em distribuições de freqüências que apresentem classes com limites indefinidos; 
ii. É muito empregada em pesquisas nas quais os valores extremos têm pouca importância; 
iii. Não é influenciada por valores extremos e sim pelo número de observações; 
iv. É mais realista do que a média para representar certas variáveis com distribuições assimétricas, 
como a renda dos brasileiros (existem valores discrepantes). 
v. Não considera todas as observações no seu cálculo. 
1.5.1.3 – MODA 
 A moda de um conjunto de dados é o valor que ocorre com maior freqüência, isto é, o valor 
mais comum. Para um conjunto de dados a moda pode não ser única, bem como pode não existir. 
Exemplo 1: 2,3, 4,5,7,7,7,8,9 a moda é 7Mo  ; 
 1, 2,3, 4,7,9,10,13, 20 não possui moda; 
 1,2,3,4,4,8,10,10,13 as modas são 4Mo  e 10Mo  , dizemos que esta série e bi 
modal. 
 Cálculo da Moda para Dados Agrupados: 
1) Variável Discreta: usa-se o mesmo procedimento feito anteriormente para cálculos da moda, ou 
seja, a classe que aparece com a maior freqüência absoluta. 
Exemplo 2: Seja a Tabela 1.7, dos dados agrupados dos nº de irmãos, calcule a moda. 
Observando a coluna da freqüência absoluta, vemos que a de maior freqüência é a segunda classe 
com 12af  , logo a moda é dada por: 1Mo  . 
2) Variável Contínua: quando os dados estão agrupados, na forma de uma distribuição de 
freqüências de uma variável contínua, a moda é o ponto do eixo das abscissas, correspondente à 
ordenada máxima da distribuição. O processo para cálculo da moda em dados agrupados é o 
geométrico, a partir do histograma de freqüências, conhecido como Método de Czuber. Este método 
é baseado na influencia que as classes adjacentes exercem sobre a moda, deslocando-se no sentido 
da classe de maior freqüência. Algebricamente obtém-se a moda da seguinte forma: 
1
inf
1 2
Mo MoMo L c
  
 
, 
onde 1 Mo antesMoa af f   ; 
 2 Mo depoisMoa af f   ; 
 infMo
L é o limite inferior da classe modal; 
 Moc é a amplitude da classe modal. 
 
 36 
Exemplo 3: Seja a Tabela 1.4, dos dados agrupados das alturas, calcule a moda. 
Temos que a classe modal é aquela classe que contém a maior freqüência, ou seja, a quarta classe é 
a modal. Logo a moda é dada por: 
 
 
Alturas (m) 
af 
1,473├1,547 2 
1,547├1,621 2 
1,621├1,695 7 
1,695├1,769 10 
1,769├1,843 5 
1,843├1,917 4 
TOTAL 30 
 1 10 7 3
Mo antesMoa af f      2 10 5 5
Mo depoisMoa af f      
1
inf
1 2
3
1,695 0,074 1,723
3 5Mo MoMo L c m

      
  
 
Propriedades da Moda: 
i. Somando-se ou subtraindo-se uma constante (k) a todos as observações, a moda também fica 
somada ou subtraída deste valor, ou seja, *
i ix x k  então *Mo Mo k  . 
Exemplo 4: Dados os valores observados igual a    1 2 3 4, , , 2,2,0,5,3x x x x x  de 2Mo  . Se 
somarmos uma constante ( 3k  ) tem-se a nova variável  * 5,5,3,8,6x  com moda 
* 5 2 3Mo Mo k     . 
ii. Multiplicando ou dividindo todas as observações por uma constante (k) a moda também fica 
multiplicada ou dividida por essa constante, ou seja, 
* * ou i
i i i
x
x x k x
k
   então 
* * ou 
Mo
Mo Mo k Mo
k
   . 
Exemplo 5: Dados os valores observados igual a    1 2 3 4, , , 2,2,0,5,3x x x x x  de 2Mo  . Se 
multiplicarmos por constante ( 3k  ) tem-se a nova variável  * 6,6,0,15,9x  com moda 
* 6 2 3Mo Mo k     . 
Características e Importância da Moda: 
i. Não é afetada por valores extremos, a não ser que estes constituam a classe modal; 
Classe Modal 
 
 37 
ii. É uma medida bastante utilizada em Estatística Econômica; 
Posição relativa da média, mediana e moda: 
Crespo (1999) cita que quando uma distribuição é simétrica, as três medidas coincidem. 
Porém, a assimetria as torna diferentes de modo que quanto maior a assimetria maior será essa 
diferença entre as três medidas. Assim, em uma distribuição em forma de sino, temos: 
a) X Md Mo  , no caso de curva simétrica; 
b) X Md Mo  , no caso de curva assimétrica positiva (assimétrica à direita); 
c) X Md Mo  , no caso de curva assimétrica negativa (assimétrica à esquerda); 
(a) (b) (c) 
Figura 7: Formas de distribuições em situações reais: (a) distribuição em forma de sino simétrica; (b) distribuição 
assimétrica à direita; e (c) distribuição assimétrica à esquerda. 
 
1.5.2 - MEDIDAS DE DISPERSÃO 
 
 A utilização de uma medida de posição para substituir um conjunto de dados é insuficiente 
para sintetizar a informação nele contida, como pode ser observado a seguir: 
 
 
 
10,10,10,10,10,10,10
1,8,10,10,11,12,18
1,2,10,10,10,13,24
A
B
C



 
 Calculando a média, mediana e moda desses três conjuntos tem-se: 
 x Md Mo 
A 10 10 10 
B 10 10 10 
C 10 10 10 
 
Assim, verifica-se que os três conjuntos (A,B,C) apresentam médias, medianas e modas 
iguais a 10 unidades, porém observando-os, percebe-se que eles são bem diferentes entre si, pois 
enquanto no conjunto A os dados são todos iguais, os demais apresentam uma certa variação, sendo 
que esta variação é maior no conjunto C. Deste modo, para sintetizarmos eficientemente a 
informação de um conjunto de dados temos que associar à medida de posição utilizada, uma medida 
 
 38 
de dispersão, que vai informar como estes dados se comportam em torno da medida de posição em 
questão. 
1.5.2.1 – AMPLITUDE TOTAL (A) 
 A amplitude total é a diferença entre o maior e o menor valor observado, 
A MVO mvo  
em que: 
MVO é o maior valor observado, e mvo é o menor valor observado. 
 Para os conjuntos A, B e C tem-se: 
10 10 0 
18 1 17 
24 1 23 
A
B
C
A unidades
A unidades
A unidades
  
  
  
 
 Nota-se, então, que a amplitude do conjunto C é bem maior que nos demais. A amplitude é 
uma medida fácil de ser calculada e é certamente a maneira mais natural e comumente utilizada 
para descrever a variabilidade de um conjunto de dados. Porém sua interpretação depende do 
número de observações, mas, no seu calculo não são consideradas todas as observações, pois só 
utiliza os valores extremos. 
 
1.5.2.2 – VARIÂNCIA E DESVIO PADRÃO 
1.5.2.2.1 – VARIÂNCIA 
Uma boa medida de dispersão deve basear-se em todos os dados, ser facilmente calculável e 
compreensível, além de prestar-se bem ao tratamento algébrico. Uma medida com todas estas 
características é obtida considerando-se os desvios de cada observação em relação a média, 
chamados erros: ï ie x x  . 
 Para obter um único número que represente a dispersão dos dados, pensou-se inicialmente 
em obter-se a média destes desvios, mas deve-se lembrar que a soma dos desvios de um conjunto de 
dados em relação a sua média é nula. Então, optou-se por utilizar a soma dos quadrados dos 
desvios, pois elevando-se cada desvio ao quadrado elimina-se o sinal negativo, que estava trazendo 
complicações, e dividindo-se a soma dos quadrados dos desvios pelo número de observações 
obtém-se a variância populacional que é uma medida quantitativa da dispersão de um conjunto de 
dados entorno da sua média, além do fato, de esta soma de quadrados de desvios ser mínima. 
 
2
2 1( )
N
i
i
x x
SQD
V x
N N
 

  

 
 Para os exemplos anteriores tem-se: 
 
 39 
       
     
     
2
2 2 2
2 21
2 2 2
2 2
2 2 2
2 2
10 10 10 10 ... 10 10
0 
7
1 10 8 10 ... 18 10
22 
7
1 10 2 10 ... 24 10
50 
7
N
i
i
A
B
C
x x
unidades
N
unidades
unidades





     
  
     
 
     
 

 
 Observação: Quando estiver trabalhando com amostras, a variância é dada pela soma dos 
quadrados dos desvios dividida por 1n  (número de observações menos um) que é denominado 
graus de liberdade. Assim, a variância amostral é dada por: 
 
2
2 1
1 1
n
i
i
x x
SQD
s
n n


 
 

 
 Fórmulas computacionais (método prático) para o cálculo da variância são dadas por: 
2
12 2
1
1
N
iN
i
i
i
x
x
N N
 

  
  
   
 
 
  

 e 
2
12 2
1
1
1
n
in
i
i
i
x
s x
n n


  
  
   
 
 
  

 
 Prova: 
 
 
2
2
2 21
1
2
2
1 1
2
12 1
2
1 1
2 2
1 12
1
1
2
1 1
1
 2
1
1
 2
1
1
 2
1
n
i n
i
i i
i
n n
i i
i i
nn
iin n
ii
i i
i i
n n
i in
i i
i
i
x x
s x x x x
n n
x x x nx
n
xx
x x n
n n n
x x
x
n n n


 

 
 


    
 
 
      
  
  
     
 
 
  
    
    
     


 


 

 
 

2
12
1
1
 .
1
n
in
i
i
i
x
x
n n


 



  
  
   
 
 
  


 
 Cálculo da variância para dados agrupados: 
1) Variável Discreta: 
 
 40 
2
12 2
1
1
1
k
i aik
i
i ai
i
X f
s X f
n n


  
  
   
 
 
  

 , 
onde iX é a classe i e aif é a freqüência absoluta na classe i. 
Exemplo 1 (FERREIRA, 2005): Na Tabela 1, abaixo, estão apresentados os dados referentes ao 
número de ovos danificados da inspeção feita em uma amostra de 30 embalagens de uma dúzia 
cada, de um carregamento para o mercado municipal de Lavras. Determine a variância. 
 
Tabela 1: Número de ovos danificados em uma inspeção feita em 30 embalagens, de uma dúzia 
cada, em um carregamento para o mercado municipal de Lavras proveniente de uma cidade 
distante. 
Número de ovos quebrados  iX fai
 
0 13 
1 9 
2 3 
3 3 
4 1 
5 1 
 30 
 
Para calcular a variância temos: 
 
 * * *
* * *
k
i ik
i
i i
i
X f
s X f
n n


  
               
      
  


2
2
12 2 2 2 2
1
0 13 1 9 5 11 1
0 13 1 9 5 1
1 30 1 30
 
   , , .s
 
     
  
2
22
331 1
89 89 36 3 18172 ovos danificados
29 30 29
 
 
 
 
 
 
2) Variável Contínua: 
 
 41 
2
12 2
1
1
1
k
i aik
i
i ai
i
PM f
s PM f
n n


  
  
   
 
 
  

 , 
onde iPM é o ponto médio da classe i e aif é a freqüência absoluta na classe i. 
Exemplo 2: Em uma fábrica de pneus automotivos a matéria prima para a fabricação consiste em 
materiais derivados do petróleo, materiais sintéticos e borracha. As características dos diversos tipos 
de pneus fabricados são determinadas pela qualidade do material empregado em sua fabricação, e, 
neste sentido diversos testes são aplicados a estes produtos para a medição e verificação de sua 
qualidade. Em uma sessão de testes foram realizadas 40 medições e o coeficiente de atrito medido 
foi dividido em quatro classes cujos resultados estão mostrados na Tabela 2, abaixo. Determine a 
variância. 
 
 
Tabela 2: Distribuição de freqüências do coeficiente de atrito medido. 
Classes de Coeficiente de Atrito Cinético 
if iX 
0,15 ├ 0,35 5 0,25 
0,35 ├ 0,55 10 0,45 
0,55 ├ 0,75 8 0,65 
0,75 ├ 0,95 17 0,85 
TOTAL 40 - 
 
k
i ik
i
i i
i
PM f
s PM f
n n


  
  
   
 
 
  


2
12 2
1
1
1
 
 
 
 
 
, * , *
, * , *
,
,
,
s
s
s
s
  
    
   
 
  
  
 

2
2 2 2
2
2
2
2
0 25 5 0 85 171
0 25 5 0 85 17
40 1 40
25 41
18
39 40
1
18 16 129
40
0 0480
 
Propriedades da variância: 
i. A variância de uma constante é nula. 
 
 42 
( ) 0, k=constanteV k  
ii. A variância de uma soma ou diferença entre variáveis é a soma das variâncias das variáveis se 
estas forem independentes. 
( ) ( ) ( ) se X e Y forem independentesV X Y V X V Y   
iii. Somando-se ou subtraindo-se uma constante (k) a todos dos dados a variância não se altera. 
* *( ) ( )x x k V x V x    
iv. Multiplicando-se todos os dados por uma constante (k), a variância fica multiplicada por k2. 
* * 2( ) ( )x x k V x k V x     
 
1.5.2.2.2 – DESVIO PADRÃO 
 Um inconveniente da variância é que ela é expressa em unidades ao quadrado, ou seja, caso 
esteja-se trabalhando com o peso corporal de indivíduos, tomados em kg, a variância destes pesos é 
expresso em kg2, o que causa algumas dificuldades de interpretação. No intuito de resolver este 
problema trabalha-se com o desvio padrão que é definido como a raiz quadrada positiva da 
variância, o qual é expresso na mesma unidade em que os dados foram coletados. 
Desvio Padrão Populacional: 
2
12 2
1
1
N
iN
i
i
i
X
X
N N
  

  
  
    
 
 
  

 . 
Desvio Padrão Amostral: 
2
12 2
1
1
1
n
in
i
i
i
X
s s X
n n


  
  
    
 
 
  

 . 
Para dados agrupados em classe o estimador do desvio padrão é: 
2
12
1
1
1
k
ai ik
i
ai i
i
f PM
s f PM
n n


  
  
   
 
 
  

 . 
O estimador acima pode ser usado substituindo iPM , ponto médio da classe i, por Xi, valor 
da categoria ou atributo da classe i, quando os dados são quantitativos discretos, isto é: 
2
12
1
1
1
k
i aik
i
i ai
i
X f
s X f
n n


  
  
   
 
 
  

 . 
 
 43 
A variância e o desvio padrão são medidas que só podem assumir valores não negativos 
(positivo e igual a zero) e quanto maior for, maior será a dispersão dos dados, ou seja, maior será a 
variabilidade dos dados. Em outras palavras o desvio padrão e a variância medem a dispersão dos 
dados em torno da média. 
Exemplo 3: Para ilustrar cálculos de desvio padrão utilizou-se os dados dos exemplos 1 e 2 feitos 
anteriormente. Tem-se que o desvio padrão dos coeficientes de atrito cinético do pneu automotivo e 
o desvio padrão de ovos danificados são respectivamente: 
, ,s s  2 0 0480 0 2190 e , ,s s  2 1 8172 1 3480 ovos danificados. 
 Propriedades do desvio padrão: 
i. Somando-se ou subtraindo-se uma constante (k) a todos dos dados o desvio padrão não se altera. 
* *( ) ( )x x k s x s x    
ii. Multiplicando-se todos os dados por uma constante (k), o desvio padrão fica multiplicado por k. 
* *( ) ( )x x k s x k s x     
1.5.2.2.3 - COEFICIENTE DE VARIAÇÃO 
 O desvio padrão e a variância são medidas da variabilidade absoluta dos dados. Essas 
medidas são dependentes da grandeza, escala ou unidade de medida empregada para mensurar os 
dados. Conjuntos de dados com diferentes unidades de medidas não podem ter suas dispersões 
comparadas pela variância ou pelo desvio padrão. Mesmo para uma única unidade, se os conjuntos 
possuem médias de diferentes magnitudes, suas variabilidades não podem ser comparadas por essas 
medidas de dispersão apresentadas anteriormente. Para esta situação utiliza-se o coeficiente de 
variação (CV), pois ele não depende da grandeza, da escala ou unidade de medida empregada para 
mensurar os dados, ou seja, não possui unidade de medida (medida adimensional). Portanto, fica 
evidente que se deve usar o CV quando se tem diferentes unidades de medida e/ou médias de 
diferentes magnitudes. 
O coeficiente de variação populacional é: 100%CV


 . 
O coeficiente de variação amostral é: 100%
S
CV
X
 . 
Exemplo 4: A média e o desvio padrão do tempo de vida das lâmpadas de marca A e B são 
respectivamente: ,AX 4 0 meses , A
S 0,8 meses , B
X 8,0 meses e B
S 1,2 meses . Qual das 
lâmpadas possui maior uniformidade de tempo de vida? 
Se, ao inspecionar as estatísticas, apresentadas você fosse induzido a responder que a 
lâmpada (A) seria a que possui maior uniformidade e que a razão seria o menor desvio padrão 
apresentado por ela (0,8 meses), você teria cometido um erro. O fundamento usado aqui para 
comparar a variabilidade das lâmpadas não foi correto, uma vez que o desvio padrão é uma medida 
 
 44 
de variabilidade absoluta. Embora as unidades não sejam diferentes, as médias das amostras o são. 
O procedimento adequado seria o de estimar o CV para ambas as lâmpadas e compará-los. Logo o 
coeficientes de variação são : 
,
%
,
A
A
A
S
CV
X
  
0 8
x100 x100 20
4 0
 e 
,
%
,
B
B
B
S
CV
X
  
1 2
x100 x100 15
8 0
. 
 É fácil verificar que a lâmpada (B) é a mais uniforme, pois possui um menor CV que a 
lâmpada (A). 
 
1.5.2.2.4 - ERRO PADRÃO DA MÉDIA 
É uma medida da dispersão das médias amostrais em torno da media da população, ou seja, 
é uma medida que fornece uma idéia da precisão com que a média foi estimada. 
O erro padrão da média é: 
X
s
s
n
 , em que s é o desvio padrão amostral e n é o tamanho da 
amostra. 
 
2 - PROBABILIDADES 
 2.1 – INTRODUÇÃO 
 As origens da probabilidade remontam ao século XVI e suas aplicações se limitavam a jogos 
de azar. Hoje, a utilização das probabilidades ultrapassou o âmbito dos jogos. O governo e as 
empresas incorporaram a teoria das probabilidades em seus processos diários de deliberações. 
 O estudo das probabilidades indica que existe um elemento de acaso, ou de incerteza, quanto 
à ocorrência ou não de um evento futuro. Assim, em muitos casos é impossível afirmar por 
antecipação o que irá ocorrer, mas através de dados históricos e da experiência, é possível dizer o 
quão provável é a ocorrência de um determinado evento. Exemplos dessa situação nos negócios e 
no governo: a previsão da procura de um novo produto, o cálculo dos custos de produção, a compra 
de apólices de seguro, o preparo de um orçamento, a avaliação do impacto da redução de impostos 
sobre a inflação. Tudo isso contém algum elemento de acaso. 
 As probabilidades são úteis no desenvolvimento de estratégias. Por exemplo: se as chances 
de lucro são boas, os investidores sentem-se mais inclinados a aplicar seu dinheiro; uma empresa 
pode negociar seriamente com um sindicato, quando há forte ameaça de greve; ou pode investir em 
novo equipamento, se há boa chance de recuperar o dinheiro. 
 As probabilidades são utilizadas para exprimir a chance deocorrência de determinado 
evento. 
 
 
 
 45 
2.2 - PROBABILIDADES E ESPAÇO AMOSTRAL 
Antes de entrarmos no contexto de probabilidade é necessário entendermos alguns conceitos 
como: experimento, espaço amostral e eventos. 
Denominamos de experimento aleatório a todo fenômeno ou ação que geralmente pode ser 
repetido indefinidamente sob mesmas condições e cujo resultado é aleatório. 
Exemplo: Quando lançamos uma moeda, uma única vez, estamos fazendo um experimento cujo 
resultado será cara ou coroa. 
Denominamos de espaço amostral (Ω) ao conjunto de todos os possíveis resultados de um 
determinado experimento. 
Exemplos: No lançamento de um dado, o espaço amostral é: Ω = {1, 2, 3, 4, 5, 6}. No lançamento 
de uma moeda, o espaço amostral é: Ω = {cara, coroa}. Na inspeção de uma fábrica, contando o 
número de acidentes: Ω = {0, 1, 2, 3, ...}. 
 Denominamos de evento a todo subconjunto do espaço amostral. 
Exemplos: Obter um número par na face superior do dado: A = {2, 4, 6}. Obter um número menor 
que 7 no dado: B = {1, 2, 3, 4, 5, 6} = Ω (evento certo). Obter um número negativo no dado: 
C = { }= Φ (evento impossível) 
Outras definições importantes: 
i) Evento certo → Ω (caracterizado pelo espaço amostral) 
ii) Evento impossível→ Φ. 
iii) Processo aleatório: Qualquer fenômeno que gere um resultado incerto ou casual. 
Exemplo: lançamento de moeda, lançamento de dado, sexo do primeiro filho de um casal, peso de 
pessoas, etc. 
Características 
1) Pode ser repetido indefinidamente sob as mesmas condições. 
2) Não se conhece a priori (inicialmente) o resultado, mas todos os resultados possíveis podem 
ser descritos. 
Dentro deste contexto, Probabilidade pode ser definida como o número de eventos (pontos ou 
elementos) favoráveis divididos pelo número de elementos do espaço amostral: 
X
P
n
 . 
Em que X é o número de eventos favoráveis, e n número de eventos do espaço amostral. 
 
 
 
 
 
 46 
OPERAÇÕES 
A seguir apresentaremos o Diagrama de Venn para ilustrarmos algumas propriedades: 
 
Figura1: Diagrama de Venn. 
1) União ( ): A B B A   
 
2) Intersecção ( ): A B B A   
 
3) Complementar: 
CA A  (lê-se: complementar de A ou não A). 
 
Observação Importante: Se A e B são conjuntos mutuamente exclusivos (disjuntos) então, 
A B   . 
 
 
 
 
 
 47 
Exercícios 
1) Um casal pretende ter 3 filhos. 
a) Determine o espaço amostral referente ao sexo dos filhos. 
Ω = {(M,M,M); (M,M,F); (M,F,M); (F,M,M); (F,F,M); (F,M,F); (M,F,F); (F,F,F)} 
b) Qual o número de elementos (eventos) do espaço amostral? 
O espaço amostral possui oito elementos (eventos). 
c) Qual a probabilidade do casal ter exatamente 3 filhas? 
Evento: X = número de filhas. 
 
1
3 0,125
8
P X    
d) Qual a probabilidade do casal ter exatamente dois filhos? 
Evento: Y = número de filhos. 
 
3
2 0,375
8
P Y    
e) Qual a probabilidade do casal ter apenas um filho? 
Evento: Y = número de filhos. 
 
3
1 0,375
8
P Y    
2) Jogando-se dois dados, calcular a probabilidade da soma dos pontos ser superior a nove. 
Evento: X = soma dos pontos 
 
11 21 31 41 51 61
12 22 32 42 52 62
13 23 33 43 53 63 6 1
9 0,1667
14 24 34 44 54 36 6
15 25 35 45
16 2
64
55 65
46 56 666 36
P X
 
 
 
 
       
 
 
  
 
 
 
Dessa forma podemos sintetizar a definição de Probabilidade de ocorrer um evento A 
 ( ) P A como a razão entre o número de possíveis resultados favoráveis ao evento A (n(A)) e todos 
os possíveis resultados do experimento (n(Ω)), ou seja, número de elementos do espaço amostral. 
( )
( )
( )
n A
P A
n


. 
 
 
 
 
 
 48 
2.3 - AXIOMAS DE PROBABILIDADE 
Axioma 1: A probabilidade de um certo evento ocorrer corresponde a um número não negativo. 
  0P A  . 
Axioma 2: A probabilidade de ocorrer todo o espaço amostral é igual a um. 
  1P   . 
2.4 - TEOREMAS 
Teorema 1: A probabilidade de um evento impossível ocorrer é   0P   . 
Demonstração: 
Seja Ω o espaço amostral. Sabe-se que    , então aplicando a função probabilidade de 
ambos os lados têm-se: 
     
 
 
1 1
0
P P P
P
P
  
    
  
 
 
Teorema 2 (Probabilidade do complemento): Seja Ω o espaço amostral. Então, a probabilidade de 
um evento A não ocorrer é: 
   1CP A P A  . 
Demonstração: 
Sabe-se que CA A  , então aplicando a função probabilidade de ambos os lados têm-se: 
     
   1
C
C
C
A A
P A P P A
P A P A
 
  
 
 
 
Teorema 3 (Teorema da soma): Se A e B são dois eventos do espaço amostral Ω a probabilidade 
que ocorra A ou B é: 
       P A B P A P B P A B     . 
 
Corolário: Se dois eventos A e B são mutuamente exclusivos (disjuntos), isto é, A B   , então: 
     P A B P A P B   
Baseado no Axioma 1 e no Corolário acima segue-se que  0 1P A  . 
 
 
 
 49 
Exercícios 
1) Um lote é formado por 11 peças boas, 3 com defeitos leves, e 2 com defeitos graves. Considere 
como evento A defeito leve, evento B defeito grave, e evento C nenhum defeito. 
Uma peça é retirada ao acaso desse lote. Qual a probabilidade que essa peça: 
a) seja boa? 
b) tenha defeito leve? 
c) tenha defeito grave? 
d) seja defeituosa? 
Duas peças são retiradas ao acaso com reposição desse lote. Qual a probabilidade de: 
e) ambas serem boas? 
f) pelo menos uma boa? 
Duas peças são retiradas ao acaso sem reposição desse lote. Qual a probabilidade de: 
g) ambas serem boas? 
2) Se um dado é lançado duas vezes. Determine qual a probabilidade de ocorrer maior do que 3 no 
primeiro lance e menor do que 5 no segundo lance. 
3) Em uma bolsa tem-se duas moedas de 1 centavo, três de 10 centavos e quatro de 1 real. Duas 
moedas são retiradas aleatoriamente da bolsa, determine as seguintes possibilidades (sem 
reposição). 
a) ambas moedas serem de 1 centavo. 
b) uma moeda de 1 centavo e a outra moeda de 1 real. 
c) ambas do mesmo valor. 
d) pelo menos uma de 10 centavos. 
e) Nenhuma moeda de 10 centavos. 
 
2.5 - PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA 
2.5.1 - PROBABILIDADE CONDICIONAL 
A probabilidade condicional do evento A em relação ao evento B é denotada por: 
 
 
 
 | , 0
P A B
P A B P B
P B

  . 
A probabilidade condicional do evento B em relação ao evento A é denotada por: 
 
 
 
 | , 0
P A B
P B A P A
P A

  . 
 
 
 
 50 
Exemplo 1: Qual a probabilidade no lançamento de um dado, a face superior do dado ser maior ou 
igual a 4 sabendo que ela é par? 
No lançamento de um dado, o espaço amostral é  1,2,3,4,5,6 .  Vamos definir o evento A 
como sendo face superior par, e o evento B face superior maior ou igual a 4. Então, 
   2,4,6 e 4,5,6 .A B  
 
 
 
 
 
| ?
| , 0
P B A
P A B
P B A P A
P A


 
 
 
Agora, vamos determinar    ( ), e P A P B P A B : 
 
 
 
 
( ) 3 1( )
( ) 6 2
1 3( ) 3 1 1 2 2.( ) |
( ) 6 2 1 2 3 1 3
( ) 2 1
( ) 6 3
n A
P A
n
P A Bn B
P B P B A
n P A
n A B
P A B
n

  



       

 
     
. 
Portanto, a probabilidade de que a face superior do dado seja maior ou igual a 4 sabendo que ela é 
par é de 2/3. 
 
Exemplo 2: Em uma urna tem-se 40 bolas, sendo10 pretas e 30 vermelhas (20 com manchas 
brancas e 10 sem manchas). Qual a probabilidade de se ter uma bola vermelha com mancha branca, 
sabendo que o evento bola vermelha já ocorreu. 
Vamos definir o evento VB como sendo bola vermelha com mancha branca, e o evento V bola 
vermelha. 
 
 
 51 
 
 
 
 
 
| ?
| , 0
B
B
B
P V V
P V V
P V V P V
P V


 
 
Agora, vamos determinar    ( ), e B BP V P V P V V : 
 
 
 
 
 
 
 
30 3
( ) 40 4 1 2 1 4 2.|
3 4 2 3 3
20 1
( ) 40 2
B
B
B
B
n V
P V
n P V V
P V V
P Vn V V
P V V
n

    
    
    
 
. 
Portanto, aprobabilidade de se ter uma bola vermelha com mancha branca, dado que o evento bola 
vermelha já ocorreu é de 2/3. 
 
2.5.2 - INDEPENDÊNCIA DE EVENTOS 
Dois eventos A e B são independentes se      P A B P A P B  . 
Exemplo 1: Considere o lançamento de uma moeda (não viciada) três vezes. Cujo evento A 
corresponde ao primeiro lançamento da moeda sair cara e o evento B corresponde ao segundo 
lançamento da moeda sair cara. Esses dois eventos são independentes? 
O espaço amostral é:  , , , , , , , .ccc ccr crc rcc crr rcr rrc rrr  Os eventos favoráveis aos eventos A e 
B são    , , , e , , , .A ccc ccr crc crr B ccc ccr rcc rcr  Conseqüente,  ,A B ccc ccr  . 
Agora, vamos verificar se este dois eventos são independentes. 
   
   
( ) 4 1( )
( ) 8 2 ( )1 1 1 2 1. e ( )
2 2 4 ( ) 8 4( ) 4 1( )
( ) 8 2
1( )
4
n A
P A
n n A B
P A P B P A B
nn B
P B
n
P A B P A P B

  
  
       
  
 
   
 
Portanto, os eventos A e B são independentes. 
Exemplo 2: Distribuição de alunos matriculados em um determinado instituto de Matemática. Com 
base na Tabela abaixo, determine: 
Curso 
Sexo 
Total 
Masculino Feminino 
Mat. Pura 70 40 110 
Mat. Aplicada 15 15 30 
Estatística 10 20 30 
Computação 20 10 30 
Total 115 85 200 
 
 52 
a) Probabilidade do sexo masculino. 
b) Probabilidade do sexo feminino. 
c) Probabilidade matemática pura. 
d) Probabilidade matemática aplicada. 
e) Probabilidade computação 
f) Probabilidade matemática pura e sexo feminino. 
g) Probabilidade matemática pura e sexo masculino. 
h) Probabilidade matemática pura dado que ele é do sexo feminino. 
i) Probabilidade matemática pura dado que ele é do sexo masculino. 
j) Verifique se sexo feminino e matemática pura são eventos independentes. 
k) Verifique se sexo feminino e matemática aplicada são eventos independentes. 
l) Verifique se sexo feminino e estatística são eventos independentes. 
m) Verifique se sexo feminino e computação são eventos independentes. 
n) Verifique se sexo masculino e matemática pura são eventos independentes. 
o) Verifique se sexo masculino e matemática aplicada são eventos independentes. 
p) Verifique se sexo masculino e estatística são eventos independentes. 
q) Verifique se sexo masculino e computação são eventos independentes. 
 
2.5.3 - TEOREMA DA PROBABILIDADE TOTAL 
Suponha que um espaço amostral Ω de um experimento seja dividido em três eventos R1, R2 e 
R3, mutuamente exclusivos e considere um evento B qualquer, como mostra a figura abaixo: 
 
 
 
 
 
 
Então )()()()()()()( 332211 RPRBPRPRBPRPRBPBP  
 O Teorema da Probabilidade Total pode ser generalizado para n eventos: 
)()()()()()()( 2211 nn RPRBPRPRBPRPRBPBP   
 
 
 
 
 
R1 
R2 
R3 B 
Ω 
 
 53 
Exemplos: 
1) Um piloto de fórmula 1 tem 50% de probabilidade de vencer determinada corrida, quando esta 
se realiza sob chuva. Caso não chova durante a corrida, sua probabilidade de vitória é de 25%. Se o 
serviço de meteorologia estimar em 30% a probabilidade de que chova durante a corrida, qual é a 
probabilidade deste piloto vencer esta corrida? 
 
 
 
 
 
 
 
( ) ( ) ( ) ( ) ( ) 0,5 0,3 0,25 0,7 0,325 32,5%P V P V CH P CH P V NCH P NCH          
 
2.6 - TEOREMA DE BAYES 
É um importante teorema que expressa o conceito de uma probabilidade condicional em função de 
outras probabilidades condicionais e marginais. 
Teorema de Bayes: Se B1, B2,..., Bk são conjuntos mutuamente exclusivos cuja união resulta em  , 
então: 
 
   
   
1
|
|
|
i i
i k
i i
i
P B P A B
P B A
P B P A B



. 
Exemplo: Considere cinco urnas cada uma com seis bolas. Duas dessas urnas (tipo C1), tem três 
bolas brancas, duas outras urnas (tipo C2), tem duas bolas brancas e a última (tipo C3) tem seis bolas 
brancas. Escolhe-se uma urna ao acaso e retira-se uma bola desta. Qual a probabilidade de que a 
urna escolhida seja do tipo C3, sabendo-se que a bola retirada á branca? 
Resolução: 
O evento bola branca será denotado por B, e o que se quer determinar é:  3 | ?P C B  
Sabe-se que existe 5 urnas (2 do tipo C1, 2 do tipo C2 e 1 do tipo C3). 
Pelo teorema de bayes temos: 
Ω 
CH NCH 
V 
25% 
50% 
30% 70% 
 
 54 
 
   
   
 
   
   
 
   
           
1
3 3
3 3
1
3 3
3
1 1 2 2 3 3
. |
|
. |
. |
|
. |
. |
| ?
. | . | . |
i i
i k
i i
i
i i
i
P C P B C
P C B
P C P B C
P C P B C
P C B
P C P B C
P C P B C
P C B
P C P B C P C P B C P C P B C




 
 


 
A probabilidade de selecionar aleatoriamente a urna do tipo C1 é: 
 
 
 
1 1
1
º 2
º 5u
n C n de urnas C
P C
n n total deurnas
  

. 
Analogamente, a probabilidade de selecionar aleatoriamente a urna do tipo C2 e a urna do tipo C3 é: 
 
 
 
 
 
 
2 3 32
2 3
º º 2 1
 e 
º 5 º 5u u
n C n C n de urnas Cn de urnas C
P C P C
n n total deurnas n n total deurnas
     
 
. 
Agora, determinaremos as seguintes probabilidades condicionais: 
 1 1
6 1
| Prob. de sair bola branca dado que a urna é do tipo C
12 2
P B C    
 2 2
4 1
| Prob. de sair bola branca dado que a urna é do tipo C
12 3
P B C    
 3 3
6
| Prob. de sair bola branca dado que a urna é do tipo C 1
6
P B C    . 
Então: 
 
   
           
3 3
3
1 1 2 2 3 3
. |
|
. | . | . |
P C P B C
P C B
P C P B C P C P B C P C P B C

 
 
 3
1
.1
5|
2
P C B 
1
.
5 2
1 1 1
15 5 5
2 2 6 2 82 1 1 5
. .1
5 15 15 15 155 3 5
   
  
15
.
3
3
0,375.
8 8
  
Exercício 
Uma empresa produz circuitos integrados em três fábricas. A fábrica 1 produz 40% dos circuitos 
enquanto que as fábricas 2 e 3, produzem 30% cada. A probabilidade de que um circuito produzido 
por estas fábricas não funcione é de 0,01; 0,04 e 0,03 respectivamente. Qual a probabilidade de se 
pegar um circuito ao acaso da produção total da companhia, sendo ele da fábrica 1 e sabendo que 
ele não funciona.? 
Solução: 
 
 55 
 
   
           
 
1 1
1
1 1 2 2 3 3
1
. |
|
. | . | . |
0,40*0,01
| 0,16
0,40*0,01 0,30*0,04 0,30*0,03
P F P def F
P F def
P F P def F P F P def F P F P def F
P F def

 
 
 
 
 
 
3 - VARIÁVEL ALEATÓRIA UNIDIMENSIONAL 
Para entendermos este conceito de variável aleatória (v.a.), imagine um lançamento de um 
dado. Tente dizer qual será o número resultante. É claro que, antes do lançamento, não podemos 
dizer com exatidão qual é o número que ocorrerá, pois o resultado depende do fator sorte e, por 
isso, é uma variável aleatória. 
Variável Aleatória (v.a.) é uma variável cujos valores são determinados pelos resultados de 
experiências aleatórias, isto é, uma função que associa valores reais aos eventos de um espaço 
amostral. 
Uma v.a. pode ser entendida como uma variável quantitativa, ou seja, uma v.a. pode ser 
classificada como discreta ou contínua. As variáveis aleatórias dizem-se discretas, quando 
assumem um número determinado de valores contáveis (valores oriundos de um processo de 
contagem), ou contínuas, quando assumem qualquer valor num dado intervalo (valores oriundos de 
um processo de mensuração). 
 
3.1 - VARIÁVEL ALEATÓRIA DISCRETA 
 O conceito de v.a. discreta será introduzido por meio de exemplos. 
Exemplo 1: Se um experimento consiste no lançamento de dois dados, a função: X = “soma das 
faces dos dois dados”, define uma variável aleatória discreta, que pode assumir onze valores 
possíveis: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 ou 12. 
Exemplo 2: Se um experimento consiste em verificar o número de circuitos defeituosos num 
sistema formado por quatro circuitos, a função: Y = “número de circuitos defeituosos”, define uma 
variável aleatória discreta, que pode assumir onze valores possíveis: 0, 1, 2, 3 ou 4. 
Com base nos exemplos acima fica claro que a variável aleatória discreta está vinculada

Continue navegando

Outros materiais