Buscar

Apostila Introdução à Probabilidade e Estatística

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 141 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 141 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 141 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

UENF 
Universidade Estadual do Norte Fluminense 
Centro de Ciência e Tecnologia 
Laboratório de Engenharia de Produção 
 
 
 
 
 
 
 
 
 
 
 
INTRODUÇÃO À PROBABILIDADE 
E 
ESTATÍSTICA 
 
 
 
 
 
 
 
 
Notas de Aula 
 
 
 
 
 
 
 
 
Prof. André Policani 
 
 
 
 
2004
 
 
 
 
 
SUMÁRIO 
 
 
 
 
CAPÍTULO 1: A NATUREZA DA ESTATÍSTICA 
1.1 Introdução .............................................................................................................................. 1 
1.2 Método Estatístico ................................................................................................................. 1 
1.3 Conceitos Básicos da Estatística .......................................................................................... 2 
1.4 Amostragem .......................................................................................................................... 3 
1.5 Séries Estatísticas ................................................................................................................. 4 
1.6 Interpretação de Tabelas ....................................................................................................... 6 
1.7 Gráficos Estatísticos .............................................................................................................. 6 
1.8 Arredondamento de Dados ................................................................................................... 9 
 
CAPÍTULO 2: DISTRIBUIÇÃO DE FREQUÊNCIA 
2.1 Tabela Primitiva ou Dados Brutos ....................................................................................... 10 
2.2 Rol ....................................................................................................................................... 10 
2.3 Distribuição de Freqüência .................................................................................................. 10 
2.4 Elementos de Uma Distribuição de Freqüência .................................................................. 10 
2.5 Distribuição de Frequência sem Intervalos de Classe ........................................................ 13 
2.6 Representação Gráfica de Uma Distribuição ...................................................................... 13 
2.7 A Curva de Frequência (Curva Polida) ................................................................................ 15 
2.7.1 O Formato das Curvas de Frequência ............................................................................. 16 
 
CAPÍTULO 3: MEDIDAS DE TENDÊNCIA CENTRAL 
3.1 Introdução ............................................................................................................................ 18 
3.2 Média Aritmética .................................................................................................................. 18 
3.3 Desvio em Relação À Média ............................................................................................... 20 
3.4 Propriedades da Média ....................................................................................................... 20 
3.5 Outras Médias ..................................................................................................................... 21 
3.6 Mediana (Md) ...................................................................................................................... 22 
3.7 Moda .................................................................................................................................... 25 
3.8 Considerações Sobre o Emprego da Média Aritmética, Mediana e Moda .......................... 26 
3.9 Posição Relativa da Média, Mediana e Moda ..................................................................... 27 
3.10 Separatrizes ...................................................................................................................... 27 
 
CAPÍTULO 4: MEDIDAS DE DISPERSÃO OU VARIABILIDADE 
4.1 Introdução ............................................................................................................................ 29 
4.2 Amplitude Total .................................................................................................................... 29 
4.3 Desvio Médio ....................................................................................................................... 30 
4.4 Desvio Padrão (S) ............................................................................................................... 31 
4.5 Variância (S2) ...................................................................................................................... 32 
4.6 Coeficiente de Variação (Cv) ............................................................................................... 32 
4.7 Exemplos ............................................................................................................................. 33 
 
CAPÍTULO 5: MEDIDAS DE ASSIMETRIA E MEDIDAS DE CURTOSE 
5.1 Assimetria ........................................................................................................................... 36 
5.2 Curtose ............................................................................................................................... 37 
5.3 Exemplos ............................................................................................................................. 38 
 
CAPÍTULO 6: INTRODUÇÃO À PROBABILIDADE 
6.1 Introdução ............................................................................................................................ 39 
6.2 Conceitos Iniciais ................................................................................................................. 39 
6.3 Probabilidades ..................................................................................................................... 41 
6.4 Eventos Independentes ....................................................................................................... 43 
6.5 Análise Combinatória .......................................................................................................... 43 
6.6 Probabilidade Condicional ................................................................................................... 46 
6.7 Partição de Um Espaço Amostral ........................................................................................ 47 
6.8 Teorema de Bayes .............................................................................................................. 48 
6.9 Distribuição de Probabilidade de Uma Variável Aleatória Discreta ..................................... 48 
6.10 Modelos Probabilísticos para Variáveis Aleatórias Discretas ............................................ 53 
6.11 Variáveis Aleatórias Multidimensionais ............................................................................. 61 
 
 
CAPÍTULO 7: DISTRIBUIÇÕES DE PROBABILIDADE DE VARIÁVEIS ALEATÓRIAS CONTÍNUAS 
7.1 Introdução ............................................................................................................................ 68 
7.2 Função de Distribuição de Probabilidade ............................................................................ 69 
7.3 Valor Esperado e a Variância de Uma V.A. Contínua ......................................................... 70 
7.4 Modelos Probabilísticos para V.A. Contínuas ..................................................................... 71 
7.5 Distribuição Conjunta de Variáveis Aleatórias Contínuas ................................................... 83 
7.6 Funções Densidade Marginais de Variáveis Aleatórias Contínuas ..................................... 83 
7.7 Distribuições Condicionais Contínuas ................................................................................. 84 
7.8 Exercícios ............................................................................................................................84 
 
CAPÍTULO 8: INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA 
8.1 Introdução ........................................................................................................................... 86 
8.2 Amostragem ........................................................................................................................ 87 
8.3 Amostragem Casual Simples .............................................................................................. 88 
8.4 Estatísticas e Parâmetros .................................................................................................... 89 
8.5 Distribuições Amostrais ....................................................................................................... 90 
8.6 Distribuição Amostral da Média ........................................................................................... 91 
8.7 Teorema do Limite Central .................................................................................................. 91 
8.8 Distribuição Amostral da Proporção .................................................................................... 94 
 
CAPÍTULO 9: ESTIMAÇÃO DE PARÂMETROS 
9.1 Introdução ............................................................................................................................ 96 
9.2 Estimação Pontual ............................................................................................................... 96 
9.3 Processos para Obter Estimadores ..................................................................................... 97 
9.4 Estimação por Intervalos de Confiança ..............................................................................100 
 
 
CAPÍTULO 10: TESTES DE HIPÓTESES 
10.1 Introdução .........................................................................................................................106 
10.2 Objetivo do Teste de Hipótese .........................................................................................106 
10.3 Teste da Hipótese Nula ....................................................................................................107 
10.4 Nível de Significância do Teste ........................................................................................107 
10.5 Etapas para Construção de um Teste de Hipóteses ....................................................... 107 
10.6 Testes de Hipótese Sobre a Média ................................................................................. 108 
10.7 Testes de Hipótese para Proporções .............................................................................. 116 
10.8 Teste de Hipótese para a Variância ................................................................................ 117 
 
 
 
REFERÊNCIAS BIBLIOGRÁFICAS 
EXERCÍCIOS RESOLVIDOS 
EXERCÍCIOS PROPOSTOS 
 
 
 
 
 
 
CAPÍTULO 1 
A NATUREZA DA ESTATÍSTICA 
 
 
1.1 INTRODUÇÃO 
 
ESTATÍSTICA: é o ramo da matemática que trata da coleta, organização, resumo, 
apresentação e análise dos dados, assim como obtenção de conclusões que auxiliam nos 
processos de tomada da decisão. 
 
A coleta, a organização ,a descrição dos dados, o cálculo e a interpretação de coeficientes 
pertencem à ESTATÍSTICA DESCRITIVA, enquanto a análise e a interpretação dos dados, 
associado a uma margem de incerteza, ficam a cargo da ESTATÍSTICA INDUTIVA ou 
INFERENCIAL, também chamada como a medida da incerteza ou métodos que se 
fundamentam na teoria da probabilidade. 
 
Assim, a análise e a interpretação dos dados tornam possível o diagnóstico de uma empresa, o 
conhecimento de seus problemas (condições de funcionamento, produtividade, etc.) a 
formulação de soluções apropriadas e um planejamento objetivo de ação. 
 
 
1.2 MÉTODO ESTATÍSTICO 
 
Muitas dos conhecimentos atuais foram obtidos por acaso, por necessidades práticas, sem a 
utilização de um método de pesquisa. Atualmente, quase todo acréscimo de conhecimento 
resulta de observações e de estudo. Neste sentido, busca-se assegurar que todas as 
conclusões obtidas sejam cientificamente comprovadas. 
 
• Método: é um conjunto de meios (procedimentos) devidamente organizados para se atingir 
um determinado objetivo. Dentre os métodos utilizados para fins científicos destacam-se o 
método experimental e o método estatístico. 
 
• Método Experimental: consiste em manter constante todas as causas, exceto uma, que 
deverá ter variações, permitindo assim determinar os efeitos destas variações, caso 
existam. Ex: Estudos da Química, Física, etc. 
 
• Método Estatístico: diante da impossibilidade de manter as causas constantes (nas 
ciências sociais), admitem todas essas causas presentes variando-as, registrando essas 
variações e procurando determinar, no resultado final, que influências cabem a cada uma 
delas. Ex: Quais as causas que definem o preço de uma mercadoria quando a sua oferta 
diminui? 
Ou seja: seria impossível, no momento da pesquisa, manter constantes a uniformidade dos 
salários, o gosto dos consumidores, nível geral de preços de outros produtos, etc. 
 
 
.2.1 FASES DO MÉTODO ESTATÍSTICO 1
 
1º - DEFINIÇÃO DO PROBLEMA : nesta etapa deve-se definir exatamente o que se pretende 
esquisar/analisar e qual o objetivo da pesquisa. p
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
2
2º - PLANEJAMENTO : Como obter informações ? Que dados deverão ser obtidos ? Quais as 
etapas da pesquisa (cronograma de atividades)? Quais os custos envolvidos ?, etc. 
 
3º - COLETA DE DADOS : esta etapa consiste no registro sistemático de dados, com um 
objetivo determinado. Deve ser precedida de um planejamento experimental adequado e de 
uma técnica de amostragem conveniente. Os dados podem ser classificados em 
 
• Dados primários: quando são publicados pela própria pessoa ou organização que os haja 
recolhido. Ex: tabelas do censo demográfico do IBGE. 
 
• Dados secundários: quando são publicados por outra organização. Ex: quando 
determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE. 
 
OBS: as fontes primárias são mais confiáveis. O uso da fonte secundária traz o grande risco de 
rros de transcrição. e
 
• Coleta Direta: quando é obtida diretamente da fonte. Ex: Empresa que realiza uma 
pesquisa para saber a preferência dos consumidores pela sua marca. 
A coleta direta pode ser: contínua (registros de nascimento, óbitos, casamentos, etc.), 
periódica (recenseamento demográfico, censo industrial) e ocasional (registro de casos de 
dengue). 
 
Coleta Indireta: É feita por deduções a partir dos elementos c• onseguidos pela coleta 
direta, por analogia, por avaliação, indícios ou proporcionalização. 
dos coletados e 
 disposição (distribuição e agrupamento) mediante critérios de classificação. 
dos 
onstitui uma apresentação geométrica permitindo uma visão rápida e clara do fenômeno. 
. Na estatística indutiva 
 interpretação dos dados se fundamentam na teoria da probabilidade. 
.3 CONCEITOS BÁSICOS DA ESTATÍSTICA 
r, cujo estudo 
eja possível da aplicação do método estatístico. São divididos em três grupos: 
• 
 de 
criminalidade no Rio de Janeiro, o preço médio do litro de gasolina em São Paulo, etc. 
ssa. Ex: cada 
o se 
 
4º - APURAÇÃO DOS DADOS : Representa a soma e o processamento dos da
a
 
5º - APRESENTAÇÃO DOS DADOS : Há duas formas usuais de apresentação, que não se 
excluem mutuamente. A apresentação em tabelas ou quadros, ou seja é uma apresentação 
numérica dos dados em linhas e colunas distribuídas de modo ordenado, segundo regras 
práticas fixadas pelo Conselho Nacional de Estatística. A apresentação gráfica dos da
c
 
6º - ANÁLISE E INTERPRETAÇÃO DOS DADOS : A última fase do trabalho estatístico é a 
mais importante e delicada. Está ligada essencialmente ao cálculo de medidas e coeficientes, 
cuja finalidadeprincipal é descrever o fenômeno (estatística descritiva)
a
 
 
1
 
1.3.1 FENÔMENO ESTATÍSTICO: é qualquer evento que se pretenda analisa
s
 
Fenômenos de massa ou coletivo: são aqueles que não podem ser definidos por uma 
única observação. A estatística dedica-se ao estudo desses fenômenos. Ex: A taxa
 
Fenômenos individuais: são aqueles que irão compor os fenômenos de ma• 
crime no Grande Rio, o preço da gasolina em cada posto de São Paulo, etc. 
 
• Fenômenos de multidão: quando as características observadas para a massa nã
verificam para o fenômeno individual. 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
3
1.3.2 DADO ESTATÍSTICO: é uma característica observada ou medida de alguma forma. 
 
1.3.3 VARIÁVEL: é, convencionalmente, o conjunto de resultados possíveis de um fenômeno. 
 
uando os dados são de caráter nitidamente quantitativo, e o conjunto dos 
 
- 
 de contagens finitas. 
- 
portadores de, pelo menos, uma 
existem na população e que servem para 
essíveis 
opulação muito grande ou infinita, alto custo para obtenção e tratamento de todos os dados 
empo para coletar e analisar todas os dados da população, etc.). 
, a amostra deve possuir as 
 
• 
 
• 
(es
e tais estratos. 
As variáveis podem ser: 
 
• Qualitativas: Quando seu valores são expressos por atributos: sexo, cor da pele, etc. 
Quantitativas: Q• 
resultados possui uma estrutura numérica, trata-se portanto da estatística de variável e se 
subdividem em : 
Variável discreta ou descontínua: Seus valores são expressos geralmente através de 
úmeros inteiros não negativos. Resulta normalmenten
Ex: Nº de alunos candidatos aprovados no vestibular 2002, por curso. Direito= 80, 
Administração = 50; Medicina= 100, Engenharia= 35. 
 
Variável contínua: Resulta normalmente de uma mensuração, e a escala numérica de 
seus possíveis valores corresponde ao conjunto R dos números Reais, ou seja, podem 
assumir, teoricamente, qualquer valor entre dois limites. 
Ex.: o tempo necessário para percorrer a ponte Rio-Niterói. Ao cronometrar o percurso, 
o tempo necessário poderá ser qualquer valor dentro da escala de tempo utilizada. 
 
.3.4 POPULAÇÃO: é o conjunto total de elementos 1
característica comum. A população pode ser finita (quando é possível enumerar os elementos) 
e infinita (quando não é possível enumerar os elementos). 
 
1.3.5 AMOSTRA: é uma parcela representativa e finita da população que é examinada com o 
propósito de tirarmos conclusões sobre a essa população. 
 
.3.5 PARÂMETROS: São valores singulares que 1
caracterizá-la. Para definirmos um parâmetro devemos examinar toda a população. Exemplo 
de parâmetros média, mediana, desvio padrão, etc. 
 
1.3.6 ESTIMATIVA: é um valor aproximado do parâmetro estudado e é calculado com o uso da 
mostra. Isto porque muitas vezes os dados de toda a população não estão aca
(p
da população, muito t
 
 
1.4 AMOSTRAGEM 
 
Através do emprego de uma técnica conveniente de amostragem, busca-se assegurar que a 
mostra coletada seja representativa da população, ou sejaa
mesmas características básicas da população, no que diz respeito ao fenômeno que está 
sendo investigado. Os tipos de amostragem mais comuns são: 
Amostragem aleatória simples: este tipo de amostragem é equivalente a um sorteio 
lotérico, onde todos os elementos da população têm iguais chances de pertencer à 
amostra. Para realizá-la basta identificar todos os elementos da população e sortear, por 
um meio aleatório qualquer, os elementos que deverão pertencer à amostra. 
Amostragem estratificada: muitas vezes a população se divide em subpopulações 
tratos), sendo possível que a variável em estudo apresente, de estrato para estrato, um 
comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo. 
Neste caso, é conveniente que o sorteio dos elementos da amostra consider
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
4
 Ex: Em uma classe de 60 alunos, 38 são do sexo masculino e 22 do sexo feminino. 
Deseja-se am da corre ente a 10 os da turma 
(população). Como são dois estratos (sexo masculino e sexo feminino), temos: 
 
POPU ÇÃO 10% AMOSTRA 
obter uma ostra estratifica spond % dos alun
SEXO LA
Masculino 38 3,8 4 
Feminino 22 2,2 2 
Total 60 6 6 
 
 Logo, deverão ser sorteados 4 alunos e 2 alunas para compor a amostra. 
Amostragem sistemática: é quando os elementos da população apresentam-se 
ordenados e a 
 
 
• 
retirada dos elementos da amostra é feita periodicamente. Por exemplo, em 
uma linha de produção, a cada dez itens produzidos, pode-se retirar um para pertencer a 
Neste caso, o tamanho da amostra estaria fixado em 10% 
adro que resume um conjunto de dados dispostos segundo linhas e 
olunas de maneira siste ática (a seguir apresenta-se um exemplo que contém os elementos 
ção 886 do IBGE, nas casas ou células da 
• 
 zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada; se os 
 são expressos em numerais decimais, deve-se acrescentar à parte decimal um 
número correspondente de zeros (0,0; 0,00; 0,000; ...). 
• um ponto de interrogação (?) quando há dúvida quanto à exatidão de determinado valor. 
 
Exemp
Produção de Café (Brasil: 1991 – 1995) 
PRODUÇÃO (1000 t) 
uma amostra da produção diária. 
da população. 
 
 
1.5 SÉRIES ESTATÍSTICAS 
 
Denomina-se série estatística qualquer tabela que apresenta a distribuição de um conjunto de 
dados estatísticos em função da época, do local ou da espécie. 
 
1.5.1 TABELA: É um qu
c m
que compõem uma tabela). De acordo com a Resolu
tabela deve-se colocar: 
 
um traço horizontal ( - ) quando o valor é zero; 
• três pontos ( ... ) quando os dados não estão acessíveis; 
•
valores
lo: 
ANOS 
1991 2535 
1992 2700 
1993 2200 
1994 3570 
1995 1950 
Fonte: IBGE 
 
Título 
Cabeçalho 
Casa ou 
célula
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
5
1.5.2 SÉRIE TEMPORAL R os valores da variável, 
em determinado local, discriminados segundo intervalos de tempo variáveis. 
 
Produção de Televisores (Brasil: 1995 – 1999) 
UNIDADES PRODUZIDAS (x 1000) 
, HISTÓ ICA OU CRONOLÓGICA: descrevem
ANOS 
1995 125 
1996 150 
1997 138 
1998 179 
1999 213 
Fonte: Eletroban 
 
 
1.5.3 SÉRIE GEOGRÁFICA, ESPACIAL, TERRITORIAL OU DE LOCALIZAÇÃO: descrevem 
os valores da variável em determinado instante, discriminados segundo regiões. 
 
DIDAS 
Vendas da Autocar Veículos Ltda em 1999. 
DESTINO UNIDADES VEN
Cidade 140 
Interior 50 
Outra cidade 23 
Fonte: Autocar Veículos Ltda 
 
 
1.5.4 SÉRIE ESPECÍFICA EGÓRIC valores da variável, em 
determinado tempo e local, discriminados segundo especificações ou categorias. 
 
 vendidos em 199
UNIDADES (x 1000) 
OU CAT A: descrevem os 
Itens 7 
ARTIGO 
R 82 oupa feminina 
Roupa masculina 60 
Roupa infantil 53 
brinquedos 20 
Fonte: Casa do Povo 
 
 
 
1.5.5 SÉRIES CONJUGADAS: Também chamadas de tabelas de dupla entrada. São 
apropriadas à apresen jugada, havendo duas 
ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série 
geográfica-temporal. 
 
nais T em 91
RE O 
tação de duas ou mais séries de maneira con
Termi elefônicos Serviço (19 - 1993) 
GIÃ 1991 1992 1993 
Norte 342.938 375.658 403.494 
Nordeste 1.287.813 1.379.101 1.486.649 
Sudeste 6.234.501 6.729.467 7.231.634 
Sul 1.497.315 1.608.989 1.746.232 
Centro-oeste 713.357 778.925 884.822 
 Fonte: Ministério das Comunicações 
 
 
1.5.6 DISTRIBUIÇÕES DE FREQUÊNCIA: por serem de grande utilização na Estatística, este 
conceito será tratado posteriormente em outro capítulo. 
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani6
1.6 INTERPRETAÇÃO DE TABELAS 
onclusões precisas a partir dos 
ados contidos nas mesmas. 
.6.2 DADOS RELATIVOS: são o resultado de comparações por quociente (razões) que se 
bsolutos e têm por finalidade realçar ou facilitar as comparações 
ntre quantidades. Os dados relativos geralmente são expressos em termos de percentagens, 
índices, c
 
1.6.2.1 PERCENTAGENS: 
 
ALUNOS DO INSTITUTO QI APRO OS NO CONCU
TURMAS ALUNOS APROVADOS PERCENTUAL (%) 
 
A interpretação de tabelas consiste fundamentalmente em tirar c
d
 
1.6.1 DADOS ABSOLUTOS: são os dados estatísticos resultantes da coleta direta da fonte, 
sem outra manipulação, a não ser a contagem ou mensuração. 
 
1
estabelecem entre dados a
e
oeficientes e taxas. 
VAD RSO DO TRT- 1997 
TURMA A 87 (87x100)/203 = 42, 9 
TURMA B 62 (62x100)/203 = 30,5 
203 100,0 
TURMA C 54 (54x100)/203 = 26,6 
TOTAL 
 
 
1. 2.2 ÍNDICES: são razões entre duas g6. randezas tais que uma não inclui a outra. Como 
xemplo, citam-se os índices econômicos: 
6. ro total ( número 
e ocorrências e número de não-ocorrências). 
 Coef. de aprovação escolar = n. de alunos aprovados / n.o de matrículas 
.6.2.4 TAXAS: são os coeficientes multiplicados por uma pot6encia de 10 (10, 100, 1000, etc.) 
ara facilitar o entendimento do resultado. 
 Taxa de evasão escolar = Coef. de evasão escolar x 100 
denadas, veracidade sobre o 
 
e
 
• renda per capita = renda / população 
• receita per capita = receita / população 
 
 
1. 2.3 COEFICIENTES: são razões entre o número de ocorrências e o núme
d
 
• Coef. de evasão escolar = n.o de alunos desistentes / n.o de matrículas 
o•
 
 
1
p
 
•
• Taxa de aprovação escolar = Coef. de aprovação escolar x 100 
 
 
.7 GRÁFICOS ESTATÍSTICOS 1
 
São representações visuais dos dados estatísticos contidos nas tabelas. Estas representações 
ão caracterizadas pelo uso de escalas de valor, sistema de coors
fenômeno em estudo, clareza e simplicidade na interpretação dos valores. 
Os gráficos são classificados em: Diagramas, Pictogramas e Cartogramas. 
 
1.7.1 DIAGRAMAS: São gráficos geométricos dispostos em duas dimensões. São os mais 
usados na representação de séries estatísticas. Eles podem ser : 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
7
1.7.1.1 GRÁFICOS EM LINHAS OU EM CURVAS: são frequentemente usados para 
 
retângulos proporcionais, dispostos verticalmente (em colunas) ou horizontalmente (em barras). 
• s. 
 A ordem a ser observada é a cronológica, se a série for histórica, e a decrescente, se for 
• Gráficos 
 
m
 as partes. 
• Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. 
O gráfico em setores só deve ser empregado quando há, no máximo, sete dados. 
• Cada setor é obtido por meio de uma regra de três simples e direta, onde o valor total 
corresponde a 360o. Ou seja: busca-se determinar quantos graus deve possuir cada setor. 
• As séries temporais geralmente não são representadas por este tipo de gráfico. 
representação de séries cronológicas com um grande número de períodos de tempo. As linhas 
são mais eficientes do que as colunas em situações onde existem grandes flutuações nas 
séries ou quando há necessidade de se representarem várias séries em um único gráfico. 
 Fonte: Empresa ABC 
 
 
1.7.1.2 GRÁFICOS EM COLUNAS OU EM BARRAS: uma série é representada por meio de 
 
Se as informações a serem escritas forem extensas, é comum optar pelo gráfico de barra
•
geográfica ou categórica. 
em colunas (ou em barras) superpostas e compostas são utilizados para 
representação simultânea de dois ou mais fenômenos, com o propósito de comparação. 
Fonte: Seminário (Coppe, 2001) 
 
1.7.1.3 GRÁFICOS EM SETORES: são construídos com base em um círculo, e é empregado 
se pre que deseja-se ressaltar a participação do dado no total. 
• O total é representado pelo círculo, que é dividido em tantos setores quantas são
Investimentos no Setor Elétrico 
13,3
11,1
9 9,1 8,6
7,1
5,7
4,5 4,9
5,9 6
6
8
10
12
14
6 1997 1998
$(
bi
lh
õe
s)
0
1988 1989 1990 1991 1992 1993 1994 1995 199
2
4U
S
De m anda (Produto X e Y)
50
100
150
200
250
300
n/7
5
r/7
5
ai/
75 l/7
5
t/7
5
v/7
5
n/7
6
ar/
76 i/7
6
l/7
6 76 /76
M
ilh
ar
es
 d
e 
un
id
ad
es
0
Ja Ma M Ju Se No Ja M M
a Ju Se
t/
No
v
X
Y
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
8
Grau de Instrução na Empresa InfoMarketing
13%
38%
49%
fundamental
médio
superior
 Fonte: InfoMarketing (2001) 
 
 
1.7.2 CARTOGRAMAS: são representações relativas a cartas geográficas (mapas). O objetivo 
desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas 
geográficas ou políticas. 
 
 Fonte: IBGE (1996) 
MG 
28 34
SP 
137 14
RJ 
305 32
ES 
60 69
Densidade Demográfica
 
 
1.7.3 PICTOGRAMAS: são constituídos de elementos gráficos e de figuras representativas do 
fenômeno em estudo. Devido a sua forma atraente e sugestiva, despertam a atenção do 
público leigo. 
Índice de Aprovação no Vestibular 
(Pré Vestibular Isaac Newton)
65%
73% 78%
90%
53%
40%
0%
20%
40%
60%
80%
100%
1997 1998 1999 2000 2001 2002
Fonte: Pré Vestibular Isaac Newton (2002) 
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
9
1.8 ARREDONDAMENTO DE DADOS 
 
Frequentemente o pesquisador realiza mensurações em seus experimentos que resultam em 
números decimais. Neste sentido, é conveniente estabelecer algumas regras de 
arredondamento de dados, baseadas na resolução 886/66 do IBGE. Em suma, tais regras são: 
 
1.8.1 quando o primeiro algarismo a ser abandonado é 0, 1, 2, 3, ou 4: fica inalterado o último 
algarismo a permanecer. 
 
Ex: 53,24 ⇒ 53,2 42,13 ⇒ 42,1 
 
 
1.8.2 quando o primeiro algarismo a ser abandonado é 6, 7, 8 ou 9: aumenta-se de uma 
unidade o último algarismo a permanecer. 
 
Ex: 42,86 ⇒ 42,9 53,99 ⇒ 54,00 23,378 ⇒ 23, 38 
 
 
1.8.3 quando o primeiro algarismo a ser abandonado é 5 existem duas possibilidades 
 
a) se após o 5 seguir, em qualquer casa, um algarismo diferente de zero, aumenta-se uma 
unidade do algarismo a permanecer. 
 
Ex: 2, 352 ⇒ 2,4 76,2500001 ⇒ 76,3 
 
b) se o 5 for o último algarismo ou se após o 5 somente existirem zeros, o último algarismo a 
ser conservado somente será aumentado de uma unidade se for ímpar. 
 
Ex: 24,75 ⇒ 24, 8 24,65 ⇒ 24,6 24,650000 ⇒ 24,6 
 
 
 
 
 
 
CAPÍTULO 2 
DISTRIBUIÇÃO DE FREQUÊNCIA 
 
2.1 TABELA PRIMITIVA OU DADOS BRUTOS: é uma tabela ou relação de elementos que 
não foram numericamente organizados. É difícil formar uma idéia exata do comportamento do 
grupo como um todo, a partir de dados não ordenados. 
 
Ex: Na tabela abaixo, cada valor representa a quantidade vendida (em milhares de unidades) 
por cada um dos 36 representantes de uma determinada multinacional em 2001. 
 
120 102 95 95 108 100 140 92 97 
111 140 132 102 125 89 135 87 82 
85 145 124 92 120 85 90 120 110 
97 78 89 75 105 128 105 115 91 
 
 
2.2 ROL: é uma tabela composta por dados ordenados (crescente ou decrescente). Ex: A 
tabela (rol) abaixo apresenta o volume de vendas com os valores ordenados crescentemente. 
 
75 85 90 95 100 105 115 124 135 
78 87 91 95 102 108 120 125 140 
82 89 92 97 102 110 120 128 140 
85 89 92 97 105 111 120 132 145 
 
 
2.3 DISTRIBUIÇÃO DE FREQUÊNCIA: é um tipo de tabela que condensa uma coleção de 
dados conforme as frequências (repetições de seus valores). No exemplo acima, denomina-se 
frequência o número de vendedores que está relacionado a um determinado valor de vendas. 
 
Obs: Para umrol de tamanho relativamente razoável e com muitos valores distintos, é 
conveniente agrupar os valores em intervalos de classe. 
 
 
2.4 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA 
 
2.4.1 AMPLITUDE AMOSTRAL (AA): é a diferença entre o valor máximo e o valor mínimo dos 
dados disponíveis. Ou seja: 
AA = xmáx - xmín
 
No exemplo, tem-se que: AA = 145 – 75 = 70. 
 
 
2.4.2 CLASSES: são intervalos de variação da variável e é simbolizada por i, onde i = 1, 2, .., k. 
(k é o número total de classes da distribuição). 
 
• A regra de Sturges é uma das fórmulas mais empregadas para determinar o número de 
classes (i) que deverá ter a distribuição em função do n.o de dados existentes (n). Ou seja: 
 
i = 1 +3,3log (n) 
 
 No exemplo dado, tem-se seis classes pois: i = 1 + 3,3log(36) = 6,14 (6 classes). 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
10
• O uso da fórmula de Sturges não conduz uma decisão final. Na realidade busca-se definir 
um número de classes que inclua todos os dados da distribuição, não permita a existência 
de classes com frequência nula ou com frequência relativa muito elevada. 
 
 
2.4.3 AMPLITUDE DOS INTERVALOS DE CLASSE: representa a medida do intervalo que 
define uma classe. É calculada pela seguinte fórmula: 
 
i
AAh = 
No exemplo, tem-se que: 126611
6
70h ≅== , 
 
2.4.4 LIMITES DE CLASSE: correspondem aos extremos de cada classe. Designa-se por li e 
Li, respectivamente, o limite inferior e o limite superior da classe i. 
 
Uma vez definidos o número de classes e a amplitude dos intervalos de classe, o próximo 
passo consiste em determinar os limites de cada uma das classes. De acordo com o exemplo, 
tem-se a seguinte tabela: 
 
VENDAS (x 1000) APURAÇÃO FREQUÊNCIA (fi) 
75 ⊢ 87 
87 ⊢ 99 
99 ⊢ 111 
111 ⊢ 123 
123 ⊢ 135 
135 ⊢ 147 
TOTAL 
 
• Para definir a primeira classe, utilizou-se o menor nº da amostra e o intervalo de classe (h). 
No exemplo, a primeira classe possui os seguintes valores: l1 = 75 e L1 = 75 + 12 = 87. 
 
• Os intervalos de classe devem ser escritos de acordo com a Resolução 886/66 do IBGE. 
Utiliza-se o símbolo ⊢ para indicar a inclusão de li e a exclusão de Li . Ou seja: o vendedor 
que vendeu 99000 unidades estaria incluso na terceira classe (i = 3) e não na segunda. 
 
 
2.4.5 FREQUÊNCIA SIMPLES OU ABSOLUTA: ou simplesmente frequência de uma classe 
ou de um valor individual é o número de observações correspondentes a essa classe ou a esse 
valor. Para determinar a frequência de cada classe, deve-se realizar a apuração dos dados 
bservações). De acordo com os dados do exemplo, temos que: (o
 
VENDAS (x 1000) APURAÇÃO FREQUÊNCIA (f ) i
75 ⊢ 87 � ׀ 5 
87 ⊢ 99 � � П 11 
99 ⊢ 111 � П 7 
111 ⊢ 123 � ׀ 5 
123 ⊢ 135 � 4 
135 ⊢ 147 � 4 
 
TOTAL 
 
36 ∑k if
=1i
= 36 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
11
• A frequência da classe i é simbolizada por f . i
• A soma de todas as frequências (frequências de todas as classes) é representada pelo 
símbolo de somatório: ∑ = n. 
=
k
1i
if
 
2.4.6 PONTO MÉDIO DE UMA CLASSE: é o ponto que divide o intervalo de classe em duas 
artes iguais. É o valor que representa cada classe. Calcula-se da seguinte forma: p
 
2
Llx iii
+= 
 
 tabela abaixo apresenta o ponto médio de cada classe para o exemplo em questão: A
 
VENDAS (x 1000) APURAÇÃO FREQUÊNCIA (fi) P.M. (xi) 
75 ⊢ 87 � ׀ 5 81 
87 ⊢ 99 � � П 11 93 
99 ⊢ 111 � П 7 105 
111 ⊢ 123 � ׀ 5 117 
123 ⊢ 135 � 4 129 
135 ⊢ 147 � 4 141 
 
TOTAL 
 
36 ∑
=
k
1i
if = 36 
 
 
 
.4.7 OUTROS TIPOS DE FREQUÊNCIA: 2
 
2.4.7.1 FREQUÊNCIAS RELATIVAS (fri): são os valores das razões entre as frequências 
imples e a frequência total. Ou seja: s
 
∑= iii f
ffr 
 
2.4.7.2 FREQUÊNCIA ACUMULADA (FI): é o somatório das frequências de todas as classes 
té a classe em questão, inclusive a própria. Ou seja: a
 
Fk = f1 + f2 + .... + fk
 
 tabela abaixo apresenta o cálculo destas frequências para o exemplo dado: A
 
VENDAS (x 1000) APURAÇÃO FREQUÊNCIA (fi) P.M. (xi) fri Fi
75 ⊢ 87 � ׀ 5 81 5/36 5 
87 ⊢ 99 � � П 11 93 11/36 16 
99 ⊢ 111 � П 7 105 7/36 23 
111 ⊢ 123 � ׀ 5 117 5/36 28 
123 ⊢ 135 � 4 129 4/36 32 
135 ⊢ 147 � 4 141 4/36 36 
 
TOTAL 
 
36 ∑
=
k
1i
if = 36 
 ∑
=
k
1i
ifr = 1 
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
12
2.5 DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALOS DE CLASSE: é empregada 
quando se trata de variável discreta de variação relativamente pequena, onde cada valor pode 
ser considerado como um intervalo de classe. 
 
Se a variável assume numerosos valores distintos, é comum tratá-la como uma variável 
contínua, formando intervalos de classe diferente de um. Esse tratamento abrevia o trabalho, 
mas ocasiona alguma perda de precisão. Uma distribuição sem intervalos de classe apresenta 
a seguinte forma: 
 
xi fi
x1 f1
x2 f2
M M 
xn fn
 ∑
=
n
1i
if =n 
 
 
Exemplo: Considere a variável x como sendo “o número de filhos de 50 famílias entrevistadas”. 
A tabela abaixo apresenta os outros tipos de frequências: 
 
i xi fi fri Fi
1 0 7 0,14 7 
2 1 8 0,16 15 
3 2 15 0,30 30 
4 3 8 0,16 38 
5 4 7 0,14 45 
6 5 4 0,08 49 
7 Mais de 5 filhos 1 0,02 50 
 ∑
=
n
1i
if = 50 ∑
=
n
1i
ifr 1,00 
 
 
 
2.6 REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO 
 
Todos os gráficos que representam uma distribuição de frequências utilizam o primeiro 
quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo 
das abscissas) colocam-se os valores da variável e na linha vertical (eixo das ordenadas), as 
frequências. A seguir, apresentam-se os gráficos usualmente utilizados: 
 
2.6.1 HISTOGRAMA: é formado por um conjunto de retângulos justapostos, cujas bases se 
localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os 
pontos médios dos intervalos de classe. 
 
As larguras dos retângulos são iguais às amplitudes dos intervalos de classe. As alturas dos 
retângulos devem ser proporcionais às frequências de classe. A área de um histograma é 
proporcional à soma das frequências simples ou absolutas. 
 
 
 
 
 
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
13
 
 
 
2.6.2 POLÍGONO DE FREQUÊNCIA: é um gráfico em linha, sendo as frequências marcadas 
sobre perpendiculares ao eixo hotizontal, levantadas pelos pontos médios dos intervalos de 
classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura, 
ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da 
posterior à última, da distribuição. 
 
 
Obs: uma distribuição de frequência sem intervalos de classe é representada graficamente por 
um diagrama onde cada valor da variável é representado por um segmento de reta vertical e de 
comprimento proporcional à respectiva frequência. No exemplo abaixo, tem-se a seguinte 
representação: 
 
 
75 87 99 111 123 135 147
2
4
6
8
10
12
0
f
x
VENDAS (x 1000) (fi) P.M. (xi) 
75 ⊢ 87 5 81 
87 ⊢ 99 11 93 
99 ⊢ 111 7 105 
111 ⊢ 123 5 117 
123 ⊢ 135 4 129 
135 ⊢ 147 4 141 
 
TOTAL ∑
=
k
1i
if = 36 
 
75 87 99 111 123 135 147
2
4
6
8
10
12
0
f
x
 5
11
 7
 5
 4 4
 11 
VENDAS (x 1000) (fi) P.M. (xi) 
75 ⊢ 87 5 81 
87 ⊢ 99 11 93 
99 ⊢ 111 7 105 
111 ⊢ 123 5 117 
123 ⊢ 135 4 129 
135 ⊢ 147 4 141 
 
TOTAL ∑
=
k
1i
if = 36 
 
i xi fi
1 0 7 
2 1 8 
3 2 15 
4 3 8 
5 4 7 
6 5 4 
7 Mais de 5 filhos 1 
 ∑
=
n
1i
if = 50 
1 2 3 4 5 mais de 5
2
4
6
8
10
12
0
f
x
14
16
Introdução à Probabilidadee Estatística - IPE 
Prof. André Policani 
14
2.6.3 POLÍGONO DE FREQUÊNCIA ACUMULADA: é traçado marcando-se as frequências 
acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes 
aos limites superiores dos intervalos de classe. 
 
 
 
Obs: No caso de uma distribuição de frequência sem intervalos de classe, o gráfico da 
frequência acumulada se apresentará com pontos de descontinuidade nos valores observados 
da variável. Por exemplo, tem-se a seguinte representação: 
VENDAS (x 1000) fi Fi 
75 ⊢ 87 5 5 
87 ⊢ 99 11 16 
99 ⊢ 111 7 23 
111 ⊢ 123 5 28 
123 ⊢ 135 4 32 
135 ⊢ 147 4 36 
 
TOTAL ∑
=
k
1i
if = 36 
 
75 87 99 111 123 135 147
10
20
30
40
0
F
x
i xi fi Fi
1 0 7 7 
2 1 8 15 
3 2 15 30 
4 3 8 38 
5 4 7 45 
6 5 4 49 
7 Mais de 5 filhos 1 50 
 ∑
=
n
1i
if = 50 
 7
 49
1 2 3 4 5 mais de 5
10
6
30
40
0
F
x
50
20
50
 45
 38
 30
 15
 
 
 
2.7 A CURVA DE FREQUÊNCIA (CURVA POLIDA): 
 
Enquanto o polígono de frequência fornece a imagem real do fenômeno estudado, a curva de 
frequência fornece a imagem tendencial. O polimento (geometricamente, corresponde à 
eliminação dos vértices da linha poligonal) de um polígono de frequência representa o que 
seria tal polígono com um número maior de dados em amostras mais amplas. Isto pode ser 
obtido através do emprego da seguinte fórmula: 
 
4
ff2ffc 1ii1ii +−
++= onde: 
 
• fc = frequência calculada da classe considerada (freq. polida) i
• fi frequência simples da classe considerada =
• fi-1 = frequência simples da classe anterior à da classe considerada 
• fi+1 = frequência simples da classe posterior à da classe considerada 
. 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
15
VENDAS (x 1000) fi fci
75 ⊢ 87 5 5,3 
87 ⊢ 99 11 8,5 
99 ⊢ 111 7 7,5 
111 ⊢ 123 5 5,3 
123 ⊢ 135 4 4,3 
135 ⊢ 147 4 3,0 
 
TOTAL ∑
=
k
1i
if = 36 
 
75 87 99 111 123 135 147
2
4
6
8
10
12
0
fci
x
 
 
2.7.1 O FORMATO DAS CURVAS DE FREQUÊNCIA 
 
As curvas de frequência geralmente assumem as seguintes formas características: 
 
2.7.1.1 CURVAS EM FORMA DE SINO: caracterizam-se por apresentarem um valor máximo 
na região central. De acordo com os dados da distribuição, podem apresentar-se de forma 
simétrica e assimétrica. 
 
• Curva simétrica: caracteriza-se por apresentar o valor máximo no ponto central e os 
pontos equidistantes deste ponto terem a mesma frequência. 
 
 
• Curva assimétrica: na realidade não existem curvas perfeitamente simétricas. Deste 
modo, as curvas correspondentes às distribuições apresentam uma cauda mais alongada 
em um dos lados da curva. Se a cauda mais alongada fica à direita, a curva é chamada 
assimétrica positiva ou enviesada à direita. Se a cauda se alonga à esquerda, a curva é 
chamada assimétrica negativa ou assimétrica à esquerda. 
 
 
2.7.1.2 CURVAS EM FORMA DE JOTA: representam distribuições fortemente assimétricas, 
caracterizando-se por apresentarem o ponto de ordenada máxima em uma das extremidades. 
 
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
16
 
 
2.7.1.3 CURVAS EM FORMA DE U: caracterizam-se por apresentarem ordenadas máximas 
em ambas as extremidades. 
 
 
2.7.1.3 DISTRIBUIÇÃO RETANGULAR: é uma distribuição muito rara. Apresenta todas as 
classes com a mesma frequência. Representa-se através de um histograma em que todas as 
colunas possuem a mesma altura ou por um polígono de frequência reduzido a um segmento 
de reta horizontal. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
CAPÍTULO 3 
MEDIDAS DE TENDÊNCIA CENTRAL 
 
3.1 INTRODUÇÃO 
 
São medidas cujo valor numérico permite ter uma noção da localização do centro de uma 
distribuição de frequência. Estas medidas permitem verificar a tendência dos dados 
observados a se agruparem em torno dos valores centrais. 
 
As medidas de tendência central mais utilizadas são: as médias (aritmética, harmônica, 
geométrica, quadrática), a mediana e a moda. 
 
 
3.2 MÉDIA ARITMÉTICA 
 
Sejam x1, x2, x3, ...., xn os valores de um conjunto de observações e n a quantidade de 
observações. 
 
 
3.2.1 MÉDIA ARITMÉTICA SIMPLES (Dados não-agrupados) 
 
Quando deseja-se conhecer a média dos dados não-agrupados em tabelas de frequências, 
determinamos a média aritmética simples através da seguinte equação: 
 
n
x
x
n
i
i∑
== 1 
 
 
Exemplo: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 
13, 15, 16, 18 e 12 toneladas, temos, para venda média diária na semana de: 
 
7
12181615131410x ++++++= = 14 toneladas 
 
 
3.2.2 MÉDIA ARITMÉTICA PONDERADA (Dados agrupados) 
 
Quando cada dado da distribuição está associado a um valor de frequência, diz-se que a média 
é ponderada (possui peso). Lembre-se que frequência é o número de vezes que um dado se 
repete. 
 
3.2.2.1 Sem intervalos de classe: Neste caso a média aritmética ponderada é calculada pela 
equação: 
 
n
fx
x
n
1i
ii∑
== 
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
19
Exemplo: Considere a variável x como sendo “o número de televisores de 50 famílias 
entrevistadas”. 
i xi fi fri Fi xifi
1 0 3 0,06 3 0 
2 1 15 0,30 18 15 
3 2 18 0,36 36 36 
4 3 10 0,20 46 30 
5 4 4 0,08 50 16 
 ∑
=
n
1i
if = 50 ∑
=
n
1i
ifr =1,00
 
i
n
1i
ifx∑
=
=97
Assim, tem-se que: 
 
n
fx
x
n
1i
ii∑
== = 
50
97
= 1,94 
 
Obs: Como x (quantidade de televisores) é uma variável discreta, como interpretar o resultado 
obtido? Afinal, não existem 1,94 televisores. O valor médio de 1,94 televisores identifica uma 
tendência de que as famílias entrevistadas possuem, em média, dois televisores. 
 
 
3.2.2.2 Com intervalos de classe: Neste caso, convenciona-se que todos os valores incluídos 
em um determinado intervalo de classe são representados pelo seu ponto médio. Assim, 
determina-se a média aritmética ponderada por meio da equação: 
 
∑
∑
=
== k
1i
i
k
1i
ii
f
fx
x , onde: 
• x é o ponto médio da classe i. i
• k é o número total de classes 
 
xemplo: Calcular a média de vendas dos 36 vendedores de uma empresa (vide capítulo 2). E
 
Solução: Após estabelecer o rol para organizar os dados e distribuí-los em intervalos de 
lasses, têm-se a seguinte tabela: c
 
VENDAS (x 1000) APURAÇÃO fi P.M. (xi) fri Fi xifi
75 ⊢ 87 � ׀ 5 81 5/36 5 405 
87 ⊢ 99 � � П 11 93 11/36 16 1023 
99 ⊢ 111 � П 7 105 7/36 23 735 
111 ⊢ 123 � ׀ 5 117 5/36 28 585 
123 ⊢ 135 � 4 129 4/36 32 516 
135 ⊢ 147 � 4 141 4/36 36 564 
 
TOTAL 
 
36 ∑
=
k
1i
if = 36 
 ∑
=
k
1i
ifr = 1 
 ∑
=
k
1i
iifx = 3828
 
Assim, tem-se que: 
∑
∑
=
== k
1i
i
k
1i
ii
f
fx
x = 
36
3828
= 106,3 
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
20
3.3 DESVIO EM RELAÇÃO À MÉDIA 
ento de um conjunto de 
alores e a média aritmética. Sendo o desvio denotado por di, temos: 
 
 
Denomina-se desvio em relação à média a diferença entre cada elem
v
xdi −= xi 
 
na: 10, 14, 13, 15, 16, 18 e 12 toneladas; 
venda média diária na semana de: 
Para o exemplo apresentado: 
• venda diária de arroz tipo A, durante a uma sem
• ton 14x = 
 
xxd ii −= ⇒ d1 = 10 –14 = -4 
xxd 22 −= ⇒ d2 = 14 –14 = 0 
xxd 33 −= ⇒ d3 = 13 –14 = -1 
xx44 −= ⇒ d4 = 15 –14 = 1 d
xxd 55 −= ⇒ d5 = 16 –14 = 2 
xxd 66 −= ⇒ d6 = 18 –14 = 4 
xxd 77 −= ⇒ d7 = 12 –14 = -2 
.4 PROPRIEDADES DA MÉDIA 
.4.1 A soma algébrica dos desvios tomados em relação à média é nula: 
1i
i
=
 
 
3
 
3 0d
k
=∑ 
onformeo exemplo ante
 
 
C rior, temos: 
( ) ( ) ( ) =−++++−++−=∑ 2421104d7
=
i 0 
os valores de uma variável, a 
édia do conjunto é aumentada (o nte: 
 
1i
 
.4.2 Somando-se ou subtraindo-se uma constante (c) de todos 3
m u diminuída) desta consta
cxycxy ±=±= ii ⇒ 
 
Seja c=3. Somando
y1 = 13; y2 = 17; y3 = 16; y4 = 18; y5 = 19; y6 = 21; y7 = 15. 
Donde: 
i =++++++=∑ 
endo n = 7: 
 3 a cada um dos valores da variável x, temos que: 
 
 
11915211918161713y
7
1i=
 
S 17314cxy17119y =+=+=⇒== 
el por uma constante 
), a média do conjunt dida) p 
 
7
 
.4.3 Multiplicando-se (ou dividindo-se) todos os valores de uma variáv3
(c o é multiplicada (ou divi or essa constante: 
cxycxy ii •=⇒•= ou cycy
i
i =⇒= xx 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
21
 
Seja c=3. Multiplica
y1 = 30; y = 42; y = 39; y = 45; y = 48; y = 54; y = 36. 
 
Donde: 
29436544845394230y
i
=++++++=∑ 
endo n = 7: 
ndo por 3 cada um dos valores da variável x, temos que: 
 
2 3 4 5 6 7
7
1
i
=
 
S 42314cxy42
7
294y =•=+=⇒== 
3.5.1 MÉDIA HARMÔNICA:
 
 
 
3.5 OUTRAS MÉDIAS 
 
 é calculada pela equação: 
 
fx
M 
1
n
n
1i
i
1
i
H
−
=
−
⎥⎥
⎥⎤
⎢⎢
⎢⎡
=
∑ .
f
1i
i
= ⎥⎦⎢⎣ ∑
 
) xi =: 2, 4, 6, 8 f = 1, i = 1, 2,...., n (média harmônica simples) 
 
 
MH = 
 
 
Exemplo: Calcule a média harmônica para os seguintes dados: 
 
a i
843
25
96
424
25
4
24
34612
4
8
1
6
1
4
1
2
1
1
11
,==⎥⎦
⎤⎢⎣
⎡
⋅=⎥
⎥⎤⎢⎢
⎡ +++
=⎥⎥
⎤
⎢⎢
⎡ +++ −
−−
 
⎥⎥⎦⎢⎢⎣⎥⎥⎦⎢⎢⎣
) xi =: 2, 4, 6, 8 f = 4, 3, 2, 1 (média harmônica ponderada) 
 
 
MH= 
 
 
b i
123
77
240
240
77
10
24
381848
1234
1
8
12
6
13
4
14
2
1
1
11
,==⎥⎦
⎤⎢⎣
⎡=
⎥⎥
⎥⎤
⎢⎢
⎢⎡
+++
=⎥⎥
⎥⎤
⎢⎢
⎢⎡
+++
⎟⎠
⎞⎜⎝
⎛ ⋅+⎟⎠
⎞⎜⎝
⎛ ⋅+⎟⎠
⎞⎜⎝
⎛ ⋅+⎟⎠
⎞⎜⎝
⎛ ⋅ −
−−
 
⎥⎦⎢⎣⎥⎦⎢⎣
3.5.2 MÉDIA GEOMÉTRICA: 
 
 
 
é calculada pela equação: 
 xxxM n fn
f
2
f
1G
n21 ⋅⋅⋅= L 
 
 
 
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
22
Exemplo: Calcule a média geométrica para os seguintes dados: 
 
a) xi =: 2, 4, 6, 8 ) 
MG = 
fi = 1, i = 1, 2,...., n (média geométrica simples
 
4343848642 44 111 ,==⋅⋅⋅ 
 
b) xi =: 2, 4, 6, 8 
MG= 
1
 
 fi = 4, 3, 2, 1 (média geométrica ponderada) 
 
52383664168642 1010 1234 ,=⋅⋅⋅=⋅⋅⋅ 
3.5.3 MÉDIA QUADRÁTICA:
 
 
 
 é calculada através da equação: 
 
fxfx
M n
n
1i
i
2
i
2
1
n
n
1i
i
2
i
Q
∑∑
== =⎥⎥
⎥⎤
⎢⎢
⎢⎡
=
..
ff
1i
i
1i
i ∑∑
== ⎥⎦⎢⎣
 
) xi =: 2, 4, 6, 8 fi = 1, i = 1, 2,...., n (média quadrática simples) 
 
 
MQ = 
 
 
Exemplo: Calcule a média quadrática para os seguintes dados: 
 
a
485
41111
,==+++ 
b) xi =: 2, 4, 6, 8 
 
MQ= 
1208642 2222 +++
 
 
fi = 4, 3, 2, 1 (média quadrática ponderada) 
( ) ( ) ( ) ( ) 474
101234
,==+++ 
s, estando estes 
úmeros ordenados de forma crescente ou decrescente. A mediana é o valor que separa o 
onjunto de números em dois subconjuntos de mesmo número de elementos. 
de-se da seguinte forma: 
) ordenar os dados (de forma crescente ou decrescente); 
b) determinar a posição (p) da mediana, através da equação: 
 
20018263442 2222 ⋅+⋅+⋅+⋅
 
 
3.6 MEDIANA (Md) 
 
A mediana é o número que se encontra no centro de uma série de número
n
c
 
 
3.6.1 A MEDIANA EM DADOS NÃO AGRUPADOS 
 
Para determinar a mediana em dados não agrupados, proce
 
a
2
p = 1N + , onde N é o número de elementos da série. 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
23
c) identificação da mediana: se o número de elementos (N) for ímpar, a mediana representa 
exatamente o valor central dos dados, definido pela posição (p). Se o número de elementos 
for par, a mediana corresponde a média dos dois valores centrais da série. 
 
 
Exemplo A: Determine a mediana da seguinte série de valores: 1, 7, 5, 11, 9. 
 
a) ordenação: 1, 5, 7, 9, 11. 
b) posição (p) da mediana: 
5p = to) 
c) como o número de elementos ediana é Md = 7. 
 
 
 
Exemplo B: Determine a median
 
a) ordenação: 1, 5, 7, 9, 11, 50. 
b) posição (p) da mediana: 6p =
c) como o número de elemento
valores centrais da série. 
Sendo a série ordenada (1, 5,
 
 
3.6.2 A MEDIANA EM DADOS A
 
Assim como no estudo das
intervalos de classe ou em uma d
 
 
3.6.2.1 SEM INTERVALOS DE C
 
Identifica-se a frequência acum
frequências. A mediana será o va
 
Exemplo: Seja x “o número de te
a) posição: 525
2
150p ,=+= (a m
 
b) Md = 2 ( o 25,5.o elemento po
 
2
1+
= 3 (a mediana é o 3.o elemen
 da série é ímpar (5), o valor da m
(1, 5, 7, 9, 11) 
a da seguinte série de valores: 1, 7, 5, 11, 50, 9. 
2
1+ = 3,5 (a mediana está entre o 3.o e o 4.o elemento) 
s da série é par (6), o valor da mediana é a média dos dois 
 7, 9, 11, 50), então: Md = 8
2
97 =+ 
GRUPADOS 
 médias, a mediana pode ser agrupada em frequências sem 
istribuição de frequência. 
LASSE 
ulada imediatamente superior à metade da soma das 
lor da variável que corresponde a tal frequência acumulada. 
levisores de 50 famílias entrevistadas”. 
 
 
i xi fi Fi
1 0 3 3 
2 1 15 18 
3 2 18 36 
4 3 10 46 
5 4 4 50 
 ∑
=
n
1i
if = 50 
 
ediana é o 25,5.o elemento) 
ssui 2 televisores) 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
24
3.6.2.2 COM INTERVALOS DE CLASSE 
 
Neste caso, deve-se realizar os seguintes passos: 
 
a) calcular as frequências acumuladas; 
b) calcular a posição da mediana: p = 
2
N 
c) determinar a classe na qual se encontra a mediana: a classe mediana (a classe 
correspondente à frequência acumulada imediatamente superior a p = 
2
N ). 
d) determinar o limite inferior da classe mediana: Linf 
e) determinar a amplitude do intervalo da classe mediana: h 
f) determinar a frequência acumulada da classe anterior à da classe mediana: Fant 
g) determinar a frequência da classe mediana: f * 
h) Determinar o valor da mediana através da expressão: 
 
 
 
f
FphLMd antinf ⎟⎠
⎞⎜⎝
⎛ −⋅+=
* 
 
 
Exemplo: Calcule a mediana para a distribuição abaixo. 
 
 
VENDAS (x 1000) APURAÇÃO fi P.M. (xi) fri Fi xifi
75 ⊢ 87 � ׀ 5 81 5/36 5 405 
87 ⊢ 99 � � П 11 93 11/36 16 1023 
99 ⊢ 111 � П 7 105 7/36 23 735 
111 ⊢ 123 � ׀ 5 117 5/36 28 585 
123 ⊢ 135 � 4 129 4/36 32 516 
135 ⊢ 147 � 4 141 4/36 36 564 
 
TOTAL 
 
36 ∑
=
k
1i
if = 36 
 ∑
=
k
1i
ifr = 1 
 ∑
=
k
1i
iifx = 3828
 
 
a) as frequências acumuladas estão ilustradas na sexta coluna; 
b) a posição da mediana: p = 
2
N = 18
2
36 = 
c) a classe mediana: [99, 111[ 
d) o limite inferior da classe mediana: Linf = 99 
e) a amplitude do intervalo da classe mediana: h = 12 
f) a frequência acumulada da classe anterior à da classe mediana: Fant = 16 
g) a frequência da classe mediana: f * = 7 
h) o cálculo da mediana: 
 
⎟⎠
⎞⎜⎝
⎛ −⋅+=
*f
FphLMd antinf = =⎟⎠
⎞⎜⎝
⎛ −⋅+
7
16181299 102,43 
 
 
 
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
25
3.7 MODA 
 
A moda (Mo) é o valor que ocorre com maior frequência em uma série de valores. Assim, o 
salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário 
recebido pelo maior número de empregados dessa fábrica. 
 
 
3.7.1 A MODA EM DADOS NÃO AGRUPADOS 
 
A moda é facilmente obtida, bastan mais se repete. 
 
Exemplo A: Na série { 1, 2, 7, 8, 9, 10. 
 
• Háséries nas quais não exis apareça mais vezes que 
outros. 
 
Exemplo B: A série { 2, 3, 5, 9
 
 
• Em outros casos, pode haver 
série tem dois ou mais valores 
 
Exemplo C: { 2, 3, 5, 5, 5, 6, 
bimodal. 
 
 .
 
.7.2 A MODA EM DADOS AGRU3
 
.7.2.1 SEM INTERVALOS DE CL3
 
Uma vez agrupados os dados, de
ariável de maior frequência. v
 
Exemplo: Seja x “o número de
quantos televisores cada família po
amílias possui? f
 
 
De acordo com a tabela acima, M
elevisores). t
 
 
 
 
do somente encontrar o valor que
 10, 10, 10, 15 } a moda é igual a 
te moda, isto é, não há um valor
, 10, 15 } não apresenta moda. A série é amodal. 
dois ou mais valores de concentração. Diz-se, então, que a 
modais. 
6, 9, 9, 9, 11, 12 } apresenta duas modas: 5 e 9. A série é 
PADOS 
ASSE 
termina-se imediatamente a moda encontrando o valor da 
 televisores”. Entrevistam-se 50 famílias para determinar 
ssui. Qual a quantidade de televisores que a maioria das 50 
o = 2 (a maioria das 50 famílias entrevistadas possui 2 
i xi fi Fi
1 0 3 3 
2 1 15 18 
3 2 18 36 
4 3 1 0 46 
5 4 4 50 
 ∑
=
n
1i
if = 50 
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
26
3.7.2.2 COM INTERVALOS DE CLASSE 
stá compreendido entre os 
mites da classe modal. Para calcular a moda é preciso determinar: 
a classe modal: Fpost 
se modal: FMo 
) o cálculo da Moda: 
 
 
A classe que apresenta a maior frequência é denominada classe modal. Pela definição, 
podemos afirmar que a moda, neste caso, é o valor dominante que e
li
 
a) a classe modal 
b) limite inferior da classe modal: Linf 
c) a amplitude do intervalo da classe modal: h 
d) a frequência da classe anterior à da classe modal: Fant 
e) a frequência da classe posterior à d
f) a frequência da clas
g
 
 
F2FF
FFhLMo antMoinf ⎟⎟
⎞
⎜⎜
⎛
−+
−⋅−=
Moantpost ⎠⎝
 
xemplo: Calcule a moda para a distribuição abaixo. 
 
 
 
E
 
VENDAS (x 1000) APURAÇÃO fi P.M. (xi) fri Fi xifi
75 ⊢ 87 � ׀ 5 81 5/36 5 405 
87 ⊢ 99 � � П 11 93 11/36 16 1023 
99 ⊢ 111 � П 7 105 7/36 23 735 
111 ⊢ 123 � ׀ 5 117 5/36 28 585 
123 ⊢ 135 � 4 129 4/36 32 516 
135 ⊢ 147 � 4 141 36 564 4/36
 
TOTAL 36 
=1i
= 36 
 ∑
=
k
1i
ifr = 1 
 ∑
=
k
1i
iifx = 3828
 ∑k if
 
a) a classe modal: [87, 99[ 
b) limite inferior da classe modal: Linf = 87 
c) a amplitude do intervalo da classe modal: h =12 
d) a frequência da classe anterior à da classe modal: Fant = 5 
e) a frequência da classe posterior à da classe modal: Fpost = 7 
se modal: FMo = 11 
) o cálculo da Moda: 
 
f) a frequência da clas
g
 
⎟⎟
⎞
⎜⎜
⎛
−+
−⋅−= antMoinf F2FF
FFhLMo
⎠⎝ Moantpost
 = ( ) =⎟⎟⎠
⎞
⎜⎜⎝
⎛
−+
−⋅−
11.275
5111287 94,2 
.8 CONSIDERAÇÕES SOBRE O EMPREGO DA MÉDIA ARITMÉTICA, MEDIANA E MODA 
na e com a 
oda. A média aritmética é a medida de posição que possui a maior estabilidade. 
 
 
3
 
A média aritmética pode ser calculada a partir de dados brutos, sem a necessidade de 
agrupamento ou ordenação dos valores originais, o que não ocorre com a media
m
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
27
A mediana é preferível à media aritmética quando: 
a) onto médio da distribuição: aquele valor que divide a 
) Quando há valores extremos que afetam de maneira acentuada a média aritmética. 
o 
entral ou quando a medida de posição deva ser o valor mais típico (comum) da distribuição. 
.9 POSIÇÃO RELATIVA DA MÉDIA, MEDIANA E MODA 
e acordo com a curva da distribuição em forma de sino, tem-se que: 
 
 
.10 SEPARATRIZES 
 quartis, os percentis e os decis – 
ssom como a mediana, são conhecidas por separatrizes. 
 os valores de uma série que dividem em quatro partes iguais. Existem, 
ortanto, três quartis. 
 
 
deseja-se conhecer exatamente o p
distribuição em duas partes iguais. 
b
 
A moda é utilizada quando deseja-se obter uma medida rápida e aproximada de posiçã
c
 
 
3
 
D
• Curva simétrica: x = Md = Mo 
• Curva assimétrica positiva: Mo < Md < x 
• Curva assimétrica negativa: x < Md < Mo
x = Md = Mo 
Curva simétrica 
xMo < Md < x < Md < Mo 
Curva assimétrica positiva Curva assimétrica negativa 
 
 
3
 
Além das medidas de posição apresentadas, existem outras que consideradas isoladamente, 
não são medidas de tendência central. Tais medidas – os
a
 
3.10.1 QUARTIS: São
p
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
28
• primeiro quartil (Q1): valor situado de tal modo na série que uma quarta parte (25%) dos 
dados é menor que ele e as três quartas partes restantes (75%) são maiores. 
• segundo quartil (Q2): coincide com a mediana (Q2 = Md). 
• terceiro quartil (Q3): valor situado de tal modo que as três quartas partes (75%) dos dados 
são menores que ele e uma quarta parte (25%) é maior. 
 
uando os dados estão agrupados, determinam-se os quartis a partir das equações: Q
 
 
 
f*
F
4
f
hLQ 
ant
i
inf1
⎟⎟
⎟⎟
⎠
⎞
⎜⎜
⎜⎜
⎝
⎛ −
⋅+=
∑
 e 
f*
F
4
f3
hLQ 
ant
i
inf3
⎟⎟
⎟⎟
⎠
⎞
⎜⎜
⎜⎜
⎝
⎛ −
⋅+=
∑
 
 
 
3.10.2 PERCENTIS: são os noventa e nove valores que separam uma série em 100 partes 
uais. Indicamos estes valores por: P , P , ...., P . ig 1 2 99
50 25 1 75 3
 
ode-se notar que: P = Md, P = Q e P = QP
 
 cálculo de um percentil é obtido pela fórmula: O
 
 
 
f*
F
100
fk
hLP 
ant
i
infk
⎟⎟
⎟⎟
⎠
⎞
⎜⎜
⎜⎜
⎝
⎛ −
⋅+=
∑
 
 
 
or exemplo, para o 32.o percentil temos: P
 
 
 
f*
F
100
f32
hLP 
ant
i
inf32
⎟⎟
⎟⎟
⎠
⎞
⎜⎜
⎜⎜
⎝
⎛ −
⋅+=
∑
 
 
 
 
 
 
CAPÍTULO 4 
MEDIDAS DE DISPERSÃO OU VARIABILIDADE 
 
4.1 INTRODUÇÃO 
 
As medidas de dispersão servem para indicar o quanto os dados de uma distribuição 
apresentam-se dispersos em torno de um valor de tendência central (média ou mediana) 
tomado como ponto de comparação. 
 
Exemplo intuitivo: Considere os seguintes conjuntos de valores das variáveis X, Y e Z: 
 
X = {80, 80, 80, 80, 80} Y = {78, 79, 80, 81,82} Z = { 15, 25, 60, 130, 170 } 
 
É possível observar que: 
• os três conjuntos apresentam a mesma média aritmética = 400/5 = 80 
• o conjunto X é mais homogêneo que Y e Z, já que todos os valores são iguais à média. 
• O conjunto Y é mais homogêneo que o conjunto Z, pois há menor diversificação entre cada 
um de seus valores e a média representativa. 
 
Logo o conjunto X apresenta dispersão nula e o conjunto Y apresenta uma dispersão menor 
ue o conjunto Z. Apresentam-se a seguir as medidas de dispersão. q
 
 
.2 AMPLITUDE TOTAL 4
 
É a única medida de dispersão que não tem na média o ponto de referência. É a diferença 
ntre o maior e o menor valor observado: AT = X - X . e máx mín
X Y Z
 
.2.1 DADOS NÃO AGRUPADOS 4
 
xemplo: Considere os conjuntos X, Y e Z apresentados anteriormente. A amplitude total será: E
 
T = 80 – 80 = 0 AT = 82 – 78 = 4 AT = 170 – 15 = 155. A
 
 
.2.2 DADOS AGRUPADOS 4
 
.2.2.1 SEM INTERVALOS DE CLASSE: neste caso ainda temos: 4
 
xemplo: Considere a variável x como sendo “o número de TVs de 50 famílias entrevistadas”. 
AT = X - X .máx mín
E
 
i xi fi fri Fi xifi
1 0 3 0,06 3 0 
2 1 15 0,30 18 15 
3 2 18 0,36 36 36 
4 3 10 0,20 46 30 
5 4 4 0,08 50 16 
 ∑
=
n
if
1i 1i 1i
= 50 ∑
=
n
ifr =1,00
 
i
n
ifx∑
=
=97
Assim, temos que: 
 
AT = 4 – 0 = 4 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
30
4.2.2.2 COM INTERVALOS DE CLASSE: 
 
A amplitude total é a diferença entre o limite superior da últimaclasse e o limite inferior da 
primeira classe. 
AT = Lmáx - lmín. 
 
Exemplo: Considere a distribuição abaixo. 
 
VENDAS (x 1000) fi
75 l⎯ 87 5 
87 l⎯ 99 11 
99 l⎯ 111 7 
111 l⎯ 123 5 
123 l⎯ 135 4 
135 l⎯ 147 4 
 
TOTAL ∑k if = 36 
AT = 147 – 75 = 72.000 unidades 
 
4.3 DESVIO MÉDIO 
 
Desvio médio ou média dos desvios é igual a média aritmética dos valores absolutos dos 
desvios tomados em relação à média ou à mediana. Apresentam-se a seguir as equações para 
calcular o desvio médio em diferentes situações. 
 
4.3.1 DESVIO MÉDIO EM RELAÇÃO À MÉDIA 
 
a) para dados não agrupados: 
n
xx
D
n
1i
i
x
∑
=
−
= 
 
b) para dados agrupados: 
∑
∑
=
=
•−
= n
1i
i
k
1i
ii
x
f
fxx
D 
 
 
4.3 ÃO À MEDIANA 
 
a) p
Mdx
D
k
1i
i∑
=
−
= 
 
b) p
.2 DESVIO MÉDIO EM RELAÇ
ara dados não agrupados: 
nMd
ara dados agrupados: 
∑
∑
=
=
•−
= k
1i
i
k
1i
ii
Md
f
fMdx
D 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
31
4.4 DESVIO PADRÃO (S) 
 
É a medida de dispersão mais utilizada na Estatística. Esta medida representa a raiz quadrada 
da média aritmética dos quadrados dos desvios, sendo estes desvios tomados em relação à 
média aritmética. As inferências estatísticas podem ser realizadas considerando-se toda a 
população ou uma amostra desta (caso mais freqüente na estatística). Apresentam-se a seguir 
as expressões para calcular o desvio padrão. 
 
4.4.1 DADOS NÃO AGRUPADOS 
 
a) Desvio padrão populacional: 
( )
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
⎟⎟⎠
⎞⎜⎜⎝
⎛
−=
−
= ∑ ∑∑
=
==
n
1i
2n
1i
i
2
i
n
1i
2
i
n
x
x
n
1
n
xx
S
 
b) Desvio padrão amostral: 
( )
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
⎟⎟⎠
⎞⎜⎜⎝
⎛
−−=−
−
= ∑ ∑∑
=
==
n
1i
2n
1i
i
2
i
n
1i
2
i
n
x
x
n
1
n
xx
S
11
 
 
4.4.2 DADOS AGRUPADOS 
 
a) Desvio padrão populacional: 
( )
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
⎟⎟⎠
⎞⎜⎜⎝
⎛
−=
⋅−
= ∑ ∑∑
=
==
k
1i
2k
1i
ii
i
2
i
k
1i
i
2
i
n
fx
fx
n
1
n
fxx
S
 
b) Desvio padrão amostral: 
( )
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
⎟⎟⎠
⎞⎜⎜⎝
⎛
−⋅−=−
⋅−
= ∑ ∑∑
=
==
k
1i
2k
1i
ii
i
2
i
k
1i
i
2
i
n
fx
fx
1n
1
1n
fxx
S
 
 
 
4.4.3 OBSERVAÇÕES 
 
a) observe que quando a inferência abrange toda a população, o divisor nas expressões é n. 
Caso seja considerada uma amostra da população, o divisor é n –1. 
 
b) as expressões expandidas são mais práticas e frequentemente utilizadas para facilitar o 
cálculo computacional. 
 
c) Somando-se (ou subtraindo-se) uma constante k a (de) todos os valores de uma variável, o 
desvio padrão não se altera: 
xyii SS kxy =⇒±= 
 
d) Multiplicando-se todos os valores de uma variável por uma constante k (k diferente de 
zero), o desvio padrão é multiplicado por esta constante: 
 
xii Sk xky ⋅⇒⋅= 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
32
4.5 VARIÂNCIA (S2) 
 
Em termos práticos, a variância representa o quadrado do desvio padrão. Esta medida de 
dispersão em geral tem pouca utilidade na Estatística Descritiva, mas é extremamente 
importante para a Estatística Indutiva e em combinações de amostras. 
 
Analogamente ao desvio padrão, a variância é calculada considerando-se o agrupamento de 
dados (não agrupados ou agrupados) e os dados (populacional ou amostral). 
 
 
4.5.1 DADOS NÃO AGRUPADOS 
 
a) Variância populacional: 
( )
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
⎟⎟⎠
⎞⎜⎜⎝
⎛
−=
−
= ∑ ∑∑
=
==
n
1i
2n
1i
i
2
i
n
1i
2
i
2
n
x
x
n
1
n
xx
S
 
 
b) Variância amostral: 
( )
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
⎟⎟⎠
⎞⎜⎜⎝
⎛
−−=−
−
= ∑ ∑∑
=
==
n
1i
2n
1i
i
2
i
n
1i
2
i
2
n
x
x
n
1
n
xx
S
11
 
 
4.5.2 DADOS AGRUPADOS 
 
a) Variância populacional: 
( )
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
⎟⎟⎠
⎞⎜⎜⎝
⎛
−=
⋅−
= ∑ ∑∑
=
== k
1i
2k
1i
ii
i
2
i
k
1i
i
2
i
2
n
fx
fx
n
1
n
fxx
S
 
 
b) Variância amostral: 
( )
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
⎟⎟⎠
⎞⎜⎜⎝
⎛
−−=−
⋅−
= ∑ ∑∑
=
== k
1i
2k
1i
ii
i
2
i
k
1i
i
2
i
2
n
fx
fx
1n
1
1n
fxx
S
 
 
 
4.6 COEFICIENTE DE VARIAÇÃO (CV) 
 
É definido como o quociente entre o desvio padrão e a média aritmética. É frequentemente 
expresso em porcentagem. ( )
x
xSCV = 
 
Sua vantagem é caracterizar a dispersão dos dados em termos relativos ao seu valor médio. 
Assim, uma pequena dispersão absoluta pode ser, na verdade, considerável quando 
comparada com a ordem de grandeza dos valores da variável e vice-versa. 
 
 
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
33
4.7 EXEMPLOS 
 
Nos exemplos a seguir apresentam-se os cálculos das medidas de dispersão apresentadas 
neste capítulo. 
 
4.7.1 DADOS NÃO AGRUPADOS: Seja o conjunto de dados X = { 15, 25, 60, 130, 170 } 
 
Para resolver este exemplo, elabora-se uma tabela que auxiliará o cálculo das medidas de 
tendência central e das medidas de dispersão apresentadas nos capítulos 3 e 4, 
respectivamente. 
 
xi xxi − xx i − Mdxi − Mdxi− 2ix 
15 -65 65 -45 45 225 
25 -55 55 -35 35 625 
60 -20 20 0 0 3600 
130 50 50 70 70 16900 
170 90 90 110 110 28900 
Σ = 400 Σ =280 Σ =260 Σ =50250 
 
 
Medidas de tendência central (vide capítulo 3): 
a) Média Aritmética: 80
5
400
n
x
x
n
1i
i
===
∑
= 
 
b) Mediana: Md = 60 ( o valor central da distribuição) 
 
 
Medidas de Dispersão: após o cálculo da média e da mediana, completam-se as colunas da 
tabela acima convenientemente. 
 
a) Amplitude Total: ATX = Xmáx –Xmin = 170 – 15 = 155 
 
b) Desvio Médio em relação à média: 56,00
5
280
n
xx
D
n
1i
i
x ==
−
=
∑
= 
 
c) Desvio Médio em relação à mediana: 52,00
5
260
n
Mdx
D
n
1i
i
Md ==
−
=
∑
= 
 
d) Desvio padrão: ( ) 67,55
5
40050250
4
1
n
x
x
1n
1S
2
1i
2n
1i
i
2
i =⎥⎥⎦
⎤
⎢⎢⎣
⎡ −=
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
⎟⎟⎠
⎞⎜⎜⎝
⎛
−−= ∑
∑
=
=n 
 
e) Variância: S = (67,55)2 = 4562,5 
 
f) Coeficiente de Variação: ( ) 84,44%100*
80
67,55
x
xSCV === 
 
 
 
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
34
4.7.2 DADOS AGRUPADOS SEM INTERVALOS DE CLASSE 
 
Seja x “o número de televisores de 50 famílias entrevistadas”. 
 
i xi fi fri Fi xifi xxi − ifxxi ⋅− Mdxi − ii fMdx ⋅− i2i fx ⋅ 
1 0 3 0,06 3 0 -1,94 5,82 -2 6 0 
2 1 15 0,30 18 15 -0,94 14,10 -1 15 15 
3 2 18 0,36 36 36 0,06 1,08 0 0 72 
4 3 10 0,20 46 30 1,06 10,6 1 10 90 
5 4 4 0,08 50 16 2,06 8,24 2 8 64 
 Σ = 50 Σ =1,00 Σ = 97 Σ=39,84 Σ=39,00 Σ=241 
 
 
Medidas de Posição: 
a) Média: 
∑
∑
=
== n
1i
i
n
1i
ii
f
fx
x = 50
97 = 1,94 
 
b) Mediana: 525
2
150p ,=+= (a mediana é o 25,5.o elemento) Md = 2 
 
 
Medidas de Dispersão: 
 
a) Amplitude Total: AT = Xmáx –Xmin = 4 – 0 = 4 
 
b) Desvio Médio em relação à média: 0,80
50
39,84
f
fxx
D
n
1i
i
n
1i
ii
x
==
−
=
∑
∑
=
= 
 
c) Desvio Médio em relação à mediana: 0,78
50
39,00
f
fMdx
D n
1i
i
n
1i
ii
Md ==
⋅−
=
∑
∑
=
= 
 
d) Desvio padrão: ( ) 1,04
50
97241
49
1
n
fx
fx
1n
1S
2k
1i
2k
1i
iii
2
i =⎥⎥⎦
⎤
⎢⎢⎣
⎡ −=
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
⎟⎟⎠
⎞⎜⎜⎝
⎛ ⋅
−⋅−= ∑
∑
=
= 
 
e) Variância: S = (1,04)2 = 1,08 
 
f) Coeficiente de Variação: ( ) 53,61%100*
1,94
1,04
x
xSCV === 
 
Observação: Embora o emprego do Coeficiente de Variação aparentemente seja mais 
atraente para avaliar a dispersão de uma distribuição, é conveniente ressaltar novamente que a 
o desvio padrão e a variância são de grande utilização na Estatística Indutiva. 
 
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
35
4.7.3 DADOS AGRUPADOS EM INTERVALOS DE CLASSE 
 
Considere a distribuição de frequências apresentada nos Capítulos 2 e 3. 
 
 
VENDAS (x 
1000) 
Apuração fi PM 
(xi) 
fri Fi xifi xxi − ifxxi ⋅− Mdxi − ii fMdx ⋅− i2i fx ⋅ 
75 I⎯ 87 � ׀ 5 81 5/36 5 405 -25,3 126,50 -21,43 107,15 32.805 
87 l⎯ 99 � � П 11 93 11/36 16 1023 -13,3 146,30 -9,43 103,73 95.139 
99 I⎯ 111 � П 7 105 7/36 23 735 -1,3 9,10 2,57 17,99 77.175 
111I⎯ 123 � ׀ 5 117 5/36 28 585 10,7 53,50 14,57 72,85 68.445 
123 I⎯ 135 � 4 129 4/36 32 516 22,7 90,80 26,57 106,28 66.564 
135 I⎯ 147 � 4 141 4/36 36 564 34,7 138,80 38,57 154,28 79.524 
Σ 36 36 1 3828 565,0 562,28 419652 
 
 
Medidas de tendência central: 
 
a) Média: 
∑
∑
=
== k
1i
i
k
1i
ii
f
fx
x = 
36
3828
= 106,30 
 
b) Mediana: ⎟⎠
⎞⎜⎝
⎛ −⋅+=
*f
FphLMd antinf = =⎟⎠
⎞⎜⎝
⎛ −⋅+
7
16181299 102,43 
 
 
Medidas de Dispersão: 
 
a) Amplitude Total: AT = 147.000 – 75.000 = 72.000 unidades 
 
b) Desvio Médio em relação à média: 15,69
36
565,0
f
fxx
D
n
1i
i
n
1i
ii
x
==
−
=
∑
∑
=
= 
 
c) Desvio Médio em relação à mediana: 15,62
36
562,28
f
fMdx
D n
1i
i
n
1i
ii
Md ==
⋅−
=
∑
∑
=
= 
 
d) Desvio padrão: ( ) 18,71
36
3828419652
36
1
n
fx
fx
n
1S
2k
1i
2k
1i
ii
i
2
i =⎥⎥⎦
⎤
⎢⎢⎣
⎡ −=
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
⎟⎟⎠
⎞⎜⎜⎝
⎛ ⋅
−⋅= ∑ ∑
=
= 
 
e) Variância: S = (18,71)2 = 350,06 
 
f) Coeficiente de Variação: ( ) %17,100*
106,30
18,
x
xSCV 6071 === 
 
 
 
 
 
CAPÍTULO 5 
MEDIDAS DE ASSIMETRIA E MEDIDAS DE CURTOSE 
 
5.1 ASSIMETRIA 
 
Conforme visto no Capítulo 3, a assimetria de uma distribuição pode ser verificada ao 
compararmos os valores das medidas de tendência central: média, mediana e moda. Ou seja, 
de acordo com a curva da distribuição em forma de sino, tem-se que: 
• Curva simétrica: x = Md = Mo 
• Curva assimétrica positiva: Mo < Md < x
• Curva assimétrica negativa: 
 
x < Md < Mo 
x = Md = Mo 
Curva simétrica 
Mo < Md < x x < Md < Mo 
Curva assimétrica positiva Curva assimétrica negativa 
 
5.1.1 COEFICIENTE DE ASSIMETRIA 
 
Uma das formas mais usuais de avaliar a assimetria dos dados de uma distribuição é através 
do coeficiente de assimetria de Pearson, dado por: 
 ( )
S
Mdx3As −= , onde: 
 
• Md é a mediana, e 
• S é desvio padrão. 
 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
37
Convencionalmente afirma-se que se: 
• 0,15As < , a assimetria é considerada pequena 
• 1As0,15 << , a assimetria é considerada moderada 
• 1As > , a assimetria é forte. 
 
Obs: Se o valor de As é positivo, a assimetria é positiva. A assimetria será negativa, caso 
contrário. 
 
 
5.2 CURTOSE 
 
A curtose representa o grau de achatamento de uma distribuição em relação a uma distribuição 
padrão, denominada curva normal (curva correspondente a uma distribuição teórica de 
probabilidade). Existem três tipos de curvas, segundo o grau de achatamento: 
 
• curva leptocúrtica: quando a distribuição apresenta uma curva de frequência mais 
fechada que a curva normal (ou mais aguda na parte superior). 
• curva platicúrtica: quando a distribuição apresenta uma curva de frequência mais aberta 
que a curva normal (ou mais achatada na parte superior). 
• curva mesocúrtica: é a distribuição normal propriamente dita. 
.2 COEFICIENTE DE CURTOSE 
ma fórmula para medida da curtose é: 
 
 
onvenciona-se que: 
 
 
 
 
 
 
 
 
 
 
 
 
 
mesocúrtica leptocúrtica platicúrtica 
 
5
 
U
( )
4
k ou n
1i
i
k ou n
1i
i
4
i
S
f
fxx
K
∑
∑
=
=
⋅−
=
 
C
 
• K = 3 ⇒ curva mesocúrtica 
• K > 3 ⇒ curva leptocúrtica 
• K < 3 ⇒ curva platicúrtica 
 
Introdução à Probabilidade e Estatística - IPE 
Prof. André Policani 
38
5.3 EXEMPLOS 
 
5.3.1 EXEMPLO A eja x o nú ro e e i t
 
: S “ me de tel visores d 50 famíl as entrevis adas”. 
i Xi fi fri Fi xi if xxi − ifxi ⋅−x M− dxi ii fx ⋅− Md ii f⋅2x ( ) ifx 4i x−
1 0 3 0,06 3 0 -1,94 5,82 -2 6 0 42,49 
2 1 15 0,30 18 15 -0,94 14,10 -1 15 15 11,71 
3 2 18 0,36 36 36 0,06 1,08 0 0 72 0,00 
4 3 10 0,20 4 1, 6 30 06 10,6 1 10 90 12,62 
5 4 4 0,08 50 16 2,06 8,24 2 8 64 72,03 
 Σ = 50 Σ =1,00 Σ = 97 Σ=39,84 Σ=39,00 Σ=241 Σ= 138,86 
 
 
Conforme visto anteriormente: 1,94x = Md = 2 S=1,04 
: 
 
a) Coeficiente de Assimetria
( ) ( ) -0,172,001,943Mdx3As =−=−= (moderada negativa) 
b) Coeficiente de Curtose: 
.3.2 EXEMPLO B: Considere a distribuição de frequências apresentada nos Capítulos 2 e 3. 
 
 
1,04S
 
 
5
VENDAS 
 (x 1000) 
fi PM 
(xi) 
Fi x fi i xxi − ifxxi ⋅− Mdx −i ii fMd ⋅−x ii fx ⋅ 2 ( )4 ii fxx − 
75 I⎯ 87 5 81 5 405 -25,3 126,50 -21,43 107,15 2048576,04 32.805 
87 l⎯ 9 9 11 93 16 1023 -13,3 146,30 -9,43 103,73 95.139 344190,793 
99 I⎯ 11 1 7 105 23 735 -1,3 9,10 2,57 17,99 77.175 19,99 
111I⎯ 123 5 117 28 585 10,7 53,50 14,57 72,85 68.445 65539,80 
123 I 1 32 22,7 26 7 ⎯ 135 4 29 516 90,80 ,5 106,28 66.564 1062095,14 
135 I⎯ 147 5799330,91 4 141 36 564 34,7 138,80 38,57 154,28 79.524 
Σ 36 3828 562,28 9 9319752,68 565,0 41 652 
 
Conforme visto anteriormente: 106,30x = Md= 102,43 S= 18,71 
 
a) Coef. de Assimetria:
( ) ( ) 2
71
0,6
18,
102,43106,303
S
Mdx3 =−=−= (moderada positiva) 
b) Coeficiente de Curto
As
se: 
( )
( ) 2,371,0450
138,86
S
f
fxx
K 44
k ou n
1i
i
k ou n
1i
i
4
i
==
⋅−
=
∑
∑
=
=
Curva platicúrtica 
( ) 
( ) =2,11 18,71 
9319752,68 
S 
f 
K 44 
n
1 i 
 
n
1 i 
i
4 
f i
xx i 
k ou 
k ou 
= 
⋅ 
= 
− 
∑ 
∑ 
=
= 
 36 Curva platicúrtica 
 
 
 
 
 
CAPÍTULO 6 
INTRODUÇÃO À PROBABILIDADE 
 
6.1 INTRODUÇÃO 
 
A Probabilidade é o campo da Matemática que trata do estudo dos fenômenos aleatórios. Este 
estudo é de grande importância, pois a maioria dos fenômenos de que trata a Estatística são 
de natureza aleatória ou probabilística. O conhecimento dos aspectos fundamentais do cálculo 
da probabilidades é uma necessidade essencial para o estudo da Estatística Indutiva ou 
Inferencial. 
 
 
6.2 CONCEITOS INICIAIS 
 
6.2.1 EXPERIMENTO ALEATÓRIO 
 
São fenômenos que, mesmo repetido várias vezes sob condições semelhantes, apresentam 
resultados imprevisíveis. O resultado final depende do acaso. 
 
Exemplo: Considere o lançamento de uma moeda e observação da sua face superior. Este 
experimento pode ser caracterizado por: 
 
• Poder ser realizado inúmeras vezes sob condições essencialmente iguais 
• O resultado do experimento não é conhecido “a priori”, mas todos os resultados possíveis 
podem ser conhecidos: Cara ou coroa. 
• Regularidade estatística: quando a quantidade de experimentos realizados é grande, a 
frequência de ocorrência de um resultado particular se aproxima de um valor constante. 
Assim, a regularidade estatística mostrará que a frequência de ocorrência do resultado 
“cara” se aproxima de 0,5. 
 
.2.2 ESPAÇO AMOSTRAL 6
 
É o conjunto de todos os

Outros materiais