Buscar

Apostila de Estatística

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 51 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 51 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 51 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
1 
APOSTILA DE ESTATÍSTICA DESCRITIVA 
 
1. APRESENTAÇÃO DOS DADOS 
1.1 - O que é Estatística e suas Divisões 
Para muitos a Estatística não passa de conjuntos de tabelas de dados numéricos. Mas será 
que a estatística é só isso? A Estatística originou-se com a coleta e construção de tabelas de dados 
para o governo. A situação evoluiu e esta coleta de dados representa somente um dos aspectos da 
Estatística. Hoje em dia podemos adotar a seguinte definição para a Estatística: A Estatística é uma 
ciência (ou método) baseada na Teoria das Probabilidades, cujo objetivo principal é nos 
auxiliar a tomar decisões ou tirar conclusões em situações de incerteza, a partir de 
informações numéricas. 
 
 
A coleta, o processamento, a interpretação e a apresentação de dados numéricos pertencem 
todos ao domínio da estatística. 
Essas atribuições compreendem o cálculo de pontos num campeonato, a coleta de dados 
sobre nascimentos e mortes, a avaliação da eficiência de produtos comerciais e a previsão do tempo. 
A informação estatística é apresentada constantemente no rádio e na televisão. Nosso interesse por 
fatos estatísticos é suscitado por jornais. 
A palavra estatística é usada em vários sentidos. Pode referir-se não só à simples tabulação 
de informações numéricas, como a relatórios de transações na bolsa de valores, como ao corpo de 
técnicas utilizadas para processar ou analisar dados. 
A palavra estatístico é também empregada em vários sentidos. O termo pode aplicar-se 
tanto aos que apenas coletam informações como aos que preparam análises ou interpretações; 
designa, ainda, os estudiosos que elaboraram a teoria matemática sobre a qual se fundamenta a 
estatística. 
 
 
Divisões da Estatística 
 
A Teoria Estatística moderna se divide em dois grandes campos: 
Estatística Descritiva - consiste num conjunto de métodos que ensinam a reduzir uma 
quantidade de dados bastante numerosa por um número pequeno de medidas, 
substitutas e representantes daquela massa de dados. A estatística descritiva vai 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
2 
resumi-los através do uso de certas medidas sínteses, que tornem possível a 
interpretação de resultados, No sentido mais amplo, suas funções são: 
 coleta de dados; 
 organização e classificação destes dados; 
 apresentação através de gráficos e tabelas; 
 cálculos de medidas (estatísticas), que permitem descrever resumidamente os 
fenômenos. 
Estatística Indutiva - consiste em inferir (deduzir ou tirar conclusões a respeito das) 
propriedades de um universo a partir de uma amostra. O processo de generalização, 
que é característico do método indutivo, está associado a uma margem de incerteza. 
A medida da incerteza é tratada mediante técnicas e métodos que se fundamentam na 
Teoria das Probabilidades. 
 
Exemplos de utilização: Pesquisas na Educação, Pesquisa de Mercado, Pesquisa de 
opinião pública, Ensaios de medicamentos e em praticamente todo experimento. 
A inferência estatística procura com base nos dados amostrais tirar conclusões sobre a 
população. 
 
O esquema a seguir tente sintetizar as etapas de uma pesquisa estatística: 
 
Fig. 1.1 – Etapas de uma pesquisa estatística 
 
 
 
 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
3 
1.2 - População e Amostra 
 
População - Conjunto de indivíduos, objetos ou informações que apresentam pelo menos 
uma característica comum, cujo comportamento interessa-nos analisar. Ou, em outras palavras, 
conjunto de todas as medidas, observações relativas ao estudo de determinado fenômeno. 
 
i) Deseja-se conhecer o perfil sócio-econômico dos pais dos alunos de uma escola. 
População ou universo: todos os pais dos alunos 
Características: perfil sócio-econômico 
 
ii) Deseja-se conhecer o consumo de energia elétrica em MWh nas residências da cidade de Teófilo 
Otoni no ano de 2011. 
População ou universo: todos as residências que estavam ligadas a rede elétrica em Teófilo 
Otoni, em 2011. 
Características: X = consumo anual de energia elétrica em MWh. 
 
iii) Deseja-se saber se nas indústrias situadas no Estado de Minas Gerais, em 2012, existia algum 
tipo de controle ambiental. 
População ou universo: indústrias situadas no Estado de Minas Gerais em 2012. 
Característica: X = existência ou não de algum tipo de controle ambiental na indústria. 
 
iv) Estudo sobre a precipitação pluviométrica na Região Sudeste no ano 2010. 
 População ou universo: área referente à Região Sudeste. 
Característica: X = precipitação pluviométrica. 
 
Populações finitas e infinitas: Quanto ao número de elementos, as populações podem ser 
classificadas em finita ou infinita, dependendo do número de elementos que a compõe. 
 
Exemplos : 
i) População finita: empresas do Pólo Petroquímico de Camaçari. 
ii) População infinita: as pressões atmosféricas ocorridas nos diversos pontos do Continente em 
determinado momento. 
 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
4 
Em geral, como os universos são grandes, investigar todos os elementos populacionais para 
determinarmos a característica necessita muito tempo, e/ou o custo é elevado, e/ou o processo de 
investigação leva a destruição do elemento observado, ou, como no caso de populações infinitas, é 
impossível observar a totalidade da população. Assim, estudar parte da população constitui-se um 
aspecto fundamental da Estatística. 
 
Amostra: É qualquer subconjunto da população. 
 
A Estatística ocupa-se fundamentalmente das propriedades das populações cujas 
características são passíveis de representação numérica como resultado de medições e contagens. 
Essas características da população são normalmente chamadas de variáveis. 
 
 
1.3 - Tipos de Variáveis 
 
A característica que nos interessa analisar recebe o nome de variável. As características ou 
variáveis podem ser divididas em dois tipos: qualitativas e quantitativas. 
 
 
 
 NOMINAL (SEXO, COR DOS OLHOS...) 
 
QUALITATIVA 
 
ORDINAL (CLASSE SOCIAL, GRAU DE INSTRUÇÃO...) 
 
 
 
 CONTÍNUA (PESO, ALTURA...) 
 
 QUANTITATIVA 
 
DISCRETA (NÚMERO DE FILHOS, NÚMERO DE CARROS...) 
 
 
 
Variáveis qualitativas - quando o resultado da observação é apresentado na forma de 
qualidade ou atributo. Exemplos: sexo; estado civil; grau de escolaridade; etc. 
 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
5 
Variáveis quantitativas - quando o resultado daobservação é um número, decorrente de 
um processo de mensuração ou contagem. Exemplos: número de filhos; salário mensal; altura; peso; 
idade; tamanho da família; etc. Para resumir as informações levantadas durante uma pesquisa 
usaremos a técnica e a representação mais apropriada, a depender do tipo de variável que estamos 
analisando. 
 
 
Fig. 1.2 – Natureza dos dados 
 
 
1.4 - A Estatística em Pesquisas 
 
A utilização da Estatística em pesquisas pode ser ilustrada pela “equação”: 
 
Estatística = Matemática + Português 
 
Os fatos sociais e humanos só podem ser estudados através da construção de conceitos 
expressos em determinada língua. O pesquisador deverá estabelecer uma série de variáveis 
aleatórias, definidas em Português, que devem ser adequadas a obtenção de respostas aos seus 
objetivos de estudo. Obtendo no campo os dados de uma amostra, o pesquisador deverá realizar os 
cálculos da estatística descritiva, que lhe trarão conclusões acerca desta, bem como os cálculos da 
estatística indutiva, que lhe mostrarão até que ponto tais conclusões amostrais são válidas também 
para a população pesquisada. As conclusões estatísticas necessitarão de palavras em Português para 
se transformarem em conclusões acerca do objeto de estudo, no âmbito da população delimitada 
pelo pesquisador e de acordo com o quadro conceptual anteriormente definido. 
Natureza dos Dados
Ex: número de habitantes de uma cidade
Contagens
Discreta
Ex: renda per capita de uma cidade
Medidas
Contínua
Quantitativas
Ex: grau de escolaridade
Atributos / categorias
Qualitativas
Variáveis
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
6 
O diagrama ao lado ilustra o 
processo de pesquisa estatística, com 
suas interconexões matemática x 
português. 
A importância da construção 
de um quadro conceptual está em 
que o conhecimento teórico do 
pesquisador sobre o objeto de estudo 
e seu método filosófico de obtenção 
do conhecimento não pode ser 
substituído pela análise estatística. 
Ao contrário, tal 
conhecimento deve servir para en-
quadrar a análise estatística dentro 
de uma caracterização mais 
abrangente da realidade, de forma a 
que esta esclareça situações e 
reforce ou negue argumentações 
sobre as relações de causalidade 
intrínsecas ao objeto de estudo. 
O perigo para o pesquisador 
é a substituição de seu método 
específico de obtenção de 
conhecimento por uma caricatura do 
método estatístico. 
Quando isso ocorre em pesquisas ditas “quantitativas”, as variáveis aleatórias são impostas 
como sendo “os” conceitos em estudo e procura-se estabelecer conclusões e relações estatísticas 
entre tais variáveis como sendo “as” conclusões e “as” relações existentes acerca dos conceitos. 
Ocorre que as variáveis aleatórias não são “os” conceitos em si, mas representações estatís-
ticas de aspectos desses conceitos. Em conseqüência, todo processo de substituição de conceitos por 
variáveis definidas de modo mais ou menos arbitrários retira a abrangência do método de pesquisa e 
o reduz ao método estrutural-funcionalista. 
Justamente para evitar tais perigos é que insistimos tanto em discutir a relação entre método 
filosófico, o método científico e o método estatístico. Justamente por isso, um dos principais 
Delimitação, pelo pesquisador, 
da população a ser estudada 
Definição, pelo pesquisador, 
do objeto e dos objetivos de 
pesquisa 
Para cada uma das variáveis 
aleatórias em estudo: 
 Estimação da média populacional. 
 Cálculo da margem de erro 
e nível de confiança para a média 
populacional. 
 Testes de Hipóteses 
Amostra 
 
Estatística 
Indutiva 
Conclusões sobre 
a População 
Teoria da 
Amostragem 
Estatística 
Descritiva 
Conclusões 
sobre 
a Amostra 
 
Definição do tamanho, do perfil e do 
processo de escolha dos elementos da 
amostra 
 
Cálculo da distribuição de 
frequências e das estatísticas média, 
mediana, moda, desvio padrão e 
desvio padrão da média da amostra 
para as variáveis aleatórias, tanto as 
que representam o perfil da amostra 
como as que representam as 
respostas às questões fechadas. 
 
Definição, pelo pesquisador, 
das 
variáveis aleatórias 
populacionais 
que serão estudadas 
Obtenção em campo de conjuntos de 
valores amostrais para cada uma das 
variáveis aleatórios em estudo 
Variáveis 
Aleatórias 
População 
Objetos e 
Objetivos de 
Pesquisa 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
7 
objetivos de nosso curso é habilitar os futuros profissionais ao dialogo com os estatísticos, 
necessário para o projeto, realização e análise de pesquisas que envolvam técnicas estatísticas. 
Assim, uma vez definidos os principais conceitos de estatística, voltemos a examinar agora 
de uma forma mais aprofundada, como o método dessa ciência se enquadra na teoria mais geral de 
construção do conhecimento humano. 
Seja X uma variável aleatória que representa uma característica em estudo de certa po-
pulação. Queremos estudar o comportamento dessa característica, mas não podemos, por razões de 
economia, obter os valores populacionais de X. Contornamos essa dificuldade retirando uma 
amostra representativa da população e obtemos um certo número de valores amostrais de X. Cal-
culamos, através dos valores amostrais, as estatísticas descritivas de X. 
O método estatístico é materialista, pois parte de fatos materiais (estatísticas descritivas da 
amostra) para estabelecer teorias (modelos probabilísticos) e não ao contrário. E é dialético, pois 
trabalha com o movimento das idéias, ao contrário de supor que as idéias são algo estático. Uma 
vez estabelecidas as idéias que representam a realidade material (modelos probabilísticos), o 
método estatístico realiza transformações nessas idéias (cálculos de probabilidade) que possibilitam 
a previsão de futuros comportamentos materiais. E se os comportamentos previstos não ocorrem, os 
modelos são criticados e substituídos por outros mais adequados, permitindo a evolução da ciência. 
Permitindo que se chegue a conclusões acerca do todo a partir do estudo de uma fração 
desse todo, a Estatística torna economicamente possível uma série de estudos que não o seriam sem 
ela. Fundamentalmente nisso é que reside sua importância perante a construção do conhecimento 
humano, como ferramenta à disposição das diversas ciências. 
É importante o estudante compreender perfeitamente a metodologia estatística pois tal 
compreensão lhe servirá não apenas para a realização de estudos e pesquisas próprios, mas também 
para desmascarar toda uma série de manipulações que se utilizam da Estatística para impingir à 
população, como verdadeiras, conclusões falsas. 
De fato, a importância de qualquer cidadão compreender o método estatístico está na razão 
direta da necessidade de explicarmos, com palavras simples e compreensíveis à grande maioria do 
povo brasileiro, o quão mentirosas e a serviço de quem tais “pesquisas estatísticas” estão. 
 
1.5 - Usos e Abusos da Estatística 
 
As aplicações da estatística se desenvolveram de tal forma que, hoje, praticamente todo 
campo de estudo se beneficia da utilização de métodos estatísticos. O estudo da estatísticatorna o 
leitor mais crítico em sua análise de informações, e menos sujeito a afirmações enganosas, como as 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
8 
que se acham comumente associadas a pesquisas, gráficos e médias. È importante reconhecer dados 
estatísticos distorcidos e interpretar inteligentemente dados que se apresentam sem distorção. 
Não é de hoje que ocorrem abusos com a estatística. Alguns dos que abusam da estatística o 
fazem simplesmente por descuido ou ignorância; outros, porém, têm objetivos pessoais, 
pretendendo suprimir dados desfavoráveis enquanto dão ênfase aos dados que lhes são favoráveis. 
Existem diversas maneiras como os dados podem ser distorcidos: 
 pequenas amostras; 
 números precisos; 
 estimativas por suposição; 
 porcentagens distorcidas; 
 cifras parciais; 
 distorções deliberadas; 
 perguntas tendenciosas; 
 gráficos enganosos; 
 pressão do pesquisador; 
 más amostras. 
 
O Que Podemos Concluir desta Pesquisa? 
 
O programa de televisão ABC-Nightline realizou uma pesquisa em que solicitava a opinião 
dos espectadores sobre a permanência, ou não, da sede das Nações Unidas nos EUA. Para 
responder, os espectadores deviam pagar 50 centavos (americanos) para fazer uma chamada 
telefônica. Dos 186.000 que responderam, 67% disseram que a sede da ONU devia sair dos EUA. 
Com base nesses resultados amostrais, o que podemos concluir sobre a opinião da população 
americana, sobre a permanência ou não da sede da ONU nos EUA? 
 
 
1.6 - Planejamento de Experimentos 
 
Os estudos que utilizam métodos estatísticos vão desde os que são bem concebidos e 
executados, dando resultados confiáveis, aos que são concebidos deficientemente e mal executados, 
levando a conclusões enganosas e sem qualquer valor real. 
Todo problema estatístico envolve: 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
9 
 Uma clara definição dos objetivos da experiência e da população associada. 
 Projeto de experiência (procedimento amostral). 
 Coleta e análise de dados. 
 Procedimento a tomar, a fim de realizar inferências acerca da população, tomando-se como 
base as informações contidas na amostra. 
 Provisão de uma medida da confiabilidade de uma inferência a ser realizada. 
 
É extremamente importante notar que os passos que conduzem à solução de um problema 
estatístico são seqüenciais; isto é, deve-se identificar a população de interesse e planejar como 
coletar os dados antes de obtê-los e analisá-los. 
Dados coletados de forma descuidada podem ser tão inúteis que nenhum processamento 
estatístico consegue salvá-los. 
 
As amostragens efetuadas a partir de projetos pouco significativos freqüentemente produzem 
dados de pouco ou nenhum valor. Por isso, após realizada uma inferência, deve-se analisá-la com 
olho crítico, nunca se esquecendo de obter uma medida acerca da sua confiabilidade. 
 
Fig. 1.3 – Divisões da Estatística e suas inter-relações 
 
1.7 - Amostragem 
 O conhecimento de fatos que afetam a convivência sócio-econômica numa comunidade 
influi sempre na tomada de decisão de um indivíduo em todos os aspectos de sua vida e de sua 
família. Quando um indivíduo escolhe um mecânico para fazer revisão de seu carro, um médico 
População
características
Amostra
Técnicas de Amostragem
Análise
Descritiva
Conclusões
sobre as
características
da população
Informações contidas
nos dados
Inferência
Estatística
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
10 
para uma consulta, um dentista para fazer um tratamento dentário específico ou mesmo um 
restaurante para jantar, alguma informação ele utiliza para nortear sua escolha. Percebe-se, portanto 
que as pessoas utilizam no dia a dia resultados de amostragens que são realizadas quase sempre, 
imperceptivelmente. 
Quando o comércio e a indústria se baseiam em levantamentos por amostragem para decidir 
sobre os investimentos a serem feitos e em seus empreendimentos geralmente obtém sucesso. A 
pesquisa de mercado é fundamental. 
Para que um levantamento por amostragem tenha sucesso, é importante que se conheça 
profundamente a população. A amostragem apresenta várias vantagens em relação ao censo: custo 
reduzido, maior rapidez, maior amplitude e maior exatidão. O sucesso de um levantamento por 
amostragem está na dependência direta do seu adequado planejamento. 
Um dos erros mais graves consiste em uma forma inadequada de coleta de dados. Vamos 
descrever então os métodos mais comuns de amostragem: 
1.7.1 - Amostragem Aleatória Simples: os elementos de uma população são escolhidos de tal 
forma que cada um deles tenha igual chance de figurar na amostra. Este tipo de amostragem é 
recomendado para estudo de populações homogêneas. As amostras aleatórias podem ser escolhidas 
por diversos métodos, inclusive a utilização de tabelas de números aleatórios e de computadores 
para gerar números aleatórios. 
 
 
 
 
 
 
 
 
Fig. 1.4 – Amostragem Aleatória Simples 
 
1.7.2 - Amostragem Aleatória Estratificada: quando a população for heterogênea não se deve 
usar a amostra aleatória simples devido à baixa precisão das estimativas obtidas. Nesta situação, 
deve-se subdividir a população em, no mínimo, duas subpopulações (ou estratos) que compartilham 
das mesmas características (como sexo) e, em seguida, extrair uma amostra de cada estrato. 
Costuma-se usar a amostragem estratificada para reduzir a variação nos resultados. 
 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
11 
 
 
 
 
 
 
Fig. 1.5 – Amostragem Aleatória Estratificada 
 
1.7.3 - Amostragem Sistemática: é uma variação da amostragem aleatória simples. Sua aplicação 
exige que a população esteja devidamente ordenada. Nesta situação, escolhe-se um ponto de 
partida, e seleciona-se cada k
ésimo
 elemento (como por exemplo cada 10º elemento) da população. 
Apresenta as seguintes vantagens em relação a amostragem aleatória simples: 
 maior simplicidade no processo de seleção dos elementos, pois definido o primeiro elemento 
da amostra, os demais já estarão definidos; 
 distribuição mais uniforme na população podendo levar a uma maior representatividade. 
 
 
 
 
 
 
Fig. 1.6 – Amostragem Sistemática 
 
1.7.4 - Amostragem por Conglomerado: utilizada quando a população é muito dispersa. Neste 
caso, divide-se a população em seções (ou conglomerados); em seguida escolhe-se algumas seções 
e, finalmente, toma-se todos os elementos das seções escolhidas. Este método é muito mais rápido e 
menos dispendioso. É extremamente usada pelo governo e por organizações particulares de 
pesquisa. 
 
 
 
 
 
Fig. 1.7 – Amostragem por Conglomerado 
______________________________________________________________________________________________________________Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
12 
1.7.5 - Amostragem por Conveniência: utiliza-se de resultados de fácil acesso ou que já estão 
disponíveis. Apresentam-se bastante tendenciosos. 
“Não importa quão bem planejemos e executemos o processo de coleta de amostras, há 
sempre a possibilidade de um erro nos resultados. Um erro amostral é a diferença entre um 
resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuações 
amostrais aleatórias.” 
 Se extrairmos uma amostra cuidadosamente, de forma que ela represente a população, 
podemos aplicar os métodos acima para analisar o erro amostral, mas devemos ter o máximo 
cuidado em minimizar os erros não-amostrais. 
1.8 - Apresentação Gráfica de Dados 
Após a apuração, há a necessidade de dispor os dados e os resultados obtidos a partir deles 
em uma forma ordenada e resumida, a fim de auxiliar o pesquisador na análise e facilitar a 
compreensão das conclusões apresentadas ao leitor. Os dados e os resultados são então apresentados 
na forma de tabelas. 
Uma tabela possui elementos essenciais, tais como: 
Título – é obrigatório. Deve ser colocado na parte superior da tabela. 
Corpo da tabela – é o conjunto de linhas e colunas onde se encontram as informações sobre o fato 
observado. 
Cabeçalho – é a parte superior da tabela, onde se especifica o conteúdo de cada coluna. 
Coluna indicadora – é a parte da tabela em que se especifica o conteúdo de cada linha. 
Fonte – é a indicação da entidade responsável pelo fornecimento ou elaboração dos dados. É 
colocado no fim da tabela. 
Tab. 1.1: Ranking das torcidas no futebol brasileiro 
Clubes Porcentagem de torcedores (%) 
A 15 
B 11 
C 7 
D 6 
E 5 
F 4 
G 4 
H 3 
I 3 
J 2 
K 2 
L 2 
Fonte: Rede Globo, 06 de jan. de 2011 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
13 
Os dados estatísticos, apresentados em tabelas, também podem ser expostos em gráficos. 
Desde que não haja necessidade de grande precisão, os gráficos dão, melhor do que as tabelas, visão 
de tendências e ajudam a interpretar um fenômeno. 
Tabelas, gráficos e medidas podem ser utilizados para descrever ou explorar um conjunto de 
dados, ou comparar dois ou mais conjuntos. 
Gráfico de Barras: usado para apresentar séries cronológicas, geográficas e categóricas. É mais 
comum a apresentação das barras em posição vertical, conforme representado na Fig. 1.8. 
No entanto, as barras em posição horizontal facilitam a identificação das categorias, 
principalmente nos casos em que essas categorias têm nomes muito longos. 
Gráfico de Barras Vertical: facilidade de identificação das categorias, conforme representado na 
Fig. 1.9. 
Ranking das torcidas 
 
 Porcentagem de torcedores 
 
Ranking das torcidas 
 
 
 Fonte: Rede Globo, 06 de jan. de 2011 Fonte: Rede Globo, 06 de jan. de 2011. 
 Fig. 1.8 – Gráfico de barras Fig. 1.9 – Gráfico de barras vertical 
 
Gráfico de Setores: usado para comparar proporções, conforme representado pela Fig. 1.10. 
Gráfico de Linhas: usado para apresentar séries cronológicas, conforme representado pela Fig. 
1.11. 
Fonte: não identificada Fonte: Revista Veja, 14 de jan. de 2008 
Fig. 1.10 – Gráfico de setor Fig. 1.11 – Gráfico de linhas 
Consumo de refrigerantes 
38%
26%
18%
10%
8%
Coca-Cola
Guaraná
Antártica
Fanta
Sprite
Outros
Os brasileiros de férias no exterior
4,2
2,9 2,9
2,3
1,7 1,9
0
1
2
3
4
5
1 2 3 4 5 6
Ano
M
ilh
õe
s d
e v
ia
ja
nt
es
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
14 
Gráficos Comparativos: são desenhados dois gráficos, lado a lado, para melhor estabelecer a 
comparação de um fenômeno, conforme representado na Fig. 1.12. 
 
Fonte: Folha de São Paulo, 12 de jan. de 2004 
Fig. 1.12 – Gráfico comparativo 
 
Através das tabelas e gráficos, o educador está capacitado a entender o complexo 
educacional (matrícula, escolarização, aprovação, repetência, evasão, ...), ver a evolução dos 
fenômenos relevantes, decidir sobre as prioridades, programar e executar seu planejamento. 
Os dados também podem ser estudados pela distribuição de freqüência, histograma e 
polígono de freqüência. 
 
 
1.9 - Exercícios 
 
1. Identifique cada número como discreto ou contínuo: 
a) Cada cigarro tem 16,13 mg de alcatrão. 
b) O altímetro de um avião da VARIG indica uma altitude de 21.359 pés. 
c) Uma pesquisa efetuada com 1015 pessoas indica que 40 delas assinam a revista X. 
d) De 1000 consumidores pesquisados, 930 reconheceram a marca da “Coca-Cola”. 
 
2. Uma pessoa foi encarregada de pesquisar o reconhecimento da marca Nike, devendo 
contactar por telefone 1500 consumidores. Por que razão é incorreta a utilização de listas 
telefônicas como população para fornecer a amostra? 
 
As universidades e o cumprimento da LDB
0,00%
10,00%
20,00%
30,00%
40,00%
50,00%
60,00%
70,00%
80,00%
90,00%
100,00%
1 2 3
Situação das Instituições
Po
rc
en
ta
ge
m
Privadas
Públicas
Total
Situações das Instituições: 
1 – Com ao menos 1/3 do corpo docente 
trabalhando em regime integral. 
2 - Com ao menos 1/3 do corpo docente 
com título de mestre ou doutor 
3 – Têm menos de três cursos de pós-
graduação recomendados pela Capes 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
15 
 
3. Um relatório patrocinado pela Florida Citrus Comission concluiu que os níveis de colesterol 
podem ser reduzidos mediante ingestão de produtos cítricos. Por que razão a conclusão 
poderia ser suspeita? 
4. Identifique o tipo de amostragem utilizado: 
a) Um psicólogo de uma Universidade seleciona 12 homens e 12 mulheres de cada uma 
das quatro turmas de inglês. 
b) Um cabo eleitoral escreve o nome de cada vereador da cidade, em cartões separados, 
mistura-se e extrai 3 nomes. 
c) Um pesquisador médico da USP entrevista todos os portadores de leucemia em cada 
um dos 20 hospitais selecionados aleatoriamente. 
d) A empresa Sony seleciona cada 200º CD de sua linha de produção e faz um teste de 
qualidade rigoroso. 
e) Um professor seleciona 15% de mulheres e 15% de homens de uma turma para 
responder a uma pergunta. 
f) A supervisora escolhe dentre os 28 professores, 3 para representar a escola em um 
evento na cidade. 
 
5. Uma população se encontra dividida em três estratos, com tamanhos, respectivamente, A = 
80, B = 120 e C = 60. Ao se realizar uma amostragem estratificada proporcional, 12 
elementos da amostra foram retirados do primeiro estrato. Qual é o número de elementos da 
amostra? 
6. Uma amostragem entre os moradores de uma cidade é realizada da seguinte forma: em cada 
bairro, sorteia-se um certo número de quarteirões proporcional à área do bairro; de cada 
quarteirão, são sorteadas cinco residências, cujos moradores são entrevistados. 
a) Essa amostra será representativada população ou poderá apresentar algum vício? 
b) Que tipo de amostragem foram usados no procedimento? Justifique. 
 
7. Discuta sobre o planejamento de um experimento enfatizando a importância dos métodos de 
boa amostragem. 
 
8. (ENEM/98) Uma pesquisa de opinião foi realizada para avaliar os níveis de audiência de 
alguns canais de televisão, entre 20h e 21h, durante uma determinada noite. Os resultados 
obtidos estão representados no gráfico de barras abaixo. 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
16 
 
 
 
 
 
 
 
 
 
 
Fig. 1.13 - Nº de residências ligadas em um determinado canal de TV, entre 20h e 21h, durante uma noite. 
 
I) O número de residências atingidas nessa pesquisa foi aproximadamente de: 
a) 100 b) 135 c) 150 d) 200 e) 220 
II) A porcentagem de entrevistados que declararam estar assistindo ao canal B é aproximadamente: 
a) 15% b) 20% c) 22% d) 27% e) 30% 
 
9. O quadro abaixo apresenta o número de novos casos de AIDS notificados anualmente no 
Brasil no período considerado: 
 
 
 
 
 
 
 
 
 
Fig. 1.14 - Número de novos casos de AIDS notificados anualmente no Brasil 
 
As informações contidas no gráfico permitem concluir corretamente que, no período 
considerado: 
a) a partir de 1997, certamente caiu o número de novos casos de aidéticos; 
b) o número aproximado de aidéticos no país, em 1997, era de 112.000; 
 Nº de residências 
 100 
 
 80 
 
 60 
 
 
 40 
 
 20 
 
 
 0 A B C D nenhum 
20.000 
 
18.000 
 
 
16.000 
 
14.000 
 
 
12.000 
 
10.000 
 1991 1992 1993 1994 1995 1996 1997 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
17 
c) a maior taxa de variação no número de aidéticos ocorreu em 1996; 
d) a maior taxa de variação no número de aidéticos ocorreu em 1992; 
e) o número máximo de aidéticos ocorreu em 1996. 
 
10. No gráfico de colunas dos resultados do Proeb 2000 e do SAEB 99 para o 1º Ano do Ciclo 
Intermediário (4ª Série) do Ensino Fundamental, é CORRETO afirmar que: 
a) O rendimento em Matemática foi inferior ao de Português no Proeb 2000. 
b) O rendimento em Português foi superior ao de Matemática no SAEB 99 – MG. 
c) O rendimento em Matemática foi superior ao de Português em todas as fases. 
d) O rendimento em Português foi superior ao de Matemática em todos os programas de 
avaliações. 
 
11. Os empregados na Eletronics Associates estão num sistema de horário flexível: eles podem 
começar seu dia de trabalho às 7h, 7h30, 8h ou 9h. Os seguintes dados representam uma 
amostra do horário de início escolhido pelos empregados: 
7h 8h30 9h 8h 7h30 7h30 8h30 8h30 7h30 7h 
8h30 8h30 8h 8h 7h30 8h30 7h 9h 8h30 8h 
 Construa uma tabela para representar os dados acima. 
(Adaptado do livro “Estatística Aplicada à Administração e Economia”, de David R. Anderson et al. Ed. 
Pioneira, 2002). 
 
12. Faça um gráfico de barras e um de pizza para representar os dados do exercício 11. 
 
Resultados do Proeb 2000 e do SAEB 99 para o 1º Ano do Ciclo Intermediário (4ª 
Série) do Ensino Fundamental
155
160
165
170
175
180
185
190
195
200
205
Português Matemática
Proeb 2000 - Regular
SAEB 99 - MG Estadual
SAEB 99 - MG 
SAEB 99 - Brasil
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
18 
13. Imagine que foi obtida a opinião de 1000 pessoas a respeito da liberação de determinado 
filme para exibição em televisão. Dessas 1000 pessoas, 432 mostravam-se favoráveis, 322 
eram contrárias, 122 não quiseram declarar opinião e as restantes disseram não ter opinião 
formada. Mostre esses dados numa tabela. 
 
14. Faça um gráfico de setores levando em conta os dados do exercício 13. 
 
15. Faça um gráfico de barras para apresentar os valores de densidade demográfica, segundo a 
região. 
Tab. 1.2: Densidade Demográfica no Brasil, segundo a região, 
de acordo com o censo de 1980 
Região Densidade (hab./km
2
) 
Norte 1,65 
Nordeste 22,57 
Sudeste 56,31 
Sul 33,86 
Centro-Oeste 4,01 
 FONTE: IBGE (1984) 
16. Construa um gráfico de linhas para mostrar que, na Escola de 1º Grau “D. Pedro II”, a taxa 
de evasão escolar (porcentagem de alunos que abandonaram a escola) foi 12,1; 11,3; 10,7; 
15,0; 14,7 e 10,1 em 1980, 1981, 1982, 1983, 1984 e 1985, respectivamente. 
17. Os principais mercados emissores de turista para o Brasil em 1998 estão relacionados na 
tabela abaixo. Obtenha o gráfico em: a) barra; b) barra vertical 
 
Tab. 1.3: Principais mercados emissores de turistas para o Brasil (1998) 
 
Fonte: Embratur 
Países Turistas (%) 
Argentina 31 
Estados Unidos 11 
Paraguai 9 
Uruguai 7 
Alemanha 5 
Itália 4 
Chile 3 
Bolívia 3 
França 3 
Portugal 2 
Inglaterra 2 
Outros 20 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
19 
 
18. Aberta e fechada são dois tipos de questões de uma pesquisa. Uma questão aberta permite 
uma resposta livre, enquanto uma questão fechada apenas uma resposta fixa. Quais são as 
vantagens e desvantagens das questões abertas? E das fechadas? Que tipo é mais fácil de 
analisar com processos estatísticos formais? 
 
19. Elaborar uma questão(ões) aberta(s) ou fechada(s) sobre o tema: Importância da Pesquisa de 
Mercado. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
20 
2. REPRESENTAÇÃO GRÁFICA E DISTRIBUIÇÃO DE FREQÜÊNCIA 
 
2.1 – Introdução 
Ao estudarmos grandes conjuntos de dados, é conveniente organizá-los e resumi-los, 
construindo uma tabela de freqüências. A título de ilustração, considere o exemplo a seguir, de 
dados brutos, relativo ao tempo de parada (em minutos) de uma máquina para manutenção (Tab. 
2.1). 
 A construção de uma distribuição de freqüência consiste na elaboração de classes a partir de 
intervalos, fixando um número adequado de classes. 
 
Tab. 2.1 - Tempo de parada (em minutos) de uma máquina para manutenção 
7 3 4 9 5 
8 5 3 8 7 
9 3 1 9 9 
5 77 10 3 
4 8 8 8 7 
8 8 9 3 8 
6 10 7 7 9 
9 9 7 8 1 
O primeiro procedimento a ser tomado para a elaboração de uma distribuição de freqüências 
de uma variável contínua consiste na ordenação dos dados (rol), para permitir uma melhor 
manipulação (Tab. 2.2). 
 
Tab. 2.2 - Tempo de parada (em minutos) de uma máquina para manutenção 
1 4 7 8 9 
1 5 7 8 9 
3 5 7 8 9 
3 5 7 8 9 
3 6 7 8 9 
3 7 8 8 9 
3 7 8 9 10 
4 7 8 9 10 
 
 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
21 
2.2 – Distribuição de Freqüências 
A precisão de medida corresponde ao menor valor detectável pelo instrumento ou 
procedimento de medida empregado. No exemplo dos tempos de parada, a precisão de medida é x 
= 1. Deve-se atentar que os valores presentes no conjunto de dados não são exatos, mas carregam 
alguma inexatidão devido à precisão de medida. Assim, um valor de 5 não representa 
necessariamente uma nota de exatamente 5, mas sim uma nota que pode estar acontecendo em 
qualquer ponto entre 4,5 e 5,5. 
A elaboração de uma distribuição de freqüência para variáveis contínuas requer a 
apresentação de alguns conceitos: 
 
1 – Amplitude: corresponde à diferença entre o maior e o menor valor de um conjunto de dados. 
Em geral, é simbolizada por “A”. 
 
2 - Amplitude de Classe: consiste na diferença entre o limite superior e o limite inferior de uma 
classe em uma distribuição de freqüência. Será aqui simbolizada por “c”. 
 
 A seguir, temos o algoritmo para obtenção de uma distribuição de freqüência relativa à uma 
variável contínua. 
 
Passo 1 – Escolhe-se um número de classes k. É importante que a distribuição conte com um 
número adequado de classes. Se esse número for escasso, os dados originais ficarão tão 
comprimidos que pouca informação poderá ser extraída desta tabela. Se, por outro lado, forem 
utilizadas muitas classes, haverá algumas com freqüência nula ou muito pequena, apresentando uma 
distribuição irregular e prejudicial à interpretação do fenômeno. 
Para determinar o número de classes há diversos métodos. Veremos dois deles: 
 
(1) k = 5, para n  25 e 
 
 para n > 25, utiliza-se a 
(2) Fórmula de Sturges: k = 1 + 3,3 log n, onde n é o tamanho da amostra. 
 Ex: Se n = 49 teríamos: 
(1) k = 7 
(2) k = 1 + 3,3 log 49 = 6,58  7 
nk 
 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
22 
Mesmo tendo outros critérios de determinação do número de classes, o que se deve ter em 
mente é que a escolha dependerá, sobretudo da natureza dos dados e da unidade de medida em que 
eles se encontram, e não somente de regras muitas vezes arbitrárias e pouco flexíveis. Para facilitar 
a análise é conveniente que se mantenham os intervalos de classe sempre constantes. 
Passo 2 – Calcula-se a amplitude total A dos dados: A = MVO – mvo onde MVO: maior valor 
observado e mvo: menor valor observado; 
Passo 3 – Calcula-se a amplitude de classe c, através de: fazendo o arredondamento igual ao 
número de casas decimais dos dados. 
 
 
Passo 4 – O limite inferior LI1 da 1ª classe é obtido por: LI1 = mvo - x/2 
Passo 5 - O limite superior LS1 da 1ª classe é obtido por: LS1 = LI1 + c 
sendo que LS1 = LI2 e assim, sucessivamente – soma-se ao valor do limite inferior da primeira 
classe a amplitude de classe e obtém-se o limite superior, sendo o limite superior da primeira classe 
o inferior da segunda; 
Passo 6 – Construídas as classes, são contados quantos dados estão em cada classe (freqüências 
absolutas de cada classe); 
Obs: a frequência absoluta (fa) é o número de repetições de um valor individual ou de uma classe 
de valores da variável. 
Passo 7 - São calculadas as freqüências relativas e percentuais de cada classe. 
Obs: a frequência relativa (fr) representa a proporção de observações de um valor individual ou de 
uma classe, em relação ao número total de observações. Trata-se, portanto, de um número relativo. 
Obs: a frequência percentual (fp) é o produto da freqüência relativa por 100, tendo como resultado 
uma porcentagem. 
Obs: a frequência acumulada (fA) é a soma da frequência absoluta, sendo que a primeira fA é a 
frequência absoluta da primeira classe. Somando a frequência absoluta da primeira classe com a 
segunda classe, temos como resultado a frequência acumulada da segunda classe e assim 
sucessivamente. 
 
 
 
 
 
cLILS  11
 
k
ΔxA
c


 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
23 
2.3 – Histograma e Polígono de Freqüências 
Com o conceito de densidade de freqüência, pode-se apresentar as duas principais 
representações gráficas: o histograma e o polígono de freqüência. 
Histogramas são retângulos cujas bases são proporcionais as amplitudes de classes e as áreas 
proporcionais as freqüências das classes. Todas as classes devem ter a mesma amplitude. 
Polígono de freqüência são gráficos de linhas unindo os pontos médios das classes no topo 
dos retângulos. 
 Vamos exemplificar os processos acima descritos através do exemplo do tempo de parada 
(em minutos) de uma máquina para manutenção. 
No exemplo, temos: 
Passo 1: Escolhe-se, por exemplo, k = 1 + 3,3 log 40 = 6,28  6 classes; 
Passo 2: A = 10 – 1 = 9; 
Passo 3: c = (9 + 1) / 6 = 1,67 => 2; 
Passo 4: LI1 = 1 – 1 / 2 = 0,5; 
 
Passo 5: LS1 = LI2 = 0,5 + 2 = 2,5 
 LS2 = LI3 = 2,5 + 2 = 4,5 
 LS3 = LI4 = 4,5 + 2 = 6,5 
 LS4 = LI5 = 6,5 + 2 = 8,5 
 LS5 = 8,5 + 2 = 10,5 
 
Tab. 2.3 - Distribuição de freqüências relativas ao tempo de parada (em minutos) de uma máquina para 
manutenção 
Classes FA FR FP 
(0,5 – 2,5] 2 0,050 5,0% 
(2,5 – 4,5] 7 0,175 17,5% 
(4,5 – 6,5] 4 0,100 10,0% 
(6,5 – 8,5] 17 0,425 42,5% 
(8,5–10,5] 10 0,250 25,0% 
Totais 40 1,000 100,0% 
 
 
 
 
 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
24 
 
 
 
 
Fig. 2.1 - Histograma e Polígono de Freqüência 
 
 
 
 
 
 
 
 
 
2.4 - Exemplo de Dados com Tabelas de Freqüência 
 Considere o exemplo a seguir, relativo à média da quantidade de cerveja vendida, em caixas 
por dia, durante o carnaval, por 201 bares de uma determinada cidade (Tab. 2.4). 
 O primeiro procedimento a ser tomado para a elaboração de uma distribuição de freqüências 
de uma variável contínua consiste na ordenação dos dados, para permitir uma melhor manipulação 
(Tab. 2.5). 
 A precisão de medida corresponde ao menor valor detectável pelo instrumento ou 
procedimento de medida empregado. No exemplo, a precisão de medida é x = 0,1. 
 
Tab. 2.4 – Média da quantidade de cerveja vendida, em caixas por dia, durante o carnaval, por 201 bares de uma determinada cidade. 
__________________________________________________________________________________________ 
24,725,8 23,6 18,6 20,7 22,4 22,4 21,4 19,2 18,2 21,2 20,0 17,8 
17,5 19,7 23,7 15,3 13,6 20,7 17,0 15,7 15,1 13,8 11,1 14,7 17,6 
16,2 13,4 13,2 14,1 13,1 20,1 19,8 16,8 12,0 11,9 15,0 14,1 14,4 
 6,9 26,6 24,6 22,2 22,8 24,0 30,6 33,0 23,0 20,9 19,5 21,2 20,4 
23,3 27,1 21,6 20,4 25,5 19,6 26,2 21,6 14,3 17,9 15,4 12,6 13,2 
13,3 12,8 10,4 11,5 10,3 10,6 14,1 13,8 27,5 25,4 26,6 28,5 25,9 
25,2 26,3 24,7 24,1 23,3 22,7 19,0 22,8 22,3 23,7 21,0 19,3 21,2 
19,7 16,7 19,3 18,9 19,7 22,6 25,2 30,4 22,6 15,3 17,9 21,6 21,0 
25,1 21,3 26,2 23,8 24,6 27,3 18,9 18,8 14,6 14,1 21,0 23,7 17,3 
24,4 17,3 18,6 19,9 19,5 15,3 20,8 18,9 20,3 18,0 16,9 20,5 19,7 
12,8 21,1 21,0 22,7 15,0 15,1 13,3 17,7 5,3 14,5 19,3 15,8 16,7 
 9,7 14,1 19,5 14,3 17,0 27,5 19,0 22,9 18,0 16,7 18,5 12,9 18,2 
14,3 18,6 17,2 18,6 16,4 18,8 12,6 13,7 10,7 17,5 16,2 15,1 13,9 
11,8 17,8 17,0 15,7 15,3 22,4 14,1 20,4 19,6 20,1 26,6 33,8 20,0 
22,2 20,4 25,8 17,7 15,0 19,2 12,7 22,7 19,0 13,5 15,4 14,5 18,5 
21,0 32,7 21,8 23,6 16,8 14,1 
 
 
 fr 
 
 0,425 
 
 
 
 0,250 
 
 0,175 
 
 
 0,100 
 0,050 
 
 0 0,5 2,5 4,5 6,5 8,5 10,5 tempo 
 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
25 
Tab. 2.5 – Dados ordenados, relativos à média da quantidade de cerveja vendida, em caixas por dia, durante o carnaval, 
por 201 bares de uma determinada cidade. 
 5,3 6,9 9,7 10,3 10,4 10,6 10,7 11,1 11,5 11,8 11,9 12,0 12,6 
12,6 12,7 12,8 12,8 12,9 13,1 13,2 13,2 13,3 13,3 13,4 13,5 13,6 
13,7 13,8 13,8 13,9 14,1 14,1 14,1 14,1 14,1 14,1 14,1 14,3 14,3 
14,3 14,4 14,5 14,5 14,6 14,7 15,0 15,0 15,0 15,1 15,1 15,1 15,3 
15,3 15,3 15,3 15,4 15,4 15,7 15,7 15,8 16,2 16,2 16,4 16,7 16,7 
16,7 16,8 16,8 16,9 17,0 17,0 17,0 17,2 17,3 17,3 17,5 17,5 17,6 
17,7 17,7 17,8 17,8 17,9 17,9 18,0 18,0 18,2 18,2 18,5 18,5 18,6 
18,6 18,6 18,6 18,8 18,8 18,9 18,9 18,9 19,0 19,0 19,0 19,2 19,2 
19,3 19,3 19,3 19,5 19,5 19,5 19,6 19,6 19,7 19,7 19,7 19,7 19,8 
19,9 20,0 20,0 20,1 20,1 20,3 20,4 20,4 20,4 20,4 20,5 20,7 20,7 
20,8 20,9 21,0 21,0 21,0 21,0 21,0 21,1 21,2 21,2 21,2 21,3 21,4 
21,6 21,6 21,6 21,8 22,2 22,2 22,3 22,4 22,4 22,4 22,6 22,6 22,7 
22,7 22,7 22,8 22,8 22,9 23,0 23,3 23,3 23,6 23,6 23,7 23,7 23,7 
23,8 24,0 24,1 24,4 24,6 24,6 24,7 24,7 25,1 25,2 25,2 25,4 25,5 
25,8 25,8 25,9 26,2 26,2 26,3 26,6 26,6 26,6 27,1 27,3 27,5 27,5 
28,5 30,4 30,6 32,7 33,0 33,8 
 
Para o exemplo, temos: 
 
Passo 1: Escolhe-se, por exemplo, k = 1 + 3,3 log 201 = 8,60  10 classes; 
 
Passo 2: A = 33,8 – 5,3 = 28,5; 
 
Passo 3: c = (28,5 + 0,1) / 10 = 2,86 => 2,9; 
 
Passo 4: LI1 = 5,3 – 0,1 / 2 = 5,25; 
 
Passo 5: LS1 = LI2 = 5,25 + 2,9 = 8,15 
 LS2 = LI3 = 8,15 + 2,9 = 11,05 e assim por diante. 
 
 
 
 
 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
26 
Tab. 2.6 - Distribuição de freqüências, relativa à média da quantidade de cerveja vendida, em caixas por dia, durante o 
carnaval, por 201 bares de uma determinada cidade 
 
 CLASSES fa fr fp 
 [5,25; 8,15) 2 0,0100 1,00 
 [8,15; 11,05) 5 0,0249 2,49 
 [11,05; 13,95) 23 0,1144 11,44 
 [13,95; 16,85) 38 0,1891 18,91 
 [16,85; 19,75) 48 0,2388 23,88 
 [19,75; 22,65) 37 0,1841 18,41 
 [22,65; 25,55) 29 0,1443 14,43 
 [25,55; 28,45) 13 0,0646 6,43 
 [28,45; 31,35) 3 0,0149 1,49 
 [31,35; 34,25) 3 0,0149 1,49 
 TOTAIS 201 1,0000 100,00 
 
Na Fig. 2.2 está representado o histograma e o polígono de freqüência. 
 
Figura 2.2 - Histograma e Polígono de Freqüência da distribuição de freqüência relativa, da 
quantidade de cerveja vendida, em caixas por dia, durante o carnaval, por 201 bares de uma 
determinada cidade. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 fr 
 
 0,2500 
 
 
 
 0,2000 
 
 
 
 0,1500 
 
 
 
 0,1000 
 
 
 
 0,0500 
 
 
 
 0,0000 5,25 8,15 11,05 13,95 16,85 19,75 22,65 25,55 28,45 31,35 34,25 
 
Quantidade de caixas de cerveja vendidas em média por dia 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
27 
2.5 - Exercícios: 
1) Construa uma tabela de freqüências (pm, fa, fr, fp e fac), histograma e polígono de freqüência da 
renda familiar (em reais) de 54 funcionários de uma empresa. Os valores foram: 
 
2) Construa uma tabela de freqüências (fa, fr e fp), uma tabela de densidade de freqüência relativa, 
o histograma e o polígono de freqüência das 20 observações relativas ao índice pluviométrico em 
determinados municípios do Estado de Minas Gerais. Os índices (em milímetros de chuva) são: 
144 152 159 160 160 151 157 146 154 145 141 150 142 146 
142 141 141 150 143 158 
 
3) Dá-se abaixo a distribuição dos salários mensais de 200 funcionários da educação da prefeitura 
de uma cidade. 
 
Quantia (dólares) faparente frelativa fpercentual facumulada 
( 0,00 – 200,00] 90 
(200,00 – 400,00] 40 
(400,00 – 600,00] 32 
(600,00 – 800,00] 18 
(800,00 – 1000,00] 15 
(1000,00 – 1200,00] 5 
Total 200 
 
Complete a tabela acima. Construa o histograma e o polígono de freqüência correspondente. 
 
 
 
 
 
 
80 344 416 348 166 220 262 360 204 144 332 34 140 180 
105 166 204 26 120 436 125 132 90 40 220 46 154 116 
182 150 65 356 316 94 86 150 270 202 202 365 79 148 
446 62 236 212 60 64 114 76 48 29 514 140 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
28 
4) Complete a tabela de distribuição de freqüências abaixo. Faça o histograma e o polígono de 
freqüência. 
Classes faparente frelativa fpercentual facumulada 
1,5 – 3,2 4 0,08 
3,2 – 4,9 4 8% 
4,9 – 6,6 0,16 
6,6 – 8,3 7 0,14 
8,3 – 10,0 5 
10,0 – 11,7 20% 
 11,7 – 13,4 7 0,14 
13,4 – 15,1 10% 
Totais 1,00 100% 
 
 
3. MEDIDAS DE POSIÇÃO E DISPERSÃO 
 
 As distribuições de freqüências e os gráficos fornecem mais informações sobre o 
comportamento de uma variável do que a própria série original de dados. Mas, queremos resumir 
ainda mais esses dados. Com esse objetivo usaremos métodos da Estatística Descritiva que ensinam 
a reduzir a informação contida em uma grande quantidade de dados a um pequeno número de 
medidas, substitutas e representantes daquela massa de dados. Vamos agora estudar as principais 
medidas da Estatística Descritiva, agrupadas em medidas de posição (ou de locação ou de 
localização), medidas de dispersão (ou de variabilidade). 
______________________________________________________________________________________________________________Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
29 
 Com base no polígono de freqüência pode-se classificar o tipo de distribuição dos dados 
amostrais ou experimentais com que se está trabalhando. Esta classificação é de suma importância, 
pois grande parte das análises que serão abordadas posteriormente neste material depende da 
natureza desta distribuição, sendo que a maioria requer distribuição do tipo simétrica ou 
aproximadamente simétrica. 
 
Fig. 3.1 – Naturezas de uma distribuição. 
 
 
 
 
 
 
 
 
 
 
 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
30 


n
1j
jX
 
n
X
X
n
1j
j

 






















 


n
1j
2
n
1j
j
2
j
2
n
X
X
1n
1
S
 
3.1 - Técnicas de Somatório 
3.1.1 - Índices ou Notação por Índices 
 O símbolo Xj (leia X índice j) representa qualquer um dos n valores, X1, X2, ..., Xn, 
assumidos pela variável X, na amostra ou no conjunto de dados. A letra j, usada como índice, pode 
representar qualquer um dos valores: 1, 2, ... n. Evidentemente pode ser usada qualquer outra letra 
além do j. 
 
3.1.2 - Notação de Somatório 
 
 O símbolo é usado para representar a soma de todos os valores Xj desde j = 1 até 
j = n, ou seja, por definição: 
 
 
 O símbolo  é a letra grega sigma, que indica soma. 
 
3.1.3 - Exercício 
 
 
Seja a média aritmética e a variância. 
 
 
Dado o conjunto de dados X = {2, 4, 5, 6, 1, 8}, calcule a sua média e variância. 
 
3.2 - Medidas de Posição ou de Tendência Central 
 Uma medida de tendência central procura sintetizar as informações da amostra em um único 
e informativo valor. Ao examinar uma distribuição amostral simétrica ou aproximadamente 
simétrica, nota-se que geralmente, eles são mais freqüentes perto de um valor central e mais raro ao 
afastar-se deste. A obtenção deste valor central é de suma importância nos levantamentos amostrais, 
seja na pesquisa ou na extensão. 
n21
n
1j
j X...XXX 

______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
31 
 A medida de posição é uma grandeza numérica que descreve um conjunto de dados, pela 
indicação da posição do conjunto na escala de valores possíveis que a variável em questão pode 
assumir. Dentre elas, serão abordadas a média, a mediana e a moda. 
Exemplo de aplicação: (Notas) 
Uma escola tinha duas turmas de mesma série, mesmo conteúdo, mesmo professor, mas com 
resultados diferentes. Em vista dessa situação, a escola decidiu formar um grupo de trabalho para 
resolver esses problemas. Para avaliar se estavam ocorrendo problemas, o grupo decidiu retirar uma 
amostra aleatória dos alunos, verificar as notas e comparar os resultados. Foi utilizada uma 
estratificação, sendo então retirada uma amostra de 80 notas da turma A e 80 da turma B. Os dados 
coletados, já ordenados, estão na Tab. 3.1, a seguir. 
 
Tab. 3.1 - Medidas das Notas de 160 alunos (dados ordenados) 
TURMA A TURMA B 
2,3 3,1 3,8 4,5 4,9 5,6 5,8 6,2 
2,4 3,1 3,9 4,5 4,9 5,6 5,8 6,2 
2,4 3,3 3,9 4,5 5,0 5,6 5,8 6,3 
2,4 3,3 3,9 4,5 5,1 5,7 5,8 6,3 
2,6 3,4 4,0 4,5 5,1 5,7 5,9 6,4 
2,7 3,4 4,0 4,6 5,1 5,7 5,9 6,4 
2,7 3,5 4,0 4,6 5,3 5,7 5,9 6,4 
2,8 3,5 4,0 4,7 5,3 5,7 5,9 6,4 
2,8 3,5 4,0 4,7 5,3 5,7 5,9 6,4 
2,8 3,5 4,1 4,9 5,3 5,7 5,9 6,5 
2,9 3,5 4,1 4,9 5,3 5,7 6,0 6,5 
2,9 3,5 4,1 5,1 5,3 5,7 6,0 6,5 
2,9 3,6 4,2 5,2 5,3 5,7 6,0 6,5 
3,0 3,6 4,2 5,4 5,4 5,7 6,1 6,6 
3,0 3,7 4,2 5,4 5,4 5,7 6,1 6,7 
3,0 3,7 4,3 5,5 5,4 5,7 6,1 6,7 
3,1 3,7 4,3 5,6 5,4 5,8 6,1 6,7 
3,1 3,7 4,3 5,6 5,4 5,8 6,1 6,8 
3,1 3,8 4,4 5,7 5,5 5,8 6,2 6,9 
3,1 3,8 4,4 5,9 5,5 5,8 6,2 7,0 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
32 
 
Ao observarmos o conjunto de dados abaixo já fazemos alguma idéia sobre o 
comportamento das duas turmas. Entretanto, claramente necessitamos calcular algumas medidas 
que resumam a informação contida nos dados. Vamos começar tentando responder: Qual o valor 
típico da turma A? E da turma B? A primeira idéia para obter um valor típico é a de calcular uma 
média. Vamos estudar um pouco sobre os diferentes tipos de média. 
 
3.2.1 - Média Aritmética 
A média é a principal medida de posição, sendo utilizada quando os dados apresentam 
distribuição simétrica ou aproximadamente simétrica, como acontece com a maioria das situações 
práticas. A média é, de modo geral, a mais importante de todas as mensurações numéricas 
descritivas. A média aritmética de um conjunto de valores é o valor obtido somando-se todos eles e 
dividindo-se o total pelo número de valores. Deve-se diferenciar, através de notação apropriada a 
média populacional da amostral. 
 
A média aritmética simples de n números 
nx,...,2x,1x
 é um valor 
x
 (média amostral) tal 
que 
xnnx...2
x
1
x 
 
logo temos que, 
n
n
1i i
x
n
nx...2
x
1
x
x




 
 
 
A média de todos os valores de uma população é dada por: 
 
em que, n é o tamanho da amostra, e N o tamanho da população. 
 
Resumindo em uma tabela as médias aritméticas, temos: 
 
Turma Média Aritmética 
A 3,8575 
B 5,8725 
 
N
Σx
μ 
 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
33 
Observando as médias aritméticas das amostras observadas, parece existir diferença, em 
termos médios, entre as notas das turmas A e B. 
 
Podemos pensar na média aritmética como o valor “típico” do conjunto de dados e é 
considerada a principal medida de tendência central. Algumas das razões que fazem com que seja a 
medida de posição mais recomendada são: 
 
É definida rigorosamente e pode ser interpretada sem ambigüidades; 
Leva em consideração todas as observações efetuadas; 
Calcula-se com facilidade. 
Entretanto, esta medida apresenta alguns inconvenientes como o fato de ser muito sensível a 
valores extremos, isto é, a valores excessivamente pequenos ou excessivamente grandes, em relação 
às demais observações do conjunto de dados. Ex: Estamos interessados em conhecer o salário 
médio mensal de certa empresa e delimitamos uma amostra média de cinco setores. Temos o 
seguinte conjunto de salários mensais, para os setores, em reais: 223 - 245 - 310 - 425 - 1.500. 
Podemos observar que quatro dos cinco salários apresentam valores entre 223 e 425 reais, porém a 
média salarial de 540,6 reais é bastante distinta desse conjunto pela influência do salário de 1.500 
que puxou o valor médio para cima. 
 
 Para dadosagrupados em distribuição de freqüência: 
 
 
 
em que Xi é o ponto médio da classe i e Fi é a sua freqüência. 
 
 Como exemplo, vamos verificar os dados da Tab. 2.3, referente ao tempo de parada (em 
minutos) de uma máquina para manutenção. Essa tabela foi modificada, de modo a ficar os itens 
que nos interessam, conforme Tab. 3.2. 
 
 
 
 
 
 
n
k
1i i
F
i
X
X


 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
34 
Tab. 3.2: Distribuição de freqüências relativas tempo de parada (em minutos) de uma máquina para manutenção 
Classes Xi Fi 
(0,5 – 2,5] 1,5 2 
(2,5 – 4,5] 3,5 7 
(4,5 – 6,5] 5,5 4 
(6,5 – 8,5] 7,5 17 
(8,5–10,5] 9,5 10 
Totais 40 
 
Para o exemplo em questão: 
 
Há uma diferença no cálculo pelos dois processos. O resultado do último é apenas aproximado. No 
entanto, o erro cometido é mínimo, e, portanto deve ser desprezado. 
 
Propriedades da média: 
A soma algébrica dos desvios em relação à média aritmética é nula. 
A soma dos quadrados dos desvios de um conjunto de dados em relação a sua média é um valor 
mínimo. 
 
 
A média de um conjunto de dados acrescido (ou subtraído) em cada elemento por uma constante é 
igual à média original mais (ou menos) essa constante. 
 
Em que 
X
, é a média do novo conjunto de dados. 
 
Multiplicando todos os dados por uma constante a nova média será igual ao produto da média 
anterior pela constante 
 


n
1i
i 0XX
 
86
40
10591757455753251
n
k
1i
iFiX
x ,
,,,,,





 


n
1i
2
i XXD
K X'X
Xk'X 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
35 
 
A média é influenciada por valores extremos. 
Não pode ser mensurada em distribuições com classes indeterminadas. 
 
3.2.2 - Moda 
 
 A moda é outra medida de posição, mas diferentemente das médias, não utiliza em seu 
cálculo todos os valores do conjunto de dados analisado. A moda é o valor que ocorre com maior 
freqüência no conjunto de dados. 
Notação: mo = moda 
Ex: 
a) X = {2, 3, 3, 5, 5, 5, 6, 7}  mo = 5 
b) Y = {10, 12, 17, 21, 32} mo = não existe, a distribuição é amodal. 
c) Z = {2, 2, 5, 5, 7, 7} mo = não existe 
d) W = {10, 12, 12, 12, 13, 13, 15, 18, 18, 18, 21}  A distribuição apresenta dois valores modais: 
12 e 18 (distribuição bimodal). 
Quando o conjunto de dados apresenta mais de uma moda damos o nome de distribuição 
plurimodal. A moda é uma medida mais adequada ao caso de dados agrupados. Quando a 
distribuição de freqüências está organizada por classes de valores, devemos identificar a classe 
modal (classe em que observamos a maior freqüência). O ponto médio da classe modal será o valor 
estimado para a moda que é denominada moda bruta. 
 
No caso de dados agrupados a moda pode ser calculada de acordo com a seguinte expressão: 
 
mo
21
1
moo c
ΔΔ
Δ
LIm


 
 
onde: LImo = limite inferior da classe modal; 
 cmo = amplitude da classe modal; 
 1 = diferença entre as freqüências da classe modal e a classe anterior; 
2 = diferença entre as freqüências da classe modal e a classe posterior 
 
Obs: No caso de dados não agrupados, a moda nem sempre tem utilidade com elemento 
representativo ou sintetizador do conjunto. 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
36 
Resumindo em uma tabela as modas das notas, temos: 
Turma Moda 
A 4,0 
B 5,5 
 
Para o exemplo da Tab. 3.3: 
 
Propriedades da moda: 
 
mo’ = mo  K (somando K a todos os dados) 
mo’ = mo . K (multiplicando todos os dados por K) 
 
3.2.3 - Mediana 
 
Notação: md = mediana 
 
Chamamos de mediana o elemento do conjunto que ocupa a posição central na distribuição 
ordenada (crescente ou decrescente). Isto é, divide a distribuição em duas partes iguais de modo 
que 50% dos valores observados são inferiores ao valor mediano e 50% superiores a esse valor. 
 
Notação: X(i)= elemento que ocupa a i-ésima posição da série ordenada. 
 n =número de elementos da série. 
 
(1) 
2
XX
m
2
n
2
n
d














1 , n é par. Ex: No conjunto: 500 500 600 800 1000 50000, como o 
número de valores é 6 (par), a mediana é a média de 600 e 800, valendo então 700. 
 
(2) 





 

2
1nd Xm
 , n é ímpar. Ex: No conjunto de dados: 10 15 26 28 29, como o número de 
valores é 5 (ímpar), a mediana é o 26. 
 
872
713
13
56c
ΔΔ
Δ
LIm mo
21
1
moo ,, 




______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
37 
A mediana é uma medida de posição resistente, pois é pouco afetada por mudanças de 
pequena porção dos dados, ao contrário da média aritmética que é sensível a valores atípicos. 
Ex: Comparação entre a média aritmética e a mediana para os conjuntos de salários (em reais) 
dados. 
X = { 200, 250, 250, 300, 450, 460, 510}  
X
 = 345,7; md = 300. 
Y = { 200, 250, 250, 300, 450, 460, 2.300} 
Y
 = 601,0; md = 300. 
 
Podemos observar que no caso do conjunto Y a média não sintetiza adequadamente o conjunto de 
dados, pois apenas um valor é superior a ela. 
 
Exemplo de aplicação: (Notas) 
As mesmas comparações feitas para a média faremos para a mediana para o nosso conjunto 
de dados. Resumindo em uma mesma tabela as médias e as medianas, temos: 
Turma Média Aritmética Mediana 
A 3,8575 3,8 
B 5,8725 5,8 
 
Para ambas as turmas, a média aritmética e a mediana apresentam valores semelhantes. Isso 
indica que 50% das notas da turma A estão inferior a 3,8 e 50% da turma B apresentam superior a 
5,8. 
No caso de dados agrupados a mediana pode ser calculada de acordo com a seguinte 
expressão: 
 
em que, Fmd: freqüência da classe mediana, 
cmd: amplitude da classe mediana, 
FA: freqüência acumulada das classes anteriores à classe mediana; e 
 LImd: limite inferior da classe mediana. 
 
 
md
md
A
mdd c.
F
F
2
n
LIm














______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
38 
 A classe mediana é a classe que contém a posição n/2 (posição mediana) da distribuição de 
freqüência. 
Para o exemplo da Tab. 4.3: 
 
 
Propriedades da mediana: 
md’ = md  K (somando K a todos os dados) 
md’ = md . K (multiplicando todos os dados por K) 
i xi - md representa um valor mínimo 
 
Vimos que as três principais medidas de posição - a média aritmética, a mediana e a moda - 
têm o mesmo objetivo:determinar um valor típico do conjunto de dados. Surge, então, a seguinte 
questão: quando deveremos utilizar cada uma dessas medidas? 
De maneira geral, a moda é a menos empregada e a mais difícil de calcular 
satisfatoriamente. No entanto, é adequada para caracterizar situações onde estejam em causa os 
casos ou valores mais usuais. Por exemplo, em resultados de uma avaliação, o professor pode estar 
interessado nas notas que mais apareceram. 
Correntemente a escolha é feita entre a média e a mediana, dependendo da natureza do 
problema a estudar e de outros fatores, muitos dos quais não podem abordar-se a nível elementar. 
A mediana tem vantagem: é mais resistente do que a média, isto é, a alteração drástica de 
um só valor do conjunto de dados reflete-se substancialmente no valor da média e pode não refletir-
se, ou refletir-se muito pouco, no valor da mediana. 
A média tem vantagens: quando a curva de freqüências tem forma de sino, mais ou menos 
simétrica, com abas decaindo rapidamente (valores erráticos muito improváveis), a média é mais 
eficiente do que a mediana; a média é uma função linear das observações, propriedade que também 
pode pesar na sua adoção. 
Por fim, uma vantagem da mediana e da moda em relação à média aritmética é que esta 
última não pode ser calculada quando ocorrem classes de freqüências com limites indefinidos 
(classes abertas). Entretanto, nesta situação, a moda e a mediana podem ser encontradas sem 
qualquer dificuldade. 
3272
17
13
2
40
56c.
F
F
2
n
LIm md
md
A
mdd ,, 




























______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
39 
 Muitas vezes existem dúvidas de qual medida utilizar para sintetizar os dados amostrais. 
Como uma regra geral, pode-se definir qual medida é mais conveniente para uma dada situação com 
base na análise do histograma ou do polígono de freqüências. Se a distribuição dos dados por 
assimétrica, isto é quando valores extremos predominam em uma das caudas da distribuição, deve 
se preferir a mediana como medida sintetizadora. Isto se deve ao fato da mediana ser pouco sensível 
a presença de valores extremos, sendo considerada mais robusta que a média. O termo robusto é o 
termo técnico usado para indicar esta propriedade da mediana em relação à média aritmética. 
 
Relação entre média, mediana e moda: 
 
 = md = mo (distribuição simétrica; assimetria nula) 
 
 > md > mo (distribuição assimétrica à direita ou positiva) 
 
 
X
 < md < mo (distribuição assimétrica à esquerda ou negativa) 
 
3.3 - Medidas de Variação ou de Dispersão 
 
As medidas de posição não informam sobre a variabilidade dos dados e são insuficientes 
para sintetizar as informações amostrais. As medidas de dispersão servem para avaliar o grau de 
variabilidade dos valores de um conjunto de dados. Estas medidas permitem estabelecer 
comparações entre fenômenos de mesma natureza ou de natureza distinta e, em geral, essa 
variabilidade é observada em torno de uma medida de tendência central. Essas medidas podem ser 
absolutas ou relativas. 
 
3.3.1 - Amplitude Total (medida de dispersão absoluta) 
 
Notação: A = Amplitude Total 
Definição: A amplitude total de um conjunto de números é a diferença entre os valores extremos do 
conjunto. 
Observações: 
1ª) A amplitude total é a medida mais simples de dispersão. 
X
 
X
 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
40 
2ª) A desvantagem desta medida de dispersão é que leva em conta apenas os valores mínimo e 
máximo do conjunto. Se ocorrer qualquer variação no interior do conjunto de dados, a 
amplitude total não nos dá qualquer indicação dessa mudança. 
3ª) A amplitude total também sofre a influência de um valor "atípico" (“outlier”) na distribuição 
(um valor muito elevado ou muito baixo em relação ao conjunto). 
 
Exemplo de aplicação: (Notas) 
 
Vamos observar no nosso conjunto de dados as médias aritméticas e as amplitudes totais 
(ranges) para termos uma primeira idéia sobre a variabilidade das notas para as diferentes turmas. 
 
Turma Média aritmética Amplitude total 
A 3,8575 3,6 
B 5,8725 2,1 
 
Podemos observar que a amplitude total para a turma B é menor que a da turma A. 
 
3.3.2 - Variância e Desvio Padrão 
 
Poderia se pensar então em utilizar a soma dos desvios em relação à média como medida de 
dispersão ou de variabilidade. No entanto, esta medida não serve devido ao fato da soma de desvios 
em relação à média ser nula, e todos os conjuntos amostrais teriam variabilidade nula. 
 Uma medida da variabilidade que considera todas as observações, e que é a mais utilizada na 
maioria das situações na estatística, devido às propriedades que possui é a variância ou a sua raiz 
quadrada, o desvio padrão. A variância é dada pela "média" da soma de quadrados de desvios em 
relação à média. Numa amostra de tamanho n , deveria ser utilizado este valor (n) como divisor, 
desta soma de quadrados de desvios. No entanto, devido a motivos associados a propriedades dos 
estimadores e inferência estatística, como divisor de variância amostral é usado n-1 em lugar de n 
na expressão do cálculo da variância que será apresentada a seguir. 
 
 
 
 
 
Simbologia 
 
População: Variância  2 e 
 Desvio Padrão   
 
Amostra: Variância  S2 e Desvio Padrão  
S 
 
 
______________________________________________________________________________________________________________ 
Curso de Bacharelado em Ciência e Tecnologia – BC&T – ICET – UFVJM/CM 
Disciplina: Probabilidade e Estatística Prof. MSc. Marcos Antônio Resende Miranda. 
41 
 
A variância amostral é dada por: 
 
 
em que, n – 1 é denominado graus de liberdade. 
A unidade da variância é igual ao quadrado da unidade dos dados originais. O desvio 
padrão, por sua vez, é expresso na mesma unidade do conjunto de dados, sendo obtido pela extração 
da raiz quadrada da variância, fornecida pela expressão anterior. 
 Para o cálculo da variância ou desvio padrão amostral a partir dos dados elaborados pode-se 
usar a expressão acima. No entanto, devido a usar desvio em relação à média ao quadrado, erros de 
arredondamentos são comuns de ocorrer. 
Por essa razão deve-se preferir as seguintes expressões (equivalentes): 
 
Para a obtenção do desvio padrão, basta extrair a raiz quadrada: 
 
 
 
 
Cálculo para dados agrupados em distribuições de freqüência: 
Para o exemplo da Tab. 3.2: 
 
 
 
1n
n
1i
2
X
i
X
2
S





 
2SS 
 






















 


k
1i
2
k
1i
ii
2
ii
2
n
XF
XF
1n
1
S
   
48,9205S
40
109,5177,545,573,521,5
9,5107,5175,543,571,52
140
1
S
2
2
222222








 

























 


n
1i
2
n
1i
i
2
i
2
n
X
X
1n
1
S
______________________________________________________________________________________________________________

Outros materiais