Buscar

Unidade I - Estatística Descritiva

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 105 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 105 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 105 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE 
CENTRO DE CIÊNCIAS EXATAS E DA TERRA 
DEPARTAMENTO DE ESTATÍSTICA 
DOCENTE: Mariana Oliveira Cedraz 
 
ESTATÍSTICA DESCRITIVA 
O QUE É ESTATÍSTICA? 
 Pode-se entender estatística como um 
conjunto de técnicas que permite, de forma 
sistemática, planejar, organizar, 
descrever, analisar e interpretar um 
conjunto de dados oriundos de estudos ou 
experimentos, realizados em qualquer área 
do conhecimento. 
 
INTRODUÇÃO À ESTATÍSTICA 
 Ao contrario do que se 
pensa, a estatística não se 
ocupa apenas na análise 
dos dados, ela também se 
ocupa em planejar como 
os dados serão 
coletados para análise. 
INTRODUÇÃO À ESTATÍSTICA 
 Sem o planejamento 
adequado nunca se 
sabe se os dados 
coletados servirão para 
alguma coisa, por mais 
sofisticadas que sejam as 
análises depois. 
FASES DO MÉTODO ESTATÍSTICO 
Definição do 
Problema 
Planejamento 
Coleta dos 
dados 
Crítica dos 
dados 
Apresentação 
dos dados 
Tabelas e 
Gráficos 
Análise e 
Interpretação 
DEFINIÇÃO DO PROBLEMA 
 Saber exatamente o que se 
pretende pesquisar é o 
mesmo que definir 
corretamente o problema. 
Portanto, a primeira fase 
consiste em uma definição 
ou formulação correta do 
problema a ser estudado. 
PLANEJAMENTO 
 Nele se determina o procedimento necessário para 
resolver o problema, como levantar informações 
sobre o objeto do estudo. 
 
 Nesta fase é importante a escolha das perguntas, 
que, na medida do possível, devem ser fechadas. No 
caso de um experimento, deve-se atentar para os 
objetivos que se pretende alcançar. 
 
COLETA DOS DADOS 
 O levantamento de dados pode ser de dois tipos: 
 Censitário – quando envolve toda a população; 
 Por amostragem – quando é utilizada uma fração da 
população. 
 
 Outros elementos do planejamento de uma pesquisa 
são: cronograma das atividades, custos envolvidos, 
exame das informações disponíveis... 
 
CRÍTICA DOS DADOS 
 Objetiva a eliminação de 
erros capazes de 
provocar futuros 
enganos. Faz-se uma 
revisão crítica dos dados, 
suprimindo os valores 
estranhos ao 
levantamento. 
APRESENTAÇÃO DOS DADOS 
 A organização dos 
dados denomina-se 
Série Estatística. Sua 
apresentação pode 
ocorrer por meio de 
tabelas ou gráficos. 
ANÁLISE E INTERPRETAÇÃO 
 Esta fase consiste em 
tirar conclusões que 
auxiliem o pesquisador a 
resolver seu problema, 
descrevendo o fenômeno 
através do cálculo de 
medidas estatísticas, 
especialmente as de 
posição e as de 
dispersão. 
DESCRITIVA x INFERENCIAL 
 DESCRITIVA: Trata da observação de fenômenos de 
mesma natureza, da coleta de dados numéricos referentes a 
esses fenômenos, da sua organização e classificação por 
meio de tabelas e gráficos, bem como da análise e 
interpretação. 
 
 
 INFERENCIAL: Estuda as características de uma 
população, com base em dados obtidos de amostras. 
ESQUEMA 
 
 
 
Conjunto de todos 
os elementos que 
contém a mesma 
característica 
População Amostra 
Inferência Estatística: 
Estimação de quantidades 
desconhecidas, extrapolação dos 
resultados, testes de hipóteses 
Estatísticas descritivas: 
Tabular os dados, construir 
tabelas. Tirar conclusões 
informais 
Subconjunto 
da população 
CONCEITOS BÁSICOS 
 EXEMPLO DE POPULAÇÃO: 
 
 População de residentes no município de Natal 
 (elementos: pessoas residentes no município) 
 
 População de pacientes internados no HUOL 
 (elementos: pacientes internados no HUOL) 
 
 Pessoas portadoras de HIV 
 (elementos: pessoas soropositivos) 
TIPOS DE COLETA DOS DADOS 
 A coleta direta de dados pode ser classificada relativamente ao 
fator tempo em: 
 
 CONTÍNUA (REGISTRO): Quando feita continuamente, tal 
como a de nascimentos e óbitos e a de frequência dos alunos 
às aulas; 
 
 PERIÓDICA: Quando feita em intervalos constantes de 
tempo, como os censos (de 10 em 10 anos) e as avaliações 
periódicas dos alunos; 
 
 OCASIONAL: Quando feita extemporaneamente, a fim de 
atender a uma conjuntura ou a uma emergência, como no 
caso de epidemias que assolam ou dizimam rebanhos inteiros. 
TIPOS DE COLETA DOS DADOS 
 Coleta direta: Quando a informação é obtida a partir 
do próprio elemento. 
 
 Já a coleta é indireta quando é inferida de elementos 
conhecidos (coleta direta) e/ou do conhecimento de 
outros fenômenos relacionados com o fenômeno 
estudado. 
 
 Dados colhidos em sites como DATASUS, IBGE são 
considerados como coleta indireta. 
TIPOS DE VARIÁVEIS 
 Variável: Em estatística define-se variável como um 
atributo, uma característica que pode mudar de 
observação para observação. Podendo ser qualitativa 
ou quantitativa. 
 
 Exemplo: Vamos supor, que estamos interessados 
em estudar o estado civil e a idade dos estudantes da 
disciplina de estatística aplicada a Engenharia 
Elétrica. 
 
VARIÁVEL QUALITATIVA 
 A variável qualitativa revela certo tipo de 
característica relacionada ao grupo que não pode ser 
mensurada numericamente. 
 
 Exemplo: Cor dos olhos (azuis, verdes, castanhos...), 
gênero (masculino, feminino), grau de satisfação (muito 
satisfeito, satisfeito, nada satisfeito), nível de instrução 
dos funcionários da UFRN (fundamental, médio, 
superior). 
 
 Estas variáveis podem ainda ser identificadas em 
subcategorias, nominal ou ordinal. 
VARIÁVEL QUALITATIVA 
 A variável qualitativa se diz nominal quando não se 
pode estabelecer uma relação de ordem ou de 
hierarquia entre os possíveis valores a serem 
assumidos pela variável. 
 
 Exemplo: Considerando o exemplo anterior temos a 
cor dos olhos (azuis, verdes, castanhos...) e o gênero 
(masculino, feminino). Outros exemplos, estado civil 
dos aposentados, país de origem dos funcionários 
públicos. 
 
VARIÁVEL QUALITATIVA 
 Uma variável qualitativa ordinal permite que se 
estabeleça uma hierarquia coerente ou uma relação 
de ordem entre os valores assumidos. 
 
 Exemplo: Grau de satisfação (muito satisfeito, 
satisfeito, nada satisfeito), nível de instrução dos 
funcionários da UFRN (fundamental, médio, 
superior). 
VARIÁVEL QUANTITATIVA 
 A variável quantitativa é uma variável que pode ser 
mensurada numericamente. Tal como a idade de 
pessoas em anos, número de pessoas que moram 
numa mesma residência, altura dos alunos em 
metros, quantidade de baterias em um estoque, 
variação da voltagem em uma pilha AA, 
circunferência de cabos fase em centímetros . 
 
 
 A variável quantitativa pode ser discreta ou 
contínua. 
VARIÁVEL QUANTITATIVA 
 As variáveis quantitativas discretas podem ser vistas 
como resultante de uma contagem, assumindo 
assim, em geral, valores inteiros. De uma maneira 
mais formal o conjunto de valores assumidos é finito 
enumerável. 
 
 
 Exemplos: a idade de pessoas (1 ano, 2 anos, ..., n 
anos), quantidade de baterias em um estoque 
(1,2,3,..., n baterias) 
VARIÁVEL QUANTITATIVA 
 As variáveis contínuas assumem valores em 
intervalos de números reais e, geralmente, são 
provenientes de uma mensuração. 
 
 Exemplos: altura dos alunos em metros (1,50 a 2,00 
metros), variação de volts em uma pilha AA (0 a 1,5 
V), circunferência de cabos fase em centímetros (1,5 
a 2,5 mm²) . 
TIPOS DE VARIÁVEIS 
Qualitativa 
Quantitativa 
Nominal 
Ordinal 
Discreta 
Contínua 
André Edson Jarbas 
1º colocado 2º colocado 3º colocado 
1 atleta 2 atletas 3 atletas 
12 segundos 14 segundos 16 segundos 
TIPOS DE VARIÁVEIS 
Nominal 
Ordinal 
Discreta 
Contínua 
Qualitativa 
Quantitativa 
Variável 
CONCEITOS BÁSICOS PARÂMETROS: Medidas numéricas de 
características mensuráveis de uma população. 
 
 ESTATÍSTICA: Função definida sobre os valores 
numéricos de uma amostra (estimativas dos 
parâmetros da população). 
 
 DADOS: São as informações obtidas, seja com base 
nos elementos da população ou da amostra. 
ESTATÍSTICA DESCRITIVA 
 Conjunto de técnicas estatísticas que permite 
explorar grandes massas de dados para uma 
primeira aproximação à realidade estudada, na 
procura de algum padrão ou comportamento 
relevante que esteja presente no conjunto de dados. 
 
 Os dados podem ser organizados: 
 Em tabelas quando é importante a apresentação dos valores 
 Em gráficos ou mapas quando necessita-se da apresentação de 
distribuições, tendências ou relacionamentos entre variáveis 
 Resumidos com o uso de estatísticas. 
DISTRIBUIÇÃO DE FREQUÊNCIAS 
 A distribuição de frequência nada mais é do que a representação 
tabular dos dados, que consiste em dispor os dados em linhas e 
colunas, distribuídas de modo ordenado, segundo algumas regras 
práticas e obedecendo à Resolução nº 886/66, de 26 de outubro de 
1966, do Conselho Nacional de Estatística. 
NORMAS PARA CRIANÇÃO DE TABELAS 
 Toda tabela deve ser autoexplicativa (IBGE): 
 
 As tabelas devem ser fechadas no alto e embaixo por 
linhas horizontais, não sendo fechadas à direita nem 
à esquerda por linhas verticais. É facultativo o 
emprego de traços verticais para a separação de 
colunas no corpo da tabela; 
 Em publicações que compreendem muitas tabelas, 
estas devem ser numeradas em ordem crescente, 
conforme a ordem de aparecimento; 
NORMAS PARA CRIAÇÃO DE TABELAS 
 Os totais e subtotais são destacados (negrito, itálico, 
caracteres afastados etc); 
 O título deve conter a descrição básica do conteúdo, 
local e época em que foram coletados os dados; 
 Deverá ser mantida uniformidade quanto ao número 
de casas decimais. 
 
BASE DE DADOS 
Nº INICIAIS SEXO IDADE BAIRRO_RESIDENCIAL ESCOLA2OGR ALTURA BRACO 
--- -------- ---- ----- ------------------------- ---------- ------ ----- 
 1 PAMS F 19 JACAREPAGUA PRIV 168 24.5 
 2 ACPP F 21 JACAREPAGUA PUB 160 28.0 
 3 LTK F 19 PIEDADE PRIV 173 28.0 
 4 JAC F 22 PIEDADE PUB 174 32.0 
 5 LSS F 19 MEIER PRIV 158 24.0 
 6 PAGAC M 20 TIJUCA PRIV 177 29.0 
 7 KNL F 20 TIJUCA PRIV 162 22.5 
 8 VPR F 19 ENGENHO NOVO PRIV 168 27.0 
 9 WFC F 21 WONA/BELFORD ROXO PUB 170 33.0 
 10 PFS F 19 ILHA DO GOVERNADOR PRIV 161 26.5 
 11 RRS F 19 CENTENARIO/DUQUE CAXIAS PRIV 175 26.0 
 12 ARP F 19 VILA DA PENHA PUB 169 26.0 
 13 AAN F 24 BAIRRO DE FATIMA/NITEROI PRIV 166 25.0 
 14 PCCN F 21 ICARAI/NITEROI PRIV 171 25.0 
 15 ALM F 22 PARAISO/SAO GONCALO PUB 164 23.5 
 16 SM F 18 COPACABANA PRIV 170 25.5 
 17 RCF F 19 CATETE PRIV 168 24.0 
 18 TAG F 19 ICARAI/NITEROI PRIV 163 26.5 
 19 AHM F 21 FLAMENGO PUB 168 21.0 
 20 ASC F 18 CAMPO GRANDE PRIV 155 26.0 
TABULAÇÃO DE VARIÁVEIS QUANTITATIVAS 
CONTÍNUAS 
Peso em gramas Nº de prematuros % 
400 ├ 600 120 24,0 
600 ├ 800 80 16,0 
800 ├ 1000 130 26,0 
1000 ├ 1200 70 14,0 
1200 ├ 1400 100 20,0 
Total 500 100,0 
Distribuição dos pesos dos prematuros, nascidos na MEJC 
OBS: Chamamos de distribuição em classes 
TABULAÇÃO DE VARIÁVEIS QUANTITATIVAS 
DISCRETAS 
Consultas de pré-natal Nº de consultas % 
0 106 42,1 
1 15 6,0 
2 34 13,5 
3 50 19,8 
4 47 18,7 
Total 252 100 
Número de consultas de pré-natal realizadas durante a gestação 
OBS: Quando a variável tem poucos valores, podemos fazer 
uma tabela simples, caso contrário, a tabela deve ser em 
classes. 
TABULAÇÃO DE VARIÁVEIS QUALITATIVAS 
NOMINAIS 
Distribuição do sexo dos recém nascidos na MEJC 
Sexo Nº de entrevistados % 
Masculino 207 45,39 
Feminino 249 54,61 
Total 456 100,00 
TABULAÇÃO DE VARIÁVEIS QUALITATIVAS 
ORDINAIS 
Recém nascidos, segundo o grau de anorexia 
Grau de Anorexia Nº de bebês % 
Sem Anóxia 94 22,12 
Moderada 157 36,94 
Severa 174 40,94 
Total 425 100,00 
OBS: Respeitar a ordem da variável. 
TIPOS DE GRÁFICOS 
45% 
55% 
Sexo dos entrevistados do RN 
Feminino Masculino 
0 10 20 30 40 50 
Fórcipe 
Pélvico 
Normal 
Cesária 
Tipos de parto na MEJC 
Gráfico de setores 
ou pizza 
Gráfico de barras 
TIPOS DE GRÁFICOS 
Feminino Masculino 
45,0 
55,0 
Sexo dos entrevistados do RN 
Gráfico de colunas 
80 
90 
100 
110 
120 
130 
140 
150 
2007 2008 2009 2010 
Casos de dengue detectados 
nas grandes cidades do RN 
Natal 
Mossoró 
Caicó 
Gráfico de linhas 
TIPOS DE GRÁFICOS 
0
5
10
15
20
25
30
 600 800 1000 1200 1400 1600
peso (g)
Re
cé
m-
na
sc
ido
s (
%)
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
300 500 700 900 1100 1300 1500 1700
Peso (g)
 (%) 
Histograma 
Polígono 
TIPOS DE GRÁFICOS 
Boxplot 
DISTRIBUIÇÃO DE FREQUÊNCIAS 
 Considere o seguinte exemplo: Um questionário foi 
aplicado em uma escola para alunos do fundamental ao 
ensino médio. Uma amostra de 20 alunos foi 
selecionada. Fornecendo as seguinte informações. 
 
• Id: Identificação do aluno 
• Nº irmãos: Número de irmãos dos alunos 
• Sexo: Sexo do aluno, F se feminino e M se masculino 
• Idade: Idade em anos dos alunos 
• Alt: Altura em metros dos alunos 
• Rend. Escolar: Rendimento escolar dos alunos 
 
 Os dados tabulados encontram-se na Tabela 1. 
 
Tabela 1 - Informação de dados estudantis - Dados brutos 
Id N° de irmãos Sexo Idade Alt Rend. Escolar 
1 0 F 17 1.50 Ótimo 
2 1 F 18 1.69 Bom 
3 1 M 18 1.95 Bom 
4 2 M 25 1.85 Ruim 
5 0 F 19 1.48 Ótimo 
6 1 M 19 1.76 Bom 
7 1 F 20 1.60 Ruim 
8 2 F 18 1.64 Bom 
9 3 F 18 1.62 Ótimo 
10 4 F 17 1.64 Ruim 
11 2 F 18 1.72 Ótimo 
12 2 F 18 1.66 Bom 
13 1 F 21 1.70 Bom 
14 4 M 19 1.78 Bom 
15 1 F 18 1.65 Ótimo 
16 1 F 19 1.63 Bom 
17 2 F 17 1.82 Bom 
18 1 M 18 1.80 Ruim 
19 1 F 20 1.60 Bom 
20 0 F 18 1.68 Ótimo 
Fonte: Dados fictícios 
DISTRIBUIÇÃO DE FREQUÊNCIAS 
DISTRIBUIÇÃO DE FREQUÊNCIAS 
 Tabelas com grandes números de dados são cansativas e não dão uma 
visão rápida e geral do fenômeno. 
 Dessa forma, é necessário que os dados sejam organizados em uma 
tabela de distribuição de frequências para facilitar ao analista o seu estudo. 
 
DISTRIBUIÇÃO DE FREQUÊNCIAS: 
 SIMPLES 
• Série estatística para dados nominais, ordinais e discretos, 
organizados em uma tabela. 
 POR CLASSES 
• Série estatística para dados contínuos. 
• Pode ser utilizada para dados discretos se os mesmos foram em sua 
maioria ou num todo, diferentes. 
 
DISTRIBUIÇÃO DE FREQUÊNCIA 
 CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE 
FREQUÊNCIAS SIMPLES: 
 1. Ordenar os dados brutos em forma de rol (ordem 
crescente) 
 2.Listar todos os elementos diferentes, numa coluna 
de nome “X”. 
 3. Listar a frequência de todos os elementos 
diferentes numa coluna de nome "fi" ou "frequência". 
 4. Somar todos os elementos da coluna "fi" (total). 
CONSTRUÇÃO DA DISTRIBUIÇÃO DE 
FREQUÊNCIAS 
Exemplo: Considere a variável Nº de irmãos na Tabela 1. 
0 1 1 2 0 1 1 2 3 4 
2 2 1 4 1 1 2 1 1 0 
Rol (dados em ordem crescente): 
0 0 0 1 1 1 1 1 1 1 
1 1 2 2 2 2 2 3 4 4 
DISTRIBUIÇÃO DE FREQUÊNCIA 
 Tabela de Distribuição de Frequências Simples: 
 
 
 
 
 
 
 
 
 
 Algumas considerações ou conclusões: 
• Qual o número de estudantes que não tem irmãos? 
• Quantos estudantes têm 4 irmãos? 
• A maioria dos estudantes tem quantos irmãos? E a minoria? 
Tabela 2– Distribuição de frequência do número de 
irmãos. 
Nº de irmãos f 
0 3 
1 9 
2 5 
3 1 
4 2 
Total 20 
Fonte: Dados fictícios 
DISTRIBUIÇÃO DE FREQUÊNCIA 
 Vamos supor que agora queremos responder 
as seguinte perguntas: 
• Qual o percentual de estudantes que não tem irmãos? 
• Qual o percentual estudantes têm quatro irmãos? 
• Informe o percentual dos estudantes que tem o maior número de irmãos? E dos que 
tem o menor número de irmãos. 
 
 Para responder essa pergunta temos que utilizar a 
seguinte fórmula chamada de frequência relativa: 
 
 
 
 
 
 
% .100i
n
f
N

DISTRIBUIÇÃO DE FREQUÊNCIA 
 
 Aplicando na fórmula os valores da tabela, obtemos os seguintes resultados: 
Tabela 3– Distribuição de frequência e porcentagem do número de 
irmãos. 
Nº de irmãos f f % 
0 3 15 
1 9 45 
2 5 25 
3 1 5 
4 2 10 
Total 20 100 
Fonte: Dados fictícios 
3
.100 15
20

DISTRIBUIÇÃO DE FREQUÊNCIA 
 Outros questionamentos que podem surgir são os seguintes: 
 
•Quantos estudantes têm até 2 irmãos? 
• Quantos estudantes têm ao menos 3 irmãos? 
• Qual o percentual de estudantes com no máximo 1 irmão? 
• Qual o percentual de estudantes com no mínimo 2 irmãos? 
 
 Tabela 4 – Distribuição de frequência acima de a abaixo de e porcentagem do 
número de irmãos. 
Nº de irmãos f f % F↓ F↓% F↑ F↑% 
0 3 15 3 15 20 100 
1 9 45 12 60 17 55 
2 5 25 17 85 8 30 
3 1 5 18 90 3 25 
4 2 10 20 100 1 15 
Total 20 100 - - - - 
DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES 
 CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE 
FREQUÊNCIAS POR CLASSES: 
 1. Ordenar os dados brutos em forma de rol (ordem 
crescente) 
 2. Calcular a amplitude total: A = LS - LI 
 3. Calcular o número de classes e arredondar o valor 
final para um número inteiro: 
 C = 1 + (3,33333.....) • log(n) 
 4. Calcular o intervalo entre classes: i = A / C. 
 Construa de uma Distribuição de Frequências com 
CLASSES para os dados referentes ao Peso (kg) de 14 
blocos de concreto: 
 
 
 SOLUÇÃO: 
 Amplitude Total (A): 
 
 
 A = LS – LI = 95 – 56 = 39. 
DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES 
56 57 58 60 62 64 69 74 74 74 76 80 81 95 
 Número de Classes (C) – Fórmula de Sturges: 
 
 C = 1 + (3,33333.....) · log(n) 
 C = 1 + 3,333 · log (14) = 4,82  5 
 
 Intervalo de Classe (i): 
 
 A=39 e C=5 
 i = A/C = 39/5 = 7,8. 
 
DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES 
 Peso de blocos de concreto 
 
 
 
 
 
 Fonte: Dados Fictícios 
Peso (kg) fi Fi% 
56,0 |- 63,8 5 35,71 
63,8 |- 71,6 2 14,28 
71,6 |- 79,4 4 28,58 
79,4 |- 87,2 2 14,28 
87,2 |-| 95 1 7,14 
Total 14 100 
DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES 
EXEMPLO 
 Um determinado professor está interessado em 
analisar a altura (m) dos alunos da disciplina de 
Estatística. Os dados são os seguintes: 
 
 
 
 
 
Construa uma distribuição de frequência em classes. 
 
1,51 1,65 1,58 1,54 1,65 
1,40 1,61 1,08 1,81 1,38 
1,56 1,83 1,69 1,22 1,22 
1,68 1,49 1,80 1,33 1,83 
1,50 1,46 1,67 1,23 1,54 
MÉDIDAS DE TENDÊNCIA CENTRAL 
 Os dados quantitativos, apresentados em tabelas e 
gráficos, constituem a informação básica do 
problema. Mas é conveniente apresentar medidas 
que mostrem a informação de maneira resumida. 
 
 MEDIDAS DE TENDÊNCIA CENTRAL: São 
medidas que tendem para o centro da distribuição e 
têm a capacidade de representá-la como um todo. 
Dão o valor do ponto em torno do qual os dados se 
distribuem. As principais são: Média Aritmética, 
Mediana e Moda e algumas. 
MÉDIA ARITMÉTICA 
 A média aritmética pode ser definida em dois tipos: 
populacional (μ) e amostral (X ). Nos dois casos 
existem três situações quanto aos cálculos. 
 
 1. Dados apresentados em forma de rol: 
 A média será: 
 
MÉDIA ARITMÉTICA 
 Ex: Número de tomadas a serem trocadas em 12 
hotéis de Natal 
 Dados: 50, 62, 70, 86, 60, 64, 66, 77, 58, 55, 82, 74 
 
 
 Análise: O número médio de tomadas para serem 
trocadas é de 67 por hotel. 
 
MÉDIA ARITMÉTICA 
 2. Dados apresentados em forma de 
distribuição de frequência simples: 
 A média será: 
 
 
 Ex: Número de peças com defeitos produzidas em 27 
dias em certa fábrica 
 X 0 1 2 3 4 Total 
F 2 4 10 6 5 27 
 
 
 
 
 Podemos verificar que a média de peças defeituosas 
2,3 por dia. 
MÉDIA ARITMÉTICA 
EXERCÍCIO 
 As informações abaixo apresentam a idade dos 
usuários de drogas internos numa clínica para 
tratamento. Determine a idade média dos internos. 
MÉDIA ARITMÉTICA 
 3. Dados apresentados em forma de 
distribuição de frequência em classes: 
 
 
 
 A média é: 
 
MÉDIA ARITMÉTICA 
 Ex: Nascidos vivos segundo o peso ao nascer, em kg. 
MÉDIA ARITMÉTICA 
 
 
 
 
 
 Verifica-se que o peso médio dos 100 nascidos vivos 
é de 3kg. 
EXEMPLO 
 Temperatura (Cº) para o derretimento de certo 
material eletrônico 
Temperatura Fi Pm 
150 |- 200 35 
200 |- 250 164 
250 |- 300 31 
300 |- 350 344 
350 |- 400 112 
400 |- 450 32 
450 |- 500 10 
Total 728 - 
MEDIANA 
 Valor que divide a distribuição em duas partes 
iguais, em relação à quantidade de elementos. Isto é, 
é o valor que ocupa o centro da distribuição, de onde 
se conclui que 50% dos elementos ficam abaixo dela 
e 50% ficam acima. 
 Colocados em ordem crescente, a mediana (Med ou 
Md) é ou valor que divide a amostra, ou população, 
em duas partes iguais. 
MEDIANA 
 Variável Discreta: 1º Colocar os elementos em 
forma de ROL 
 2º Verificar se n é par ou ímpar 
 -> Se n for ímpar: 
 
 
 -> Se n for par: 
 
MEDIANA 
 Ex1: n sendo ímpar 
 
 
 Ex2: n sendo par 
MEDIANA 
 Variável contínua: 
 1º Calcular a ordem (n/2)º 
 Obs: Não importar se é par o ímpar 
 2º Através da F identificar onde está a posição da 
mediana 
 3º Utilizar a forma: 
 
 
MEDIANA 
 Temperatura (ºC) para o derretimento de certo 
material eletrônico. 
MEDIANA 
 Resolução: 
EXEMPLO 
 Quantidade de creatinina (ml) encontrada na urina 
de 84 pacientes com problemas renais. 
MODA 
 É o valor que ocorre com maior frequência na série, 
ou seja, aquele que mais se repete. 
 
 Ex: 
 ROL: 3, 4, 5, 7, 7, 7, 9, 9 
 
 Moda igual a 7 
MODA 
 Série Unimodal: Existe apenas uma moda 
 Ex: 1,1,3,4,5,6,6,6,7 -> Moda igual a 6 
 
 Série Bimodal: Existe duas modas 
 Ex: 1,2,3,3,4,5,6,7,7,8 -> Moda igual a 3 e 7 
 
 Série Trimodal: Ocorrem três modas 
 Ex: 4,4,4,5,6,7,7,7,8,8,8 -> Moda igual a 4, 7 e 8 
MODA 
 Série Polimodal: Ocorrem quatro ou mais modas 
 Ex: 1,1,2,3,3,4,5,6,6,7,7 -> Moda igual a 1, 3, 6, 7 Série Amodal: Não há moda 
 Ex: 1, 3, 4, 6, 7, 8 -> Não há moda 
MODA 
 Dados apresentados em uma distribuição de 
frequência simples: 
Moda = elemento de maior frequência 
 Ex: 
 Moda = 6 
 
MODA (DISTRIBUIÇÃO EM CLASSES) 
 Moda Bruta: 
 
 Moda de Pearson: 
 
 Moda de King: 
 
 Moda de Czuber: 
 
OBS: Para achar a 
classe modal (classe 
que será referência 
para o cálculo da 
moda), olha a classe 
com maior frequência. 
MODA 
 Temperatura (ºC) para o derretimento de certo 
material eletrônico. 
MODA 
 Tendo a média e mediana, calcularemos a moda de Pearson, para o 
cálculo das outras modas, usaremos a classe com maior frequência, que 
nesse caso é a 4ª classe. 
 
 
 
 
 
 
SEPARATRIZES 
 Individualmente não são medidas de tendência 
central, mas como são medidas de posição na série, 
podemos considerá-las. 
 
 Essas medidas (Quartis, Decis e Percentis) 
juntamente com a mediana são chamadas 
genericamente de separatrizes. 
SEPARATRIZES 
 A mediana divide a distribuição em duas partes 
iguais. 
 
 
 
 
 
 
Mediana (Me) divide em duas partes iguais 
Quartis (Q1, Q2 e Q3) dividem em quatro partes iguais 
Decis (D1, D2, ..., D9) dividem em dez partes iguais 
Percentis (P1, P2, ..., P99 ) dividem em cem partes iguais 
SEPARATRIZES 
SEPARATRIZES (DADOS EM ROL) 
 Primeiro encontra-se a posição e em seguida 
identifica o elemento. 
 1 ) Posição da Mediana: 
 
 2 ) Posição dos Quartis: 
 
 3 ) Posição dos Decis: 
 
 4) Posição dos Percentis: 
SEPARATRIZES 
 Ex: Considere o tempo (em anos) de 24 máquinas 
utilizadas numa indústria. Calcule os quartis. 
 
 
 
 
 Calculando os quartis: 
 
17 18 19 20 21 22 
23 24 25 26 27 29 
32 33 35 38 39 42 
44 46 48 50 54 57 
SEPARATRIZES 
 Interpretação: 
 
 25% das máquinas têm idade até 22 anos de uso, 
como também metade delas têm até 29 anos e 25% 
das máquinas têm mais de 42 anos de uso na 
indústria. 
 
SEPARATRIZES 
 Ex: Considere o tempo (em anos) de 24 máquinas 
utilizadas numa indústria. 
 
 
 
 Calculando os Decis: 
 
17 18 19 20 21 22 
23 24 25 26 27 29 
32 33 35 38 39 42 
44 46 48 50 54 57 
SEPARATRIZES 
 Interpretação: 
 
 Pode concluir que 30% das máquinas têm até 23,5 
anos de uso, como também metade delas têm até 29 
anos e 90% tem no mínimo 49 anos (10% delas têm 
mais de 49 anos). 
 
SEPARATRIZES 
 Ex: Considere o tempo (em anos) de 24 máquinas 
utilizadas numa indústria. 
 
 
 
 Calculando os Percentis 17, 35 e 83: 
 
17 18 19 20 21 22 
23 24 25 26 27 29 
32 33 35 38 39 42 
44 46 48 50 54 57 
SEPARATRIZES 
 Interpretação: 
 
 Assim pode concluir que, 17% das máquinas têm até 
20,5 anos de uso, como também 35% delas têm até 
24,5 anos e 65% das máquinas tem mais de 24,5 
anos. 
 
SEPARATRIZES (EM CLASSES) 
 Para os cálculos quando os dados estão agrupados 
em classes, o cálculo é semelhante ao da mediana: 
 
 1) Calcula-se a posição da separatriz; 
 2) Procura a posição na frequência “abaixo de”; 
 3) Usa a fórmula: 
SEPARATRIZES 
 Calcule o 1º quartil (Q1) e interprete: 
 Tabela 1 – Idades dos alunos da turma Educação Física 
para a terceira idade 
Classes Fi F 
50 |- 54 4 4 
54 |- 58 9 13 
58 |- 62 11 24 
62 |- 66 8 32 
66 |- 70 5 37 
70 |- 74 3 40 
Total 40 - 
SEPARATRIZES 
 1) Calcula a posição do 1º Quartil 
 
 
 2) Usando a 2ª classe como referência 
25% dos alunos da turma 
de Educação Física para a 
terceira idade tem idade 
inferior a 56,6 anos 
EXERCÍCIO 
 Nascidos vivos segundo o peso ao nascer, em kg. 
 
 
 
 
 
 
 
 
 Calcule o D2 e o P88 e interprete. 
Classes Fi F 
1,5 |- 2,0 3 3 
2,0 |- 2,5 16 19 
2,5 |- 3,0 31 50 
3,0 |- 3,5 34 84 
3,5 |- 4,0 11 95 
4,0 |- 4,5 4 99 
4,5 |-| 5,0 1 100 
Total 100 - 
MEDIDAS DE DISPERSÃO 
 Utilizaremos o termo dispersão para indicar o grau 
de afastamento de um conjunto de números em 
relação a sua média, pois ainda que consideremos a 
média como um número que tem a faculdade de 
representar uma série de valores ela não pode por si 
mesma, estacar o grau de homogeneidade ou 
heterogeneidade que existe entre os valores que 
compõem o conjunto. O nosso objetivo é construir 
medidas que avaliem a representatividade da média, 
para isto usaremos as medidas de dispersão. 
MEDIDAS DE DISPERSÃO 
 Uma breve reflexão sobre as medidas de tendência 
central permite-nos concluir que elas não são 
suficientes para caracterizar totalmente uma 
sequência numérica. Se observarmos as seguintes 
sequências: 
 
 
 
 OBS: Sequência distinta se pensarmos na 
variabilidade dos dados. 
X: 70, 70, 70, 70, 70 
Y: 68, 69, 70, 71, 72 
Z: 1, 38, 70, 76, 165 
MEDIDAS DE DISPERSÃO 
 As principais medidas de dispersão absolutas são: 
amplitude total, variância, desvio padrão e 
coeficiente de variação. 
 
 Nosso objetivo é construir medidas que avaliem a 
representatividade da média. 
VARIÂNCIA 
 È a medida de dispersão mais utilizada. É definida 
como sendo o quociente entre a soma dos quadrados 
dos desvios e o número de elementos. É classificada 
em dois tipos: 
VARIÂNCIA 
 Calcule a variância da estatura dos funcionários de 
certa indústria automobilística: 
 
 Primeiro calcula-se a média: 
1,92 1,72 1,82 1,80 1,84 
VARIÂNCIA 
 Quando os dados estão em frequência simples: 
 
 
 
 Quando os dados estão em frequências em classes: 
VARIÂNCIA 
 As informações abaixo apresentam a idade dos 
usuários de drogas internos numa clínica para 
tratamento. 
Idade Fi Xi.Fi Xi².Fi 
17 2 34 578 
18 4 72 1296 
19 5 95 1805 
20 6 120 2400 
21 3 63 1323 
22 4 88 1936 
23 2 46 1058 
Total 26 518 10396 
VARIÂNCIA 
 Nascidos vivos segundo o peso ao nascer, em kg. 
 
 
 
 
 
 
 
 
Classes Fi Pm Pm.Fi Pm ².Fi 
1,5 |- 2,0 3 1,75 5,25 15,75 
2,0 |- 2,5 16 2,25 36 576 
2,5 |- 3,0 31 2,75 85,25 2642,75 
3,0 |- 3,5 34 3,25 110,5 3757 
3,5 |- 4,0 11 3,75 41,25 453,75 
4,0 |- 4,5 4 4,25 17 68 
4,5 |-| 5,0 1 4,75 4,75 4,75 
Total 100 - 300 7518 
VARIÂNCIA 
“DESVANTAGEM” DO USO DA VARIÂNCIA 
 No cálculo da variância, quando elevamos ao quadrado a 
diferença (xi − x) , a unidade de medida da série fica também 
elevada ao quadrado. 
 Portanto, a variância é dada sempre no quadrado da unidade 
de medida da série. Se os dados são expressos em metros, a 
variância é expressa em metros quadrados. Em algumas 
situações, a unidade de medida da variância nem faz sentido. 
É o caso, por exemplo, em que os dados são expressos em 
litros. A variância será expressa em litros quadrados. 
 Logo, o valor da variância não pode ser comparado 
diretamente com os dados da série, ou seja: variância não tem 
interpretação. 
 
SOLUÇÃO: Usar o desvio padrão 
DESVIO PADRÃO 
 Medida de dispersão que apresenta as propriedades da 
variância e tem a mesma unidade de medida dos dados. 
É a raiz quadrada da variância. 
 
 
 
 
 
 
 OBS: Quanto maior o valor do desvio padrão significa 
que mais dispersos estão os elementos em torno da 
média. 
COEFICIENTE DE VARIAÇÃO 
 O CV mede a dispersão em relação à média. É a razão 
entre o desvio padrão e a média. O resultado obtido 
dessa operação é multiplicado por 100, para que o 
coeficiente de variação seja dado em porcentagem. 
COEFICIENTE DE VARIAÇÃO 
 Alturas e Pesos de Homens. Usando os dados 
amostrais de alturas e pesos de 40 homensde uma 
turma de estatística, encontramos as estatísticas 
dadas na tabela a seguir. 
Altura (cm) Peso (kg) 
CV = (7,56/168).100 CV = (10,98/72).100 
CV = 4,5% 15,25% 
EXERCÍCIO 
 Em um grupo de pacientes, foram tomadas as 
pulsações (batidas por minuto) e dosadas as taxas de 
ácido úrico (mg/100ml). As médias e os desvios-
padrão foram: 
 
 
 
 
 Compare a dispersão da Pulsação com as taxas de 
ácido úrico.

Outros materiais