Buscar

estatistica SAVA aulas 1 a 10

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 149 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 149 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 149 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Probabilidade e Estatística
Daniela Pereira
Aulas 1 a 13
Plano de Ensino
2
Objetivos
Apresentar os elementos da Estatística descritiva e da teoria elementar da 
probabilidade, que servirão de base para o estudo da Estatística indutiva, com o 
objetivo de tornar o acadêmico apto a tomar decisões empresariais com o uso do 
ferramental estatístico.
3
Conteúdo Programático (geral)
Tipos de Dados, Arredondamentos, Medidas Estatísticas, Preparação de 
Dados para Análises Estatísticas Gráficos, Séries Estatísticas, Técnicas de 
Amostragem, Intervalo de Confiança, Distribuição Normal de Probabilidade, 
Probabilidade, Variáveis Aleatórias Discretas, Noções de Testes de Hipóteses 
e Correlação e Regressão Linear Simples.
4
Bibliografia
FREUND, John E., SIMON, Gary A. Estatística 
aplicada à economia, administração e 
contabilidade. São Paulo: Bookman, 2000,
TRIOLA, Mario F. Introdução a Estatística 7ª 
edição. Rio de Janeiro: LTC, 1999.
TOLEDO, Geraldo L.; OVALLE, Ivo I. Estatística 
básica. São Paulo: Atlas,1998.
5
Objetivos da aula – UNIDADE 1
apresentar a importância e o significado da estatística.
Compreender os objetivos da estatística descritiva
Compreender e identificar os conceitos básicos da estatística
Organizar e agrupar dados em uma tabela de frequência
Compreender o conceito das medidas de posição / tendência central
Resumir dados através do cálculo de medidas de tendência central
6
Informações em jornais e revistas
Vendas no varejo variam -0,5% em dezembro e fecham 2012 em 8,4%.
Emprego industrial recua 1,4% em 2012.
Em janeiro, IBGE prevê safra de grãos 13,1% maior que a safra obtida em 2012.
Vendas no varejo variam -0,5% em dezembro e fecham 2012 em 8,4%.
Estatística na prática
Os dados numéricos 
-0,5%, 8,4%, 1,4% e 13,1%
denominam-se estatísticas.
Definição de Estatística
Ciência que trata de métodos científicos para coleta, organização, descrição, 
análise e interpretação (conclusão) de um conjunto de dados, visando à 
tomada de decisões.
Fases do método estatístico
• Coleta
• Resumo
• Apresentação
• Análise • Resolução de Problemas
• Tomada de decisões
• Estimativas
•Planejamento e 
desenvolvimento de produtos 
ou procedimentos
Aplicação da Estatística
Podemos dividir a aplicação da Estatística basicamente 
em três etapas, que são descritas resumidamente a 
seguir:
1. Primeira Etapa - Refere-se à coleta de dados, na qual 
devemos utilizar técnicas estatísticas que garantirão uma 
amostra representativa da população.
11
h
tt
p
:/
/a
fo
n
s
o
fe
lix
.c
o
m
.b
r
http://afonsofelix.com.br/services_item/coleta-de-dados/
Aplicação da Estatística
2. Depois dos dados coletados, devemos resumí-los em 
tabelas de frequências e/ou gráficos e, posteriormente, 
encontrar as medidas de posição e variabilidade 
(quantidades). Esta etapa também é conhecida como 
Estatística 
Descritiva ou Dedutiva.
12
p
ro
in
fo
d
a
ta
.c
3
s
l.
u
fp
r.
b
r
http://proinfodata.c3sl.ufpr.br/attendance/
Aplicação da Estatística
3. Esta etapa envolve a escolha de um possível modelo 
que explique o comportamento dos dados para 
posteriormente se fazer a inferência dos dados para a 
população de interesse. Esta etapa também é chamada de 
Estatística Inferencial ou Indutiva. Nesta etapa, se faz 
necessário um conhecimento mais 
aprofundado, principalmente 
no que se refere aos tópicos
de probabilidades.
13
w
w
w
.a
b
q
.o
rg
.b
r
http://www.abq.org.br/biocom/2010/trabalhos/30-7310.htm
14
Para refletir
Na sua opinião, observando a definição de estatística, o que é mais importante: 
coletar, analisar, apresentar ou interpretar os dados?
Conceitos Básicos
População
Coleção de medidas de todos os elementos 
de um universo sobre o qual desejamos tirar 
conclusões ou tomar decisões.
Amostra
Subconjunto da população; dados 
disponíveis (acessíveis) da população.
15
Conceitos Básicos
Estatística Descritiva
Trata da organização e resumo do conjunto 
de dados em tabelas, gráficos, medidas.
Estatística Indutiva
Apresenta métodos conclusivos sobre uma 
população a partir do estudo de uma 
amostra retirada da mesma.
16
Conceitos Básicos
Variável
Conjunto de resultados possíveis de um fenômeno.
fenômeno variabilidade
Exemplo 1
• Consumo residencial de energia elétrica.
• Quantidade de itens vendidos mensalmente.
• Valores de saques em uma agência bancária.
• Grau de escolaridade.
• Sexo.
• Quantidade de itens defeituosos por lote.
17
Tipos de variáveis
18
Contínuas
Ex.: altura, salário, tempo.
Discretas
Ex.: no de filhos, quantidade de 
atendimentos.
Ordinais
Ex.: grau de escolaridade.
Nominais
Ex.: sexo, estado civil, religião.
Quantitativas
Qualitativas
Distribuições de frequências -
agrupando dados
19
Coleta de Dados Dados Brutos
Resumo / Organização
Tabelas de frequências
Quantidade de vezes que
cada valor ou atributo
ocorre no conjunto de dados.
Tabelas de frequências
Distribuição de frequências é uma tabela em que se resumem grandes 
quantidades de dados, determinando o número de vezes que cada dado 
ocorre (frequência) e a porcentagem com que aparece (frequência relativa). 
Para facilitar a contagem do número de vezes que cada dado ocorre, 
podemos ordenar os dados. A uma sequência ordenada (crescente ou 
decrescente) de dados brutos damos o nome de Rol. 
Os tipos de frequências com os quais iremos trabalhar são: 
Frequência absoluta ou simplesmente frequência (f): é o nº de vezes que 
cada dado aparece na pesquisa.
20
Tabelas de frequências
Frequência relativa ou percentual (fr): é o quociente da frequência absoluta 
pelo número total de dados. Esta frequência pode ser expressa em 
porcentagem. O valor de (fr x100) é definido como fr (%). 
Frequência acumulada (fa): é a soma de cada frequência com as que lhe são 
anteriores na distribuição. 
Frequência relativa acumulada (fra): é o quociente da frequência acumulada 
pelo número total de dados. Esta frequência também pode ser expressa em 
porcentagem. O valor de (fra x100) é definido como fra (%).
21
Tabelas de frequências
Exemplo 1.1: Dada a tabela abaixo, vamos definir qual é a variável em 
estudo e qual o tipo de variável. Depois, completaremos a tabela de 
distribuição de frequências encontrando a frequência relativa (%). 
22
Tabelas de frequências
No exemplo 1.1, a variável em estudo é a renda dos operários de uma 
determinada empresa. Esta variável é classificada como quantitativa 
contínua, pois pode assumir qualquer valor dentro de um intervalo 
numérico. 
As frequências absolutas (f) são fornecidas no problema. As frequências 
relativas (fr(%)) são encontradas dividindo cada frequência absoluta (de cada 
classe de frequência) pelo total de operários (110) e multiplicando por 100.
Em todos os nossos exemplos, na distribuição de frequências construída com 
intervalos de classes, vamos considerar que o intervalo de classe é fechado 
à esquerda e aberto à direita. Por exemplo, no caso dessa tabela, 
considerando a terceira classe de frequência, podemos dizer que os 16 
operários que estão nesta classe recebem de 4 a menos que 6 salários 
mínimos por mês.
23
Tabelas de frequências
A coluna frequência acumulada (fa) de cada classe é obtida somando a frequência 
da respectiva classe com as que lhe são anteriores e a fra (%) é obtida dividindo a fa
pelo número total de dados e multiplicando por 100.
24
Dados não agrupados Dados agrupados
em classes em classes
Tabelas de frequências
Quantidade de filhos 
por funcionário
0
1
2
3
4
Renda
(em salários mínimos)
0  2
2  4
4  6
6  8
8  10
Frequência absoluta (f): é a quantidade de vezes
que cada valor (ou atributo) aparece na pesquisa.
Tipos de frequências
Renda 
(em salários
mínimos)
f
0  2 86
2  4 58
4  6 32
6  8 16
8  10 8
Total 200
Frequência relativa ou percentual (fr): é o quociente da frequência absoluta 
pelo número total de dados. 
Tipos de frequências
Renda 
(em salários 
mínimos)
f
Frequência
relativa(fr)
0  2 86 0,43 (43%)
2  4 58 0,29 (29%)
4  6 32 0,16 (16%)
6  8 16 0,08 (8%)
8  10 8 0,04 (4%)
Total 200
Frequência acumulada (fa ou F): é a soma de cada frequência com as que lhe
são anteriores na distribuição.
Tipos de frequências
Renda 
(em salários 
mínimos)
f
Frequência
relativa (fr)
Frequência
acumul. (fa)
0  2 86 0,43 (43%) 86
2  4 58 0,29 (29%) 144
4  6 32 0,16 (16%) 176
6  8 16 0,08 (8%) 192
8  10 8 0,04 (4%) 200
Total 200
Tabelas de frequências
Exemplo 8:
Número de filhos de 65 funcionários de uma empresa (não agrupados)
29
Número de filhos Frequência
0 12
1 30
2 18
3 4
4 1
Total 65
Tabelas de frequências
Exemplo 8
Número de filhos (não agrupados)
30
Número de 
filhos
Frequência Porcentagem
Freq. 
Acumul.
0 12 18,5% 12
1 30 46,2% 42
2 18 27,7% 60
3 4 6,2% 64
4 1 1,5% 65
Total 65 100%
Tabelas de frequências
Definições Importantes
Limite inferior (Li): é o menor valor que a variável pode assumir em uma classe de 
frequência.
Limite superior (Ls): serve de limite para estabelecer qual o maior valor que a variável 
pode assumir em uma classe de frequência, mas, geralmente, os valores iguais ao 
limite superior não são computados naquela classe e sim na seguinte.
Ponto médio (Pm): é a média aritmética entre o Li e o Ls da mesma classe, ou 
seja, Pm = (Li + Ls) / 2
Amplitude (h): é a diferença entre o Ls e o Li da classe, ou seja, h = Ls – Li.
Amplitude total (ht): é a diferença entre o Ls da última classe de frequência e o Li da 
primeira classe, ou seja: ht = Ls – Li.
31
Tabelas de frequências
Como determinar o número k de classes? E o tamanho das classes?
Sugestão: regra da raiz
Onde n é o tamanho total da amostra
Exemplo, se n= 50
Tamanho (amplitude - h) de cada intervalo: h = R / K, onde R é a 
amplitude total dos dados.
Exemplo, se R = 5600, a amplitude será dada por h = 5600/ 7 = 800
32
nk 
(faixas) classes 7071,750 k
Para montar uma tabela de frequências 
devemos:
•Achar o mínimo e o máximo dos dados. 
•Determinar as classes de frequências, o que na verdade nada mais é do que escolher 
intervalos de mesmo comprimento que cubra a amplitude entre o mínimo e o 
máximo. Para determinar o número de classes, usaremos 
e para determinar o “tamanho” das classes usaremos 
h = R / K, onde R é a amplitude total dos dados.
•Contar o número de observações que pertencem a cada intervalo de classe. Esses 
números são as frequências observadas da classe. 
•Calcular as frequências relativas e acumuladas de cada classe. 
•De modo geral, a quantidade de classes não deve ser inferior a 5 e nem superior a 25.
33
nk 
Atividade
34
(ENADE 2006)
A tabela seguinte mostra como se 
distribui o tipo de ocupação dos 
jovens de 16 a 24 anos que trabalham em 
5 Regiões Metropolitanas e no Distrito 
Federal.
35
Das regiões estudadas, aquela que 
apresenta o maior percentual de jovens 
sem carteira assinada, dentre os jovens 
que são assalariados do setor privado, é
(A) Belo Horizonte.
(B) Distrito Federal.
(C) Recife.
(D) Salvador.
(E) São Paulo.
36
Exercício 2 
38
Antes de enviar um lote de aparelhos elétricos para venda, o 
Departamento de Inspeção da empresa produtora selecionou uma 
amostra casual de 32 aparelhos avaliando o desempenho através 
de uma medida especifica, obtendo os seguintes resultados: 
Construa uma tabela de frequências.
Exercício 3 
39
Complete a tabela
Exercício 4 
40
Dada a tabela a seguir, agrupe os dados em uma tabela 
de frequências, contemplando a frequência absoluta, 
relativa e acumulada.
Tabelas de frequências
Exercício 3: salários de 50 funcionários (agrupados)
Tabela 1.4 – Salários dos 50 funcionários da empresa XYZ. 41
452,00 890,00 1.000,00 1.425,00 2.200,00 
452,00 890,00 1.000,00 1.425,00 2.200,00 
452,00 960,00 1.200,00 1.425,00 2.200,00 
680,00 960,00 1.200,00 1.450,00 3.000,00 
750,00 960,00 1.200,00 1.450,00 3.000,00 
780,00 960,00 1.200,00 1.450,00 3.000,00 
800,00 960,00 1.252,00 1.500,00 3.000,00 
800,00 960,00 1.332,00 1.500,00 5.600,00 
800,00 1.000,00 1.332,00 1.500,00 5.600,00 
800,00 1.000,00 1.332,00 2.200,00 5.600,00 
Tabelas de frequências
Exemplo 9: salários de 50 funcionários (agrupados)
42
Salário (em reais) f fr (%) fa
450  1.186 22 44,0% 22
1.186  1.922 17 34,0% 39
1.922  2.658 4 8,0% 43
2.658  3.394 4 8,0% 47
3.394  4.130 0 0,0% 47
4.130  4.866 0 0,0% 47
4.866  5.602 3 6,0% 50
Total 50 100,0%
Medidas de tendência central
São valores calculados a partir de um conjunto de dados e cuja função é apresentar 
um valor que tipifica ou que “melhor” representa o conjunto de números.
Algumas medidas
•Média aritmética
•Média ponderada
•Mediana
•Moda
43
Média aritmética
É o quociente (divisão) entre a soma de todos os valores 
do conjunto e a quantidade de elementos do mesmo.
Média populacional:
Média amostral:
N
X
N
x
N
i
i 
 1
n
X
n
x
x
n
i
i 
 1
44
Média aritmética
Exemplo 10:
Calcular a média de faturas emitidas nos 5 dias desta semana pela empresa ABC 
Ferragens:
10 15 13 12 50
faturas 20
5
100
5
5012131510
55
54321
5
1






 xxxxx
x
x i
i
45
Média aritmética
Exemplo 11
Calcular a média dos salários da tabela seguinte.
salários (R$) freq. (fi) p. médio (xi) xi fi
450  1.186 22 818 17.996
1.186  1.922 17 1.554 26.418
1.922  2.658 4 2.290 9.160
2.658  3.394 4 3.026 12.104
3.394  4.130 0 3.762 0
4.130  4.866 0 4.498 0
4.866  5.602 3 5.234 15.702
Total 50 81.380
46
Média aritmética
Exemplo 11:
60,627.1
50
00,380.81
1
1 






k
i
i
k
i
ii
f
xf

47
Média ponderada
Cada valor é ponderado de acordo com sua importância 
no conjunto total de valores.
wi é o peso atribuído à observação xi.






k
i
i
k
i
ii
w
w
xw
1
1
48
49
Aplicação 1
Em uma instituição de ensino, para cada 
disciplina, anualmente, há 4 avaliações com 
pesos, respectivamente, iguais a 1, 2, 3 e 4. 
A média necessária para aprovação na 
disciplina deve ser igual ou maior que 7. 
Um aluno que obteve (nessas avaliações) 
as notas 7, 4, 5 e 10 conseguiu ser 
aprovado?
Resolução
7
10
70
10
401587
10
104534271
4
1
4
1











i
i
i
ii
w
w
xw

50
Mediana
Divide o conjunto (ordenado) ao meio. É o valor que ocupa a posição central do 
conjunto
• Se n é ímpar, a mediana é dada por:
• Se n é par, a mediana é dada por:





 

2
1n
xMd
2
1
22














nn
xx
Md
51
Mediana
Exemplo 12 – VARIÁVEL DISCRETA
Calcular a mediana de faturas emitidas nos 5 dias desta semana pela 
empresa ABC Ferragens:
10 15 13 12 50
NOTE QUE O CONJUNTO JÁ ESTÁ ORDENADO E N= 5
Md = 13
52





 

2
1n
xMd
Mediana
Exemplo 13 VARIÁVEL DISCRETA
Calcular a mediana do conjunto:
2 3 4 0 1 1 5 9
1) CONJUNTO ORDENADO
0 1 1 2 3 4 5 9
2) VERIFICAR SE N É PAR OU É IMPAR = > N=8
Md = (2 + 3) / 2 = 2,5
53
2
1
22














nn
xx
Md
Mediana
E A MEDIANA DE UMA TABELA DE FREQUÊNCIA?
54
Mediana
E A MEDIANA DE UMA TABELA DE FREQUÊNCIA COM VARIÁVEIS 
DISCRETAS?
55





 

2
1n
xMd
Mediana
MEDIANA DE UMA TABELA DE VARIÁVEIS CONTÍNUAS.
classes freq. (fi) F
35  45 5 5
45  55 12 17
55  65 18 35
65  75 14 49
75  85 6 55
85  95 3 58
Total 58
56
Mediana
MEDIANA DE UMA TABELA DE VARIÁVEIS CONTÍNUAS.
57
Mediana
MEDIANA DE UMA TABELA DE VARIÁVEIS CONTÍNUAS.
classes freq. (fi) Fa
35  45 5 5
45  55 12 17
55  65 18 35 
65  75 14 49
75  85 6 55
85  95 3 58
Total 58
58
Mediana
MEDIANA DE UMA TABELA DE VARIÁVEIS CONTÍNUAS.
59
Mediana
MEDIANA DE UMA TABELA DE VARIÁVEIS CONTÍNUAS.
60
Moda
Valor(es) com maior frequência no conjunto.
Exemplo 14 – VARIÁVEL DISCRETA
Determinar a(s) moda(s) de cada conjunto
a) 28 4 7 5 7 8 2 7
b) 54 5 3 4 5 3 4 3
c) 0 5 2 0 5 5 0 261
Moda
62
Salários (US$) freq. (fi) F
0  1 3 3
1  2 10 13
2  3 17 30
3 4 8 38
4 5 5 43
Total 43
Moda
MEDIANA DE UMA TABELA DE VARIÁVEIS CONTÍNUAS.
63
Moda
64
Salários (US$) freq. (fi) F
0  1 3 3
1  2 10 13
2  3 17 30
3 4 8 38
4 5 5 43
Total 43
Moda
MEDIANA DE UMA TABELA DE VARIÁVEIS CONTÍNUAS.
65
Exemplo de aplicação da moda
Apresentar o artigo: Universitário "padrão" é mulher e estuda à noite, 
mostra Censo.
http://educacao.uol.com.br/noticias/2012/05/27/universitario-padrao-
e-mulher-e-estuda-a-noite-mostra-censo-uol-acompanha-dia-de-
aluna.htm
66
Perfil do universitário brasileiro 
Presencial A Distância
Sexo Feminino Feminino
Categoria Privada Privada
Grau Bacharelado Licenciatura
Turno Noturno --
Idade 21 29
Idade de ingresso 19 28
Idade de conclusão 23 31
Fo
n
te
: M
EC
/I
n
ep
 
Para construção do perfil do aluno, foi considerada a 
moda: medida de posição que identifica o atributo 
com maior frequência na distribuição dos aspectos 
selecionados. 67
Exemplo de aplicação da mediana
PARA REFLEXÃO AO LONGO DA 
SEMANA
Um levantamento sobre a quantidade de empresas atendidas diariamente por um 
representante comercial revelou os seguintes números.
É possível calcular a média de empresas atendidas diariamente?
E a mediana?
68
Quant. de empresas 2 3 4 5 6 ou mais
frequências 15 9 6 5 3
Finalizando a aula
69
SEPARATRIZES
QUARTIS - Q
DECIS - D
PERCENTIL - P
70
SEPARATRIZES
As SEPARATRIZES não são medidas de tendência central, mas 
estão ligadas à mediana relativamente à sua característica de 
separar a série em duas partes que apresentam o mesmo 
número de valores.
Essas medidas - os quartis, os decis e os percentis - são, 
juntamente com a mediana, conhecidas pelo nome genérico 
de separatrizes.
71
QUARTIS - Q
Denominamos quartis os valores de uma série que a 
dividem em quatro partes iguais. Precisamos portanto 
de 3 quartis (Q1 , Q2 e Q3) para dividir a série em quatro 
partes iguais.
Obs: O quartil 2 ( Q2 ) SEMPRE SERÁ IGUAL A MEDIANA 
DA SÉRIE.
72
Quartis em dados não agrupados
73
• Se a divisão resultar num número fracionário, 
arredonde-o para cima e o valor do quartil será a 
resposta da variável encontrada nesta posição. 
• Se a divisão for um número inteiro, o quartil será a 
média aritmética da resposta da variável que ocupar a 
posição encontrada com a resposta da variável que 
ocupar a posição seguinte.
Quartis em dados não agrupados
74
Cálculo do quartil para o rol
1° Passo: Determina-se a posição do Quartil. 
2° Passo: Identifica-se a posição mais próxima do rol – verificar se o valor é 
fracionário
3° Passo: Calcular o valor do Quartil
Exemplo 1: Um escritório que presta consultoria em administração levantou os 
tempos de espera de pacientes que chegam a uma clínica de ortopedia para 
atendimento de emergência. Foram coletados os seguintes tempos, em minutos, 
durante uma semana. Encontre os quartis.
2 5 10 11 3 14 8 8 7 12 3 4 7 3 4 2 6 7
Quartis em dados não agrupados
75
Quartis em dados não agrupados
76
Quartis em dados não agrupados
77
Quartis em dados agrupados
EXEMPLO 3
78
Quartis em dados agrupados
79
Classes Frequência = F 
Frequência 
acumulada FA 
50 |------------ 54 4 4 
54 |------------ 58 9 13 
58 |------------ 62 11 24 
62 |------------ 66 8 32 
66 |------------ 70 5 37 
70 |------------ 74 3 40 
Total 40 
 
Quartis em dados agrupados
80
Quartis – dados agrupados em uma tabela de frequência com classes
Exemplo 4 – Dada a tabela abaixo, calcular os quartis
Quartis em dados agrupados
81
Classes Frequência = F 
Frequência 
acumulada FA 
50 |------------ 54 4 4 
54 |------------ 58 9 13 
58 |------------ 62 11 24 
62 |------------ 66 8 32 
66 |------------ 70 5 37 
70 |------------ 74 3 40 
Total 40 
 
Quartis em dados agrupados
82
Quartis em dados agrupados
Considere a distribuição dos pesos de um grupo de turistas que visita um 
parque temático em Fortaleza/CE/Julho/16. Calcule os Quartis
Tabela 3.2 - Pesos de um grupo de turistas do Parque Temático 
Fortaleza/CE/Julho/16.
83
Quartis em dados agrupados
84
Quartis em dados agrupados
85
Quartis em dados agrupados
86
Quartis em dados agrupados
87
PERCENTIS - P
A definição dos Percentis obedece ao mesmo princípio 
dos quartis. A diferença é que dividimos o conjunto em 
100 partes iguais. Desta forma, precisamos calcular 100 
percis:
P1, P2,..., P98,P99
88
PERCENTIS - P
1º PASSO – para calcular os percentis, o conjunto deve 
estar organizado como um rol
2º PASSO – identificamos a posição dos percentil usando a 
fórmula 
Adotaremos a seguinte convenção: 
• Se a divisão resultar num número fracionário, arredonde-o para cima e o 
valor do percentil será a resposta da variável encontrada nesta posição. 
• Se a divisão for um número inteiro, o percentil será a média aritmética 
da resposta da variável que ocupar a posição encontrada com a resposta 
da variável que ocupar a posição seguinte.
89
PERCENTIS - P 
variáveis discretas e não agrupadas
Exemplo:
Vamos encontrar o trigésimo quinto percentil do conjunto de dados do exemplo 2.4.
2 2 3 3 3 4 4 5 6 7 7 7 8 8 10 11 12 14
O percentil P35 será a resposta da variável que ocupar a posição (35 X18 )/100 = 6,3
Como a divisão resultou em um valor fracionário, vamos arredondar para 7. Portanto, 
o trigésimo quinto percentil é o valor que está na sétima posição.
P35 = 4
Então, aproximadamente 35% das observações são menores ou iguais a 4 minutos
90
DECIS - D
A definição dos Decis obedece ao mesmo princípio dos 
quartis. A diferença é que dividimos o conjunto em 10 
partes iguais. Desta forma, precisamos calcular 9 Decis:
D1, D2, D3, D4, D5, D6, D7, D8 e D9
O quinto decil divide o conjunto em duas partes iguais. 
Assim sendo,o QUINTO DECIL É IGUAL AO SEGUNDO 
QUARTIL, que por sua vez É IGUAL À MEDIANA
91
DECIS - D
O Decil DK será dado pela variável que ocupar a 
posição DK = (Kxn) / 10
• Se a divisão resultar num número fracionário, 
arredonde-o para cima e o valor do decil será a 
resposta da variável encontrada nesta posição. 
• Se a divisão for um número inteiro, o decil será a 
média aritmética da resposta da variável que ocupar a 
posição encontrada com a resposta da variável que 
ocupar a posição seguinte.
92
Gráficos
UTILIZANDO O MICROSOFT EXCEL
93
Gráficos
O objetivo da utilização de gráficos em análise de dados é o de 
facilitar a compreensão do fenômeno estatístico por meio do 
efeito visual imediato que os gráficos proporcionam.
Os tipos de gráfico mais usados:
• GRÁFICO EM LINHAS
• DIAGRAMAS DE ÁREA ( gráfico em colunas, gráfico em barras e gráfico 
em setores)
• GRÁFICO PARA REPRESENTAR DISTRIBUIÇÃO DE FREQUENCIA COM 
INTERVALOS DE CLASSES (polígono de frequências, histograma e ogiva)
94
Gráfico em Linhas
Usado sempre que os dados estiverem distribuídos segundo uma variável no tempo 
(meses, anos, etc) Esse tipo de gráfico retrata as mudanças nas quantidades com 
respeito ao tempo através de uma série de segmentos de reta. É muito eficiente 
para mostrar possíveis tendências no conjunto de dados.
Note que o eixo X do Gráfico (linha horizontal), representa a passagem de tempo e 
o eixo Y (linha vertical) representa os dados, os números.
Exemplos: 
1) Bolsa de valores 2) Precipitação pluviométrica
95
Gráfico em Linhas
ANO ASSINANTES EM MILHÕES
1997 1,1
1998 1,3
1999 1,5
2000 1,9
2001 2,4
2002 2,6
2003 3,1
2004 7,4
2005 18,6
2006 21,5
2007 29
96
A tabela abaixo fornece uma lista do número de assinantes de telefones 
celulares, em milhões, de 1997 a 2007, do país X. Construa um gráfico 
para resumir os dados da tabela a seguir.
Gráfico em Linhas
97
Gráfico em Linhas
98
O gráfico de linhas no Excel pode ser usado em diversas situações, como:
 Resultado de vendas ao longo do ano;
 Controle de custos aolongo do ano;
 Controle de peso ao longo do ano;
 Taxa de crescimento de clientes ao longo do ano.
Gráficos de linhas podem mostrar dados contínuos ao longo do tempo 
em um eixo com escalas iguais e, portanto, são ideais para mostrar 
tendências de dados em intervalos iguais, como meses, trimestres ou 
anos fiscais.
Diagramas de barras – Gráficos 
em coluna
Os diagramas em barras (ou colunas) são bastante utilizados quando 
trabalhamos com variáveis qualitativas (dados categóricos). 
No eixo horizontal especificamos os nomes das categorias e no eixo 
vertical construímos uma escala com a frequência ou a frequência 
relativa. 
As barras terão bases de mesma largura e alturas iguais à frequência ou 
à frequência relativa. O gráfico em barras, quando as barras estão 
dispostas no sentido vertical, também é chamado de gráfico em colunas. 
ATENÇÃO
99
Diagramas de barras – Gráficos 
em coluna
100
Exemplos 
Note que o eixo X do 
Gráfico (linha 
horizontal), representa a 
categoria dos dados, 
também poderia ser 
a passagem de tempo e 
o eixo Y (linha vertical) 
representa a 
porcentagem, os 
números.
Diagramas de barras – Gráficos 
em coluna
101
Diagramas de barras – Gráficos 
em coluna
102
Exemplo: observe a figura 2.2. O gráfico ilustrado compara a audiência de 
quatro canais de TV aberta durante 7 dias da semana
Diagramas de barras – Gráficos 
em coluna
103
Exemplo: Uma grande indústria de materiais de construção, com diversas lojas 
espalhadas pelo país, fez um levantamento das principais causas de perda de ativos 
durante o ano de 2007 e as informações estão dispostas na tabela seguinte. 
CAUSAS VALOR PERDIDO - MILHÕES DE R$
Má administração 5,2
Roubos de funcionários 3,9
Fraudes nas vendas 5,5
Assaltos às lojas 1,8
Perda do estoque 1,6
Atendimento ruim 0,8
Diagramas de barras – Gráficos 
em coluna
Você pode usar Gráfico de Barras no Excel em diversas situações, como:
•Resultado de vendas por categorias específicas (por vendedor, por local, 
por tempo, etc.)
•Controle de custos por categorias específicas (por vendedor, por local, 
por tempo, etc.)
•Controle de peso ao longo do ano;
•Taxa de crescimento de clientes ao longo do ano e também por 
categorias específicas.
104
Gráfico ou Diagrama de 
Setores
O diagrama em setores, também conhecido como gráfico de pizza, é um 
dos gráficos mais utilizados para representar variáveis qualitativas (ou 
categóricas) e é bastante apropriado quando se deseja visualizar a 
proporção que cada categoria representa do total. 
105
Gráfico ou Diagrama de 
Setores
106
Gráfico ou Diagrama de 
Setores
107
Exemplo: Uma grande indústria de materiais de construção, com diversas lojas 
espalhadas pelo país, fez um levantamento das principais causas de perda de ativos 
durante o ano de 2007 e as informações estão dispostas na tabela seguinte. 
CAUSAS VALOR PERDIDO - MILHÕES DE R$
Má administração 5,2
Roubos de funcionários 3,9
Fraudes nas vendas 5,5
Assaltos às lojas 1,8
Perda do estoque 1,6
Atendimento ruim 0,8
Gráfico ou Diagrama de 
Setores
Considere a utilização de um gráfico de pizza quando:
Você tiver apenas uma série de dados.
Nenhum dos valores nos seus dados for negativo.
Quase nenhum dos valores nos seus dados for igual a zero.
Você não tiver mais de sete categorias, todas elas representando partes 
da pizza inteira.
•Para apresentar resultado de pesquisas por região;
•Para apresentar resultado de vendas de um determinado período de 
tempo;
•Para apresentar relatório de despesas administrativas por determinadas 
categorias;
108
GRÁFICO PARA REPRESENTAR 
DISTRIBUIÇÃO DE FREQUENCIA 
POLÍGONO DE FREQUÊNCIAS 
HISTOGRAMA 
OGIVA
109
Histograma
Um histograma é semelhante ao diagrama de barras, 
porém refere-se a uma distribuição de frequências para 
dados quantitativos contínuos. 
Por isso, apresenta uma diferença: não há espaços entre 
as barras. Os intervalos de classes são colocados no eixo 
horizontal enquanto as frequências são colocadas no 
eixo vertical. As frequências podem ser absolutas ou 
relativas. 
110
Histograma
111
Histograma
112
Histograma
A tabela a seguir apresenta o salário de funcionários de uma empresa no 
interior de Minas Gerais
113
SALÁRIO FREQUENCIA ABSOLUTA FREQUENCIA ACUMULADA
[400;800) 38 38
[800;1200) 18 56
[1200;1600) 12 68
[1600; 2000) 8 76
[2000,2400) 8 84
[2400;2800) 5 89
[2800;3200) 3 92
[3200;3600) 0 92
[3600;4000) 2 94
[4000; 4400) 0 94
[4400;4800) 1 95
Total 95
38
56
68
76
84
89 92 92
94 94 95
0
10
20
30
40
50
60
70
80
90
100
V
al
o
r 
d
a 
Fr
eq
u
en
ci
a
Classes
Frequencia Acumulada
38
18
12
8 8
5
3
0
2
0 1
0
5
10
15
20
25
30
35
40
Fr
eq
u
en
ci
a
Sakários
Frequencia Absoluta
Polígono de Frequências
O polígono de frequências é um gráfico de linha de uma distribuição de 
frequências. 
No eixo horizontal são colocados os pontos médios de cada intervalo de 
classe e no eixo vertical são colocadas as frequências absolutas ou 
relativas (como no histograma). 
Para se obter as intersecções do polígono com o eixo das abscissas, 
devemos encontrar o ponto médio da classe anterior à primeira e o 
ponto médio da classe posterior à última.
114
Polígono de Frequencia
A tabela a seguir apresenta o salário de funcionários de uma empresa no 
interior de Minas Gerais
115
SALÁRIO FREQUENCIA ABSOLUTA FREQUENCIA ACUMULADA
[400;800) 38 38
[800;1200) 18 56
[1200;1600) 12 68
[1600; 2000) 8 76
[2000,2400) 8 84
[2400;2800) 5 89
[2800;3200) 3 92
[3200;3600) 0 92
[3600;4000) 2 94
[4000; 4400) 0 94
[4400;4800) 1 95
Total 95
0
5
10
15
20
25
30
35
40
200 600 100 1400 1800 2000 2200 2400 2600 2800 3000 3200 3400
Fr
eq
u
en
ci
a
Ponto Médio das Classes
Salários dos Funcionários
Polígono de Frequência com 
Histograma
A tabela a seguir apresenta o salário de funcionários de uma empresa no 
interior de Minas Gerais
116
SALÁRIO FREQUENCIA ABSOLUTA FREQUENCIA ACUMULADA
[400;800) 38 38
[800;1200) 18 56
[1200;1600) 12 68
[1600; 2000) 8 76
[2000,2400) 8 84
[2400;2800) 5 89
[2800;3200) 3 92
[3200;3600) 0 92
[3600;4000) 2 94
[4000; 4400) 0 94
[4400;4800) 1 95
Total 95
0
5
10
15
20
25
30
35
40
200 600 100 1400 1800 2000 2200 2400 2600 2800 3000 3200 3400
Fr
eq
u
en
ci
a 
A
b
so
lu
ta
Ponto Médio das Classes
Salário dos Funcionários
Ogiva
Uma ogiva é um gráfico para uma distribuição de frequências 
acumuladas. 
117
Ogiva
Para construir um gráfico de ogiva, devemos usar o limite superior de 
cada intervalo no eixo horizontal e a frequência acumulada no eixo 
vertical. A frequência acumulada relacionada com o limite inferior da 
primeira classe é sempre zero.
118
Ogiva
A tabela a seguir apresenta o salário de funcionários de uma empresa no 
interior de Minas Gerais
119
SALÁRIO FREQUENCIA ABSOLUTA FREQUENCIA ACUMULADA
[400;800) 38 38
[800;1200) 18 56
[1200;1600) 12 68
[1600; 2000) 8 76
[2000,2400) 8 84
[2400;2800) 5 89
[2800;3200) 3 92
[3200;3600) 0 92
[3600;4000) 2 94
[4000; 4400) 0 94
[4400;4800) 1 95
Total 95
0
10
20
30
40
50
60
70
80
90
100
400 800 1200 1600 2000 2400 2800 3200 3600 4000 4400 4800
Fr
eq
u
en
ci
a 
ac
u
m
u
la
d
a
Salário
Ogiva - Salários dos Funcionários
Diagrama de 
Pareto
CURVA ABC
120
Diagrama de Pareto
O princípio de Pareto, também conhecido como o princípio 80/20, foi criado em 
1897 por Vilfredo Pareto Esse diagrama também conhecido como curva ABC, é 
uma técnica estatística que auxilia na tomada de decisão, permitindo aos gestores 
selecionar prioridades quando há um grande número de problemas. 
É um gráfico de colunas que ordena as frequências das ocorrências, da maior para 
a menor, permitindo a priorização dos problemas, procurando levar a cabo o 
princiípio de Pareto (80% das consequências advêm de 20% das causas), isto é, há 
muitos problemas sem importância diante de outros mais graves. 
Recomenda-se que, antes de fazer a aplicação da regra de Pareto, tenha-seum 
objetivo dentro da empresa. Esse objetivo pode ser o aumento da taxa de retorno 
dos clientes, a redução de estoques, a redução nas devoluções de produtos, a 
venda exclusiva dos produtos mais rentáveis, dentre outros.
121
122
Gráfico de Pareto
123
Gráfico de Pareto
124
Defeito/Problema Quantidade Frequencia Relativa % Frequencia Relativa Acumulada % 
Ranhura 151 30% 30%
Rebarba 133 26% 56%
Ovalização 116 23% 79%
Fissura 46 9% 88%
Quebra 24 5% 93%
Tonalidade 15 3% 96%
Espessura 12 2% 98%
Outros 8 2% 100%
Total 505 100%
151
133
116
46
24 15 12 8
30%
56%
79%
88%
93%
96%
98% 100%
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0
100
200
300
400
500
Ranhura Rebarba Ovalização Fissura Quebra Tonalidade Espessura Outros
Diagrama de Pareto
Quantidade Frequencia Relativa Acumulada %
Gráfico de Pareto
125
Problema Total `% `% acumulada
Lubrificação da máquina 863 41,13% 41,13%
Qualidade do material 759 36,18% 77,31%
Corte desregulado 177 8,44% 85,75%
Torno descalibrado 77 3,67% 89,42%
Sensor desregulado 73 3,48% 92,90%
Erro na galvanizaçãp 40 1,91% 94,80%
Erro humano 29 1,38% 96,19%
Mistura de metais 29 1,38% 97,57%
Defeitos na refrigeração 28 1,33% 98,90%
Velocidade da máquina 23 1,10% 100,00%
2098
863
759
177
77 73 40 29 29 28 23
41,13%
77,31%
85,75%
89,42%
92,90% 94,80%
96,19% 97,57%
98,90% 100,00%
0,00%
10,00%
20,00%
30,00%
40,00%
50,00%
60,00%
70,00%
80,00%
90,00%
100,00%
0
500
1000
1500
2000
Causas e impactos na geração de defeitos
Total `% acumulada
Gráfico de Pareto
126
Descrição Causa Quantidade ´% Relativa ´% acumulada
Lentidão no sistema causa 1 62 30% 30%
Central sempre ocupada causa 2 48 23% 53%
Feedback tira dúvidas demorado causa 3 35 17% 69%
Falta de conhecimento dos produtos por parte dos atendentes causa 4 19 9% 78%
Descontentamento da Cortesia por parte do atendimento causa 5 15 7% 86%
Alta rotatividade no quadro de atendentes causa 6 12 6% 91%
Erro no envio dos pedidos por parte dos atendentes causa 7 10 5% 96%
Tempo excessivamente alto para entre gos produtos causa 8 8 4% 100%
209 100%
62
48
35
19 15 12 10 8
30%
53%
69%
78%
86%
91%
96%
100%
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0
50
100
150
200
causa 1 causa 2 causa 3 causa 4 causa 5 causa 6 causa 7 causa 8
Causas e impactos na queda do número de vendas
Quantidade ´% acumulada
Tutorial completo para gráficos 
no Excel
https://www.baboo.com.br/arquivo/software/trabalhando-com-
graficos-no-office-2013/
127
https://www.baboo.com.br/arquivo/software/trabalhando-com-graficos-no-office-2013/
Medidas de 
Dispersão
AMPLITUDE – TOTAL E INTERQUARTIL
DESVIO PADRÃO
VARIANCIA
128
129
Informações sobre Honolulu e 
Huston
•Temperatura média diária quase iguais – em torno de 23,9°
• A temperatura em Honolulu varia muito pouco ao longo do ano, 
oscilando, em geral, entre 21,1ºC e 26,7ºC. 
• A temperatura em Houston pode diferir estacionalmente, isto é, 
apresentar-se baixa em janeiro (cerca de 4,4ºC) e alta em julho e agosto 
(bem perto de 37,8ºC). 
APESAR DA MESMA MÉDIA, AMBAS AS CIDADES APRESENTAM 
VARIAÇÕES DIFERENTES DE TEMPERATURA
A distribuição de temperatura em Houston (Texas) tem maior 
variabilidade do que a distribuição de temperaturas em Honolulu (Havaí).
130
Um exemplo ...
Considere os seguintes conjuntos de valores das variáveis X, Y e Z:
X: 70, 70, 70, 70, 70.
Y: 68, 69, 70, 71, 72.
Z: 5, 15, 50, 120, 160.
Calculando a média aritmética de cada um destes conjuntos, obtemos:
Média X = 70 Média Y = 70 Média Z = 70
Os três conjuntos apresentam a mesma média aritmética: 70, entretanto é fácil 
notar que o conjunto X é mais homogêneo que os conjuntos Y e Z. 
Para quantificar o quão os dados são heterogêneos precisamos encontrar algumas 
medidas de dispersão.
131
Amplitude
Amplitude total (R): a amplitude total é a diferença entre o maior e o 
menor valor observado:
132
A amplitude só leva em conta dois valores de todo o conjunto de dados
Desvio Padrão (S)
O desvio-padrão é a medida mais usada na comparação de diferenças 
entre grupos, por ser mais precisa e estar na mesma medida do conjunto 
de dados. Ele determina a dispersão dos valores em relação a média. Sua 
formulação é dada pela raiz quadrada da média aritmética dos 
quadrados dos desvios, ou seja:
onde, é cada uma das observações do conjunto de dados, é a média do 
conjunto de dados e n é o número total de observações do conjunto de 
dados.
133
Variância 
134
Coeficiente de Variação (CV)
O coeficiente de variação (cv) é definido como o quociente entre o desvio-
padrão e a média. É freqüentemente expresso em porcentagem. (Ele mede 
o “grau” de variabilidade do conjunto de dados).
Alguns autores consideram a seguinte regra empírica para a interpretação
do coeficiente de variação:
• Baixa dispersão: C.V ≤ 15%
• Média: C.V . 15% – 30%
• Alta: C.V ≥ 30%
135
Exemplos
1) Sabendo-se que a produção leiteira diária da vaca A, durante uma 
semana, foi de: 10, 14, 13, 15, 16, 18 e 12 litros, pede-se calcular a 
amplitude, o desvio-padrão (S), a variância ( S2) e o coeficiente de 
variação (cv).
Organizando a amostra em um rol temos:
10 12 13 14 15 16 18
AMPLITUDE
R = 18 – 10 = 8
136
Exemplo - continuação
Para calcular o desvio padrão, precisamos antes da média do conjunto
Média = ( 10 + 12 + 13 + 14 + 15 + 16 + 18) / 7 = 14
137
Exemplo - continuação
138
Dados agrupado em uma 
tabela de frequencia
Atenção:
139
Exemplo – Dados Agrupados 
em uma tabela de Frequencia
Consideremos a distribuição relativa a 34 famílias de quatro filhos, 
tomando para variável o número de filhos do sexo masculino:
Para calcular as medidas de dispersão do conjunto, precisamos saber a 
média e criar novas colunas na tabela.
140
Exemplo – continuação
Média = ( 0x2 + 1x6 + 2x10 + 3x12 + 4x4) / 34
◦ Média = 2,9
◦ Amplitude = R = 4 – 0 = 4 meninos
141
Exemplo - Continuação
142
Exemplo - Continuação
143
Exemplo - continuação
Ou seja, o número médio de filhos homens por família de 4 filhos é de 
2,3 com uma variabilidade de aproximadamente 1 filho, ou seja, a maior 
parte das famílias com 4 filhos têm entre:
2,3 +/- 1 = (1,3 e 3,3) (1 e 3) filhos homens.
144
Exemplo – Dados em uma tabela 
de frequencia com classes
Custos R$ Fi
Classes de fr.
450 |- 550 8
550 |- 650 10
650 |- 750 11
750 |- 850 16
850 |- 950 13
950 |- 1050 5
1050 |- 1150 1
Total 64
145
Considere a seguinte distribuição de freqüência referente 
aos salários de operários de uma determinada fábrica:
Exemplo - continuação
146
Exemplo - continuação
Amplitude:
R= 1150 – 450 = 700
ou seja, a maior diferença existente entre os salários dos operários desta 
determinada fábrica é de R$ 700,00.
OBS: Sabemos que a média para este conjunto de dados é =754,69 filhos
Desvio-padrão:
147
Exemplo - Continuação
ou seja, o número médio de salários é de R$754,68 com uma 
variabilidade de aproximadamente R$155,26, ou seja, a maior parte dos 
operários recebem entre: 754,68 155,26 = (599,42 e 909,94) reais.
148
Exemplo - Continuação
149

Outros materiais

Outros materiais