Buscar

Estatistica Aplicada

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

UNISEB 
Centro Universitário 
Estatística 
Aplicada 
Prof. Valeria Ferreira 
 
Módulo 
UNISEB 
Centro Universitário 
Medidas Resumo 
Unidade 2 
1.1 
Objetivos da aprendizagem 
• Aprender como caracterizar um conjunto de 
dados por meio de medidas numéricas. 
 
• Aprender a calcular e interpretar as medidas 
de posição. 
 
• Aprender a calcular e interpretar as medidas 
de dispersão. 
3 
Medidas - resumo 
•Medidas de Posição ou Tendência Central 
Têm o objetivo de apresentar um ponto 
central em torno do qual os dados se 
distribuem. As mais conhecidas são: a média, 
a mediana e a moda. 
 
•Medidas de Dispersão 
Servem para indicar o quanto os dados se 
apresentam dispersos em torno da região 
central. 
4 
Medidas de posição 
•Média Aritmética 
A média aritmética de um conjunto de dados 
apresentados numa tabela de frequências é 
calculada da seguinte maneira: 
 
 
Em que: 
• são os valores que a variável assume; 
• é a frequência referente a cada valor; 
• é a soma dos valores das frequências. 
 
5 
 






k
i
i
k
i
ii
f
fx
x
1
1
 
ix
 
if
 


k
i
if
1
Média Aritmética 
Exemplo 1: os dados abaixo são referentes às 
idades de funcionários do setor administrativo de 
uma empresa: 
22 24 19 21 25 18 28 24 25 28 22 25 
 
Vamos calcular a idade média dos funcionários: 
 
 
 
 
6 
anos 42,23
12
281
12
2521192422




x
Agora, vamos calcular a média aritmética por meio 
dos dados organizados numa tabela de 
frequências. 
 
7 
Idade Nº funcionários 
18 1 18 
19 1 19 
21 1 21 
22 2 44 
24 2 48 
25 3 75 
28 2 56 
Total 12 281 
)( ix )( if
ii fx 
Utilizando as informações do quadro, 
temos: 
 
 
 
 
Portanto, podemos concluir que os dados 
estão concentrados em torno de 23,42 
anos. 
8 
anos 42,23
12
281
1
1 






k
i
i
k
i
ii
f
fx
x
Média Ponderada 
Em algumas situações, os valores que 
queremos resumir têm graus de importância 
diferentes. Nesses casos, utilizamos a média 
ponderada. 
A média ponderada dos números com 
pesos , representada por ,é definida 
como: 
 
 
9 
nxxx ,...,, 21
nppp ,...,, 21
px
n
nn
p
ppp
pxpxpx
x





21
2211
Média Ponderada 
Exemplo 2: um aluno assistiu a um curso no qual 
sua média final é determinada a partir de cinco 
fontes: 50% da média de seus testes, 15% de seu 
exame no meio do curso, 20% do seu exame final, 
10% de seu trabalho no laboratório de informática e 
5% do trabalho feito em casa. As notas obtidas em 
cada fonte são, respectivamente: 
 
8,6 9,5 8,1 7,8 9 
 
Calcule a média final obtida pelo aluno. 
10 
Média Ponderada 
Utilizando a fórmula da média ponderada: 
 
 
 
 
 
 
O aluno obteve média final 8,58. 
11 
58,8
1
575,8
05,010,02,015,05,0
05,0910,08,72,01,815,05,95,06,8
321
332211







p
p
p
x
x
ppp
pxpxpx
x
Moda 
A moda de um conjunto de dados é o valor 
(ou valores) que ocorre com maior frequência. 
A moda, diferentemente das outras medidas 
de posição, também pode ser encontrada 
quando a variável em estudo for qualitativa. 
 
Um conjunto de dados pode não apresentar 
moda (amodal), duas modas (bimodal) ou 
mais de duas modas (multimodal). 
12 
Moda 
Analisando o conjunto de dados do Exemplo 
1, verificamos que o valor que aparece com a 
maior frequência é o 25. 
 
Portanto, moda = 25 anos. 
 
13 
Mediana 
A mediana é outra medida de posição, dita mais 
robusta que a média, pois, da forma como ela é 
determinada, não permite que alguns valores muito 
altos ou muito baixos interfiram de maneira 
significativa em seu valor. 
A mediana é encontrada ordenando os dados do 
menor para o maior valor e, em seguida, 
identificando o valor central desses dados 
ordenados. É uma medida que divide o conjunto de 
dados ao meio, deixando a mesma quantidade de 
valores abaixo dela e acima. 
14 
Mediana 
Se o número de elementos do conjunto de dados 
for ímpar, então a mediana será exatamente o valor 
“do meio”, ou seja: 
 
 
Se o número de elementos do conjunto de dados 
for par, então a mediana será exatamente a média 
“dos dois valores do meio”, isto é: 
 
15 
 





 

2
1n
xMd
 
2
2
2
2





 








nn
xx
Md
Mediana 
Exemplo 3: os dados abaixo são referentes às 
idades de funcionários do setor administrativo de 
uma empresa: 
22 24 19 21 25 18 28 24 25 28 22 25 
 
Vamos encontrar a mediana para esse conjunto de 
dados. 
Para encontrar a mediana, os dados devem estar 
ordenados: 
18 19 21 22 22 24 24 25 25 25 28 28 
16 
Mediana 
Como n = 12 é um número par, encontraremos a 
mediana por meio da seguinte fórmula: 
 
 
 
 
Portanto, podemos afirmar que 50% das 
observações são menores ou iguais a 24 anos e as 
outras 50% das observações são maiores ou iguais 
a 24 anos. 
17 
anos 24
2
2424
2
2
76
2
2
2












 






xx
Md
xx
Md
nn
Medidas de posição para dados 
agrupados em classes 
Quando o conjunto de dados for apresentado 
sob a forma agrupada, perdemos a 
informação dos valores das observações. 
Nesse caso, vamos supor que todos os 
valores dentro de uma classe tenham seus 
valores iguais ao ponto médio dessa classe. 
 
18 
Exemplo 4: 
Tabela 3: distribuição de frequências dos 
salários de funcionários de uma empresa. 
19 
Salário (R$) Nº funcionários 
581|―876 13 32,5 13 
876|―1171 11 27,5 24 
1171|―1466 3 7,5 27 
1466|―1761 2 5,0 29 
1761|―2056 6 15 35 
2056|―2351 2 5,0 37 
2351|―2646 3 7,5 40 
Total 40 100 
(%)rf af
Para calcular as medidas de posição por meio 
da Tabela 3, vamos seguir o procedimento: 
 
20 
Salário (R$) Nº funcionários 
581|―876 13 728,50 9470,50 
876|―1171 11 1023,50 11258,50 
1171|―1466 3 1318,50 3955,50 
1466|―1761 2 1613,50 3227,00 
1761|―2056 6 1908,50 11451,00 
2056|―2351 2 2203,50 4407,00 
2351|―2646 3 2498,50 7495,50 
Total 40 51265,00 
ix
ii fx 
Então, a média aritmética para as 
informações contidas no quadro é: 
 
 
 
Se calcularmos a média aritmética por meio 
dos dados brutos (sem agrupar), vamos 
obter .Isso nos mostra que as 
medidas descritivas obtidas por meio dos 
dados agrupados são apenas 
aproximações dos verdadeiros valores. 
21 
reais 63,1281
40
51265
1
1 






k
i
i
k
i
ii
f
fx
x
85,1274x
No caso da mediana, vamos utilizar a seguinte 
fórmula: 
 
 
Em que: 
 
 
 
 
 
22 
md
md
anterior
md
h
f
fa
n
lMd 











 2inf
876inf mdl
20
2
40
2

n
13anteriorfa
11mdf
295mdh
Substituindo os valores encontrados na fórmula: 
 
 
 
 
 
 
 
Então, 50% das observações são menores ou 
iguais a R$ 1063,73 e as outras 50% das 
observações são maiores ou iguais a R$ 
1063,73. 
23 
md
md
anterior
md
h
f
fa
n
lMd 










 2inf
reais 73,1063
73,187876
295
11
1320
876







 

Md
Md
Md
Para calcular a moda, utilizamos a seguinte 
fórmula: 
 
 
Em que: 
 
d1 = 13 
d2 = 2 
 
 
24 
momo
h
dd
d
lMo 







21
1
inf
581inf mol
295moh
Substituindo os valores na fórmula: 
25 
momo
h
dd
d
lMo 







21
1
inf
67,836
67,255581
295
213
13
581










Mo
Mo
Mo
Exercício 1: uma pizzaria, 
interessada em estudar o número 
de pedidos de pizza por telefone, fez um 
levantamento dos pedidos dos últimos 30 
dias e obteve os seguintes resultados: 
 
26 
 35 12 15 15 20 30 
40 30 8 10 22 30 
45 50 62 5 8 12 
26 30 40 32 4 12 
20 18 30 38 40 10 
a) Indique e classifique a variável 
em estudo. 
 
 
b) Encontre as medidas de posição: média, 
moda e mediana por meio do conjunto de 
dados brutos. 
27 
Resolução 
a) A variável em estudo é o número de pizzas 
pedidas por telefone nos últimos 30 dias. Essa 
variável é classificada como quantitativa 
discreta. 
b) A média é calculada por: 
 
 
 
Foram pedidas, em média, aproximadamente 25 
pizzas nos últimos 30 dias. 
28 
pizzas 97,24
30
749
30
622102854
1
1 







 
k
i
i
k
i
ii
f
fx
x
Resolução 
Para encontrar a mediana, os dados devem 
estar ordenados: 
 
 
29 
4 5 8 8 10 10 
12 12 12 15 15 18 
20 20 22 26 30 30 
30 30 30 32 35 38 
40 40 40 45 50 62 
Resolução 
Como n = 30 é um número par, temos que 
a mediana é : 
 
 
 
 
 
Então, 50% dos valores são menores ou 
iguais a 24 e os outros 50% dos valores 
são maiores ou iguais a 24. 
 
30 
 
2
2
2
2





 








nn
xx
Md
pizzas 24
2
2622
22
16152
230
2
30












 






xx
xx
Md
Resolução 
A moda para esse conjunto de dados é 30 
pizzas, ou seja: 
 
Moda = 30 pizzas 
31 
Medidas de Dispersão 
Para entender a importância e o conceito das 
medidas de dispersão, vamos analisar a 
situação a seguir: 
 
Por exemplo, você é um agente de compra de 
uma grande firma de manufatura e que 
regularmente faz pedidos de compra com dois 
diferentes fornecedores. Depois de diversos 
meses de trabalho, você descobre que o número 
médio de dias exigido para preencher os 
pedidos de compra é de 10 dias para ambos os 
fornecedores. 
32 
Medidas de Dispersão 
A Figura 1 resume o número de dias 
trabalhados exigido para preencher os 
pedidos de compra dos fornecedores. 
Embora o número médio de dias seja 10 para 
ambos os fornecedores, será que eles têm o 
mesmo grau de confiabilidade em termos de 
fazer entregas no tempo programado? 
Que fornecedor você preferiria? 
33 
Medidas de Dispersão 
Figura 1: diagrama em colunas mostrando 
o número de dias exigidos par preencher as 
ordens de compra. 
Fonte: Anderson et al. Estatística Aplicada à Administração e Economia 
34 
0
0,1
0,2
0,3
0,4
0,5
0,6
9 10 11
Fr
eq
uê
nc
ia
 R
el
al
iv
a
Número de dias trabalhados - Fornecedor A
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
7 8 9 10 11 12 13 14 15
Fr
eq
uê
nc
ia
 R
el
at
iv
a
Número de dias trabalhados - Fornecedor B
Medidas de Dispersão 
Para a maioria das empresas, o recebimento de 
materiais no tempo programado é muito importante. 
As entregas em sete ou oito dias pelo fornecedor B 
podem ser vistas como favoráveis, no entanto, ter 
uma parte das entregas com demora de 13 a 15 
dias pode causar problemas em termos de fazer a 
produção no tempo programado. 
Esse exemplo ilustra uma situação na qual a 
variabilidade no tempo de entrega pode ser 
considerada primordial na seleção de um 
fornecedor. 
35 
Medidas de Dispersão 
As medidas de dispersão indicam o grau de 
variabilidade das observações. Essas medidas 
possibilitam que façamos distinção entre 
conjuntos de observações quanto à sua 
homogeneidade. Quanto menor as medidas de 
dispersão, mais homogêneo é o conjunto de 
dados. As medidas que vamos apresentar são: 
•Amplitude Total 
•Desvio-Padrão 
•Variância 
•Coeficiente de Variação 
36 
Amplitude Total 
A amplitude total é a diferença entre o maior e o 
menor valor observado no conjunto de dados, ou 
seja: 
 
A amplitude não é uma medida muito utilizada, pois 
só leva em conta dois valores de todo o conjunto de 
dados e é muito influenciada por valores extremos. 
Uma medida mais interessante seria aquela que 
considerasse todos os valores do conjunto de 
dados, por exemplo, o desvio-padrão. 
37 
 
   mínimomáximo xxR 
Desvio-Padrão 
Quando os dados estiverem dispostos numa tabela 
de frequências, o desvio-padrão pode ser 
encontrado da seguinte forma: 
 
 
38 
   
11
2
2
1
2










n
n
fx
fx
n
fxx
s
ii
ii
k
i
ii
Interpretação do desvio-padrão 
Para conjuntos de dados que tenham 
distribuição em forma de sino, valem as 
seguintes considerações: 
•cerca de 68% das observações do conjunto de 
dados ficam a um desvio-padrão da média, ou 
seja, ; 
•cerca de 95% das observações do conjunto de 
dados ficam a dois desvios-padrões da média, 
ou seja, ; 
•cerca de 99,7% das observações do conjunto 
de dados ficam a três desvios-padrões da 
média, ou seja, . 
 
39 
)( e )( sxsx 
)2( e )2( sxsx 
)3( e )3( sxsx 
Figura 2: Gráfico da Curva Normal 
40 
Variância 
A variância é o valor do desvio-padrão elevado ao 
quadrado, ou seja: 
 
 
 
 
A variância expressa o seu resultado numa medida 
ao quadrado, ficando difícil interpretar o seu valor. 
Portanto, para interpretação, utilizaremos o desvio-
padrão, que se apresenta na mesma medida do 
conjunto de dados. 
 
 
41 
   
11
2
2
1
2
2










n
n
fx
fx
n
fxx
s
ii
ii
k
i
ii
Coeficiente de Variação 
O coeficiente de variação é uma estatística útil para 
comparar a variação para valores originados de 
diferentes variáveis (por exemplo: peso, em Kg e 
altura, em cm), pois ele é adimensional. Esse 
coeficiente é obtido por meio da seguinte fórmula: 
42 
100
x
s
cv
Exemplo 5: vamos utilizar os dados do Exemplo 
1 para calcular as medidas de dispersão. 
 
43 
Idade Nº funcionários 
18 1 18 324 
19 1 19 361 
21 1 21 441 
22 2 44 968 
24 2 48 1152 
25 3 75 1875 
28 2 56 1568 
Total 12 281 6689 
ii fx  ii fx 
2
A amplitude é calculada como: 
 
 
O desvio-padrão é calculado por: 
 
 
44 
anos 101828  mínimomáximo xxR
 
 
anos 15,390,9
11
08,65806689
11
12
281
6689
1
2
2
2











s
s
n
n
fx
fx
s
ii
ii
Como o conjunto de dados não apresenta 
uma distribuição em forma de sino, não vamos 
utilizar a interpretação do desvio-padrão vista 
anteriormente. 
45 
0
1
2
3
4
18 19 21 22 24 25 28
N
º 
fu
nc
io
ná
ri
os
Idade
Como a variância é definida como o quadrado 
do desvio-padrão, temos:o que nos mostra que não conseguimos 
interpretar esse valor. 
O coeficiente de variação é dado por: 
 
 
 
 
46 
222 anos 92,9anos) 15,3( s
%45,13
100
42,23
15,3
100



cv
cv
x
s
cv
Alguns autores consideram a seguinte 
regra empírica para a interpretação do 
coeficiente de variação: 
 
Baixa dispersão: 
47 
%15.. VC

Outros materiais