Buscar

Introdução â Estatística - AULA 4-Medidas Estatisticas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 35 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 35 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 35 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Medidas Descritivas
Disciplina: Introdução à Estatística
Professor: ELMIRO
2014-2
Unidade I - Aula 03 
UNIVERSIDADE FEDERAL DA PARAÍBA
CENTRO DE CIÊNCIA EXATAS E DA NATUREZA
DEPARTAMENTO DE ESTATÍSTICA
Introdução
 Vimos anteriormente que é possível sintetizar um
conjunto de dados sob a forma de tabelas, gráficos e
distribuições de frequências.
 Podemos, e na maioria das vezes temos, o interesse de
apresentar esse conjunto de dados através de medidas
descritivas únicas que sintetizem as características
destes dados.
 Para tanto utilizamos um grupo de medidas estatística
que representam um conjunto de dados de forma
condensada. São ela as medidas de posição e de
dispersão.
Continuação
1. Medidas de posição
Aqui, vamos aprender o cálculo de medidas que
possibilitem representar um conjunto de dados (valores de
uma variável quantitativa, isto é, informações numéricas),
relativos à observação de determinado fenômeno de forma
reduzida. Estes índices estatísticos são as Medidas de
posição e, dentre as mais importantes, citamos as
Medidas de Tendência Central, que recebem tal
denominação pelo fato dos dados observados tenderem,
em geral, a se concentrar em torno de valores centrais.
Dentre as medidas de tendência central, destacamos:
a Média aritmética ou Média; a Moda; a Mediana.
Continuação
1. Média aritmética (ou simplesmente Média)
Definição:
Dado um conjunto de dados constituído de N
elementos, X1, X2, ..., Xn sua média, denotada por ,
mede o valor médio do conjunto de dados, é expressa
na mesma unidade dos dados, e definida por:
Notação:
 X = média da amostra ou média amostral
μ = média da população ou média populacional
A média aritmética de X é dada por:
 X =
 Xi
n
Continuação...
Para dados agrupados por valor a média é calculada por:
 X =
 xifi
n
onde: fi representa a frequência da classe i
Obs.: A expressão acima é usada tanto no caso de
distribuição de frequências por valores, como para dados
agrupados em classes. No segundo caso, o xi representa
o ponto médio da classe i.
Exemplo1:
Calcule a média para a seguinte conjunto de
dados: 3, 7, 8, 10, 11.
Continuação...
Exemplo 2:
Calcule a média para as distribuições de
frequancia abaixo
xi fi
2 8
3 2
5 4
8 6
 20
ALTURAS (m) fi
1,52 I---- 1,57 4
1,57 I---- 1,62 14
1,62 I---- 1,67 10
1,67 I---- 1,72 14
1,72 I---- 1,77 16
1,77 I---- 1,82 5
1,82 I----I1,87 10
TOTAL 73
Continuação...
Propriedades da Média.
A soma algébrica dos desvios de um conjunto de
números em relação a média aritmética é zero.
Quando somamos ou subtraímos uma constante aos
valores de uma variável, a média fica aumentada ou
diminuída dessa constante.
Quando multiplicamos ou dividimos todos os valores de
uma variável por uma constante, a média fica
multiplicada ou dividida por essa constante.
Continuação...
Média ponderada
 Nos cálculos envolvendo média aritmética simples,
todas as ocorrências têm exatamente a mesma
importância ou o mesmo peso.
 No entanto, existem casos onde as ocorrências têm
importância relativa diferente. Nestes casos, o cálculo
da média deve levar em conta esta importância
relativa ou peso relativo.
Xp=
X1p1+X2p2+…+Xnpn
p1+p2+…+pn
=
 Xipi
 pi
Exemplo: As aplicações mais comuns no mercado
financeiro são: Poupança, Certificado de Depósito
Bancário (CDB), e os Recibo de Depósito Bancário
(RDB). Uma multinacional decide aplicar parte do seu
lucro em três diferentes aplicações no período de um ano.
Segue abaixo o montante aplicado em cada uma das
aplicações no período.
Qual foi a rentabilidade média (em percentual) da
empresa com as aplicações no final do período?
Continuação...
Tipos de Aplicações Valor das Aplicações Rentabilidade
Poupança R$ 250.000,00 7%
CDB R$ 100.000,00 11%
RDB R$ 80.000,00 12%
Continuação...
VANTAGENS E DESVANTAGENS DO USO DA MÉDIA
1. É uma medida de tendência central que, por uniformizar os
valores de um conjunto de dados, não representa bem os
conjuntos que revelam tendências extremas. Ou seja, é
grandemente influenciada pelos valores extremos (grandes)
do conjunto.
2. Não pode ser calculada para distribuições de frequências com
limites indeterminados (indefinidos).
3. É o promédio mais conhecido e de maior emprego.
4. É facilmente calculável.
5. Pode ser tratada algebricamente (ver propriedades).
6. Serve para comparar conjuntos semelhantes.
7. É particularmente indicada para séries (conjuntos) que possuem
os valores simétricos em relação a um valor médio e de
frequência máxima.
8. Depende de todos os valores do conjunto de dados.
, Continuação...
2. Moda
É o valor (ou valores) mais frequente na distribuição de
dados, e é denotado por MO.
• Se todos os valores se repetem a mesma quantidade de vezes, dizemos
que não há moda, ou seja, a distribuição é amodal.(figura a)
• Se um valor ocorre com mais frequência, dizemos que a
distribuição é unimodal; (figura b)
• Se dois valores se repetem a mesma quantidade de vezes e com
mais frequência, dizemos que a distribuição é bimodal. (figura c)
• Se mais de dois valores se repetem a mesma quantidade de
vezes e com a mesma frequência, dizemos que a distribuição é
multimodal.
Continuação...
Exemplo: Determine a moda dos seguintes conjuntos de 
dados abaixo
a) 2, 2, 3, 3, 5, 5, 8, 8  Não existe moda.
b) 2, 2, 3, 5, 5, 5, 8, 8  Mo = 5
c) 2, 2, 2, 3, 3, 5, 5, 5, 8  Mo = 2 e Mo = 5 
Cálculo da Moda para valores em distribuiçao de 
frequência por intervalo
Em uma distribuição de frequências com dados
agrupados em classes, denominamos classe modal à
que possui a maior frequência, e, consequentemente,
será esta classe que conterá a moda.
Exercício...
FÓRMULA de CZUBER 
(interpretação geométrica através de 
Histograma)
Mo = Lmo+
Δ1
Δ1+Δ2
hmo
onde:
Lmo : limite inferior da classe modal
hmo : amplitude da classe modal
Δ1= fmodal - fanterior
Δ2= fmodal - fposterior
Continuação...
Exemplo:
Determinar a ALTURA MODAL para a distribuição de
frequência abaixo;
Classe modal 
ALTURAS
(m)
fi
1,52 I---- 1,57 4
1,57 I---- 1,62 14
1,62 I---- 1,67 10
1,67 I---- 1,72 14
1,72 I---- 1,77 16
1,77 I---- 1,82 5
1,82 I----I1,87 10
TOTAL 73
Continuação
VANTAGENS E DESVANTAGENS DA MODA
1. Não depende de todos os valores do conjunto de
dados, podendo mesmo não se alterar com a
modificação de alguns deles.
2. Não é influenciada por valores extremos (grandes) do
conjunto de dados.
3. Pode ser calculada para distribuições com limites
indeterminados (indefinidos) na maioria dos casos
Continuação...
3. MEDIANA
Considere uma série (conjunto de dados)
ordenada, constituída de n valores. A mediana, denotada
por Me, é o valor que divide o conjunto em duas partes
iguais, isto é, em duas partes de 50% cada.
Exemplos:
1. Calcular a mediana do seguinte conjunto de dados:
2, 3, 5, 8, 9, 11, 13 (n = 7 ímpar)
Me = 8 (termo de ordem central)
Continuação...
2. Calcular a mediana do seguinte conjunto de dados: 
2, 3, 5, 8, 9, 11, 13, 15 (n = 8 par)
Me=
8+9
2
=8,5 
Verificamos que, estando ordenados os valores
de uma série (conjunto de dados) e sendo n o número
de elementos da série, o valor mediano será:
 o termo de ordem central 
n+1
2
, se n for ímpar
 a média aritmética dos termos de ordem 
n
2
e
n
2
+1,
se n for par
(Média aritmética dos termos de ordens centrais)
CÁLCULO DA MEDIANA NUMA DISTRIBUIÇÃO DE 
FREQUÊNCIAS
a) Dados Não-agrupados
Neste caso, para a série de valores ordenados em
ordem crescente de grandeza (isto é, em um rol),a mediana
é o valor médio ou a média aritmética dos valores centrais,
caso tenhamos um número ímpar ou par de valores na série.
b) Dados Agrupados em Classes
No caso de dados agrupados, relembramos que uma
distribuição de frequências pode ser representada por meio
de um Histograma. Dizemos então que a mediana será o
valor de X (abscissa) cuja ordenada divide a área total do
Histograma em duas partes iguais.
Continuação...
Continuação...
Assim, para dados agrupados, a mediana é obtida
através de interpolação de acordo com a seguinte
fórmula:
Me = Lme+
n
2
− Fant
fme
hme,
onde
Lme = limite inferior da classe 
mediana; 
fme = frequência simples da alasse
mediana;
Fant = frequência acumulada anterior a clase mediana e
hme = aplitude da classe da mediana. 
Representação Gráfica
Exemplo: Determine a ALTURA MEDIANA dos 73 estudantes de
Introdução à Estatística do Período 13.2.
Classe da mediana
Lme = 1,67 
fme = 14
Fant = 28
hme = 0,05
ALTURAS
(m)
fi Fai
1,52 I---- 1,57 4 4
1,57 I---- 1,62 14 18
1,62 I---- 1,67 10 28
1,67 I---- 1,72 14 42
1,72 I---- 1,77 16 58
1,77 I---- 1,82 5 63
1,82 I----I1,87 10 73
TOTAL 73
37
2
173
2
1



n
 
 
 
 ,,
,
, 




 

Continuação...
VANTAGENS E DESVANTAGEM DA MEDIANA
• A mediana não é influenciada por valores extremos
(grandes) de uma série ou conjunto de dados.
• A mediana de uma série de dados agrupados de classes
extremas indefinidas pode ser calculada.
Medidas de dispersão
MEDIDAS DE DISPERSÃO
Definição: São medidas estatísticas que medem a variação
ou a dispersão dos valores de um conjunto de dados.
Principais tipos:
• Amplitude total;
• Variância;
• Desvio Padrão;
• Coeficiente de Variação.
1. Amplitude total
Medida já apresentada na elaboração de uma
distribuição de frequências com dados agrupados em
classes, denotamos por AT
AT = Xmáx - Xmín, onde: 
Xmáx=maior valor observado e 
Xmín=menor valor observado.
2. Variância
A variância de um conjunto de dados (amostra ou
população) mede a variabilidade do conjunto em termos
de desvios quadrados em relação à média aritmética do
conjunto. É uma quantidade sempre não negativa e
expressa em unidades quadradas do conjunto de dados,
sendo de difícil interpretação.
Continuação...
Continuação...
 
N
X i 

2
2


 
1
2
2




n
XX
S
i
           
5,6
15
5857555352
1
22222
2
2 







n
xx
S
i
Continuação...
3 - Desvio padrão
É uma outra medida de dispersão mais comumente
empregada do que a variância, por ser expresso na mesma
unidade do conjunto de dados. Mede a "DISPERSÃO
ABSOLUTA" de um conjunto de valores e é obtida a partir da
variância.
Desvio Padrão = + (Raiz quadrada positiva da 
Variância)
• População: 
• Amostra: 
Variância
 
N
X i 

2

 2
1



n
xx
S
i
Continuação...
1. Observação
As medidas, calculadas apartir da amostra,
são denominadas ESTATÍSTICAS, e são estimativas dos
PARÂMETROS POPULACIONAIS ,  e 2, que na maioria
das vezes são desconhecidos
,, 2SeSX
CONJUNTO MEDIDAS
POPULAÇÃO
(parâmetros)
AMOSTRA
(estatísticas)
Média 
Variância 2 S2
Desvio Padrão  S
x
Continuação...
CÁLCULO DA VARIÂNCIA EM UMA DISTRIBUIÇÃO DE 
FREQUÊNCIAS (Dados em distribuição de frequência)
OBS.: No caso de dados agrupados os são os pontos
médios de classes.
 
1
2
2




n
fxx
S
ii
ix
Continuação...
Exemplo: Determine a VARIÂNCIA e o DESVIO PADRÃO para
a distribuição de frequancia abaixo
Sabemos que:
Logo: A variância é: m2
ALTURAS
(m)
fi xi fi xi fi
1,52 I---- 1,57 4 1,55 06,20 0,0225 0,090
1,57 I---- 1,62 14 1,60 22,40 0,0100 0,140
1,62 I---- 1,67 10 1,65 16,50 0,0025 0,025
1,67 I---- 1,72 14 1,70 23,80 0,0000 0,000
1,72 I---- 1,77 16 1,75 28,00 0,0025 0,040
1,77 I---- 1,82 5 1,80 09,00 0,0100 0,050
1,82 I----I1,87 10 1,85 18,50 0,0225 0,025
TOTAL 73 - 124,40 - 0,730
 2xxi   
2
xxi 
70,1x
 
01,0
72
73,0
1
2
2 




n
fxx
S
ii
Continuação...
Como o Desvio pardão é a raiz quadrada positiva
da Variancia, teremos:
S= = 0,1 
01,0
Continuação...
4 – Coeficiente de Variação
É uma quantidade adimensional que serve para
comparar dois ou mais conjuntos de dados qua apresentam
unidades de medida diferentes. Mede a "DISPERSÃO
RELATIVA" de um conjunto de dados.
É expresso, usualmente, em percentagem ( % ).
• População:
• Amostra: 
100


CV
100
x
S
CV
 É importante expressar a variabilidade em termos
relativos porque, por exemplo, um desvio-padrão igual
a 1 pode ser muito pequeno se a magnitude dos dados
é da ordem de 1.000, mas pode ser considerado muito
elevado se esta magnitude for da ordem de 10.
 Observe também que o coeficiente de variação é
adimensional e por este motivo permite a comparação
das variabilidades de diferentes conjuntos de dados.
Continuação...
Importância do Coeficiente de Variação
VALORES MÉDIA D.P. C.V.
1 - 2 - 3 2 1 50 %
100 - 200 - 300 200 100 50 %
101 - 102 - 103 102 1 1 %
Continuação...
Exemplo: Determine o COEFICIENTE DE VARIAÇÃO para a
distribuição de frequência abaixo.
Do item anterior sabemos que: e
Logo:
ALTURAS
(m)
fi xi fi xi fi
1,52 I---- 1,57 4 1,55 06,20 0,0225 0,090
1,57 I---- 1,62 14 1,60 22,40 0,0100 0,140
1,62 I---- 1,67 10 1,65 16,50 0,0025 0,025
1,67 I---- 1,72 14 1,70 23,80 0,0000 0,000
1,72 I---- 1,77 16 1,75 28,00 0,0025 0,040
1,77 I---- 1,82 5 1,80 09,00 0,0100 0,050
1,82 I----I1,87 10 1,85 18,50 0,0225 0,025
TOTAL 73 - 124,40 - 0,730
70,1x
1,0S
%88,5100
70,1
1,0
100 
x
S
CV
 2xxi   
2
xxi 
Continuação...
CONSIDERAÇÕES GERAIS
 O conjunto de todos os possíveis elementos de uma determinada pesquisa
constitui uma população estatística. Sua média é a média populacional,
usualmente representada pela letra grega μ. Na grande maioria das
situações práticas, a média populacional é desconhecida e deve ser
estimada a partir de dados amostrais. Se a amostra for extraída de forma
adequada, a média amostral é uma boa estimativa de μ.
 A amplitude, apesar de ser muito fácil de calcular, tem a desvantagem de
levar em consideração apenas os dois valores extremos (máximo e
mínimo) da massa de dados, desprezando os demais.
 A variância populacional é representada por σ2. Usualmente, a variância
populacional é desconhecida e deve ser estimada a partir dos dados
amostrais. Se a amostra foi extraída de forma adequada, a variância
amostral S2 é uma boa estimativa de σ2.
 As medidas , S2 e S tomadas na amostra, denominadas ESTATÍSTICAS,
são estimativas dos PARÂMETROS POPULACIONAIS μ, σ2 e σ (supostos
desconhecidos).
X
X
Continuação...
Exemplo 1:
Na tabela abaixo encontra-se a estrutura do
produto interno bruto do Brasil, em bilhões de reais,
segundo as atividades econômicas.
Em qual dos setores ocorre a maior variabilidade?
PERÍODO AGROPECUÁRIA INDÚSTRIA SERVIÇOS
2002 6,6 27,1 66,3
2003 7,4 27,8 64,8
2004 6,9 30,1 63
2005 5,7 29,3 65
2006 5,5 28,8 65,8
2007 5,6 27,8 66,6
Continuação...
Exemplo 2:
Uma certa empresa que fabrica duas linhas de produtos (A e
B) necessita reestruturar sua produção. Foi realizado um estudo
para tal finalidade e uma das variáveis consideradas foi VENDA
(quantidade mensal) de cada tipo de produto (A e B). Para este
estudo foi tomado como referência o primeiro semestre dedeterminado ano, onde foram verificados as seguintes VENDAS:
a) Em relação a esta variável, qual dos produtos (A ou B)
apresentou maior estabilidade nas VENDAS mensais?
b) A empresa decide penalizar a equipe que obteve, em algum
mês, um volume de venda inferior a -1,5s. Alguma equipe foi
penalizada?
PRODUTO A 13 32 28 25 24 25
PRODUTO B 25 20 29 30 26 20

Outros materiais