Buscar

Estatistica_aulas_05_06_Descritiva

Prévia do material em texto

ESTATÍSTICA
Prof Paulo Renato A. Firmino
praf62@gmail.com
Aulas 05-06
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 2
Estatística Descritiva – Medidas de Posição
• Mediana: 
ƒ É o valor que se localiza no centro de uma amostra ordenada
• Se o número de observações (n) for impar, a mediana será o valor que
se localiza na posição (n+1)/2 da amostra ordenada
• Se não, a de se ponderar os valores localizados nas posições n/2 e 
n/2+1
ƒ É o valor cuja percentagem de valores menores ou iguais 
equivale a 50%
Dados não 
ordenados
x1
x2
x3
...
xj
...
xn
posição
Dados 
ordenados
1 x32
2 xn
3 xj
... ...
(n+1)/2 x22
... ...
n x4
Ordenação
sort(x) 
quantile(x, prob=0.5) 
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 3
Estatística Descritiva – Medidas de Posição
• Mediana: 
ƒ Não deve ser usada sobre variáveis nominais, pois requer a 
ordenação das categorias
• Ex. 1: Degradação = {0, 2, 0, 1, 2, 1, 2, 2, 0, 0} →Mediana 
=1
• Ex. 3: tempo de atendimento = {5, 10, 2.3, 4, 4.1, 3, 7, 2, 
4.5, 0.3} →Mediana = (4+4.1)/2 = 4.05
6
Estatística Descritiva – Medidas de Posição
• Exercício 1: Obtenha a mediana nos seguintes casos
1. Tempos de aposentadoria em dada comunidade (em anos): 5, 
10, 2.3, 4, 4.1, 3, 7, 2, 4.5, 0.3
2. Considera-se que o seguinte modelo se ajusta bem à
distribuição de renda (x) de dado local:
3. Considere as variáveis de “BD01”.
( )2630x
2
1
e)x(f
−−=
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 7
Estatística Descritiva – Medidas de Posição
• Quantil:
ƒ Uma generalização da mediana é a função Quantil
ƒ A mediana é o quantil 50% da amostra ordenada (Q50%)
ƒ De maneira geral, tem-se Q100·p% (o quantil 100·p%) como sendo
o valor que se encontra na posição p·n da amostra ordenada
ƒ Toda a abordagem apresentada para a mediana pode ser aplicada
para o cálculo de um quantil qualquer
quantile(x, prob=p) 
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 8
Estatística Descritiva – Medidas de Posição
• Média aritmética:
ƒ É a razão entre a soma dos valores observados e 
o número de valores observados
ƒ É a medida de posição que representa o 
centro de gravidade da amostra
ƒ Sofre influência de todos os valores da amostra
• Isto não ocorre com a moda ou a mediana, por exemplo
ƒ Não deve ser apliaca a variáveis qualitativas
• Realiza operações matemáticas de soma e divisão
ƒ Ex. 1: tempo de vida: 5, 10, 2.3, 4, 4.1, 3, 7, 2, 4.5, 0.3 →
Média = (4+10+2.3+...+0.3)/10 = 4.22
n
x
x
n
1i
i∑
==
mean(x) 
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 10
Estatística Descritiva – Medidas de Posição
• Exercício 2: Obtenha a média nos seguintes casos
1. Tempos de aposentadoria em dada comunidade (em anos): 5, 
10, 2.3, 4, 4.1, 3, 7, 2, 4.5, 0.3
2. Considera-se que o seguinte modelo se ajusta bem à
distribuição de renda (x) de dado local:
3. Considere as variáveis de “BD01”.
( )2630x
2
1
e)x(f
−−=
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 11
Estatística Descritiva – Medidas de Posição
• Aplicação por tipo de variável:
Medida
Tipo de variável
Qualitativa Quantitativa
Nominal Ordinal
Moda PodePode PodePode PodePode
Mediana Não podeNão pode PodePode PodePode
Média Não podeNão pode Não podeNão pode PodePode
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 13
Estatística Descritiva – Medidas de Dispersão
• Medidas de posição permitem inferir sobre o valor que a variável aleatória
assumirá
ƒ Qual será o resultado do lançamento da moeda?
ƒ Quantos milímetros de chuva teremos na próxima semana?
ƒ Quanto valerá a cesta básica em Outubro?
• Medidas de dispersão permitem medir quão confiáveis são estas
inferências
ƒ Elas medem a variabilidade que caracteriza uma variável como tal
ƒ A quantidade de milímetros de chuva varia “muito” de uma
precipitaçao para outra?
ƒ O valor da cesta básica tem variado “pouco” ao longo dos meses?
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 14
Estatística Descritiva – Medidas de Dispersão
• Índice de variação qualitativa (IQV):
ƒ É a razão entre a quantidade de variação observada nos dados e a máxima
variação possível
ƒ É geralmente aplicada a variáveis qualitativas
ƒ Assume valores entre zero (não há dispersão nos dados) e 1 (observa-se 
máxima dispersão nos dados)
• k – nº de classes
• n – tamanho da amostra
• ni – freqüência da classe i
ƒ Veja que as categorias observadas não são envolvidas nas contas
• Mas sim as suas frequências
)1k(n
)nn(k
IQV 2
k
1i
2
i
2
−
−
=
∑
=
#freq: the absolute frequency distribution
iqv<-function(freq){
k<-length(freq)
n<-sum(freq)
sum_n2 <- sum(freq*freq)
n2 <- n^2
k*(n2-sum_n2)/(n2*(k-1))
}
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 15
Estatística Descritiva – Medidas de Dispersão
• Exercício 3: Para os seguintes casos, calcule o IQV. Tente interpretar seus
resultados.
1. Tempos de falha (em anos): 5, 10, 2.3, 4.5, 4.1, 3, 7, 2, 4, 0.3
2. Sexo de entrevistados (1- masc, 2-femin): 1, 2, 2, 1, 1, 1, 2, 2, 2, 1, 1, 
2, 1
3. Grau de instrução de entrevistados (1- sem formação, 2-ens fundam, 
3-ens médio, 4-ens super): 1, 4, 1, 2, 2, 4, 3, 3, 1, 2, 3, 2, 2, 3
4. Nº de leitos ocupados de um hospital (por dia): 33, 21, 26, 22, 24, 28, 
35, 23, 27, 25, 32, 34
5. Considere as variáveis de “BD01”.
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 16
Estatística Descritiva – Medidas de Dispersão
• Amplitude:
ƒ É a diferença entre os valores máximo e mínimo da amostra
• Amplitude = max - min
ƒ Por usar o operador matemático de subtração, não deve ser 
aplicado a variáveis qualitativas
ƒ Não mede a dispersão dos dados contidos entre os extremos, 
tornando-se relativamente pobre
min max
Amplitude
l<-range(x)
amplitude <- l[2]-l[1]
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 17
Estatística Descritiva – Medidas de Dispersão
• Variância amostral (s2):
ƒ É a razão entre a soma dos quadrados das
diferenças entre cada observação e a média
e o número de observações (n) menos 1
ƒ Indicada apenas para variáveis quantitativas
ƒ Considera todas as observações disponíveis
ƒ A divisão por n-1 se dá de forma a eliminar eventuais vícios de 
estimadores.
ƒ Devido à sua unidade de medida ser o quadrado da unidade de 
medida da variável, é comum que se trabalhe com o desvio
padrão (DP): 
1n
)xx(
s
n
1i
2
i
2
−
−
=
∑
=
2ss =
var(x)
sd(x)
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 18
Estatística Descritiva – Medidas de Dispersão
• Exercício 4: Para os seguintes casos, calcule a amplitude, variância e o 
desvio-padrão
1. Produção de grãos de dada comunidade em 4 meses (em toneladas): 1, 
2, 4, 3
2. tempos de falha (em anos): 5, 10, 2.3, 4.5, 4.1, 3, 7, 2, 4, 0.3
3. Nº de leitos ocupados de um hospital (por dia): 33, 21, 26, 22, 24, 28, 
35, 23, 27, 25, 32, 34
4. Considere as variáveis de “BD01”.
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 20
Estatística Descritiva – Medidas de Dispersão
• Exercício 5: Para o seguinte caso, calcule a variância e o desvio-padrão
1. A distribuição de frequências do nº de clientes mensais de uma
empresa é dada por
Nº de clientes 
mensais
freq absoluta 
(ni)
1 3
2 5
3 2
Total 10
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 21
Estatística Descritiva – Medidas de Dispersão
• Coeficiente de Variação (CV):
ƒ É a razão entreo desvio-padrão e a média
ƒ Indicado apenas para os casos onde a média difere de zero
• Mais usado para variáveis não negativas
– Nestes casos, ele expressa a porcentagem de variação da amostra em
relação à média
– Trata-se de uma medida adimensional
• Permite que a dispersão de diversas variáveis seja comparada
– Esta seria uma tarefa árdua se recorrêssemos à amplitude, variância e 
desvio-padrão
x
scv =
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 22
Estatística Descritiva – Medidas de Dispersão
• Exercício 6: Retorne ao Exercício 3 e ao Exercício 4 e calcule o CV. 
1. Qual amostra apresenta maior variabilidade? 
2. Qual delas é menos dispersa?
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 23
Estatística Descritiva – Medidas de Dispersão
• Aplicação por tipo de variável:
Medida
Tipo de variável
Qualitativa Quantitativa
IQV PodePode PodePode
Amplitude Não podeNão pode PodePode
Variância 
(desvio-padrão) Não podeNão pode PodePode

Continue navegando