Buscar

Estatistica_aulas_03_04_Descritiva

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Estatística
Prof Paulo Renato A. Firmino
praf62@gmail.com
Aulas 03-04
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 2
Estatística Descritiva – Tabelas
• Distribuições de frequência para variáveis contínuas:
ƒ De maneira geral, temos
ƒ O nº de observações: n
ƒ O valor mínimo observado: min
ƒ O valor máximo observado: max
ƒ O nº de categorias (subintervalos): 
• int(x) representa o número inteiro mais próximo de x
• Se a parte decimal for maior que 0.5, x é arredondado para cima
• Caso contrário, x é arredondado para baixo
ƒ O tamanho (amplitude) de cada subintervalo: 
h = (max-min)/k
ƒ Temos assim os seguintes subintervalos
ƒ [min, min+h), [min+h, min+2h), ..., [max-h, max]
( )nintk =
min min+h min+2h max-h... max
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 3
Estatística Descritiva – Tabelas
• Distribuições de frequência para variáveis contínuas: Exemplo
ƒ tempo de desemprego (meses): 5, 10, 2.3, 4.5, 4.1, 3, 7, 2, 4, 0.3
ƒ O nº de observações: n=10 tempos
ƒ Os valores mínimo e máximo observados: min = 0.3 e max = 10
ƒ O nº de categorias:
ƒ A amplitude de cada intervalo: h = (max-min)/k = (10-0.3)/3 ≈ 3.2
ƒ Temos assim os seguintes intervalos
ƒ Devido aos arredondamentos, podemos não chegar ao máximo (o 
valor 10 nesse caso)
ƒ Recomenda-se, para o último intervalo, arredondar o valor final para o 
máximo
( ) ( ) 3)16.3int(10intnintk ====
categoria freq absoluta (ni) freq relativa (fi)
[0.3, 0.3 + 3.2 = 3.5) 4 0.4
[3.5, 3.5 + 3.2 = 6.7) 4 0.4
[6.7, 6.7 + 3.2 = 9.9] 2 0.2
Total 10 1
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 4
Estatística Descritiva – Tabelas
• Distribuições de frequência
ƒ De maneira geral
Categoria freq absoluta 
ni
freq relativa 
fi = ni/n
freq absoluta 
acumulada
freq relativa 
acumulada
Fi = Ni/n
1 n1 n1/n n1
n1/n
2 n2 n2/n n1+n2 (n1+n2)/n
... ... ... ... ...
k nk nk/n n1+n2+...+nk (n1+n2+...+nk)/n
Total n= 1 - -∑
=
k
1i
in
∑
=
=
i
1j
ji nN
minimum = min(x); maximum = max(x)
n = length(x)
k = round(sqrt(n))
h = (maximum-minimum)/k
grid = seq(minimum, maximum, by=h) 
freq = 
cut(x, grid, include.lowest=TRUE, right=FALSE) 
cumsum(table(freq))
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 5
Estatística Descritiva – Tabelas
• Exercício 1: Elabore a distribuição de frequências absolutas e 
relativas, incluindo as acumuladas, para os seguintes casos
1. tempos de falha (em anos): 5, 10, 2.3, 4.5, 4.1, 3, 7, 2, 4, 0.3
2. Sexo de entrevistados (1- masc, 2-femin): 1, 2, 2, 1, 1, 1, 2, 2, 2, 1, 
1, 2, 1
3. Grau de instrução de entrevistados (1- sem formação, 2-ens
fundam, 3-ens médio, 4-ens superior): 1, 4, 1, 2, 2, 4, 3, 3, 1, 2, 3, 
2, 2, 3
4. Nº de leitos ocupados de um hospital (por dia): 33, 21, 26, 22, 24, 
28, 35, 23, 27, 25, 32, 34
5. Nº de peças defeituosas em lotes de 6 unidades de uma fábrica: 0, 
3, 2, 1, 5, 3, 2, 1, 0, 2, 3, 1, 2, 4, 3, 2, 3, 4, 0, 0
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 6
Estatística Descritiva – Tabelas
• Distribuições de Frequências Bivariadas
ƒ Agrupam os dados relativos a duas variáveis
ƒ Generalizam distribuições univariadas (que envolvem uma variável
apenas)
ƒ Para cada combinação de resultados entre as variáveis, computa-se 
sua frequência de ocorrências (absolutas ou relativas)
Pessoa Sexo Preferência de voto
1 F D
2 M S
3 F D
4 M D
5 M M
6 F S
7 M D
8 F S
9 F D
10 M S
10415Total
5212M
5203F
TotalSMD
Preferência de voto
Sexo
table(x, y)
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 7
Estatística Descritiva – Tabelas
• Exercício 2: Elabore a distribuição de frequências absolutas e relativas bivariada 
para os seguintes casos (os dados estão ordenados de acordo com a 3ª coluna):
Computador fabricante
tempo até a 
1ª falha 
(anos)
1 B 0.0180
2 A 0.0271
3 A 0.0616
4 B 0.1177
5 B 0.3139
6 A 0.3697
7 B 0.6178
8 A 0.7553
9 A 1.2263
10 B 1.3572
1. Relação entre fabricante e tempo de 
falha de computadores
Projeto
folha de 
pagamento 
(R$10000.00) 
tempo de 
execução do 
projeto (anos)
1 11.2231 1.6157
2 10.9458 1.7378
3 10.6211 1.7683
4 10.2692 1.8047
5 10.7836 1.9813
6 9.8028 2.0228
7 9.5773 2.0832
8 8.5484 2.2941
9 8.0323 2.3023
10 9.2080 2.4593
2. Relação entre folha de pagamento e 
tempo de execução de projeto
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 8
Estatística Descritiva – Gráficos
• Por muitas vezes, extrair informação de distribuições de 
frequência mostra-se também difícil
ƒ Gráficos podem dizer mais
• Gráficos podem facilitar a compreensão da informação que
se deseja transmitir
ƒ Por vezes, um gráfico pode dizer mais que “mil palavras”
ƒ Faz-se importante, então, saber elaborar e ler gráficos
• Falaremos sobre a representação gráfica de distribuições de 
frequências
ƒ Esboçaremos a relação entre cada categoria da variável e sua
frequência
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 9
Estatística Descritiva – Gráficos
• Gráficos de barras: Exibem a forma da distribuição de 
variáveis qualitativas
0
10
20
30
40
50
60
f
r
e
q
Baixa Moder Alta
Degradação
Distribuição do nível de degradação do 
componente c
barplot(table(x))
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 10
Estatística Descritiva – Gráficos
• Gráficos de barras
ƒ Gráfico de pareto: as categorias são ordenadas, da mais
frequente à menos frequente
Pareto
Package ‘qcc’
pareto.chart(table(x))
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 11
Estatística Descritiva – Gráficos
• Gráficos de setor (de pizza): Exibem a distribuição de 
variáveis qualitativas.
ƒ Em um círculo, cada “fatia” é proporcional à frequência
Distribuição do nível de degradação do 
componente c
Baixa
Moderada
Alta
Package ‘MASS’
pie(table(x))
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 12
Estatística Descritiva – Gráficos
• Gráficos de Pares (ou de pontos): Exibem a forma da
distribuição de variáveis quantitativas discretas.
Trata-se do eixo dos 
números reais.
Pareto, nem pensar!!
plot(table(x))
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 13
Estatística Descritiva – Gráficos
• Histogramas: Exibem a forma da distribuição de variáveis
quantitativas em geral.
Distribuição do tempo até a falha do 
componente c
0 10 20 30 40 50 60 70 80 90 100
Tempo até a falha de c
0
5
10
15
20
25
30
35
40
45
50
f
r
e
q
hist(x)
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 14
Estatística Descritiva – Gráficos
• Exercício 3: Esboce as distribuições de frequência construídas
no Exercício 1
1. tempos de falha (em anos): 5, 10, 2.3, 4.5, 4.1, 3, 7, 2, 4, 0.3
2. Sexo de entrevistados (1- masc, 2-femin): 1, 2, 2, 1, 1, 1, 2, 2, 2, 1, 
1, 2, 1
3. Grau de instrução de entrevistados (1- sem formação, 2-ens
fundam, 3-ens médio, 4-ens superior): 1, 4, 1, 2, 2, 4, 3, 3, 1, 2, 3, 
2, 2, 3
4. Nº de leitos ocupados de um hospital (por dia): 33, 21, 26, 22, 24, 
28, 35, 23, 27, 25, 32, 34
5. Nº de peças defeituosas em lotes de 6 unidades de uma fábrica: 0, 
3, 2, 1, 5, 3, 2, 1, 0, 2, 3, 1, 2, 4, 3, 2, 3, 4, 0, 0
6. Elabore distribuições e gráficos para o conjunto de dados “BD01”.
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 15
Estatística Descritiva – Medidas
• Elas permitem sumarizar as informações contidas em
tabelas, distribuições de frequência e/ou gráficos:
ƒ Tornam possível a comunicaçãoefetiva entre os gestores
ƒ Permitem elaborar e analisar diretrizes e/ou metas
• Não são apenas números…
• Pode-se destacar dois tipos de medidas:
1. Medidas de posição- Possibilitam inferir sobre o resultado de 
determinada variável
2. Medidas de dispersão- Permitem medir as incertezas em
torno do resultado de determinada variável
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 16
Estatística Descritiva – Medidas de Posição
• Moda: 
ƒ É o valor mais frequente da amostra
ƒ Quando trata-se de variáveis cuja distribuição é modelada por
funções matemáticas, ela representa o ponto de máximo de 
tais funções
ƒ Pode ser usada sobre qualquer tipo de variável, pois faz uso
apenas da freqüencia de cada categoria das variáveis
• Exemplo 1: sexo = {0, 0, 0, 1, 0, 1, 1, 1, 0, 0} →Moda = 0
• Exemplo 2: Degradação = {0, 2, 0, 1, 2, 1, 2, 2, 0, 0} →
Moda = 0 e Moda = 2 → tem-se uma distribuição bimodal
• Exemplo 3: tempo de aposentadoria = {5, 10, 2.3, 4, 4.1, 3, 
7, 2, 4.5, 0.3} → Não há qualquer valor particular mais 
frequente ...
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 17
Estatística Descritiva – Medidas de Posição
• Moda de Czuber para dados agrupados de variáveis quantitativas: 
ƒ l - limite inferior da classe modal
ƒ freqm - freq da classe modal (mais frequente)
ƒ freqa - freq da classe anterior à modal
ƒ freqp - freq da classe posterior à modal
ƒ Δa = freqm – freqa eΔp = freqm – freqp
ƒ h - amplitude da classe modal
• Se a variável for discreta, pode-se arredondar o resultado para o inteiro 
mais próximo
h
pa
alModa ⋅⎟⎟⎠
⎞
⎜⎜⎝
⎛
Δ+Δ
Δ+=
l
Δa
Δp
l+h
y1=freqm–(x-l)·Δp/h
y2 = freqa + (x-l)·Δa/h
freqa
freqp
freqm
EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 19
Estatística Descritiva – Medidas de Posição
• Exercício 4: Obtenha a moda nos seguintes casos
1. A distribuição de frequências para os juros da poupança é dada por
2. Tempos de aposentadoria em dada comunidade (em anos): 5, 10, 2.3, 4, 
4.1, 3, 7, 2, 4.5, 0.3
3. Considera-se que o seguinte modelo se ajusta bem à distribuição de renda 
(x) de dado local:
4. Obtenha a moda das variáveis do banco BD01.
categoria
freq absoluta 
(ni)
[0.3, 3.5) 3
[3.5, 6.7) 5
[6.7, 10] 2
Total 10
( )2630x
2
1
e)x(f
−−=

Continue navegando