Buscar

Aula 11 Medidas Resumo (parte 2)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Medidas Resumo (parte 2)
Wesley de Jesus Silva
wjsilva.est.professor@gmail.com
Departamento de Estat´ıstica
Universidade de Bras´ılia
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
I´ndice
1 Me´dia, mediana, desvio-padra˜o e pontos discrepantes
2 Quantis emp´ıricos
3 Diagrama de Caixas (Box-plot)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
1 Me´dia, mediana, desvio-padra˜o e pontos discrepantes
2 Quantis emp´ıricos
3 Diagrama de Caixas (Box-plot)
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Considere as seguintes amostras
amostra 1: 2 2 3 2 1 2 5 4
amostra 2: 2 2 3 2 1 2 5 4 23
Me´dias: x¯am1 =
x¯am2 =
Desvios-padra˜o: Sam1 =
Sam2 =
Medianas: md(X )am1 =
md(X )am1 =
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Medidas-resumo das amostras
amostra 1: 2 2 3 2 1 2 5 4
amostra 2: 2 2 3 2 1 2 5 4 23
Me´dias: x¯am1 = 2.625
x¯am2 = 4.889
Desvios-padra˜o: Sam1 = 1.302
Sam2 = 6.9
Medianas: md(X )am1 = 2
md(X )am2 = 2
Exerc´ıcio: calcule os valores apresentados acima
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Concluso˜es
Incluindo-se o nu´mero 23 na amostra, a me´dia aumenta quase
duas vezes, e o desvio-padra˜o quase seis vezes;
A mediana na˜o se alterou;
Veremos adiante que 23 e´ um ponto discrepante, tambe´m
chamado de outlier ;
Me´dias de desvios-padra˜o:
1 Sa˜o sens´ıveis a pontos discrepates;
2 Apenas estas duas medidas, sozinhas, nada informam sobre a
assimetria da distribuic¸a˜o
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
1 Me´dia, mediana, desvio-padra˜o e pontos discrepantes
2 Quantis emp´ıricos
3 Diagrama de Caixas (Box-plot)
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Interpretac¸a˜o da mediana
Definic¸a˜o: A mediana de X sera´ o valor que ocupa a posic¸a˜o
central da sequeˆncia de valores crescentes dessa
varia´vel;
Definic¸a˜o formal: md(X ) e´ tal que, para 50% das observac¸o˜es,
X ≤ md(X );
Ex. 1: md(X ) = 2
1 O nu´mero 2 ocupa a posic¸a˜o central da sequeˆncia de valores cresentes de
X ;
2 Para 50% da amostra, X ≤ 2;
Ex. 2: Salarios (Sal) da cia MB: md(Sal) =
10.165
1 O nu´mero 10.165 ocupa a posic¸a˜o central da sequeˆncia de valores
cresentes de Sal ;
2 50% dos funciona´rios da cia MB ganham ate´ 10.165 sala´rios m´ınimos,
(para metade dos funciona´rios, Sal ≤ 10.165);
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Interpretac¸a˜o da mediana
Definic¸a˜o: A mediana de X sera´ o valor que ocupa a posic¸a˜o
central da sequeˆncia de valores crescentes dessa
varia´vel;
Definic¸a˜o formal: md(X ) e´ tal que, para 50% das observac¸o˜es,
X ≤ md(X );
Ex. 1: md(X ) = 2
1 O nu´mero 2 ocupa a posic¸a˜o central da sequeˆncia de valores cresentes de
X ;
2 Para 50% da amostra, X ≤ 2;
Ex. 2: Salarios (Sal) da cia MB: md(Sal) = 10.165
1 O nu´mero 10.165 ocupa a posic¸a˜o central da sequeˆncia de valores
cresentes de Sal ;
2 50% dos funciona´rios da cia MB ganham ate´ 10.165 sala´rios m´ınimos,
(para metade dos funciona´rios, Sal ≤ 10.165);
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Quantis emp´ıricos
p: proporc¸a˜o, 0 ≤ p ≤ 1;
q(p) (ou qX (p)): quantil de ordem p, tambe´m chamado de
p-quantil;
q(p) (ou qX (p)): valor para o qual 100× p% das observac¸o˜es
possuem valores de X menores ou iguais a este;
qX (p) e´ tal que, para 100× p% das observac¸o˜es,
X ≤ qX (p);
Ex.: Sala´rio da cia MB. Dizer que qSal(0.6) = 11.59
(quantil de ordem 0.6 da varia´vel Sala´rio = 11.59)
significa que 60% (100× 0.6) dos funciona´rios
ganham ate´ 11.59 sala´rios m´ınimos.
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Quantis Emp´ıricos. Ilustrac¸a˜o
Figura: Quantil q(p) para um p ∈ [0, 1]
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Quantis Emp´ıricos. Ilustrac¸a˜o
Figura: Quantil q(0.15) (15%)
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Quantis Emp´ıricos. Ilustrac¸a˜o
Figura: Quantil q(0.68) (68%)
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Ca´lculo de quantis
O ca´lculo de um quantil, a partir de um conjunto de informac¸o˜es, e´
obtido atrave´s de um me´todo de interpolac¸a˜o. Existem va´rios
me´todos de interpolac¸a˜o para ca´lculo de quantis, um deles e´
apresentado a seguir:
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Ca´lculo de quantis
Calculando o p-quantil qx(p).
Passo 1: ordenar os valores de X :
X(1) ≤ X(2) ≤ · · · ≤ X(n)
Passo 2: Calcular o candidato a` posic¸a˜o (rank) do quantil no
conjunto.
L = (n − 1)p + 1
L∗ = parte inteira de L
Passo 3: interpolac¸a˜o
1 Se L = L∗
qx(p) = X(L∗)
2 Caso contra´rio
qx(p) = X(L∗) +
(
X(L∗+1) − X(L∗)
)
(L∗ + 1− L)
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Exemplo 3
Quantil de 68% (q(0.68)) da Amostra 1
2 2 3 2 1 2 5 4
Passo 1: Valores ordenados
1 2 2 2 2 3 4 5
Passo 2: Candidato a posic¸a˜o
L = (8− 1)0.68 + 1 = 5.76
L∗ = 5
Passo 3: Interpolac¸a˜o. L∗ 6= L, portanto:
q(0.68) = X(L∗) +
(
X(L∗+1) − X(L∗)
)
(L∗ + 1− L)
q(0.68) = X(5) +
(
X(6) − X5
)
(5 + 1− 5, 76)
q(0.68) = 2 + (3− 2)(0, 24) = 2, 24
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Exemplo 3
Quantil de 68% (q(0.68)) da Amostra 1
2 2 3 2 1 2 5 4
Passo 1: Valores ordenados
1 2 2 2 2 3 4 5
Passo 2: Candidato a posic¸a˜o
L = (8− 1)0.68 + 1 = 5.76
L∗ = 5
Passo 3: Interpolac¸a˜o. L∗ 6= L, portanto:
q(0.68) = X(L∗) +
(
X(L∗+1) − X(L∗)
)
(L∗ + 1− L)
q(0.68) = X(5) +
(
X(6) − X5
)
(5 + 1− 5, 76)
q(0.68) = 2 + (3− 2)(0, 24) = 2, 24
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Exemplo 3
Quantil de 68% (q(0.68)) da Amostra 1
2 2 3 2 1 2 5 4
Passo 1: Valores ordenados
1 2 2 2 2 3 4 5
Passo 2: Candidato a posic¸a˜o
L = (8− 1)0.68 + 1 = 5.76
L∗ = 5Passo 3: Interpolac¸a˜o. L∗ 6= L, portanto:
q(0.68) = X(L∗) +
(
X(L∗+1) − X(L∗)
)
(L∗ + 1− L)
q(0.68) = X(5) +
(
X(6) − X5
)
(5 + 1− 5, 76)
q(0.68) = 2 + (3− 2)(0, 24) = 2, 24
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Exemplo 3
Quantil de 68% (q(0.68)) da Amostra 1
2 2 3 2 1 2 5 4
Passo 1: Valores ordenados
1 2 2 2 2 3 4 5
Passo 2: Candidato a posic¸a˜o
L = (8− 1)0.68 + 1 = 5.76
L∗ = 5
Passo 3: Interpolac¸a˜o. L∗ 6= L, portanto:
q(0.68) = X(L∗) +
(
X(L∗+1) − X(L∗)
)
(L∗ + 1− L)
q(0.68) = X(5) +
(
X(6) − X5
)
(5 + 1− 5, 76)
q(0.68) = 2 + (3− 2)(0, 24) = 2, 24
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Alguns Quantis especiais
Sa˜o definidos nomes especiais para quantis: os quartis.
(100/4 = 25) os decis (100/10 = 10), os percentis (100/100 = 1),
etc.
q(0.25): 10 quartil = 250 percentil;
q(0.5): 20 quartil = 500 percentil = 50 decil = mediana;
q(0.75): 30 quartil = 750 percentil;
q(0.9): 900 percentil = 90 decil;
q(0.95): 950 percentil;
q(0.9576): quantil de ordem 95, 76%;
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Quartis
Primeiro quartil = q(0, 25) = q1;
Segundo quartil = q(0, 5) = q2;
Terceiro quartil = q(0, 75) = q3;
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Um me´todo mais simples para o ca´lculo de quartis
Ide´ia: dividir os dados em quatro partes;
q1 (quartil 1): mediana dos valores abaixo de md(x);
q3 (quartil 2): mediana dos valores acima de md(x);
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Quartis e medida de dispersa˜o
A distaˆncia interquartis, dq ou dq(X ) e´ uma medida de dispersa˜o
alternativa ao desvio-padra˜o.
dq = q3 − q1
amostra 1: 2 2 3 2 1 2 5 4
amostra 2: 2 2 3 2 1 2 5 4 23
Distaˆncias interquartis: dqam1 =
dqam2 =
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Quartis e medida de dispersa˜o
A distaˆncia interquartis, dq ou dq(X ) e´ uma medida de dispersa˜o
alternativa ao desvio-padra˜o.
dq = q3 − q1
amostra 1: 2 2 3 2 1 2 5 4
amostra 2: 2 2 3 2 1 2 5 4 23
Distaˆncias interquartis: dqam1 = 1, 5
dqam2 = 2, 5
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Quartis, extremos e assimetria
Extremos: X(1) e X(n) (m´ınimo e ma´ximo);
Os cinco valores x(1), q1, q2, q3 e x(n) sa˜o importantes para se
ter uma boa ide´ia da assimetria de distribuic¸a˜o;
Para uma distribuic¸a˜o simetrica ou aproximadamente
sime´trica, dever´ıamos ter:
1 q2 − x(1) ' x(n) − q2;
2 q2 − q1 ' q3 − q2;
3 q1 − x(1) ' x(n) − q3;
4 Distaˆncias entre mediana e q1, q3 menores que distaˆncias entre
extremos e q1, q3;
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Ilustrac¸a˜o simetria
Figura: Quartis e extremos em distribuic¸a˜o sime´trica
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Ilustrac¸a˜o assimetria
Figura: Quartis e extremos em distribuic¸a˜o assime´trica
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
1 Me´dia, mediana, desvio-padra˜o e pontos discrepantes
2 Quantis emp´ıricos
3 Diagrama de Caixas (Box-plot)
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Diagrama de Caixas (Box-plot)
Gra´fico simples de desenhar;
Depende de poucos componentes, dependendo do caso;
Componentes que auxiliam na construc¸a˜o:
1 Quartis (q1,q2 e q3);
2 Limites, inferior (LI ) e superior (LS);
3 Pontos discrepantes (outliers), caso existam;
4 Mı´nimo e ma´ximo dentre os valores que na˜o sa˜o outliers.
Observac¸a˜o:
LI 6= X(1) e
LS 6= X(n)
LI e LS sa˜o escolhidos de tal modo que, em uma distribuic¸a˜o hipoteticamente
sime´trica (curva normal), 99.3% dos valores estejam entre LI e LS .
Valores abaixo de LI ou acima de LS sa˜o os outliers.
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Diagrama de Caixas (Box-plot)
l
ll
l
l
l
l
ll
l
l
−
10
−
5
0
5
10
Va
riá
ve
l X
Figura: Exemplo de box-plot
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Componentes do Box-Plot
l
−
10
−
5
0
5
10
Va
riá
ve
l X
Menor valor de X 
 não inferior a LI
q1
q2
q3
Maior valor de X 
 nao superior a LS
} Outliers
} Outliers
Limite superior (LS)
Limite inferior (LI)
l
ll
l
l
l
l
ll
l
l
−
10
−
5
0
5
10
Figura: Componentes do box-plot
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Componentes LS e LI
Observac¸o˜es:
1 Os topos das arestas que saem da caixa nao sa˜o os limites LI
e LS ;
2 LI e LS nao sa˜o representados no box-plot, apenas servem
para definir os outliers;
3 Os topos das arestas que saem da caixa sa˜o os valores de X
mais extremos que na˜o ultrapassem LI e LS (ou seja, sa˜o o
m´ınimo e o ma´ximo dos valores de X que nao sa˜o outliers);
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Box-Plot e assimetrias
Figura: Box-Plot em distribuic¸o˜es assime´tricas
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
Me´dia, mediana, desvio-padra˜o e pontos discrepantes
Quantis emp´ıricos
Diagrama de Caixas (Box-plot)
Ex.: Sala´rios da cia MB
Figura: Box-Plot da varia´vel Sala´rios, cia MB
Wesley J. Silva/Dpt. Estat´ıstica (UnB) Medidas Resumo (parte 2)
	Média, mediana, desvio-padrão e pontos discrepantes
	Quantis empíricos
	Diagrama de Caixas (Box-plot)

Outros materiais