Buscar

Aula 02 09 2013 medidas de posição e Dispersão Estatística Básica I (1)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 17 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 17 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 17 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Curso: Bacharelado em Estatística 
Turma: Estatística Básica –(1° período) 
Período: 2013/01 Data: 02/09/2013 
Professora: Vania C. Mota, Msc. 
Aluno (a): 
 
 
7.4 SEPARATRIZES 
 
As separatrizes, como o próprio nome sugere, separam a série estatística em 
grupos que apresentam o mesmo número valores observados. 
As principais separatrizes são, a mediana, os quartis, os decis e os percentis. 
 
7.4.1 Quartis 
 Denominamos quartis os valores que dividem uma série em quatro partes 
iguais. 
 
 
 Portanto há 3 quartis em uma série, que são chamados primeiro quartil 
(Q1), segundo quartil (Q2) e terceiro (Q3). 
 
Obs: O segundo quartil (Q2) - coincide com a mediana (Q2=Md). 
 
Quando os dados são agrupados, usamos a mesma técnica do cálculo da 
mediana, bastando substituir na formula da mediana 
 
 
 por: 
 
 
 
 
 sendo k o número de ordem do quartil. (k= 1, 2, 3) 
 
Assim temos: 
 
 
 
 
 
 
 , 
 
onde: 
 
FUNDAÇÃO UNIVERSIDADE FEDERAL DE RONDÔNIA 
CAMPUS de JI - PARANÁ - RO 
 
 
 é o limite inferior da classe quartilica; 
 é a frequência acumulada da classe anterior à classe 
quartilica; 
 é a frequência absoluta da classe quartilica; 
 é a amplitude da classe quartilica. 
 
 
 
 
 
 
 
 
 , 
 
Exemplo 1) Tabela 7. 4.1 
Estaturas fi 
150 154 4 4 
154 158 9 13 
158 162 11 24 
162 166 8 32 
166 170 5 37 
170 174 3 40 
Total 40 
 
Resp: 
Q1= 156,7 
Q2=Md= 160,54 
 Q3=165 
 
Exemplo 2: 
A partir dos dados abaixo determine os quartis. 
2; 3; 3; 3; 5; 5 ; 6; 7; 8; 9; 10 
 
Resp: 
Q1= 3 
Q2=Md= 5 
 Q3=8 
(Obs: dividiu a série 4 partes iguais ) 
 
 
 
 
7.4.2 Decis 
Denominamos decis os valores que dividem uma série em dez partes iguais. 
 
 
Logo há 9 decis em uma série estatística, que são chamados 
primeiro decil (D1) segundo decil (D2) até o nono decil (D9). 
 
 Podemos determinar os decis pela seguinte relação: 
 
 
 
 
 
 
 
 , k= 1, 2, 3, … 9, 
 
onde: 
 
 
 é o limite inferior da classe decíclica; 
 é a frequência acumulada da classe anterior à classe 
decíclica; 
 é a frequência absoluta da classe decíclica; 
 é a amplitude da classe decíclica. 
 
Exemplo 3) 
Calcule o D5 para os dados da Tabela 7. 4.1. 
 
Resp: D5=Q2=Md 
 
 
7.4.3 Percentis 
 
Denomina-se percentis os valores que dividem uma série em cem partes 
iguais. 
 
 
Portando há 99 percentis em uma série, que são chamados de primeiro percentil 
(P1), segundo (P2), até o nonagésimo nono percentil (P99). 
Podemos determinar os percentis pela seguinte relação: 
 
 
 
 
 
 
 
 , k= 1, 2, 3, … 99, 
 
onde: 
 
 
 é o limite inferior da classe percentílica; 
 é a frequência acumulada da classe anterior à classe 
percentílica; 
 é a frequência absoluta da classe percentílica; 
 é a amplitude da classe percentílica. 
 
Exemplo 4) 
Calcule o P50 para os dados da Tabela 7. 4.1. 
 
Resp: P50=D5=Q2=Md 
 
Obs: 
Q1=P25 D1=P10 
Q2=P50 D2=P20 
Q3=P75 D3=P30 
 D4=P40 
 D5=P50 
MEDIANA = : P50=D5=Q2 D6=P60 
 D7=P70 
 D8=P80 
 D9=P90 
 D10=P100 
 
 OUTRAS ESTATÍSTICAS SÃO DEFINIDAS USANDO-SE QUARTIS 
PERCENTIS, COMO AS SEGUINTES: 
 
Intervalo interquartílico (ou IIR) = Q3 – Q1. 
 
Intervalo semi-interquartílico (ou IIR) = (Q3 – Q1)/2. 
 
Ponto médio dos quartis= (Q3 + Q1)/2. 
 
Intervalo percentílico 10___90 = P90 – P10. 
 
Exercícios 
 
8) Calcule o primeiro e terceiro quartil das distribuições do exercício 5. 
 
9) Calcule o 10º, o 1º, o 23º, o 15º e o 90º percentil da distribuição “b” do exercício 5. 
 
 
 
6.5 – MEDIDAS DE DISPERSÃO 
 
 São estatísticas utilizadas para caracterizar a variabilidade de um 
conjunto de observações. Geralmente só a medida de posição não nos 
fornece uma boa caracterização da variável. 
 Veja o exemplo: 
 
A={10; 10; 10; 10; 10; 10; 10} 
 
B={1; 8; 10; 10; 11; 12; 18} 
 
C= {1; 2; 10; 10; 10; 13; 24} 
 
A B C 
Média=10 Média=10 Média=10 
Mediana=10 Mediana=10 Mediana=10 
Moda=10 Moda=10 Moda=10 
 
As principais medidas de dispersão são: 
Amplitude Total (A), Variância e o desvio padrão, coeficiente de variação 
e erro padrão da média. 
 
6.5 .1 Amplitude Total (A) 
 
A= MVO – mvo, 
 Onde: 
MVO é o maior valor observado e mvo é o menor valor observado. 
Exemplo 6) 
Encontre a amplitude total do conjunto A={ 2, 4, 5, 7, 8, 11, 13} 
A= 13 – 2 
A= 11 
 
 Problemas relacionados a essa medida: 
a) Não considera todas as observações no cálculo; 
b) Não se tem ideia do comportamento dos dados entre os extremos. 
 
Veja os seguinte exemplos: 
 
B={ 0; 2; 4; 6; 8; 8; 10} A= 10 – 0 = 10 
C={ 0; 1; 2; 3; 4; 5; 6; 7; 8; 9; 10} B= 10 – 0 = 10 
D={ 0; 3; 3; 3; 4; 4; 5; 5; 8; 8; 8; 10} D= 10 – 0 = 10 
 
CARACRTERISTICAS DESEJADAS DE UMA MEDIDA DE 
DISPERSÃO: 
 
a) Utilizar todas as observações no cálculo; 
b) Ser facilmente calculável e compreensível; 
c) Adaptar – se bem ao comportamento algébrico; 
d) Estar exposta a menos possível às flutuações das amostras. 
 
 
 
6.5. 2 - Variância (S2) e desvio padrão (S) 
 
Estas duas estatísticas apresentam as características anteriormente 
citadas. 
Obs: Variância populacional = 
 
 
 
 
 
 
 Variância Amostral = S2 
 
 
a) Variância Amostral S2 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
(Mostre algebricamente) 
 
 
 
 
Portanto: 
 
 
 
 
 
 
 
 
 
 
 
b) Desvio padrão 
 
É simplesmente a raiz quadrada positiva da variância. 
Assim se a variância é 81 o desvio padrão é 9. 
 Portanto a formula do desvio padrão é dado por: 
 
 
 
 
 
 
. 
 
Unidades: O desvio Padrão tem a mesma unidade da variável e a 
variância terá a unidade dos dados ao quadrado. 
 
 
Exemplo 1: 
Calcule a variância e o desvio padrão da amostra 2, 4, 6, 8, 10. 
Resp: S2 = 10 e S = 3,16 
 
 
 
 
 
 
Exemplo 2: 
Os dados abaixo referem-se à produção, em toneladas, de uma 
industria. 
50 280 560 170 180 500 250 
200 1050 240 180 1000 1100 120 
420 510 480 90 870 360 
 
a) Calcule a produção média da indústria. 
 
b) Calcule a variância e o desvio padrão. 
 
c) Interprete os resultados. 
 
Resp: Ma = 430,5 ton; S2 = 109478,7 e S= 330, 9 ton. 
Espera-se que a média da indústria seja de 430,5 ton, com 
dispersão em torno de 330, 876 ton. 
 
 
c) Variânicia para dados agrupados. 
 
 
 
 
 
 
 = 
 
 
 
 
 
 
 
 
onde xi é o ponto médio da classe e, é a frequência da classe i. 
 
Exemplo: 
Dada a distribuição de frequência dos pesos de pessoas em uma 
certa faixa ataria, calcular a média, a variância e o desvio padrão de 
peso. 
Classes 
 
 
40 45 3 42,5 127,5 1806,25 5418,75 
45 50 8 47,5 380,0 2256,25 18050,00 
50 55 16 52,5 840,0 2756,25 44100,00 
55 60 12 57,7 690,0 3306,25 27343,75 
60 65 7 62,5 437,5 3906,25 27343,75 
65 70 3 67,5 202,5 4556,25 13668,75 
70 75 1 72,5 72,5 5256,25 5256,25 
Total 50 2750,00 153512,50 
Resp: 
Ma = 55kg. 
 46,2 e o S= 6,8. 
 
d) Propriedades e características do desvio padrão e da variância 
 
a) O desvio padrão é um valor mínimo de erro, pois, osdesvios são obtidos em relação a média. 
b) Se somarmos ou subtrairmos uma constante k a cada valor observado, o desvio padrão e a variância 
não se alteram. 
Ex: 1 , 2 , 3, 4, 5 = =3 somando k=2 
3, 4, 5, 6, 7 = 
c) Se multiplicamos ou dividimos cada observação de um conjunto de dados por uma constante k, a 
variância ficará multiplicada ou dividida por k
2
 e o desvio por k. 
Ex: 1, 3, 5 
S
2 
= 4 e S = 2. 
 Vamos multiplicar cada valor por 3 (k=3), temos então: 3, 9, 15 
 S
2 
= 36 (4 x 3
2
) e S= 6 (3x 2). 
d) S2 e S são estatísticas pouco influenciadas por variações de amostras. 
e) Valores extremos exercem maior influência em S2 e S que os valores centrais (próximo à média). 
f) S2 e S são sempre positivos. 
g) São estatísticas que apresentam todos os valores observados no cálculo. 
h) Exerce papel importante na distribuição de probabilidade normal e nas inferências estatísticas. 
i) S2(k)=0 sendo k uma constante. 
j) S2(x )= S2(x) S2( ) se e somente se x e forem variáveis independentes. 
 
 
6.5. 3 – Coeficiente de Variação (CV) 
 
 Mede a variação relativa de um conjunto de dados. 
È utilizado para comparar a variabilidade entre amostras ou variáveis. 
 
 
 
 
 
 
Exemplo: 
Uma pesquisa sobre temperatura (ºC) e pressão (ATM) em uma 
caldeira industrial mostrou os seguintes resultados: 
T (ºC) 400 450 350 500 600 550 
P (ATM) 40 52 37 67 70 72 
 
a) Calcular a média e o desvio padrão para cada variável. 
 
 
b) Que atributo apresenta maior variabilidade. 
 
 
 
Resp: 
T (ºC) P (ATM) 
Ma= 475,0 Ma=56,3 
S= 93,5 ºC S=15,5 atm 
CV= 19,7% CV=27,5% 
 
 
 
 
 
 
6.5. 4 – Erro padrão da média (ou desvio padrão da média) 
 
È uma estatística que mostra a precisão com que a média amostral 
foi calculada. 
 
 
 
 
 
Exemplo: 
 
O ph de um certo produto é apresentado abaixo: 
5,1 5,3 5,2 5,5 4,9 
6,2 6,0 5,8 5,3 5,0 
5,1 5,4 5,1 6,1 5,6 
5,4 5,8 5,7 5,1 5,1 
a) Calcule o erro padrão da média usando as duas primeiras linhas 
de dados. 
 
 
b) Usando todos os dados. 
 
Resp: 
 
 
 
 
8 MOMENTOS ESTÁTISTICOS 
 
È utilizado para a caracterização de determinadas medidas, tais 
como a média e a variância, fornecendo ainda outros critérios para a 
determinação de medidas importantes, como a assimetria e a curtose. 
 
8.1 Momento de Ordem r (Mr) 
 Se tivermos um conjunto de números, X = {X1, X2 X3 ,..., Xn}, 
Podemos definir uma quantidade numérica. 
 
 
 
 
 
 
 
 
 
 
Duas primeiras linhas Todos os dados 
Ma= 5,43 Ma= 5,44 
S= 0,44 S= 0,39 
 = 0,14 = 0,09 
Ou 
 
 
 
 
(Obs: O M1 = Média) 
 
Exemplo: 
Seja o conjunto X= {1, 3, 5, 7, 9} aplique o 1º o 2º e o 3º momento. 
Resp: 
M1= 5; M2= 33 e M3= 245. 
 
 
8.2 Momento de Ordem r centrado numa origem qualquer ( 
 ) 
 
Se tivermos um conjunto de números, X = {X1, X2 X3 ,..., Xn}, 
e uma origem centrada em uma constante “a” podemos definir uma 
quantidade numérica: 
 
 
 
 
 
 
 
 
 
 
 
ou 
 
 
 
 
 
 
 
Exemplo: 
Seja o conjunto X= {1, 3, 5, 7, 9} e a=1 determine o 1º e o 2º momento. 
Resp: 
 
 = 4; 
 = 24 . 
8.3 Momento de Ordem r centrado na média 
 
 
Se tivermos um conjunto de números, X = {X1, X2 X3 ,..., Xn}, 
com a origem centrada na média ( , podemos definir uma quantidade 
numérica: 
 
 
 
 
 
 
 
 
 
ou 
 
 
 
 
 
 
 
Obs: 
a) Se r = 1 e a = → 
b) Se r = 2 e a = → 
 
 
 
Exemplo: 
Seja o conjunto X= {1, 3, 5, 7, 9} e a= determine e r = 1 e r = 2. 
Resp: 
 = 4; = 8. 
 
 
9 ASSIMETRIA 
 
É e o desvio ou afastamento da simetria de uma curva de 
frequência de uma distribuição estatística. Assim, podemos caracterizar 
as distribuições de frequências em assimétrica à direita, assimétrica à 
esquerda e simétrica. 
Diremos que uma distribuição é simétrica quando X = Md = Mo. 
 
 
Se uma distribuição não for simétrica, será classificada como 
assimétrica. 
Existem duas alternativas para uma distribuição assimétrica: 
 
 
 (a) (b) 
 
No caso (a): A distribuição é classificada de assimétrica positiva. 
No caso (b): A distribuição é classificada de assimétrica negativa. 
 
9.1 Medidas de Assimetria 
Coeficiente de Assimetria de Pearson. 
 
 
 
 
 
 
 
 
 
 
 
 
O momento de terceira ordem centrado em relação a média pode 
ser usado como medida de assimetria. 
Entretanto, é mais conveniente a utilização de uma média, o que 
leva a definição do coeficiente de assimetria 
 
 
= 
 
 
 . 
 
10 CURTOSE 
 
È o grau de achatamento de uma distribuição em relação à 
disribuição Normal. Assim podemos classificar a Curtose em: 
Leptocúrtica, Mesocúrtica e platicúrtica. 
 
 mais afilada (Leptocúrtica) 
 
Padrão – Similar à Normal (Mesocúrtica) 
 
 mais achatada (Platicúrtica) 
 
10.1 Medidas de Curtose 
a) Coeficiente de Momento de Curtose (C). 
É uma medida que utiliza a “técnica” de momentos, baseando-se 
no cálculo do quarto momento centrado na média (m4). 
 
 
 
 
 
 
 
Quando çã 
 O cálculo então é determinado por , assim: 
 Se é positivo Leptocúrtica. 
 Se é negativo Platicúrtica. 
 Se = nulo Mesocúrtica (Normal). 
 
Exemplo: 
Ao se obter o coeficiente de curtose 
 
 
 , encontrou-se o valor 2,7. 
Resp: Como 2,7 – 3,0 = Negativo Platicúrtica. 
Se o C=3,5; 
3,5 – 3,0 = positivo Leptocúrtica. 
 
Se o C = 3,0; 
3,0 – 3,0 = nulo Mesocúrtica (Normal). 
 
 
 
b) Coeficiente Percentílico de Curtose (K). 
 
É uma medida que utiliza os quartis e percentis: 
 
 
 
 
O valor normal de K = 0,263, assim podemos ter: 
 
 
 
 
 
Exemplo: 
Dada uma distribuição com os seguintes dados Q1=156,67, Q3=165, 
P10=154 e P90=169,2 classifique segundo o grau de achatamento. 
 
Resp: Substituindo os valores na formula temos: K = 0,274 
Como a distribuição e 
 
 
 
 
 
 
Exercícios 
 
10) Duas equipes de medição foram analisadas em termos do número de parcelas medidas por dia: 
Equipe A: {24, 26, 26, 10, 15, 12, 13, 24, 18, 12} 
Equipe B: {19, 16, 16, 18, 18, 19, 20, 17, 17, 15} 
Encontre: média, mediana, variância, desvio padrão e coeficiente de variação. Com base nestes resultados, 
responda: Qual a equipe é mais produtiva? Qual equipe é mais consistente? 
 
As questões 11, 12, 13 e 14 dizem respeito a distribuição de frequências seguinte associada ao atributo de 
interesse X. Não existem observações coincidentes com os extremos das classes. 
Classes Frequências simples 
0 10 120 
10 20 90 
20 30 70 
30 40 40 
40 50 20 
 
11) Assinale a opção que dá, aproximadamente, a média amostral de X . 
A) 25 B) 17,48 C) 18 D) 17,65 E) 19 
 
12) (1,00) Assinale a opção que dá a moda no conceito de Czuber. 
A) 5 B) 4 C) 8 D) 10 E)15 
 
13) Assinale a opção que dá o valor aproximado da mediana amostral das observações de X . 
A) 20 B) 5 C) 12 D) 15,8 E) 15,6 
 
14) Assinale a opção que dá o coeficiente deAssimetria e o de Curtose respectivamente: 
a) Simétrica a direita e Platicúrtica 
b) Assimétrica à esquerda e Platicúrtica 
c) Assimétrica à direita e Leptocúrtica 
d) Assimétrica à direita e Platicúrtica 
e) Assimétrica à esquerda e Mesocúrtica 
 
15) Os dados abaixo referem-se à produção, em toneladas, de uma indústria. 
50 280 560 170 180 500 250 
200 1050 240 180 1000 1100 120 
420 510 480 90 870 360 
a) Calcular a produção média da industria. 
b) Calcular a variância e o desvio padrão. 
c) Interprete os resultados. 
 
16) Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson. (Amostra). 
 
Classe Int. cl. fi 
1 0 ← 4 10 
2 4 ← 8 15 
3 8 ← 12 6 
4 12 ← 16 2 
5 16 ← 20 1 
 
 
 
 
 
17) Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson. (Amostra). 
 
Classe Int. cl. fi 
1 3 ← 5 14 
2 5 ← 7 16 
3 7 ← 9 18 
4 9 ← 11 19 
5 11 ← 13 17 
 
 
18) Calcule a variância e o desvio padrão da população: 
 
Idade (anos) 
xi 
Número de alunos 
fi 
17 3 
18 18 
19 17 
20 8 
21 4 
 
 
19) Calcule a variância e o desvio padrão para o número de acidentes diários, observados em um 
cruzamento, durante 40 dias. (Amostra) 
 
Número de 
acidentes por dia 
xi 
Número 
de dias 
fi 
0 30 
1 5 
2 3 
3 1 
4 1 
 
 
20) Calcule a variância e o desvio padrão para a distribuição de valores de 54 notas fiscais emitidas na 
mesma data, selecionadas em uma loja de departamentos. (Amostra) 
 
Classe Consumo por nota R$ Número de notas 
1 0,00 ← 50,00 10 
2 50,00 ← 100,00 28 
3 100,00 ← 150,00 12 
4 150,00 ← 200,00 2 
5 200,00 ← 250,00 1 
6 250,00 ← 300,00 1 
 
 
 
 
 
 
 
21) A distribuição de frequência abaixo representa o consumo por nota de 54 notas fiscais emitidas 
durante um dia em uma loja de departamentos: 
 
Classe Consumo por nota R$ Número de notas 
1 0,00 ← 50,00 10 
2 50,00 ← 100,00 28 
3 100,00 ← 150,00 12 
4 150,00 ← 200,00 2 
5 200,00 ← 250,00 1 
6 250,00 ← 300,00 1 
 
Calcule: 
 
 a) Q1 b) K2 c) D3 d) Q3 e) D7 f) P98

Outros materiais