Buscar

Estatística - UVA - Aula 05

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

ESTATÍSTICA I 
AULA 5 
Profª Adriana Maria Balena Tostes 
Suponhamos 3 turmas diferentes, cada uma com 10 alunos, onde foi aplicada 
uma avaliação com valor de 10 pontos. 
As notas foram as seguintes: 
 Notas 
 Turmas 
N1 
 
N2 
 
N3 
 
N4 
 
N5 
 
N6 
 
N7 
 
N8 
 
N9 
 
N10 
 Total 
Turma “A” 5 5 5 5 5 5 5 5 5 5 50 
Turma “B” 0 0 0 5 5 5 5 10 10 10 50 
Turma “C” 1 2 3 4 5 5 6 7 8 9 50 
 Calcular a média, a mediana e a moda para cada turma. 
 O que podemos concluir com estas medidas? 
 Precisamos de outras medidas estatísticas, que são as Medidas de Dispersão ou 
Variabilidade. 
Amplitude (Range) 
É a diferença entre o maior e o menor valor do conjunto. 
 
➢  Ex. Turma 1: 5 – 5 = 0 
➢  Ex Turma 2: 10 – 0 = 10 
➢  Ex Turma 3: 9 -1 = 8 
Para dados agrupados com intervalos de classe, a amplitude total 
é a diferença entre o limite superior da última classe e o limite 
inferior da primeira classe. 
Sua desvantagem é de levar em conta apenas dois valores, desprezando todos os outros. 
 R=L(máx) - L(mín) 
Quanto maior a amplitude total, mais heterogêneos são os dados entre si. 
Desvio 
➢  É a diferença entre cada valor observado e a média destes 
valores. 
Propriedade importante: 
A soma dos desvios em relação à 
média é sempre igual a zero. 
di = xi - X 
Variância (s2 ou σ2) 
É a média aritmética dos quadrados dos desvios em relação 
à média da distribuição. 
1- Para dados não agrupados: 
Onde: 
S2 = variância amostral 
xi = valor observado 
X = média amostral 
n = tamanho da amostra 
Onde: 
σ2= variância populacional 
xi = valor observado 
μ= média populacional 
N = tamanho da população 
Observar os 
denominadores 
n – 1 para amostra 
 N para população 
Exemplos: 
1- Encontre a variância do conjunto de dados amostral. 
2- Encontre a variância do conjunto de dados populacional. 
17	
   8	
   13	
   18	
   15	
   9	
   10	
   11	
   6	
   Média=11,9	
  
5,1	
   -­‐3,9	
   1,1	
   6,1	
   3,1	
   -­‐2,9	
   -­‐1,9	
   -­‐0,9	
   -­‐5,9	
  
26,1	
   15,1	
   1,2	
   37,3	
   9,7	
   8,3	
   3,6	
   0,8	
   34,7	
   136,9	
  	
  	
  s2	
  =	
  17,1	
  
12	
   9	
   7	
   5	
   7	
   8	
   10	
   4	
   11	
   6	
   μ	
  =	
  7,9	
  
4,1	
   1,1	
   -­‐0,9	
   -­‐2,9	
   -­‐0,9	
   0,1	
   2,1	
   -­‐3,9	
   3,1	
   -­‐1,9	
  
16,8	
   1,2	
   0,8	
   8,4	
   0,8	
   0,0	
   4,4	
   15,2	
   9,6	
   3,6	
  
σ2=	
  6,1	
  
Variância 
2- Para dados agrupados sem intervalo de classes: 
Onde: 
S2 = variância amostral 
xi = valor observado 
X = média amostral 
n= tamanho da amostra 
fi = frequência simples da classe 
Onde: 
σ2= variância populacional 
xi = valor observado 
μ= média populacional 
N = tamanho da população 
fi = frequência simples da classe 
Exemplo: 
Foi coletada uma amostra aleatória sobre o número de crianças por residência em certa região. 
Os resultados são mostrados na tabela abaixo. Encontre a variância para esse conjunto de dados. 
 
x	
   fi	
   xi	
  .	
  Fi	
   (xi	
  -­‐	
  Média)	
   (xi	
  –	
  Média)2	
   (xi	
  –	
  Média)2	
  *	
  fi	
  
0	
   10	
   0	
   -­‐1,8	
   3,24	
   32,4	
  
1	
   19	
   19	
   -­‐0,8	
   0,64	
   12,16	
  
2	
   7	
   14	
   0,2	
   0,04	
   0,28	
  
3	
   7	
   21	
   1,2	
   1,44	
   10,08	
  
4	
   2	
   8	
   2,2	
   4,84	
   9,68	
  
5	
   1	
   5	
   3,2	
   10,24	
   10,24	
  
6	
   4	
   24	
   4,2	
   17,64	
   70,56	
  
Total	
  	
   50	
   91	
   	
  	
   	
  	
   145,4	
  
Média = 1,8 
S2=3 
Variância 
3- Para dados agrupados com intervalo de classes: 
Utilizar para xi o ponto médio da classe. 
Onde: 
S2 = variância amostral 
xi = ponto médio da classe 
X = média amostral 
n= tamanho da amostra 
fi = frequência simples da classe 
Onde: 
σ2= variância populacional 
xi = ponto médio da classe 
μ= média populacional 
N = tamanho da população 
fi = frequência simples da classe 
Exemplo: 
Na auditoria anual de uma empresa foi anotado o tempo necessário (em 
minutos) para realizar a auditoria de uma amostra de 50 balanços. 
Caracterizar a dispersão da distribuição por meio da variância. 
Logo, podemos dizer que os valores observados se distanciam cerca 
de 12,4 min da média. 
 
 
Desvio Padrão (s ou σ) 
•  Desvio padrão é a medida de dispersão mais usada. 
•  Como os desvios foram elevados ao quadrado para o cálculo da variância, não 
se consegue expressá-la na mesma unidade dos valores da variável. Por isso, 
para calcular o desvio padrão, basta extrair a raiz quadrada da variância. 
•  Quanto maior é o desvio padrão maior é a dispersão dos dados em torno da 
média. 
•  Quanto mais o desvio padrão se aproxima de zero, mais homogênea é a 
distribuição dos valores observados. 
S = desvio padrão amostral 
σ = desvio padrão populacional 
s = 3 
1 2 3 4 5 6 7 
s = 1,0 
1 2 3 4 5 6 7 
s = 0,8 
1 2 3 4 5 6 7 1 2 3 4 5 6 7 
fr
eq
üê
nc
ia
 
s = 0 
7 
6 
5 
4 
3 
2 
1 
0 
O desvio-padrão cresce quando a dispersão dos dados aumenta 
Desvio Padrão (s ou σ) 
Em todos os casos temos 7 medidas com média = 4 
Coeficiente de Variação 
Para saber se uma dispersão é muito grande em relação à média, ou para 
comparar o grau de dispersão relativa entre as distribuições de duas ou mais 
variáveis é preciso utilizar uma medida de dispersão relativa, que se chama 
Coeficiente de Variação. 
 
É o quociente, expresso em %, entre o desvio padrão e a média de uma 
distribuição. 
 
 
 
Alguns pesquisadores consideram: 
Ø  Dispersão baixa quando CV inferior a 10% 
Ø  Dispersão média quando CV estiver entre 10% e 20% 
Ø  Dispersão alta quando CV estiver entre 20% e 30% 
Ø  Dispersão muito alta quando CV for superior a 30% (pequena 
representatividade da média) 
Exemplo: Qual destas grandezas 
apresenta maior grau de dispersão? 
 
Portanto as massas apresentam maior grau de dispersão do que as estaturas 
Exercícios 
Os seguintes valores em Km representam as distâncias percorridas 
por um maratonista em 50 dos 180 dias de treinamento que se 
preparou para uma competição. 
a)  Construir uma tabela de distribuição de frequências completa. (li=1,1 , h=5) 
b)  Calcular a média, a moda e a mediana 
c)  Calcular a variância, o desvio padrão e o coeficiente de variação. 
Respostas:	
   	
  	
   	
  	
   	
  	
   	
  	
   	
  	
   	
  	
  
Classes	
   (f	
  i)	
   (fri%)	
   	
  (Fi)	
   (Fri%)	
   (Xi)	
   fi	
  .	
  Xi	
   desvio	
   desvio2	
   desvio2.	
  fi	
  
1,1	
   |-­‐-­‐-­‐	
   6,1	
   4	
   8,0%	
   4	
   8,0%	
   3,6	
   14,4	
   -­‐12,8	
   163,84	
   655,36	
  
6,1	
   |-­‐-­‐-­‐	
   11,1	
   11	
   22,0%	
   15	
   30,0%	
   8,6	
   94,6	
   -­‐7,8	
   60,84	
   669,24	
  
11,1	
   |-­‐-­‐-­‐	
   16,1	
   12	
   24,0%	
   27	
   54,0%	
   13,6	
   163,2	
   -­‐2,8	
   7,84	
   94,08	
  
16,1	
   |-­‐-­‐-­‐	
   21,1	
   8	
   16,0%	
   35	
   70,0%	
   18,6	
   148,8	
   2,2	
   4,84	
   38,72	
  
21,1	
   |-­‐-­‐-­‐	
   26,1	
   8	
   16,0%	
   43	
   86,0%	
   23,6	
   188,8	
   7,2	
   51,84	
   414,72	
  
26,1	
   |-­‐-­‐-­‐	
   31,1	
   5	
   10,0%	
   48	
   96,0%	
   28,6	
   143	
   12,2	
   148,84	
   744,2	
  
31,1	
   |-­‐-­‐-­‐	
   36,1	
   2	
   4,0%	
   50	
   100,0%	
   33,6	
   67,2	
   17,2	
   295,84	
   591,68	
  
Total	
   50	
   100,0%	
   	
  	
   	
  	
   	
  	
   820	
   	
  	
   	
  	
   3208	
  
Média	
  =	
  820	
  /	
  50	
  =	
  16,4	
   Moda	
  =
13,6	
   Mediana	
  =	
  15,27	
  
Moda	
  =	
   12,1	
  
Variância	
  =	
  3208/49	
  =	
  
65,47	
   Desvio	
  Padrão	
  =	
  8,09	
   CV	
  =	
  0,49	
  =	
  49%	
  
Forma das distribuições 
Quando a distribuição for simétrica e 
unimodal, a média, a mediana e a 
moda são iguais 
Se a distribuição for assimétrica à 
esquerda (negativamente assimétrica), 
a média é menor que a mediana que é 
menor que a moda. 
Se a distribuição for simétrica e 
uniforme a média e a mediana são 
iguais. Não haverá moda para essa 
distribuição. 
Se a distribuição for assimétrica à 
direita (positivamente assimétrica), a 
média é maior que a mediana que é 
maior que a moda. 
A média sempre irá na direção que a 
distribuição for assimétrica, ou seja, na 
direção da cauda. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Medidas de Assimetria e Curtose 
Determinar o coeficiente de assimetria da distribuição populacional 
abaixo e concluir sobre o seu grau de enviesamento. 
As = 0 
Média = 75 
Moda = 75 
S = 12,65 
A distribuição é simétrica 
Classes	
   fi	
   xi	
   Fa	
  
[50,60[	
   15	
   55	
   15	
  
[60,70[	
   20	
   65	
   35	
  
[70,80[	
   30	
   75	
   65	
  
[80,90[	
   20	
   85	
   85	
  
[90,100[	
   15	
   95	
   100	
  
	
  Total	
   100	
   	
  	
   	
  	
  
Q1=65	
  
Q2=Md=75	
  
Q3=85	
  
As	
  =	
  0	
  
0 
10 
20 
30 
40 
55 65 75 85 95 
Histograma 
Dados NI 
Curtose (k) 
É o estudo do grau de achatamento da curva de frequência em 
relação à curva normal. 
(a)  Leptocúrtica 
(b)  Mesocúrtica 
(normal padão) 
(c)  Platicúrtica 
Coeficiente de Curtose (k) 
K = 0,263, DISTRIBUIÇÃO MESOCÚRTICA 
 
K < 0,263 DISTRIBUIÇÃO LEPTOCÚRTICA (CUME) 
 
K>0,263 DISTRIBUIÇÃO PLATICÚRTICA (PLANA) 
Exercício: 
Considere os seguintes resultados relativos a três distribuições de frequência: 
Determine o coeficiente de curtose e classifique a distribuição. 
Boxplot 
•  Limite superior da caixa: P75=Q3 
•  Limite inferior da caixa: P25 = Q1 
•  Altura da caixa: Desvio interquartílico. 
•  A caixa (box) propriamente contém a 
metade 50% dos dados. 
•  Linha na caixa: Md = Q2 (Se a linha mediana dentro 
da caixa não é equidistante dos extremos, diz-se então que os 
dados são assimétricos). 
•  Extremos do gráfico: valores mínimo e 
máximo, a menos que valores outliers 
estejam presentes, nesse caso o gráfico de 
estende ao máximo de 1.5 vezes da 
distância interquartil. 
•  Pontos fora do gráfico são então outliers ou 
suspeitos de serem outliers. 
Exercícios 
Criar os gráficos de Box-Plot para a tabela abaixo:

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais

Materiais relacionados

Perguntas relacionadas

Perguntas Recentes