Buscar

Aula 04 Medidas de variação em amostragens

Prévia do material em texto

Estatística
Aula 04
Prof.ª Larissa
2017
Sumário
• Medidas de variação em amostragens
• Variância
• Desvio padrão
• Coeficiente de variação
Resumindo:
𝑛𝑛 = 5Variável: comprimento (cm)𝟐𝟐𝟐𝟐 𝟐𝟐𝟐𝟐 𝟏𝟏𝟒𝟒 𝟏𝟏𝟏𝟏 𝟐𝟐𝟐𝟐
𝑠𝑠2 = ∑𝑖𝑖=1𝑛𝑛 (𝑥𝑥𝑖𝑖 − �̅�𝑥)2
𝑛𝑛 − 1
𝒙𝒙𝒊𝒊 − �𝒙𝒙 =
6
0
-6
-2
2
(𝒙𝒙𝒊𝒊−�𝒙𝒙)𝟐𝟐 =
36 0 36 4 4
Variância = 𝑠𝑠2 = 20 𝑐𝑐𝑐𝑐2 Desvio padrão = s = 4,47 𝑐𝑐𝑐𝑐
𝑠𝑠 = 𝑠𝑠2 Coef. Variação = CV(%) = 22,36%𝐶𝐶𝐶𝐶(%) = 𝑠𝑠
�̅�𝑥
× 100
Média = 20
Medidas de variação em amostragens
• Introdução:
No estudo da Estatística, dispomos de algumas estratégias para
verificar se os valores apresentados em um conjunto de dados estão
dispersos ou não e o quão distantes um do outro eles podem estar.
As ferramentas empregadas para que isso seja possível são
classificadas como medidas de variação (ou medidas de dispersão)
e denominadas de variância, desvio padrão e coeficiente de
variação. Existem outras técnicas que não serão abordadas neste
curso.
Medidas de variação em amostragens - variância
• Variância:
A variância indica o quão distantes os valores estão da média.
Quando temos acesso a todos os dados 𝑁𝑁 da população, deve-se
utilizar o cálculo de variância populacional (𝜎𝜎2), onde 𝜇𝜇 é a média
populacional. Quando temos acesso apenas a amostras 𝑛𝑛, deve-se
utilizar a variância amostral (𝑠𝑠2), onde �̅�𝑥 é a média amostral.
𝜎𝜎2 = ∑𝑖𝑖=1𝑁𝑁 (𝑥𝑥𝑖𝑖 − 𝜇𝜇)2
𝑁𝑁
𝑠𝑠2 = ∑𝑖𝑖=1𝑛𝑛 (𝑥𝑥𝑖𝑖 − �̅�𝑥)2
𝑛𝑛 − 1
𝑠𝑠2 é um estimador do parâmetro 𝜎𝜎2.
Medidas de variação em amostragens - variância
• Variância amostral:
A variância amostral, além do formato já demonstrado 𝑠𝑠2, pode
aparecer na literatura com o formato 𝑠𝑠′2:
No entanto, constatou-se que o estimador 𝑠𝑠2, para amostras de
dimensão pequena, têm tendência de estar mais próximo do
parâmetro a estimar do que 𝑠𝑠′2. Portanto, ficou padronizada a
utilização de 𝑠𝑠2 para qualquer tipo de amostra.
𝑠𝑠2 = ∑𝑖𝑖=1𝑛𝑛 (𝑥𝑥𝑖𝑖 − �̅�𝑥)2
𝑛𝑛 − 1 𝑠𝑠′2 = ∑𝑖𝑖=1𝑛𝑛 (𝑥𝑥𝑖𝑖 − �̅�𝑥)2𝑛𝑛
re
Exercícios propostos
1) A seguir, são apresentadas as medidas do nível de fosfato de sangue
de um paciente, em miligramas de fosfato por decilitro de sangue,
tomadas nas últimas seis visitas a uma clínica. Qual é a variância desta
amostra de dados? 5,5 5,6 5,2 6,5 6,6 6,6= 5,5 + 5,6 + 5,2 + 6,5 + 6,6 + 6,66
∴ 𝐴𝐴 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑛𝑛𝑐𝑐𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑𝑠𝑠𝑑𝑑𝑑𝑑𝑠𝑠 𝑑𝑑𝑣𝑣𝑑𝑑𝑑𝑑𝑠𝑠 é 𝑑𝑑𝑑𝑑 0,404 (𝑐𝑐𝑚𝑚/𝑑𝑑𝑑𝑑)2
𝑛𝑛 = 6
�̅�𝑥 = ∑𝑖𝑖=1𝑛𝑛 𝑥𝑥𝑖𝑖
𝑛𝑛
= 6,0 𝑐𝑐𝑚𝑚
𝑑𝑑𝑑𝑑
𝑠𝑠2 = ∑𝑖𝑖=1𝑛𝑛 (𝑥𝑥𝑖𝑖 − �̅�𝑥)2
𝑛𝑛 − 1
𝑠𝑠2 = (5,5− 6)2+(5,6− 6)2+(5,2− 6)2+(6,5− 6)2+(6,6− 6)2+(6,6− 6)26− 1 = 0,404 𝑐𝑐𝑚𝑚
𝑑𝑑𝑑𝑑
2
Medidas de variação – desvio padrão
• Desvio padrão:
Uma vez que a variância envolve a soma de quadrados, a unidade
em que se exprime não é a mesma que a dos dados. Assim, para
obter uma medida da variabilidade ou dispersão com as mesmas
unidades que os dados, tomamos a raiz quadrada da variância e
tem-se o desvio padrão amostral ( 𝑠𝑠 ), que é a medida que
geralmente se utiliza para medir a variabilidade dos dados
relativamente à medida de localização média.
𝑠𝑠2 = ∑𝑖𝑖=1𝑛𝑛 (𝑥𝑥𝑖𝑖 − �̅�𝑥)2
𝑛𝑛 − 1 Desvio padrão amostral:𝑠𝑠 = 𝑠𝑠2 𝜎𝜎 = 𝜎𝜎2Desvio padrão populacional:
Medidas de variação – desvio padrão
• Desvio padrão:
Podemos ver a utilização do desvio padrão na apresentação da
média aritmética, informando o quão “confiável” é esse valor. Isso é
feito da seguinte forma: �̅�𝑥 ± 𝑠𝑠
Nota: o desvio padrão não
garante que todos os
elementos da amostra
estejam dentro de seu
intervalo, mas sim que a
maioria deles está, em uma
distribuição normal.
Disponível em: <http://www.investpedia.com.br/artigo/O+que+e+desvio+padrao.aspx>
𝜇𝜇 ± 𝜎𝜎
Medidas de variação – coeficiente de variação
• Coeficiente de variação:
Podemos também estabelecer uma razão do desvio padrão em
relação à média. Como dois conjuntos de dados podem ter médias
diferentes, o desvio-padrão desses dois conjuntos não é
comparável. A solução é usar o coeficiente de variação (𝐶𝐶𝐶𝐶), que é
igual ao desvio-padrão dividido pela média:
𝐶𝐶𝐶𝐶 = 𝑠𝑠
�̅�𝑥
O coeficiente de variação pode ser multiplicado por 100, passando a
ser expressado como porcentagem. Quanto menor for o coeficiente,
mais homogêneo será o conjunto de dados.
𝐶𝐶𝐶𝐶(%) = 𝑠𝑠
�̅�𝑥
× 100
re
Exercícios propostos
2) Uma amostra de seis chapas produzidas por uma máquina forneceu
as seguintes espessuras, em milímetros:
a) Qual é o valor da variância, em mm²?
6,50 6,42 6,34 6,45 6,15 6,80
= 6,5 + 6,42 + 6,34 + 6,45 + 6,15 + 6,86
𝑛𝑛 = 6
�̅�𝑥 = ∑𝑖𝑖=1𝑛𝑛 𝑥𝑥𝑖𝑖
𝑛𝑛
𝑠𝑠2 = 0,045𝑐𝑐𝑐𝑐2
= 6,44 mm
𝑠𝑠2 = ∑𝑖𝑖=1𝑛𝑛 (𝑥𝑥𝑖𝑖 − �̅�𝑥)2
𝑛𝑛 − 1 = (0,06)2+(−0,02)2+(−0,1)2+(0,01)2+(−0,29)2+(0,36)25
re
Exercícios propostos
2) Uma amostra de seis chapas produzidas por uma máquina forneceu
as seguintes espessuras, em milímetros:
b) Qual é o valor do desvio padrão, em mm?
6,50 6,42 6,34 6,45 6,15 6,80
𝑛𝑛 = 6
𝑠𝑠2 = 0,045𝑐𝑐𝑐𝑐2
𝑠𝑠 = 𝑠𝑠2 = 0,045 = 0,21𝑐𝑐𝑐𝑐
c) Qual é o coeficiente de variação, em porcentagem?
𝐶𝐶𝐶𝐶(%) = 𝑠𝑠
�̅�𝑥
× 100 = 0,216,44 × 100 = 3,26%
re
Exercícios propostos
3) Considere duas amostras de estudantes das cidades A e B que foram
fazer o ENEM. Calculou-se, para cada uma das amostras, a média e o
desvio padrão das notas:
𝐴𝐴 𝑣𝑣𝑐𝑐𝑑𝑑𝑠𝑠𝑑𝑑𝑣𝑣𝑣𝑣 𝐴𝐴 é𝑐𝑐𝑣𝑣𝑣𝑣𝑠𝑠 ℎ𝑑𝑑𝑐𝑐𝑑𝑑𝑚𝑚𝑜𝑛𝑛𝑑𝑑𝑣𝑣,𝑝𝑝𝑑𝑑𝑣𝑣𝑠𝑠 𝑠𝑠𝑑𝑑𝑠𝑠 𝑐𝑐𝑑𝑑𝑑𝑑𝑐𝑐𝑣𝑣𝑐𝑐𝑣𝑣𝑑𝑑𝑛𝑛𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑑𝑑 é𝑐𝑐𝑑𝑑𝑛𝑛𝑑𝑑𝑣𝑣, 𝑑𝑑 𝑞𝑞𝑠𝑠𝑑𝑑
𝑣𝑣𝑛𝑛𝑑𝑑𝑣𝑣𝑐𝑐𝑣𝑣 𝑞𝑞𝑠𝑠𝑑𝑑 𝑑𝑑𝑠𝑠 𝑣𝑣𝑣𝑣𝑣𝑣𝑑𝑑𝑣𝑣𝑑𝑑𝑠𝑠 𝑑𝑑𝑑𝑑𝑠𝑠 𝑑𝑑𝑣𝑣𝑑𝑑𝑐𝑐𝑑𝑑𝑛𝑛𝑑𝑑𝑑𝑑𝑠𝑠 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑐𝑐 𝑐𝑐𝑑𝑑𝑛𝑛𝑑𝑑𝑠𝑠 𝑑𝑑𝑐𝑐 𝑣𝑣𝑑𝑑𝑣𝑣𝑣𝑣𝑣𝑣𝑑𝑑 𝑣𝑣𝑑𝑑 𝑣𝑣𝑣𝑣𝑣𝑣𝑑𝑑𝑣𝑣 𝑐𝑐𝑚𝑑𝑑𝑣𝑣𝑑𝑑.
Cidade Nota média
Desvio 
padrão
Coef.
Variação
A 40 4
B 20 4
Calcule o coeficiente de variação de
ambas as amostras e diga: qual amostra é
mais homogênea?
𝐶𝐶𝐶𝐶(%) = 𝑠𝑠
�̅�𝑥
× 100 𝐶𝐶𝐶𝐶 % 𝐴𝐴 = 440 × 100 = 10% 𝐶𝐶𝐶𝐶 % 𝐵𝐵 = 420 × 100 = 20%
re
Exercícios propostos
4) A distribuição das idades de um grupo de alunos de uma
determinada escola é dada na tabela abaixo:
Qual é o coeficiente de variação?
𝑠𝑠2 = ∑𝑖𝑖=1𝑘𝑘 (𝑥𝑥𝑖𝑖 − 𝑥𝑥𝑝𝑝)2× 𝑐𝑐𝑖𝑖
𝑛𝑛 − 1
Idades (anos) fi
14 |— 16 10
16 |— 18 20
18 |— 20 25
20 |— 22 5
Total: 60
𝑥𝑥𝑝𝑝 = ∑𝑖𝑖=1𝑘𝑘 𝑥𝑥𝑖𝑖 × 𝑐𝑐𝑖𝑖𝑛𝑛 𝑥𝑥𝑖𝑖 = 𝑑𝑑𝑣𝑣𝑐𝑐inf(𝑖𝑖) + 𝑑𝑑𝑣𝑣𝑐𝑐sup(𝑖𝑖)2
𝑠𝑠 = 𝑠𝑠2 𝐶𝐶𝐶𝐶(%) = 𝑠𝑠𝑥𝑥𝑝𝑝 × 100
Para tabela de frequências, utilizamos a média
ponderada com ponto médio de classe. A
fórmula da variância sofre uma modificação,
com a multiplicação pela frequência da classe.
𝒏𝒏: nº de elementos | 𝒌𝒌: nº de classes
re
Exercícios propostos
4) A distribuição das idades de um grupo de alunos de uma
determinada escola é dada na tabela abaixo:
Qual é o coeficiente de variação?Idades (anos) fi
14 |— 16 10
16 |— 18 20
18 |— 20 25
20 |— 22 5
Total: 60
𝑥𝑥𝑝𝑝 = ∑𝑖𝑖=1𝑘𝑘 𝑥𝑥𝑖𝑖 × 𝑐𝑐𝑖𝑖𝑛𝑛 𝑥𝑥𝑖𝑖 = 𝑑𝑑𝑣𝑣𝑐𝑐inf(𝑖𝑖) + 𝑑𝑑𝑣𝑣𝑐𝑐sup(𝑖𝑖)2
𝑥𝑥𝑝𝑝 = (15 × 10) + (17 × 20) + (19 × 25) + (21 × 5)60 = 17,83 anos
re
Exercícios propostos
4) A distribuição das idades de um grupo de alunos de uma
determinada escola é dada na tabela abaixo:
Qual é o coeficiente de variação?Idades (anos) fi
14 |— 16 10
16 |— 18 20
18 |— 20 25
20 |— 22 5
Total: 60
𝑠𝑠2 = (15− 17,83)2× 10 + (17− 17,83)2× 20 + (19− 17,83)2× 25 + (21− 17,83)2× 559
𝑥𝑥𝑝𝑝 = 17,83 anos𝑠𝑠2 = ∑𝑖𝑖=1𝑘𝑘 (𝑥𝑥𝑖𝑖 − 𝑥𝑥𝑝𝑝)2× 𝑐𝑐𝑖𝑖𝑛𝑛 − 1
𝑠𝑠2 = 3, 02 anos2
re
Exercícios propostos4) A distribuição das idades de um grupo de alunos de uma
determinada escola é dada na tabela abaixo:
Qual é o coeficiente de variação?Idades (anos) fi
14 |— 16 10
16 |— 18 20
18 |— 20 25
20 |— 22 5
Total: 60
𝑥𝑥𝑝𝑝 = 17,83 anos
𝑠𝑠2 = 3, 02 𝑣𝑣𝑛𝑛𝑑𝑑𝑠𝑠2
𝑠𝑠 = 𝑠𝑠2 𝐶𝐶𝐶𝐶(%) = 𝑠𝑠𝑥𝑥𝑝𝑝 × 100
𝑠𝑠 = 3,02 = 1,74
𝐶𝐶𝐶𝐶(%) = 1,7417,83 × 100 = 9,76%
re
Exercícios propostos
5) A distribuição de preços, em reais, da calculadora HM 6667
em diversas lojas da cidade de São Paulo é dada na tabela:
Qual é o coeficiente de variação?
𝑠𝑠2 = ∑𝑖𝑖=1𝑘𝑘 (𝑥𝑥𝑖𝑖 − 𝑥𝑥𝑝𝑝)2× 𝑐𝑐𝑖𝑖
𝑛𝑛 − 1
Preço (R$) fi
50 |— 54 1
54 |— 58 3
58 |— 62 11
62 |— 66 8
66 |— 70 4
𝑥𝑥𝑝𝑝 = ∑𝑖𝑖=1𝑘𝑘 𝑥𝑥𝑖𝑖 × 𝑐𝑐𝑖𝑖𝑛𝑛 𝑥𝑥𝑖𝑖 = 𝑑𝑑𝑣𝑣𝑐𝑐inf(𝑖𝑖) + 𝑑𝑑𝑣𝑣𝑐𝑐sup(𝑖𝑖)2
𝑠𝑠 = 𝑠𝑠2 𝐶𝐶𝐶𝐶(%) = 𝑠𝑠𝑥𝑥𝑝𝑝 × 100
Para tabela de frequências, utilizamos a média
ponderada com ponto médio de classe. A
fórmula da variância sofre uma modificação,
com a multiplicação pela frequência da classe.
𝒏𝒏: nº de elementos | 𝒌𝒌: nº de classes
re
Exercícios propostos
5) A distribuição de preços, em reais, da calculadora HM 6667
em diversas lojas da cidade de São Paulo é dada na tabela:
Qual é o coeficiente de variação?Preço (R$) fi
50 |— 54 1
54 |— 58 3
58 |— 62 11
62 |— 66 8
66 |— 70 4
𝑥𝑥𝑝𝑝 = ∑𝑖𝑖=1𝑘𝑘 𝑥𝑥𝑖𝑖 × 𝑐𝑐𝑖𝑖𝑛𝑛 𝑥𝑥𝑖𝑖 = 𝑑𝑑𝑣𝑣𝑐𝑐inf(𝑖𝑖) + 𝑑𝑑𝑣𝑣𝑐𝑐sup(𝑖𝑖)2
𝑥𝑥𝑝𝑝 = 52 × 1 + 56 × 3 + 60 × 11 + 64 × 8 + (68 × 4)27 = 𝑅𝑅𝑅 61,63
re
Exercícios propostos
5) A distribuição de preços, em reais, da calculadora HM 6667
em diversas lojas da cidade de São Paulo é dada na tabela:
Qual é o coeficiente de variação?Preço (R$) fi
50 |— 54 1
54 |— 58 3
58 |— 62 11
62 |— 66 8
66 |— 70 4
𝑠𝑠2 = (52 − 61,63)2× 1 + (56− 61,63)2× 3 + (60− 61,63)2× 11 + (64− 61,63)2× 8 + (68 − 61,63)2× 426
𝑥𝑥𝑝𝑝 = 𝑅𝑅𝑅 61,63𝑠𝑠2 = ∑𝑖𝑖=1𝑘𝑘 (𝑥𝑥𝑖𝑖 − 𝑥𝑥𝑝𝑝)2× 𝑐𝑐𝑖𝑖𝑛𝑛 − 1
𝑠𝑠2 = 16, 32 (R𝑅)2
re
Exercícios propostos
5) A distribuição de preços, em reais, da calculadora HM 6667
em diversas lojas da cidade de São Paulo é dada na tabela:
Qual é o coeficiente de variação?Preço (R$) fi
50 |— 54 1
54 |— 58 3
58 |— 62 11
62 |— 66 8
66 |— 70 4
𝑠𝑠 = 𝑠𝑠2 𝐶𝐶𝐶𝐶(%) = 𝑠𝑠𝑥𝑥𝑝𝑝 × 100
𝑠𝑠 = 16,32 = 𝑅𝑅𝑅 4,04
𝐶𝐶𝐶𝐶(%) = 4,0461,63 × 100 = 6,56%
𝑥𝑥𝑝𝑝 = 𝑅𝑅𝑅 61,63
𝑠𝑠2 = 16, 32 (R𝑅)2
Para refletir...
Disponível em: <http://www.rebresearch.com/blog/wp-content/uploads/2013/11/paranormal-distribution.jpg>
	Estatística�
	Sumário
	Resumindo:
	Medidas de variação em amostragens
	Medidas de variação em amostragens - variância
	Medidas de variação em amostragens - variância
	Exercícios propostos
	Medidas de variação – desvio padrão
	Medidas de variação – desvio padrão
	Medidas de variação – coeficiente de variação
	Exercícios propostos
	Exercícios propostos
	Exercícios propostos
	Exercícios propostos
	Exercícios propostos
	Exercícios propostos
	Exercícios propostos
	Exercícios propostos
	Exercícios propostos
	Exercícios propostos
	Exercícios propostos
	Para refletir...

Mais conteúdos dessa disciplina