Prévia do material em texto
Estatística Aula 04 Prof.ª Larissa 2017 Sumário • Medidas de variação em amostragens • Variância • Desvio padrão • Coeficiente de variação Resumindo: 𝑛𝑛 = 5Variável: comprimento (cm)𝟐𝟐𝟐𝟐 𝟐𝟐𝟐𝟐 𝟏𝟏𝟒𝟒 𝟏𝟏𝟏𝟏 𝟐𝟐𝟐𝟐 𝑠𝑠2 = ∑𝑖𝑖=1𝑛𝑛 (𝑥𝑥𝑖𝑖 − �̅�𝑥)2 𝑛𝑛 − 1 𝒙𝒙𝒊𝒊 − �𝒙𝒙 = 6 0 -6 -2 2 (𝒙𝒙𝒊𝒊−�𝒙𝒙)𝟐𝟐 = 36 0 36 4 4 Variância = 𝑠𝑠2 = 20 𝑐𝑐𝑐𝑐2 Desvio padrão = s = 4,47 𝑐𝑐𝑐𝑐 𝑠𝑠 = 𝑠𝑠2 Coef. Variação = CV(%) = 22,36%𝐶𝐶𝐶𝐶(%) = 𝑠𝑠 �̅�𝑥 × 100 Média = 20 Medidas de variação em amostragens • Introdução: No estudo da Estatística, dispomos de algumas estratégias para verificar se os valores apresentados em um conjunto de dados estão dispersos ou não e o quão distantes um do outro eles podem estar. As ferramentas empregadas para que isso seja possível são classificadas como medidas de variação (ou medidas de dispersão) e denominadas de variância, desvio padrão e coeficiente de variação. Existem outras técnicas que não serão abordadas neste curso. Medidas de variação em amostragens - variância • Variância: A variância indica o quão distantes os valores estão da média. Quando temos acesso a todos os dados 𝑁𝑁 da população, deve-se utilizar o cálculo de variância populacional (𝜎𝜎2), onde 𝜇𝜇 é a média populacional. Quando temos acesso apenas a amostras 𝑛𝑛, deve-se utilizar a variância amostral (𝑠𝑠2), onde �̅�𝑥 é a média amostral. 𝜎𝜎2 = ∑𝑖𝑖=1𝑁𝑁 (𝑥𝑥𝑖𝑖 − 𝜇𝜇)2 𝑁𝑁 𝑠𝑠2 = ∑𝑖𝑖=1𝑛𝑛 (𝑥𝑥𝑖𝑖 − �̅�𝑥)2 𝑛𝑛 − 1 𝑠𝑠2 é um estimador do parâmetro 𝜎𝜎2. Medidas de variação em amostragens - variância • Variância amostral: A variância amostral, além do formato já demonstrado 𝑠𝑠2, pode aparecer na literatura com o formato 𝑠𝑠′2: No entanto, constatou-se que o estimador 𝑠𝑠2, para amostras de dimensão pequena, têm tendência de estar mais próximo do parâmetro a estimar do que 𝑠𝑠′2. Portanto, ficou padronizada a utilização de 𝑠𝑠2 para qualquer tipo de amostra. 𝑠𝑠2 = ∑𝑖𝑖=1𝑛𝑛 (𝑥𝑥𝑖𝑖 − �̅�𝑥)2 𝑛𝑛 − 1 𝑠𝑠′2 = ∑𝑖𝑖=1𝑛𝑛 (𝑥𝑥𝑖𝑖 − �̅�𝑥)2𝑛𝑛 re Exercícios propostos 1) A seguir, são apresentadas as medidas do nível de fosfato de sangue de um paciente, em miligramas de fosfato por decilitro de sangue, tomadas nas últimas seis visitas a uma clínica. Qual é a variância desta amostra de dados? 5,5 5,6 5,2 6,5 6,6 6,6= 5,5 + 5,6 + 5,2 + 6,5 + 6,6 + 6,66 ∴ 𝐴𝐴 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑛𝑛𝑐𝑐𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑𝑠𝑠𝑑𝑑𝑑𝑑𝑠𝑠 𝑑𝑑𝑣𝑣𝑑𝑑𝑑𝑑𝑠𝑠 é 𝑑𝑑𝑑𝑑 0,404 (𝑐𝑐𝑚𝑚/𝑑𝑑𝑑𝑑)2 𝑛𝑛 = 6 �̅�𝑥 = ∑𝑖𝑖=1𝑛𝑛 𝑥𝑥𝑖𝑖 𝑛𝑛 = 6,0 𝑐𝑐𝑚𝑚 𝑑𝑑𝑑𝑑 𝑠𝑠2 = ∑𝑖𝑖=1𝑛𝑛 (𝑥𝑥𝑖𝑖 − �̅�𝑥)2 𝑛𝑛 − 1 𝑠𝑠2 = (5,5− 6)2+(5,6− 6)2+(5,2− 6)2+(6,5− 6)2+(6,6− 6)2+(6,6− 6)26− 1 = 0,404 𝑐𝑐𝑚𝑚 𝑑𝑑𝑑𝑑 2 Medidas de variação – desvio padrão • Desvio padrão: Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância e tem-se o desvio padrão amostral ( 𝑠𝑠 ), que é a medida que geralmente se utiliza para medir a variabilidade dos dados relativamente à medida de localização média. 𝑠𝑠2 = ∑𝑖𝑖=1𝑛𝑛 (𝑥𝑥𝑖𝑖 − �̅�𝑥)2 𝑛𝑛 − 1 Desvio padrão amostral:𝑠𝑠 = 𝑠𝑠2 𝜎𝜎 = 𝜎𝜎2Desvio padrão populacional: Medidas de variação – desvio padrão • Desvio padrão: Podemos ver a utilização do desvio padrão na apresentação da média aritmética, informando o quão “confiável” é esse valor. Isso é feito da seguinte forma: �̅�𝑥 ± 𝑠𝑠 Nota: o desvio padrão não garante que todos os elementos da amostra estejam dentro de seu intervalo, mas sim que a maioria deles está, em uma distribuição normal. Disponível em: <http://www.investpedia.com.br/artigo/O+que+e+desvio+padrao.aspx> 𝜇𝜇 ± 𝜎𝜎 Medidas de variação – coeficiente de variação • Coeficiente de variação: Podemos também estabelecer uma razão do desvio padrão em relação à média. Como dois conjuntos de dados podem ter médias diferentes, o desvio-padrão desses dois conjuntos não é comparável. A solução é usar o coeficiente de variação (𝐶𝐶𝐶𝐶), que é igual ao desvio-padrão dividido pela média: 𝐶𝐶𝐶𝐶 = 𝑠𝑠 �̅�𝑥 O coeficiente de variação pode ser multiplicado por 100, passando a ser expressado como porcentagem. Quanto menor for o coeficiente, mais homogêneo será o conjunto de dados. 𝐶𝐶𝐶𝐶(%) = 𝑠𝑠 �̅�𝑥 × 100 re Exercícios propostos 2) Uma amostra de seis chapas produzidas por uma máquina forneceu as seguintes espessuras, em milímetros: a) Qual é o valor da variância, em mm²? 6,50 6,42 6,34 6,45 6,15 6,80 = 6,5 + 6,42 + 6,34 + 6,45 + 6,15 + 6,86 𝑛𝑛 = 6 �̅�𝑥 = ∑𝑖𝑖=1𝑛𝑛 𝑥𝑥𝑖𝑖 𝑛𝑛 𝑠𝑠2 = 0,045𝑐𝑐𝑐𝑐2 = 6,44 mm 𝑠𝑠2 = ∑𝑖𝑖=1𝑛𝑛 (𝑥𝑥𝑖𝑖 − �̅�𝑥)2 𝑛𝑛 − 1 = (0,06)2+(−0,02)2+(−0,1)2+(0,01)2+(−0,29)2+(0,36)25 re Exercícios propostos 2) Uma amostra de seis chapas produzidas por uma máquina forneceu as seguintes espessuras, em milímetros: b) Qual é o valor do desvio padrão, em mm? 6,50 6,42 6,34 6,45 6,15 6,80 𝑛𝑛 = 6 𝑠𝑠2 = 0,045𝑐𝑐𝑐𝑐2 𝑠𝑠 = 𝑠𝑠2 = 0,045 = 0,21𝑐𝑐𝑐𝑐 c) Qual é o coeficiente de variação, em porcentagem? 𝐶𝐶𝐶𝐶(%) = 𝑠𝑠 �̅�𝑥 × 100 = 0,216,44 × 100 = 3,26% re Exercícios propostos 3) Considere duas amostras de estudantes das cidades A e B que foram fazer o ENEM. Calculou-se, para cada uma das amostras, a média e o desvio padrão das notas: 𝐴𝐴 𝑣𝑣𝑐𝑐𝑑𝑑𝑠𝑠𝑑𝑑𝑣𝑣𝑣𝑣 𝐴𝐴 é𝑐𝑐𝑣𝑣𝑣𝑣𝑠𝑠 ℎ𝑑𝑑𝑐𝑐𝑑𝑑𝑚𝑚𝑜𝑛𝑛𝑑𝑑𝑣𝑣,𝑝𝑝𝑑𝑑𝑣𝑣𝑠𝑠 𝑠𝑠𝑑𝑑𝑠𝑠 𝑐𝑐𝑑𝑑𝑑𝑑𝑐𝑐𝑣𝑣𝑐𝑐𝑣𝑣𝑑𝑑𝑛𝑛𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑑𝑑 é𝑐𝑐𝑑𝑑𝑛𝑛𝑑𝑑𝑣𝑣, 𝑑𝑑 𝑞𝑞𝑠𝑠𝑑𝑑 𝑣𝑣𝑛𝑛𝑑𝑑𝑣𝑣𝑐𝑐𝑣𝑣 𝑞𝑞𝑠𝑠𝑑𝑑 𝑑𝑑𝑠𝑠 𝑣𝑣𝑣𝑣𝑣𝑣𝑑𝑑𝑣𝑣𝑑𝑑𝑠𝑠 𝑑𝑑𝑑𝑑𝑠𝑠 𝑑𝑑𝑣𝑣𝑑𝑑𝑐𝑐𝑑𝑑𝑛𝑛𝑑𝑑𝑑𝑑𝑠𝑠 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑐𝑐 𝑐𝑐𝑑𝑑𝑛𝑛𝑑𝑑𝑠𝑠 𝑑𝑑𝑐𝑐 𝑣𝑣𝑑𝑑𝑣𝑣𝑣𝑣𝑣𝑣𝑑𝑑 𝑣𝑣𝑑𝑑 𝑣𝑣𝑣𝑣𝑣𝑣𝑑𝑑𝑣𝑣 𝑐𝑐𝑚𝑑𝑑𝑣𝑣𝑑𝑑. Cidade Nota média Desvio padrão Coef. Variação A 40 4 B 20 4 Calcule o coeficiente de variação de ambas as amostras e diga: qual amostra é mais homogênea? 𝐶𝐶𝐶𝐶(%) = 𝑠𝑠 �̅�𝑥 × 100 𝐶𝐶𝐶𝐶 % 𝐴𝐴 = 440 × 100 = 10% 𝐶𝐶𝐶𝐶 % 𝐵𝐵 = 420 × 100 = 20% re Exercícios propostos 4) A distribuição das idades de um grupo de alunos de uma determinada escola é dada na tabela abaixo: Qual é o coeficiente de variação? 𝑠𝑠2 = ∑𝑖𝑖=1𝑘𝑘 (𝑥𝑥𝑖𝑖 − 𝑥𝑥𝑝𝑝)2× 𝑐𝑐𝑖𝑖 𝑛𝑛 − 1 Idades (anos) fi 14 |— 16 10 16 |— 18 20 18 |— 20 25 20 |— 22 5 Total: 60 𝑥𝑥𝑝𝑝 = ∑𝑖𝑖=1𝑘𝑘 𝑥𝑥𝑖𝑖 × 𝑐𝑐𝑖𝑖𝑛𝑛 𝑥𝑥𝑖𝑖 = 𝑑𝑑𝑣𝑣𝑐𝑐inf(𝑖𝑖) + 𝑑𝑑𝑣𝑣𝑐𝑐sup(𝑖𝑖)2 𝑠𝑠 = 𝑠𝑠2 𝐶𝐶𝐶𝐶(%) = 𝑠𝑠𝑥𝑥𝑝𝑝 × 100 Para tabela de frequências, utilizamos a média ponderada com ponto médio de classe. A fórmula da variância sofre uma modificação, com a multiplicação pela frequência da classe. 𝒏𝒏: nº de elementos | 𝒌𝒌: nº de classes re Exercícios propostos 4) A distribuição das idades de um grupo de alunos de uma determinada escola é dada na tabela abaixo: Qual é o coeficiente de variação?Idades (anos) fi 14 |— 16 10 16 |— 18 20 18 |— 20 25 20 |— 22 5 Total: 60 𝑥𝑥𝑝𝑝 = ∑𝑖𝑖=1𝑘𝑘 𝑥𝑥𝑖𝑖 × 𝑐𝑐𝑖𝑖𝑛𝑛 𝑥𝑥𝑖𝑖 = 𝑑𝑑𝑣𝑣𝑐𝑐inf(𝑖𝑖) + 𝑑𝑑𝑣𝑣𝑐𝑐sup(𝑖𝑖)2 𝑥𝑥𝑝𝑝 = (15 × 10) + (17 × 20) + (19 × 25) + (21 × 5)60 = 17,83 anos re Exercícios propostos 4) A distribuição das idades de um grupo de alunos de uma determinada escola é dada na tabela abaixo: Qual é o coeficiente de variação?Idades (anos) fi 14 |— 16 10 16 |— 18 20 18 |— 20 25 20 |— 22 5 Total: 60 𝑠𝑠2 = (15− 17,83)2× 10 + (17− 17,83)2× 20 + (19− 17,83)2× 25 + (21− 17,83)2× 559 𝑥𝑥𝑝𝑝 = 17,83 anos𝑠𝑠2 = ∑𝑖𝑖=1𝑘𝑘 (𝑥𝑥𝑖𝑖 − 𝑥𝑥𝑝𝑝)2× 𝑐𝑐𝑖𝑖𝑛𝑛 − 1 𝑠𝑠2 = 3, 02 anos2 re Exercícios propostos4) A distribuição das idades de um grupo de alunos de uma determinada escola é dada na tabela abaixo: Qual é o coeficiente de variação?Idades (anos) fi 14 |— 16 10 16 |— 18 20 18 |— 20 25 20 |— 22 5 Total: 60 𝑥𝑥𝑝𝑝 = 17,83 anos 𝑠𝑠2 = 3, 02 𝑣𝑣𝑛𝑛𝑑𝑑𝑠𝑠2 𝑠𝑠 = 𝑠𝑠2 𝐶𝐶𝐶𝐶(%) = 𝑠𝑠𝑥𝑥𝑝𝑝 × 100 𝑠𝑠 = 3,02 = 1,74 𝐶𝐶𝐶𝐶(%) = 1,7417,83 × 100 = 9,76% re Exercícios propostos 5) A distribuição de preços, em reais, da calculadora HM 6667 em diversas lojas da cidade de São Paulo é dada na tabela: Qual é o coeficiente de variação? 𝑠𝑠2 = ∑𝑖𝑖=1𝑘𝑘 (𝑥𝑥𝑖𝑖 − 𝑥𝑥𝑝𝑝)2× 𝑐𝑐𝑖𝑖 𝑛𝑛 − 1 Preço (R$) fi 50 |— 54 1 54 |— 58 3 58 |— 62 11 62 |— 66 8 66 |— 70 4 𝑥𝑥𝑝𝑝 = ∑𝑖𝑖=1𝑘𝑘 𝑥𝑥𝑖𝑖 × 𝑐𝑐𝑖𝑖𝑛𝑛 𝑥𝑥𝑖𝑖 = 𝑑𝑑𝑣𝑣𝑐𝑐inf(𝑖𝑖) + 𝑑𝑑𝑣𝑣𝑐𝑐sup(𝑖𝑖)2 𝑠𝑠 = 𝑠𝑠2 𝐶𝐶𝐶𝐶(%) = 𝑠𝑠𝑥𝑥𝑝𝑝 × 100 Para tabela de frequências, utilizamos a média ponderada com ponto médio de classe. A fórmula da variância sofre uma modificação, com a multiplicação pela frequência da classe. 𝒏𝒏: nº de elementos | 𝒌𝒌: nº de classes re Exercícios propostos 5) A distribuição de preços, em reais, da calculadora HM 6667 em diversas lojas da cidade de São Paulo é dada na tabela: Qual é o coeficiente de variação?Preço (R$) fi 50 |— 54 1 54 |— 58 3 58 |— 62 11 62 |— 66 8 66 |— 70 4 𝑥𝑥𝑝𝑝 = ∑𝑖𝑖=1𝑘𝑘 𝑥𝑥𝑖𝑖 × 𝑐𝑐𝑖𝑖𝑛𝑛 𝑥𝑥𝑖𝑖 = 𝑑𝑑𝑣𝑣𝑐𝑐inf(𝑖𝑖) + 𝑑𝑑𝑣𝑣𝑐𝑐sup(𝑖𝑖)2 𝑥𝑥𝑝𝑝 = 52 × 1 + 56 × 3 + 60 × 11 + 64 × 8 + (68 × 4)27 = 𝑅𝑅𝑅 61,63 re Exercícios propostos 5) A distribuição de preços, em reais, da calculadora HM 6667 em diversas lojas da cidade de São Paulo é dada na tabela: Qual é o coeficiente de variação?Preço (R$) fi 50 |— 54 1 54 |— 58 3 58 |— 62 11 62 |— 66 8 66 |— 70 4 𝑠𝑠2 = (52 − 61,63)2× 1 + (56− 61,63)2× 3 + (60− 61,63)2× 11 + (64− 61,63)2× 8 + (68 − 61,63)2× 426 𝑥𝑥𝑝𝑝 = 𝑅𝑅𝑅 61,63𝑠𝑠2 = ∑𝑖𝑖=1𝑘𝑘 (𝑥𝑥𝑖𝑖 − 𝑥𝑥𝑝𝑝)2× 𝑐𝑐𝑖𝑖𝑛𝑛 − 1 𝑠𝑠2 = 16, 32 (R𝑅)2 re Exercícios propostos 5) A distribuição de preços, em reais, da calculadora HM 6667 em diversas lojas da cidade de São Paulo é dada na tabela: Qual é o coeficiente de variação?Preço (R$) fi 50 |— 54 1 54 |— 58 3 58 |— 62 11 62 |— 66 8 66 |— 70 4 𝑠𝑠 = 𝑠𝑠2 𝐶𝐶𝐶𝐶(%) = 𝑠𝑠𝑥𝑥𝑝𝑝 × 100 𝑠𝑠 = 16,32 = 𝑅𝑅𝑅 4,04 𝐶𝐶𝐶𝐶(%) = 4,0461,63 × 100 = 6,56% 𝑥𝑥𝑝𝑝 = 𝑅𝑅𝑅 61,63 𝑠𝑠2 = 16, 32 (R𝑅)2 Para refletir... Disponível em: <http://www.rebresearch.com/blog/wp-content/uploads/2013/11/paranormal-distribution.jpg> Estatística� Sumário Resumindo: Medidas de variação em amostragens Medidas de variação em amostragens - variância Medidas de variação em amostragens - variância Exercícios propostos Medidas de variação – desvio padrão Medidas de variação – desvio padrão Medidas de variação – coeficiente de variação Exercícios propostos Exercícios propostos Exercícios propostos Exercícios propostos Exercícios propostos Exercícios propostos Exercícios propostos Exercícios propostos Exercícios propostos Exercícios propostos Exercícios propostos Para refletir...