Baixe o app para aproveitar ainda mais
Prévia do material em texto
1/43 ESTATÍSTICA APLICADA Medidas de Dispersão ou Variabilidade Prof. Joseane de Menezes Sternadt 2/43 O que é dispersão? Imagine três equipes de alunos cujas notas numa mesma prova de estatística foram: Equipe A: 5; 5; 5; 5 Equipe B: 9; 9; 1; 1 Equipe C: 6; 6; 4; 4 5=X 3/43 3/43 Amplitude Total (At) A amplitude total é a diferença entre o maior e o menor valor da série ou da distribuição. Representa a dispersão máxima. Ela raramente é usada como única medida de variabilidade porque é calculada apenas com os valores extremos. 4/43 4/43 1º Caso – Dados brutos ou o rol É a diferença entre o valor máximo e mínimo observados. Exemplo 1 – Vamos calcular a amplitude total para as notas dos alunos das equipes A, B e C citadas na introdução. Equipe A: At = 5 – 5 = 0 Equipe B: At = 9 – 1 = 8 Equipe C: At = 6 – 4 = 2 5/43 5/43 Ordem Idade Ordem Idade Ordem Idade Ordem Idade Ordem Idade 1ª 18 11ª 27 21ª 37 31ª 40 36ª 45 2ª 21 12ª 27 22ª 37 32ª 42 37ª 45 3ª 23 13ª 28 23ª 37 33ª 42 38ª 46 4ª 23 14ª 28 24ª 37 34ª 42 39ª 48 5ª 23 15ª 29 25ª 37 35ª 43 40ª 49 6ª 24 16ª 32 26ª 38 7ª 25 17ª 32 27ª 38 8ª 25 18ª 33 28ª 39 9ª 26 19ª 35 29ª 39 10ª 26 20ª 36 30ª 40 At = 49 – 18 = 31 6/43 6/43 2º Caso – Distribuição de freqüência sem intervalos de classes A definição é a mesma, porém, o maior e o menor valor da série são observados na coluna do valor da variável Xi . 7/43 7/43 Exemplo 3 – Observe as distribuições a seguir e identifique os valor(es) da(s) amplitude(s) entre as 50 observações. Cervejas Xi fi 0 11 1 12 2 18 3 5 4 4 Total 50 At = 4 – 0 At = 4 cervejas 8/43 8/43 Notas Xi fi 6 6 7 10 8 15 9 10 10 9 Total 50 At = 10 – 6 At = 4 pontos 9/43 9/43 H. estudo Xi fi 6 10 7 10 8 10 9 10 10 10 Total 50 At = 10 – 6 At = 4 horas 10/43 10/43 Desvio-padrão e Variância Estas medidas levam em consideração a totalidade dos valores da variável, isto é, são medidas que fogem da influência dos extremos. A média dos desvios ao redor da média elevados ao quadrado é chamada de variância. O desvio-padrão é a raiz quadrada positiva da variância. 11/43 11/43 1º Caso – Dados brutos ou o rol Sabendo que variância é a média dos desvios ao redor da média elevados ao quadrado, podemos escrever para a população que: Onde µ é a média populacional e N é o tamanho da população estudada. N µ)(X σ 2 i2 ∑ − = 12/43 12/43 Quando a média µ não é exata e precisa ser arredondada, cada desvio fica afetado ligeiramente por esse arredondamento, que não deixa de ser um erro, por isso é mais aconselhável que se utilize a fórmula desenvolvida a seguir: ( ) ∑ = ∑ − N X2 i 2 2 iX N 1 σ 13/43 13/43 As equações que definem a variância da amostra, denotada por S2 são, então: Onde é a média amostral e n é o tamanho da amostra estudada. X 1n )X(X S 2 i2 − − = ∑ ( ) ∑ − = ∑ − n X2 i 2 2 iX 1n 1S 14/43 14/43 Para dados brutos recomendamos o uso das fórmulas: ( ) ∑ = ∑ − N X2 i 2 2 iX N 1 σ Para o cálculo da variância populacional: Para o cálculo da variância amostral: ( ) ∑ − = ∑ − n X2 i 2 2 iX 1n 1S 15/43 15/43 Como o desvio-padrão é raiz quadrada da variância, então: Variância 2σσ = 2SS = Desvio- padrão 16/43 16/43 Exemplo 4 - Vamos calcular o desvio-padrão das notas das três equipes. Para facilitar, vamos montar uma tabela com os dados e os cálculos necessários. Imagine três equipes de alunos cujas notas numa mesma prova de estatística foram: Equipe A: 5; 5; 5; 5 Equipe B: 9; 9; 1; 1 Equipe C: 6; 6; 4; 4 17/43 17/43 a) Equipe A: 5; 5; 5; 5 Cada equipe é uma população. N = 4 Qual fórmula usar? 18/43 18/43 Para dados brutos recomendamos o uso das fórmulas: ( ) ∑ = ∑ − N X2 i 2 2 iX N 1 σ Para o cálculo da variância populacional: Para o cálculo da variância amostral: ( ) ∑ − = ∑ − n X2 i 2 2 iX 1n 1S 19/43 19/43 a) Equipe A: 5; 5; 5; 5 ( ) ∑ = ∑ − N X2 i 2 2 iX N 1 σ Notas Xi 5 5.5=25 5 5.5=25 5 5.5=25 5 5.5=25 20 100 2 iX −= 4 20100 4 1 σ 2 2 20/43 20/43 −= 4 20100 4 1 σ 2 2 −= 4 400100 4 1 σ 2 [ ]100100 4 1 σ 2 −= [ ]04 1 σ 2 = 22 0pontosσ = Variância: 21/43 21/43 Como o desvio-padrão é raiz quadrada da variância, então: Variância2σσ =Desvio-padrão 0pontos0pontosσ 2 == 22/43 22/43 a) Equipe A: 5; 5; 5; 5 0pontos0pontosσ 2 == 5 Equipe A: 5 5 5 5 5555 Todos estão “em cima” da média – não há desvio! 23/43 23/43 b) Equipe B: 9; 9; 1; 1 Notas Xi 9 9.9=81 9 9.9=81 1 1.1=1 1 1.1=1 20 164 2 iX −= 4 20164 4 1 σ 2 2 ( ) ∑ = ∑ − N X2 i 2 2 iX N 1 σ 24/43 24/43 −= 4 20164 4 1 σ 2 2 −= 4 400164 4 1 σ 2 [ ]100164 4 1 σ 2 −= [ ]64 4 1 σ 2 = 22 16pontosσ = Variância: 25/43 25/43 Como o desvio-padrão é raiz quadrada da variância, então: Variância2σσ =Desvio-padrão pontos16pontosσ 2 4== 26/43 26/43 pontospontosσ 2 416 == 5 Equipe A: 9 9 1 1 9 9 1 1 Todos estão “4 pontos” da média. b) Equipe B: 9; 9; 1; 1 27/43 pontospontosσ 2 11 == 5 Equipe A: 6 6 4 4 6 6 4 4 Todos estão “1 ponto” da média. c) Equipe C: 6; 6; 4; 4 28/43 2º Caso – Distribuição de freqüência sem intervalos de classes Recomendamos o uso das fórmulas: ( ) ∑ = ∑ − N fX i 2 i 2 2 iifX N 1 σ ( ) ∑ − = ∑ − n fX i 2 i 2 2 iifX 1n 1S Para o cálculo da variância populacional: Para o cálculo da variância amostral: 29/43 29/43 Exemplo 5 - Na aula 3, elaboramos a distribuição de freqüências do número de filhos dos funcionários do Antenado. Agora, vamos calcular a variância e o desvio-padrão lembrando que a população foi investigada. ( ) ∑ = ∑ − N fX i 2 i 2 2 iifX N 1 σ 30/43 30/43 Xi fi Xifi 0 11 1 8 2 12 3 5 4 4 Total 40 63 ( ) ∑ = ∑ − N fX i 2 i 2 2 iifX N 1 σ 31/43 31/43 ( )[ ]∑ −= 4063i2i2 2fX1σ 40 Xi fi Xifi 0 11 0.11= 0 1 8 1.8 = 8 2 12 2.12 = 24 3 5 3.5 = 15 4 4 4.4 = 16 Total 40 63 ( ) ∑ = ∑ − N fX i 2 i 2 2 iifX N 1 σ 32/43 32/43 Xi fi Xifi 0 11 0.11= 0 1 8 1.8 = 8 2 12 2.12 = 24 3 5 3.5 = 15 4 4 4.4 = 16 Total 40 63 ( ) ∑ = ∑ − N fX i 2 i 2 2 iifX N 1 σ iiii 2 i fXXfX = 33/43 33/43 ( )[ ]∑ −= 4063i2i2 2fX401σ Xi fi Xifi 0 11 0.11= 0 0.0=0 ou 0.0.11=0 1 8 1.8 = 8 8.1=8 ou 1.1.8 =8 2 12 2.12 = 24 24.2=48 ou 2.2.12=48 3 5 3.5 = 15 3.15=45 ou 3.3.5= 45 4 4 4.4 = 16 4.16= ou 4.4.4 =64 Total 40 63 165 iiii 2 i fXXfX = 34/43 34/43 ( )[ ]∑ −= 4063i2i2 2fX401σ −= 4063165401σ 2 2 −= 40 3969165 40 1 σ 2 [ ]99,225165 40 1 σ 2 −= [ ]65,775 40 1 σ 2 = 22 lhos1,644375fiσ = 35/4335/43 Como o desvio-padrão é raiz quadrada da variância, então: Variância2σσ =Desvio-padrão lhos1,282332filhos1,644375fiσ 2 == 36/43 36/43 Observação – Supondo que a pesquisa na empresa do Antenado tivesse abrangido apenas uma amostra de 40 funcionários e não a população. Usaríamos, então, n -1 e os cálculos seriam: 22 lhos1,686538fiS = −= 40 63165 39 1S 2 2 ( ) ∑ − = ∑ − n fX i 2 i 2 2 iifX 1n 1S 37/43 37/43 Teorema de Chebyshev para distribuições em forma de sino µµµµ+σσσσµµµµ-σσσσ µµµµ área = 68% µµµµ+2σσσσµµµµ-2σσσσ µµµµ área = 95% µµµµ+3σσσσµµµµ-3σσσσ µµµµ área = 99% 38/43 38/43 Coeficiente de variação (CV) O coeficiente de variação é uma medida de dispersão relativa que indica qual o tamanho do desvio-padrão em relação à média. média padrãodesvioCV −= .100% média padrãodesvioCV −= 39/43 39/43 Exemplo 7 – (QUESTÃO 38, PROVÃO DE ADMINISTRAÇÃO DE 1997) ... O risco de um ativo individual, uma ação, por exemplo, pode ser devidamente avaliado através da variabilidade dos retornos esperados. Portanto, a comparação das distribuições probabilísticas dos retornos, relativas a cada ativo individual, possibilita a quem toma decisões perceber os diferentes graus de risco. Analise, a seguir, os dados estatísticos relativos aos retornos de 5 ativos. 40/43 40/43 Dados sobe os retornos Ativo A Ativo B Ativo C Ativo D Ativo E Valor esperado 15,0% 12,0% 5,0% 10,0% 4,0% Desvio- padrão 6,0% 6,6% 2,5% 3,0% 2,6% Coeficiente de variação 0,40 0,55 0,50 0,30 0,65 Era pedido qual o ativo MENOS arriscado. 41/43 41/43
Compartilhar