Baixe o app para aproveitar ainda mais
Prévia do material em texto
Ponto dos Concursos www.pontodosconcursos.com.br Atenção. O conteúdo deste curso é de uso exclusivo do aluno matriculado, cujo nome e CPF constam do texto apresentado, sendo vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição. É vedado, também, o fornecimento de informações cadastrais inexatas ou incompletas – nome, endereço, CPF, e-mail - no ato da matrícula. O descumprimento dessas vedações implicará o imediato cancelamento da matrícula, sem prévio aviso e sem devolução de valores pagos - sem prejuízo da responsabilização civil e criminal do infrator. Em razão da presença da marca d’ água, identificadora do nome e CPF do aluno matriculado, em todas as páginas deste material, recomenda-se a sua impressão no modo econômico da impressora. CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 1 PROFESSOR: VÍTOR MENEZES AULA 04 X MEDIDAS DE DISPERSÃO ....................................................................................................................... 2 1 Amplitude (A) .............................................................................................................................................. 2 2 Desvio em relação à média aritmética ........................................................................................................ 3 3 Desvio médio (DM) ..................................................................................................................................... 5 4 Variância..................................................................................................................................................... 8 5 Desvio padrão ........................................................................................................................................... 11 6 Propriedades das medidas de dispersão ................................................................................................... 11 7 Coeficiente de variação (CV) .................................................................................................................... 12 8 Medidas de dispersão para dados em classes. .......................................................................................... 13 9 Outra forma de cálculo da variância ........................................................................................................ 41 ANEXO ................................................................................................................................................................ 60 LISTA DAS QUESTÕES DE CONCURSOS................................................................................................... 67 GABARITO DAS QUESTÕES DE CONCURSOS ......................................................................................... 76 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 2 PROFESSOR: VÍTOR MENEZES X MEDIDAS DE DISPERSÃO Considere três empresas (A, B e C). Em cada uma destas três empresas, entrevistamos cinco funcionários, perguntando o salário de cada um deles. O resultado está abaixo (valores em R$ 1.000,00): Empresa A: 3, 3, 3, 3, 3 Empresa B: 1, 3, 3, 3, 5 Empresa C: 1, 2, 3, 4, 5 Na empresa A todos os cinco funcionários entrevistados ganham R$ 3.000,00. Na empresa B temos uma pessoa que ganha R$ 1.000,00, três que ganham R$ 3.000,00 e uma que ganha R$ 5.000,00. E na empresa C cada funcionário ganha um salário diferente. Note que o salário médio nas três empresas é o mesmo. A média é de R$ 3.000,00, tanto na empresa A, quanto nas empresas B e C. O que significa dizer que a média nas três empresas é a mesma. Significa que os salários, em cada uma delas, giram em torno de R$ 3.000,00. Sabemos que na empresa ‘A’ a média descreve muitíssimo bem o conjunto de dados. Por quê? Porque todos os funcionários ganham exatamente o salário médio. Todos eles ganham R$ 3.000,00. Já na empresa ‘C’ a média não descreve o conjunto de dados tão bem quanto o faz na empresa ‘A’. Na empresa ‘C’ apenas uma pessoa ganha o salário médio. Analisando apenas a média não conseguimos diferenciar as três empresas. Contudo, tendo acesso a todos os valores da pesquisa, temos condições de afirmar que os salários em cada uma delas são diferentes. O que estou querendo dizer é que a média, isoladamente, não é suficiente para descrever adequadamente um conjunto de dados. E o intuito da estatística descritiva é justamente descrever um conjunto de dados. Na empresa A, os dados não estão nada dispersos. Eles estão bem concentrados. Todos eles são iguais à média aritmética. Na empresa C, já há certa dispersão. O salário médio também é de R$ 3.000,00. Só que nesta terceira empresa os dados estão mais dispersos, assumem valores diferentes. Para melhor descrever nossos dados (lembrem-se: estamos estudando estatística descritiva, que visa descrever um conjunto de dados), vamos utilizar as medidas de dispersão. Sua finalidade é indicar o quanto os dados estão dispersos. 1 Amplitude (A) A primeira medida de dispersão é a amplitude. Nós até já vimos o conceito de amplitude anteriormente. Quando estudamos dados em classes, vimos que a diferença entre o limite superior e o limite inferior é igual à amplitude de classe. A idéia de amplitude é essa mesmo. É a diferença entre o maior e o menor valor. Dentro de uma classe, o maior valor é o limite superior e o menor valor é o limite inferior. Vamos calcular a amplitude para cada uma das três empresas do nosso exemplo. Na empresa A, todos os valores são iguais a 3. A amplitude fica: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 3 PROFESSOR: VÍTOR MENEZES Empresa A: A = 3 − 3 = 0 Na empresa B, o maior valor é 5. O menor valor é 1. A amplitude fica: Empresa B: A = 5 − 1 = 4 Na empresa C, o maior valor é 5. O menor valor é 1. A amplitude fica: Empresa C: 5 − 1 = 4 A amplitude é uma medida de dispersão. Quanto maior a amplitude, mais dispersos estão os dados. A amplitude foi capaz de me indicar que, na empresa A, os salários estão bem concentrados. Foi capaz de demonstrar também que, nas empresas B e C, os salários são mais dispersos que na empresa A. Contudo, levando em conta apenas a amplitude, não conseguimos descobrir, dentre as empresas B e C, qual tem os dados mais dispersos. Ou seja, a amplitude não foi capaz de diferenciar a dispersão dos dados nas empresas B e C. Dizemos que a amplitude é uma medida de dispersão “pobre”. Seu cálculo leva em conta apenas dois valores. Apenas o maior valor e o menor valor. Lembrete de amplitude: Amplitude é igual ao maior valor menos o menor valor. É uma medida de dispersão “pobre” por levar em conta apenas dois valores 2 Desvio em relação à média aritmética O desvio em relação à média aritmética não é uma medida de dispersão. É apenas uma ferramenta que nós usaremos daqui em diante. A exceção da amplitude, todas as outras medidas de dispersão que nós estudaremos levam em conta o desvio em relação à média aritmética. Mas o que é desvio em relação à média aritmética? Desvio em relação à média aritméticaé a diferença entre o valor considerado e a média aritmética da seqüência numérica analisada. Tomemos a empresa C. Os salários dos funcionários desta empresa são: Empresa C: 1, 2, 3, 4, 5 Vamos calcular os desvios destes valores em relação à média. A média aritmética dessa seqüência de valores é 3. O primeiro valor é 1 ( X 1 = 1). O desvio deste primeiro valor, em relação à 3 (=média aritmética) é: e1 = X 1 − X e1 = 1 − 3 = 2− Utilizamos a letra ‘e’ para indicar o desvio. É que é muito comum, em vez de falarmos em “desvios em relação à média”, utilizarmos a expressão “erros em relação à média”. Aí, a letra “e” lembraria a inicial de “erro”. Mas o significado é o mesmo. Como já estou www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 4 PROFESSOR: VÍTOR MENEZES utilizando a letra “d” (inicial de desvio) para indicar a variável transformada que facilita o cálculo da média para dados em classes (lembram? assunto da aula 2), optei pelo símbolo “e”. Então o primeiro desvio é -2. Para obtê-lo, tomamos o primeiro valor (1), tomamos a média dos dados (3), e fazemos a diferença entre eles. O segundo desvio ficaria assim: e2 = X 2 − X e2 = 2 − 3 = 1− Tomamos o segundo valor (2). Tomamos a média aritmética (3). E fazemos a diferença entre eles. A tabela abaixo contém todos os desvios para a empresa C. Desvios para os salários na empresa C Valor observado (X) Desvio em relação à média (e) Freqüência simples (f) 1 -2 1 2 -1 1 3 0 1 4 1 1 5 2 1 Com esse conceito de desvio em relação à média aritmética, uma idéia geralmente vem à cabeça. E se calcularmos a média desses desvios? Se a média dos desvios em relação à média aritmética for alta, então os dados são muito dispersos. Se a média dos desvios for baixa, os dados estão pouco dispersos. Com esta idéia, podemos calcular a média dos desvios dos salários na empresa C. Desvio em relação à média (e) Freqüência simples (f) e × f -2 1 -2 -1 1 -1 0 1 0 1 1 1 2 1 2 Totais 5 0 A média dos desvios fica: e = 0 = 0 5 Por que a média é zero? A média deu zero porque a soma dos desvios é zero (total da coluna e × f ). Lá em propriedades da média (assunto da aula 01) eu disse que a soma de todos os desvios em relação à média aritmética é igual a zero. Na hora eu não expliquei. Apenas deixei a informação. Pois bem, chegou a hora de olhar esta propriedade com mais calma. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 5 PROFESSOR: VÍTOR MENEZES Nós vimos que, para a empresa C, a soma de todos os desvios foi zero. Só que isso não acontece só para os salários dos funcionários da empresa C. Para qualquer seqüência numérica que você montar, a soma dos desvios em relação à média aritmética será zero. É uma propriedade da média. Por mais que os dados estejam dispersos, a média dos desvios será sempre nula. Isto porque, havendo dispersão, teremos valores menores que a média (desvios negativos) e teremos valores maiores que a média (desvios positivos). Os valores positivos cancelam os negativos e a soma dá sempre zero. Portanto, a média dos desvios não pode ser utilizada para comparar a dispersão de duas seqüências numéricas. 3 Desvio médio (DM) A idéia do desvio médio é muito parecida com a que trouxemos acima. Calcular os desvios em relação à média aritmética. Só que utilizamos uma ferramenta para evitarmos o problema de termos números negativos e positivos, de tal modo que os desvios negativos cancelem os desvios positivos e a soma dê zero. Esta ferramenta é o módulo. O módulo tem a propriedade de transformar um número negativo em positivo. Vamos a alguns exemplos. Qual o módulo de -2? O número -2 é negativo. O módulo transforma números negativos em positivos. − 2 = 2 Representamos o módulo por duas barras verticais. Assim, o módulo de -2 é 2. Seguindo o mesmo raciocínio, o módulo de -25 é 25. − 25 = 25 Quando o número for positivo, o módulo não faz nada. Deixa o número como está. Logo, o módulo de 8 é o próprio 8. 8 = 8 Pois bem, e se em vez de trabalharmos com os desvios utilizarmos seus respectivos módulos? Aí acabamos com o problema de termos números negativos. Não tendo mais números negativos, não há cancelamento de números negativos com positivos e a soma não dá zero. Vamos ver como ficaria. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 6 PROFESSOR: VÍTOR MENEZES Desvios para os salários na empresa C Valor observado (X) Desvio em relação à média (e) Módulo do desvio (|e|) 1 -2 2 2 -1 1 3 0 0 4 1 1 5 2 2 Pronto. Na coluna de módulos dos desvios não temos nenhum número negativo. Se fizermos a média desses valores, ficamos com: Módulo do desvio em relação à média (|e|) Freqüência simples (f) e × f 2 1 2 1 1 1 0 1 0 1 1 1 2 1 2 Totais 5 6 A média dos módulos dos desvios fica: DM = 6 = ,1 2 5 Este é o valor do Desvio Médio. Conclusão: Desvio médio é a média dos módulos dos desvios (desvios calculados em relação à média aritmética). Se fôssemos escrever a fórmula que representa os cálculos feitos na tabela acima, poderíamos dizer que o desvio médio é dado por: n ∑ X i − X DM = i =1 n Ou seja: · Calculamos cada desvio em relação à média aritmética ( X i − X ) · Tiramos o módulo de cada desvio ( X i − X ) · Somamos todos os desvios ( ∑ X i − X ) · Dividimos pelo número de dados, obtendo: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 7 PROFESSOR: VÍTOR MENEZES n ∑ X i − X DM = i =1 n Para treinar um pouco, vamos calcular o desvio médio para os salários dos funcionários da empresa B. Desvios para os salários na empresa B Valor observado (X) Desvio em relação à média (e) Módulo do desvio (|e|) 1 -2 2 30 0 5 2 2 Módulo do desvio em relação à média (|e|) Freqüência simples (f) e × f 2 1 2 0 3 0 2 1 2 Totais 5 4 E o desvio médio da empresa B fica: DM = 4 = 0 8, 5 Note que o desvio médio foi capaz de me dizer que os salários da empresa C são mais dispersos que os salários da empresa B. O desvio médio em C (=1,2) foi maior que em B (=0,8). Portanto, em C os dados são mais dispersos. O desvio médio já é uma medida de dispersão mais “rica” que a amplitude. O desvio médio leva em conta todos os dados, não apenas o maior e o menor. Lembrete de desvio médio Calculamos cada desvio em relação à média aritmética ( X i − X ) Tiramos o módulo de cada desvio ( X i − X ) Somamos todos os módulos dos desvios ( ∑ X i − X ) Dividimos pelo número de dados, obtendo: n ∑ X i − X DM = i =1 n www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 8 PROFESSOR: VÍTOR MENEZES 4 Variância A idéia da variância é bem parecida com a idéia do desvio médio. Continuamos desejando eliminar os números negativos. No desvio médio isto foi feito aplicando o módulo. Só que muitas vezes é difícil trabalhar com a função módulo. Ela apresenta algumas características “indesejadas”. Uma outra forma mais utilizada é, em vez de aplicar o módulo, elevar ao quadrado. Quando elevamos um número negativo ao quadrado, ele vira positivo. Assim, eliminamos os números negativos e acabamos com o problema de a soma dos desvios dar zero. Vamos ver como fica para a empresa C Desvios para os salários na empresa C Valor observado (X) Desvio em relação à média (e) Desvio ao quadrado (e2) 1 -2 4 2 -1 1 3 0 0 4 1 1 5 2 4 Pronto: na coluna de desvios ao quadrado só temos valores não negativos. Podemos fazer a média desses valores que ela não será igual a zero. Desvio ao quadrado (e2) Freqüência simples (f) e × f 4 1 4 1 1 1 0 1 0 1 1 1 4 1 4 Totais 5 10 O símbolo de variância é: σ2. A variância dos salários na empresa C fica: σ 2 = 10 = 2 5 A variância tem unidade igual ao quadrado da unidade dos dados. Como os dados estão expressos em R$ 1.000,00, a variância acima está expressa em (1.000.000 R$2) – um milhão de reais ao quadrado. Se fôssemos escrever uma fórmula para a variância, representando todos os cálculos feitos nas tabelas acima, ficaríamos com: n 2 ∑ ( )X i − X σ 2 = i =1 n www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 9 PROFESSOR: VÍTOR MENEZES Um comentário importante. Em concurso, é comum se fazer referência à variância populacional e à variância amostral. Na variância populacional, consideramos que nós tivemos acesso a todos os dados. Levamos em conta toda a população, todo o universo de dados. Quando for assim, o procedimento é exatamente aquele visto acima e a fórmula da variância é: n 2 ∑ ( )X i − X σ 2 = i =1 n Quando aplicamos esta fórmula, é como se estivéssemos considerando que na empresa C há apenas 5 funcionários. Como nós conseguimos entrevistar todos eles, levamos em conta toda a população. Calculamos a variância populacional. Contudo, há casos em que nós não temos acesso a todos os dados. Se a empresa C tiver mais funcionários e nós só tivermos entrevistado cinco deles, então nós trabalhamos na verdade com uma amostra. Quando temos uma amostra, a fórmula da variância fica um pouco diferente. O símbolo de variância passa a ser: s2. E a fórmula fica: n 2 ∑ ( )X i − X s 2 = i 1= n − 1 A única coisa que muda é o denominador. Em vez de “n”, fica “n-1”. Vamos supor que na empresa C tinha mais pessoas e aquelas 5 eram apenas uma amostra. Neste caso, a variância ficaria assim: s 2 = 10 = 10 = 2 5, 5 − 1 4 Quando o número de dados for grande (ou seja, quando “n” for grande), praticamente não há diferença entre as duas fórmulas. Por que subtrair 1 no denominador? Quando entrarmos em estatística inferencial, a gente faz mais alguns comentários. Por hora apenas gravem: Em concursos: Variância amostral → utilizar “n-1” no denominador Variância populacional → utilizar “n” no denominador Um último comentário sobre os desvios. No numerador da fórmula da variância temos a soma de todos os quadrados dos desvios. Desvios estes calculados em relação à média aritmética. Para a empresa C a soma dos quadrados dos desvios foi 10. Vamos fazer um teste. Vamos calcular os quadrados dos desvios novamente. Só que, agora, em vez de considerar desvios em relação à média aritmética, vamos fazer os desvios em relação a um outro valor qualquer. A título de exemplo, vamos fazer desvios em relação a X 1 . www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 10 PROFESSOR: VÍTOR MENEZES Para não confundir, esses “desvios modificados” eu vou chamar de e' . O primeiro desvio em relação à e'1 = X 1 − X 1 = 0 X 1 é: Tomamos o primeiro valor ( X 1 ). Tomamos X 1 . Subtraímos um do outro. O segundo desvio em relação à X 1 é: e 1' = X 2 − X 1 e'1 = 2 − 1 = 1 Tomamos o segundo valor (2). Tomamos X 1 (1). Subtraímos um do outro. A tabela abaixo contém todos os desvios em relação à X 1 , para a empresa C: Desvios para os salários na empresa C Valor observado (X) Desvio em relação à X 1 (e') Desvio ao quadrado (e'2 ) 1 0 0 2 1 1 3 2 4 4 3 9 5 4 16 Total 30 Note que a soma dos quadrados dos desvios foi de 30. Quando os desvios foram calculados em relação à média aritmética, a soma dos quadrados dos desvios foi 10. Quando os desvios foram calculados em relação a um outro valor, a soma dos quadrados dos desvios foi maior que 10. Daí vem a últimapropriedade da média (matéria lá da primeira aula) que tinha ficado sem explicação. Eu disse que a média aritmética é o valor em relação ao qual é mínima a soma dos quadrados dos desvios. Só que a informação ficou apenas registrada e eu não fiz nenhum comentário. Esta soma dos quadrados dos desvios será mínima quando os desvios forem em relação à média aritmética. Se outro valor for utilizado como referência para cálculo dos desvios, a soma ficará maior. Mas isto tudo foi só para entendermos melhor esta propriedade da média. No cálculo de variância: sempre utilize desvios em relação à média aritmética. Lembrete de variância n 2 ∑ ( )X i − X σ 2 = i =1 (para uma população) n www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 11 PROFESSOR: VÍTOR MENEZES n 2 ∑ ( )X i − X s 2 = i 1= (para uma amostra) n − 1 5 Desvio padrão O desvio padrão nada mais é que a raiz quadrada da variância. Se trabalharmos com uma população, seu símbolo é σ. Se trabalharmos com uma amostra, seu símbolo é s. Na empresa C, o desvio padrão populacional é: =σ 2 Caso os cinco valores de salários desta empresa sejam uma amostra, o desvio padrão amostral fica: =s 2 5, Lembram que a variância tinha unidade igual ao quadrado da unidade dos dados? Como o desvio padrão é igual à raiz quadrada da variância, então o desvio padrão tem a mesma unidade dos dados. Como os dados estão em R$ 1.000,00, o desvio padrão está também expresso em R$ 1.000,00. 6 Propriedades das medidas de dispersão Vamos considerar mais duas empresas (D e E). Os salários nestas duas empresas estão abaixo (valores em R$ 1.000,00): Empresa D: 6, 7, 8, 9, 10. Empresa E: 2, 4, 6, 8, 10. Para a empresa D, os valores de amplitude, desvio médio, desvio padrão e variância são: A = 4 DM = ,1 2 =σ 2 σ 2 = 2 São exatamente os mesmos valores obtidos para a empresa C. Interessante notar que cada valor da empresa D é igual a um valor da empresa C somado com 5. Relembrando, na empresa C os valores eram: 1, 2, 3, 4, 5. Na empresa D, temos: 6 (=1+5), 7 (=2+5), 8 (=3+5), 9(=4+5), 10 (=5+5). www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 12 PROFESSOR: VÍTOR MENEZES Conclusão: se em cada valor da seqüência de dados nós somarmos ou subtraímos uma constante, as medidas de dispersão não se alteram. Ou ainda: somas e subtrações não interferem na dispersão. Para a empresa E, os valores de amplitude, desvio médio, desvio padrão e variância são: A = 8 DM = ,2 4 σ = 2 2 σ 2 = 8 Interessante notar que cada valor na empresa E é igual a um valor da empresa C multiplicado por 2. Na empresa E, temos: 2 (= 2 ×1 ),4 ( = 2 × 2 ),6 (= 2 × 3 ), 8 (= 2 × 4 ), 10 (= 2 × 5 ) Conclusão: se multiplicarmos ou dividirmos cada valor da seqüência de dados por uma constante, a amplitude, o desvio padrão e o desvio médio sofrem a mesma variação. No exemplo acima, dobramos cada valor. A amplitude, o desvio padrão e o desvio médio também foram dobrados. Para a variância é um pouquinho diferente. A variância sofre quase a mesma alteração, só que ao quadrado. Como dobramos cada valor da seqüência de dados, a variância foi quadruplicada. Para a variância fica: se multiplicarmos ou dividirmos cada valor da seqüência de dados por uma constante “c”, a variância fica multiplicada ou dividida por “c2”. Lembrete de propriedades das medidas de dispersão. Somas e subtrações não interferem nas medidas de dispersão. Se multiplicarmos ou dividirmos cada valor da seqüência de dados por uma constante, a amplitude, o desvio padrão e o desvio médio sofrem a mesma alteração. A variância sofre a alteração ao quadrado. 7 Coeficiente de variação (CV) A última medida de dispersão que veremos é o coeficiente de variação. O coeficiente de variação é igual ao desvio padrão dividido pela média. No caso da empresa C, visto acima, temos: X = 3 =σ 2 E o coeficiente de variação fica: CV = 2 3 O coeficiente de variação é adimensional. Não tem unidade de medida. Isto porque tanto o numerador quanto o denominador têm a mesma unidade, que acabam se cancelando. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 13 PROFESSOR: VÍTOR MENEZES 8 Medidas de dispersão para dados em classes. Se os dados estiverem em classes, não temos acesso a todos os valores observados. Para calcular as medidas de dispersão, precisamos fazer algumas considerações. No caso da amplitude, não há maiores problemas. Tomamos o maior limite superior. Tomamos o menor limite inferior. E subtraímos um do outro. Nós até já fizemos isto na aula passada. Foi quando estudamos o histograma (ver EC 28 da aula 3). Na alternativa ‘e’ daquele exercício, calculamos a amplitude para dados em classes. Relembrando. Tínhamos a seguinte tabela: Classe Freqüência absoluta simples 0,5 ≤ x < 1,0 100 1,0 ≤ x < 1,5 100 1,5 ≤ x < 2,0 200 2,0 ≤ x < 2,5 400 2,5 ≤ x < 3 300 3 ≤ x < 3,5 300 3,5 ≤ x < 4 200 Total 1600 O maior limite superior é 4. O menor limite inferior é 0,5. Fazendo a subtração temos: A = 4 − 0 5, = 3 5, Como os dados estavam em R$ 1.000,00, a amplitude é igual a R$ 3.500,00. Para as demais medidas de dispersão (variância, desvio padrão, desvio médio e coeficiente de variação), a consideração que se faz é a mesma do cálculo da média para dados em classes. Consideramos que todos os valores de freqüência se referem ao ponto médio de cada classe. Na seqüência, trago alguns exercícios propostos para vermos como fica. MEDIDAS DE DISPERSÃO – EXERCÍCIOS PROPOSTOS EP 1 Considere a seguinte seqüência de dados: 1, 4, 5, 5, 10. Calcule: a) a amplitude b) o desvio médio c) a variância d) o desvio padrão e) o coeficiente de variação www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 14 PROFESSOR: VÍTOR MENEZES EP 2 Considere a seguinte seqüência de dados: 3, 9, 11, 11, 21. Calcule: a) a amplitude b) o desvio médio c) a variância d) o desvio padrão e) o coeficiente de variação. EP 3 Considere a seguinte tabela, referente às idades das crianças de uma turma (não existem observações coincidentes com os extremos das classes): Idades Freqüência absoluta simples 6 – 8 25 8 – 10 50 10 – 12 25 Calcule: a) a amplitude b) o desvio médio c) a variância d) o desvio padrão e) o coeficiente de variação. RESOLUÇÃO DO EP 1 Letra A A amplitude é dada pela diferença entre o maior e o menor valor. A = 10 −1 = 9 Letra B Antes de calcular o desvio médio, vamos calcular a média. X = 1 + 4 + 5 + 5 + 10 = 5 5 Agora podemos calcular os desvios: X e = X − 5 e f e × f 1 -4 4 1 4 4 -1 1 1 1 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 15 PROFESSOR: VÍTOR MENEZES 5 0 0 2 0 10 5 5 1 5 TOTAL 5 10 O desvio médio fica: DM = 10 = 2 5 Letra C. X e = X − 5 e 2f e 2 × f E a variância fica: σ 2 = 42 = ,8 4 5 1 -4 16 1 16 4 -1 1 1 1 5 0 0 2 0 10 5 25 1 25 TOTAL 5 42 Letra D O desvio padrão é igual à raiz quadrada da variância. =σ ,8 4 Letra E CV = σ X = ,8 4 5 RESOLUÇÃO DO EP 2 Vamos chamar esta seqüência de dados de Y. ROL (Y): 3, 9, 11, 11, 21. Vamos chamar a seqüência de dados do exercício anterior de X. ROL (X): 1, 4, 5, 5, 10. Repare que cada valor de Y pode ser calculado a partir do correspondente valor de X da seguinte maneira. Y = 2 × X + 1 A título de exemplo, tomemos o primeiro valor de Y. Y1 = 3 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 16 PROFESSOR: VÍTOR MENEZES Tomemos o primeiro valor de X. X 1 = 1 Note que 1Y = X 1 × 2 + 1 O mesmo se aplica aos demais valores de Y e X. Deste modo, podemos usar os resultados do exercício anterior para responder a este exercício. Temos que: Y = 2 × X + 1 Sabemos que somas e subtrações não interferem nas medidas de dispersão. Já a multiplicação sim. Quando multiplicamos os dados por uma constante, a amplitude também é multiplicada pela mesma constante. Assim, podemos achar a amplitude de Y ( YA ) a partir da amplitude de X ( AX ): =Y 2 × X + 1 =Y 2 × X + 1 Não interfere na amplitude YA = 2 × A X A amplitude de Y é o dobro da amplitude de X. AY = 2 × 9 = 18 Letra B. Sabemos que: Y = 2 × X + 1 Portanto, podemos usar o desvio médio de X ( DM X ) para calcular o desvio médio de Y ( DM Y ). =Y 2 × X + 1 =Y 2 × X + 1 Não interfere no desvio médio DM Y = 2 × DM X O desvio médio de Y é o dobro do desvio médio de X. DM Y = 2 × 2 = 4 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 17 PROFESSOR: VÍTOR MENEZES Letra C. Sabemos que: Y = 2 × X + 1 Portanto, podemos usar a variância de X ( 2 2 σ X ) para calcular a variância de Y (σ Y ). Para tanto, sabemos que somas e subtrações não interferem na variância. Já a multiplicação sim. Quando multiplicamos os dados por uma constante, a variância é multiplicada pelo quadrado desta constante. =Y 2 × X + 1 =Y 2 × X + 1 Não interfere na variância 2 2 2 2 σ× X Yσ = A variância de Y é quatro vezes a variância de X. 2 = 4 × ,8 4 = 33 6,σ Y Letra D. O desvio padrão é igual à raiz quadrada da variância. Yσ = ,33 6 Note que, pelas propriedades do desvio padrão, o desvio padrão de Y é igual ao dobro do desvio padrão de X. Letra E. O coeficiente de variação é igual ao desvio padrão dividio pela média. A média de Y fica: Y = 2 × X + 1 Y = 2 × X + 1 = 11 Portanto: = 33 6, YCV 11 RESOLUÇÃO DO EP 3. Letra A. Para calcular a amplitude, precisamos pegar o maior valor de idade, o menor valor, e subtrair um do outro. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 18 PROFESSOR: VÍTOR MENEZES Só que não temos acesso a todos os valores. Por exemplo, não sabemos qual a idade de cada uma das 25 crianças da primeira classe. Só sabemos que elas têm idades entre 6 e 8 anos. O mesmo ocorre para as demais classes. Nestes casos, para calcular a amplitude fazemos o seguinte: · Tomamos o maior limite superior (=12) · Tomamos o menor limite inferior (=6) · Subtraímos um do outro. Esta é a amplitude. A = 12 − 6 = 6 Letra B Para calcular o desvio médio, precisamos pegar cada valor observado, encontrar o desvio em relação à média aritmética. Feito isto, tiramos os módulos dos desvios. Por fim, o desvio médio é igual à média dos módulos dos desvios. Só que não sabemos quais os valores observados. Só sabemos as freqüências das classes. Assim, não temos nem como calcular a média aritmética nem os desvios. Por conseqüência, não temos como calcular o desvio médio. O que faremos? Vamos ‘chutar’. Vamos supor que todas as observações correspondem ao ponto médio das classes. É exatamente a mesma consideração que fizemos para calcular a média aritmética para dados em classes (matéria da aula 2). Com esta idéia, primeiro calculemos a média aritmética. Idades Pontos médios das classes ( X ) Freqüência absoluta Simples ( f ) X × f 6 – 8 7 25 175 8 – 10 9 50 450 10 – 12 11 25 275 TOTAL 100 900 X = 900 = 9 100 Na verdade, nem precisava dessas contas. O conjunto acima é simétrico. A média, portanto, é igual ao ponto médio da classe central. Tendo a média aritmética, vamos considerar que todas as observações ocorrem justamente nos pontos médios das classes. Assim, vamos calcular os desvios em relação a X . Pontos médios das classes ( X ) Desvios em relação à média aritmética ( e ) Memória de cálculo 7 -2 =7-9 9 0 =9-9 11 2 =11-9 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 19 PROFESSOR: VÍTOR MENEZES Agora basta encontrar os módulos dos desvios e fazer a média destes valores. Ptos médios das classes ( X ) Desvios em relação à média aritmética ( e ) Módulo dos Desvios e Freqüência absoluta Simples ( f ) e × f 7 -2 2 25 50 9 0 0 50 0 11 2 2 25 50 TOTAL 100 100 DM = 100 = 1 100 O desvio médio é igual a 1. Letra C. Para o cálculo da variância, também consideramos que as observações correspondem ao ponto médio de cada classe. A variância nada mais é que a média dos quadrados dos desvios. Ptos médios das classes ( X ) Desvios em relação à média aritmética ( e ) Desvios ao quadrado e 2 Freqüência absoluta Simples ( f ) e 2 × f 7 -2 4 25 100 9 0 0 50 0 11 2 4 25 100 TOTAL 100 200 σ 2 = 200 = 2 100 Letra D O desvio padrão é igual à raiz quadrada da variância. =σ 2 Letra E. O coeficiente de variação é igual ao desvio padrão dividido pela média. CV = σ X = 2 9 EXERCÍCIOS DE CONCURSOS – MEDIDAS DE DISPERSÃO www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 20 PROFESSOR: VÍTOR MENEZES EC 1 Analista IRB 2006 [ESAF] O grau ao qual os dados numéricos tendem a dispersar-se em torno de um valor médio chama-se a) média. b) variação ou dispersão dos dados. c) mediana. d) correlação ou dispersão. e) moda. Resposta: B As medidas de dispersão que têm esta finalidade: ver o quanto os dados estão dispersos em torno de um valor médio. EC 2 Auditor Fiscal ICMS/BA – 2004 [FCC] Sabe-se que o valor de uma determinadavariável Q é obtida pela expressão definida por Q = 2i + 3 2 sendo i um número inteiro positivo. Se i assumir os valores 1, 2, 3, 4 e 5, então, o desvio médio dessa variável é: a) 1,8 b) 1,2 c) 0,9 d) 0,75 e) 0,5 Vamos ver quais os valores assumidos por Q. i Q 1 2,5 2 3,5 3 4,5 4 5,5 5 6,5 A média de Q é: Q = 2 5, + 3 5, + 4 5, 5 + 5 5, + 6 5, = 4 5, Vamos calcular o desvio médio de Q: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 21 PROFESSOR: VÍTOR MENEZES 2 5, − 4 5, + 3 5, − 4 5, + 4 5, − 4 5, + 5 5, − 4 5, + 6 5, − 4 5, DM = 5 − 2 + − 1 + 0 + 1 + 2 DM = 5 DM = 2 + 1 + 0 + 1 + 2 = ,1 2 5 Resposta: B. Um detalhe interessante. Note que a seqüência de valores de Q foi obtida a partir de uma seqüência de dados i. Foi dito que: Q = 2i + 3 2 Ou seja: Q = 2i + 3 = i + 1 5, 2 Para obter cada valor de Q, basta pegar cada valor de ‘i’ e somar 1,5. A seqüência de dados ‘i’ (1, 2, 3, 4, 5) nós já tínhamos estudado. É exatamente a mesma seqüência da empresa C, que utilizamos como exemplo lá no começo da aula. Calculamos o desvio médio para este conjunto de dados e chegamos ao valor de 1,2. Ora, se a seqüência de valores de Q foi obtida a partir desta seqüência, podemos utilizar as propriedades do desvio médio. Como a operação feita foi uma adição, concluímos que o desvio médio de Q é igual ao desvio médio de i (pois somas e subtrações não interferem nas medidas de dispersão). Portanto, o desvio médio de Q é igual a 1,2. EC 3 Fiscal ICMS/PA – 2002 [ESAF] Um certo atributo W, medido em unidades apropriadas, tem média amostral 5 e desvio padrão unitário. Assinale a opção que corresponde ao coeficiente de variação, para a mesma amostra, do atributo Y=5+5W. a) 16,7% b) 20,0% c) 55,0% d) 50,8% e) 70,2% Questão da ESAF, sobre propriedades do desvio padrão. Para obter cada valor de Y, pegamos um valor de W, multiplicamos por 5 e somamos 5. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 22 PROFESSOR: VÍTOR MENEZES Em propriedades da média, vimos que a média sofre as mesmas alterações sofridas pelos dados. Assim, a média de Y fica: Y = 5W + 5 � Y = 5W + 5 Y = 5 × 5 + 5 = 30 O desvio padrão não é influenciado por somas e subtrações, apenas por multiplicações e divisões. Assim, o desvio padrão de Y fica: Yσ = 5 × σ W = 5 ×1 = 5 Agora podemos calcular o coeficiente de variação de Y: CV = 5 = 0 1667, 30 Resposta: alternativa A. EC 4 AFRF/2001 [ESAF] Numa amostra de tamanho 20 de uma população de contas a receber, representadas genericamente por X, foram determinadas a média amostral M = 100 e o desvio-padrão S =13 da variável transformada (X-200)/5. Assinale a opção que dá o coeficiente de variação amostral de X. a) 3,0 % b) 10,0 % c) 9,3 % d) 17,3 % e) 17,0 % Vamos chamar a variável transformada de Z. Z = X − 200 5 Sabemos que a média de Z é 100 e o desvio padrão de Z é 13. Podemos obter X a partir de Z. =Z X − 200 � 5 × Z + 200 = X 5 Ou seja, se pegarmos cada valor de Z, multiplicarmos por 5 e somarmos 200, chegamos em X. Por exemplo. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 23 PROFESSOR: VÍTOR MENEZES Se a seqüência de dados a que chamamos de Z for: 80, 90, 100, 110, ... Sabemos que: Z1 = 80 ; Z 2 = 90 ; e assim por diante. Pois bem, para obter a seqüência X, multiplicamos todos os valores de Z por 5 e somamos 200. Neste exemplo, X1 ficaria: X 1 = 80 × 5 + 200 = 600 E X2 ficaria: X 2 = 90 × 5 + 200 = 650 E assim por diante. Quando multiplicamos uma seqüência de dados por uma constante, a média sofre a mesma variação. E quando somamos uma constante a todos os valores de uma seqüência de dados, a média também sofre a mesma variação. Portanto, a média de X ficará: X = 5 × Z + 200 X = 5 × Z + 200 X = 5 ×100 + 200 = 700 Já o desvio padrão não é afetado por somas e subtrações. Somar 200 a todos os valores de Z não altera em nada no desvio padrão de X. Já as multiplicações sim interferem no desvio padrão. Quando multiplicamos todos os valores por uma constante, o desvio padrão sofre a mesma alteração. X = 5 × Z + 200 S x = 5 × S z S x = 5 ×13 = 65 O desvio padrão de X é igual a 65. O exercício pediu o coeficiente de variação de X. Coeficiente de variação é igual ao desvio padrão dividido pela média. CV = S x = 65 � 0 093, X 700 Resposta: C. EC 5 AFRF/2002-1 [ESAF] www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 24 PROFESSOR: VÍTOR MENEZES Um atributo W tem média amostral a ≠ 0 e desvio padrão positivo b ≠ 1. Considere a transformação Z = (W-a)/b. Assinale a opção correta: a) A média amostral de Z coincide com a de W. b) O coeficiente de variação amostral de Z é unitário. c) O coeficiente de variação amostral de Z não está definido. d) A média de Z é a/b e) O coeficiente de variação amostral de W e o de Z coincidem. Vamos encontrar a média de Z. Cada valor de Z é obtido a partir de W. Pegamos cada valor de W, subtraímos ‘a’, e dividimos por ‘b’. Quando somamos, subtraímos, multiplicamos ou dividimos uma seqüência de valores por determinadas constantes, a média sofre a mesma alteração. Assim, a média de Z fica: Z = W − a b Z = W − a b Mas o exercício disse que a média de W é igual a ‘a’. W = a Portanto: Z = a − a = 0 b Logo, Z tem média nula. Se Z tem média nula, seu desvio padrão fica: CV = S = S Z 0 Temos zero no denominador. Dizemos que o CV de variação não está definido, pois não é possível dividir por zero. Resposta: C. EC 6 Analista CGU 2008. Área: estatística e cálculos atuariais [ESAF] Calcule o valor mais próximo do desvio-padrão da amostra representada pela distribuição de freqüências abaixo representada pelos pontos médios das classes x e respectivas freqüências f. x F 5 5 15 10 25 31 35 10 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 25 PROFESSOR: VÍTOR MENEZES 45 5 a) 1. b) 2,44. c) 5,57. d) 7,056. e) 10. Para calcular o desvio-padrão, precisamos dos desvios em relação à média aritmética. Portanto, o primeiro passo é encontrar a média aritmética. Para tanto, criamos a coluna adicional: fx x × f A média fica: 5 5 25 15 10 150 25 31 775 35 10 350 45 5 225 TOTAL 61 1525 X = 1525 = 25 61 Um detalhe. Para esta série de dados, especificamente, não era necessário fazer o cálculo para chegar na média. Temos uma seqüência simétrica. A média é simplesmente o termo do meio. Agora podemos calcular os desvios em relação à média: x e Memória de cálculo5 -20 =5-25 15 -10 =15-25 25 0 =25-25 35 10 =35-25 45 20 =45-25 Podemos agora calcular a média os desvios ao quadrado: x e 2 f e 2 × f 5 400 5 2000 15 100 10 1000 25 0 31 0 35 100 10 1000 45 400 5 2000 TOTAL 61 6000 A média dos desvios ao quadrado é a variância: σ 2 = 6000 61 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 26 PROFESSOR: VÍTOR MENEZES Agora um detalhe. Estamos trabalhando com uma amostra. Então, a variância calculada é a variância amostral. Nesses casos, temos que trocar o denominador ‘n’ por ‘n-1’. s 2 = 6000 = 100 60 E o desvio padrão é igual à raiz quadrada da variância: =s 100 = 10 Resposta: E EC 7 AFRF/2002-2 [ESAF] O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes Freqüência 29,5-39,5 4 39,5-49,5 8 49,5-59,5 14 59,5-69,5 20 69,5-79,5 26 79,5-89,5 18 89,5-99,5 10 Assinale a opção que corresponde ao desvio absoluto médio do atributo X. a) 16,0 b) 17,0 c) 16,6 d) 18,1 e) 13,0 A questão pede o desvio médio. O desvio médio é igual à média aritmética dos módulos dos desvios. O primeiro passo é calcular a média aritmética. Para tanto, supomos que os valores observados são justamente os pontos médios das classes. Vamos utilizar a variável transformada ‘d’, vista na aula 02. Classes Ponto médio d = X − 34 5, Freqüência d × f ( X ) 10 ( f ) 29,5-39,5 34,5 0 4 0 39,5-49,5 44,5 1 8 8 49,5-59,5 54,5 2 14 28 59,5-69,5 64,5 3 20 60 69,5-79,5 74,5 4 26 104 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 27 PROFESSOR: VÍTOR MENEZES Classes Ponto médio d = X − 34 5, Freqüência d × f ( X ) 10 ( f ) 79,5-89,5 84,5 5 18 90 89,5-99,5 94,5 6 10 60 TOTAL 100 350 A média dos valores ‘d’ fica: d = 350 = 3 5, 100 Agora vamos calcular o desvio médio da variável ‘d’. ( d ) Desvio ( e = d − ,3 )5 e Freqüência ( f ) e × f 0 -3,5 3,5 4 14 1 -2,5 2,5 8 20 2 -1,5 1,5 14 21 3 -0,5 0,5 20 10 4 0,5 0,5 26 13 5 1,5 1,5 18 27 6 2,5 2,5 10 25 TOTAL 100 130 E o desvio médio de d fica: = 130 = 1 3, DM d 100 Só que o exercício não pediu o desvio médio da variável transformada. O exercício pediu o desvio médio de X. Sabemos que: d = X − 34 5, 10 Portanto: X = 10d + 34 5, Para obter os valores de X, pegamos os valores de ‘d’, multiplicamos por 10 e somamos 34,5. Nós vimos que somas e subtrações não interferem no desvio médio. Já a multiplicação sim interfere no desvio médio. Quando multiplicamos os dados por uma constante, o desvio médio sofre a mesma alteração. O desvio médio de X fica: DM X DM X = 10 × DM d = 13 Resposta: E. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 28 PROFESSOR: VÍTOR MENEZES EC 8 Estatístico MPOG 2006 [ESAF] Considere os seguintes conjuntos de observações referentes a cinco diferentes variáveis: A { 1; 1; 1; 1; 1; 50}, B {1, 1, 1, 1; 50; 50}, C {1, 1, 1, 50, 50, 50 }, D {1, 1, 50, 50, 50, 50 }, E {1, 50, 50, 50, 50, 50}. O conjunto de observações que apresenta a maior variabilidade, medida pelo desvio- padrão, é o referente à variável: a) A. b) B. c) E. d) D. e) C O ideal é que o candidato resolva esta questão sem fazer contas. Observe o primeiro ROL. Quase todos os dados são iguais entre si. Apenas o último é diferente. Parece razoável, portanto, admitir que neste primeiro ROL os dados estão bastante concentrados. O mesmo raciocínio vale para o último ROL. O segundo ROL tem apenas dois termos diferentes dos demais. O mesmo se aplica ao quarto ROL. Ambos não estão tão concentrados assim, mas também não são tão dispersos. Já o terceiro Rol tem metade dos dados iguais a 1 e a outra metade igual a 50. É o ROL com maior dispersão. Resposta: E. Caso vocês queiram fazer as contas, a variância do terceiro ROL é de 600,25. Todas as demais são inferiores. EC 9 Analista MPU. Área Pericial – especialidade: estatística. 2004 [ESAF] A norma euclidiana n ∑ ( )X i − A 2 é mínima quando A é igual: i =1 a) à média dos valores de X i b) à mediana dos valores de X i www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 29 PROFESSOR: VÍTOR MENEZES c) à moda dos valores de X i d) ao primeiro quartil dos valores de X i e) ao desvio padrão dos valores de X i Norma euclidiana é um nome meio complicado. Mas não precisamos dele. Observe o valor que se pretende calcular: n ∑ ( )X i − A . 2 i =1 Dentro da raiz quadrada temos uma soma de desvios ao quadrado. Desvios estes calculados em relação a “A”. Nós vimos que esta soma é mínima quando “A” é igual à média aritmética dos valores. Resposta: A. EC 10 AFRF/2003 [ESAF] O atributo Z= (X-2)/3 tem média amostral 20 e variância amostral 2,56. Assinale a opção que corresponde ao coeficiente de variação amostral de X. a) 12,9% b) 50,1% c) 7,7% d) 31,2% e) 10,0% Vamos achar a média e a variância de X. Sabemos que: Z = X − 2 3 Portanto: X = 3Z + 2 Logo, a média de X fica: X = 3Z + 2 X = 3 × 20 + 2 = 62 Sabemos que somas e subtrações não interferem na variância. Já a multiplicação sim. Quando multiplicamos os dados por uma determinada constante, a variância é multiplicada pela constante ao quadrado. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 30 PROFESSOR: VÍTOR MENEZES 2 XS = 32 2 × S Z S 2 = 9 × 2 56, X Portanto, o desvio padrão amostral de X fica: XS = 9 × 2 56, = 3 × ,1 6 = 4 8, E o coeficiente de variância de X é dado pela divisão entre o desvio padrão e a média de X. CV = 4 8, � 0 077, 62 Resposta: C. EC 11 Auditor Fiscal ICMS/BA – 2004 [FCC] Com relação às medidas de tendência central e de dispersão, é correto afirmar que: a) multiplicando-se todos os valores de uma determinada seqüência de números positivos por um mesmo número, maior que um, o seu respectivo coeficiente de variação aumenta de valor. b) a diferença entre a média aritmética e a mediana de uma seqüência de números positivos é sempre maior que a diferença entre a média aritmética e a moda dessa mesma seqüência. c) a média harmônica de uma seqüência de números positivos é igual à média aritmética dos respectivos inversos destes números. d) em uma seqüênciade números positivos, o produto da média aritmética pelo respectivo coeficiente de variação é igual ao valor do desvio padrão correspondente. e) a média geométrica de uma seqüência de números positivos é sempre maior ou igual à média aritmética destes números. Vamos à alternativa A. A alternativa seria sobre as propriedades do coeficiente de variação. Só que nós não estudamos nenhuma propriedade do coeficiente de variação. Como o coeficiente de variação é resultado da divisão do desvio padrão pela média, podemos utilizar as propriedades dessas duas grandezas para concluirmos o que acontece com o coeficiente de variação. Vamos a um exemplo para ficar mais fácil. Considere o seguinte conjunto de dados: 1, 2, 3, 4, 5. Sabemos que sua média e seu desvio padrão são: X = 3 =σ 2 E o coeficiente de variação é: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 31 PROFESSOR: VÍTOR MENEZES CV = 2 3 Agora multiplicamos todos esses valores por uma constante maior que 1. Vamos multiplicar por 3. Os dados ficam assim: 3, 6, 9, 12, 15. Vimos propriedades da média. Sempre que multiplicamos uma seqüência de valores por uma constante, a média sofre a mesma variação. A nova média fica: X ' = 3 × 3 = 9 Vimos propriedades do desvio padrão. Sempre que multiplicamos uma seqüência de valores por uma constante, o desvio padrão sofre a mesma variação. O novo desvio padrão fica: σ ' = 3 × 2 Logo, o novo coeficiente de variação fica: CV ' = 3 × 2 2= 3 × 3 3 Conclusão: o coeficiente de variação não é alterado por uma multiplicação dos dados. Isto porque tanto a média quanto o desvio padrão são multiplicados pela mesma constante. Assim, na hora de dividir um pelo outro, essa constante é “cortada”. A alternativa está errada. A alternativa B diz que a diferença entre a média e a mediana é sempre maior que a diferença entre a média e a moda. Isto é incorreto. Basta pensar na seguinte seqüência de dados: 1, 2, 2, 2, 3. A média, a mediana e a moda são todas iguais a 2 (é uma seqüência simétrica). Ou seja, a diferença entre a média e a mediana é zero. A diferença entre a média e a moda é zero. As duas diferenças são iguais. A alternativa está errada. A alternativa C diz que a média harmônica de uma seqüência de números positivos é igual à média aritmética dos respectivos inversos desses números. A questão está errada. Nós vimos (lá na aula 1) que a média harmônica é o inverso da média aritmética dos inversos dos números considerados. Na alternativa D, afirma-se que o produto da média pelo coeficiente de variação é igual ao desvio padrão. Esta alternativa está correta. X × CV = X × σ = σ X www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 32 PROFESSOR: VÍTOR MENEZES A alternativa E diz que a média geométrica é sempre maior ou igual à média aritmética. Nós vimos (lá na aula 1) que é justamente o contrário. A média aritmética é sempre maior ou igual à média geométrica. Resposta: D. EC 12 Analista BACEN/2006 – Área 5 [FCC] Com relação às medidas de posição e de dispersão, é correto afirmar: a) dobrando todos os valores dos funcionários de uma empresa, tem-se que o salário médio destes funcionários e a respectiva variância também ficam dobrados. b) a diferença entre a variância e o desvio padrão de uma seqüência de números é nula somente no caso em que a variância e o desvio padrão são iguais a zero. c) em qualquer distribuição de valores, a diferença entre a média e a moda é sempre maior ou igual a zero. d) multiplicando todos os valores de uma seqüência de números positivos por um número positivo, tem-se que o respectivo coeficiente de variação não se altera e) o coeficiente de variação correspondente a uma série de números positivos é igual à divisão do quadrado da respectiva média aritmética pela variância. Letra A. Quando dobramos todos os salários, o salário médio, de fato, também dobra. Isso porque nós vimos lá na aula 1, em propriedades da média, que a média sofre exatamente a mesma alteração dos dados. Como todos eles foram dobrados, o mesmo acontece com a média. Já com a variância as coisas mudam um pouco. Somas e subtrações não interferem na variância. Multiplicações e divisões sim. Quando dobramos todos os valores, a variância sofre a variação ao quadrado. Ou seja, a variância fica multiplicada por 4 (pois 4 é igual a 2 ao quadrado). Item errado. Letra B. Imagine o caso em que o desvio padrão é igual a 1. A variância é igual ao quadrado do desvio padrão. Portanto, a variância também será igual a 1. E a diferença entre ambos será igual a zero. Portanto, o item está errado. Letra C. A alternativa está errada. Nas distribuições assimétricas à esquerda, a média é menor que a moda. A citada diferença será menor que zero. Observe o seguinte exemplo: 1, 2, 2, 3, 3, 3, 4, 4, 4, 4. A moda é 4. A média é 3. A diferença entre a média e a moda é de -1, portanto, menor que zero. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 33 PROFESSOR: VÍTOR MENEZES Letra D. Como vimos no EC 11, multiplicações não alteram o coeficiente de variação. Alternativa correta. Letra E. Esta não é a fórmula do coeficiente de variação. O coeficiente de variação é dado pela divisão do desvio padrão pela média aritmética. Alternativa errada. Resposta: D. EC 13 Fiscal ICMS/SP – 2006 [FCC] Considerando as respectivas definições e propriedades relacionadas às medidas de posição e de variabilidade, é correto afirmar: a) concedendo um reajuste de 10% em todos os salários dos empregados de uma empresa, tem-se que a respectiva variância fica multiplicada por 1,10. b) definindo o coeficiente de variação (CV) como sendo o quociente da divisão do desvio padrão pela respectiva média aritmética (diferente de zero) de uma seqüência de valores, tem-se então que CV também poderá ser obtido dividindo a correspondente variância pelo quadrado da média aritmética. c) subtraindo um valor fixo de cada salário dos funcionários de uma empresa, tem-se que o respectivo desvio padrão dos novos valores e igual ao valor do desvio padrão dos valores anteriores. d) dividindo todos os valores de uma seqüência de números estritamente positivos por 4, tem-se que o respectivo desvio padrão fica dividido por 2. e) em qualquer distribuição de valores em estudo, a diferença entre a mediana e a moda é sempre diferente de zero. Letra A. Dar um reajuste de 10% é o mesmo que multiplicar todos os salários por 1,1. Se todos os salários são multiplicados por 1,1, a variância fica multiplicada por 1,12. Alternativa errada. Letra B. O coeficiente de variação é igual ao desvio padrão dividido pela média. Alternativa errada. Letra C. Somar ou subtrair uma constante em cada um dos dados não interfere nas medidas de dispersão. Alternativa correta. Letra D. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 34 PROFESSOR: VÍTOR MENEZES Se dividirmos todos os dados por 4, o desvio padrão também será dividido por 4. Alternativa errada. Letra E. Alternativa errada. Basta pensar numa seqüênciasimétrica. Exemplo: 1, 2, 2, 3. A mediana, a média e a moda são iguais a 2. A diferença entre a mediana e a moda é igual a zero. Resposta: C EC 14 Auditor Fiscal ICMS BA/2004 [FCC] Na tabela abaixo tem-se um estudo dos salários de empregados de três empresas X, Y, Z. Empresa Número de empregados Média salarial (R$) Coeficiente de variação (%) X 80 1.800 4,50 Y 100 2.000 3,20 Z 120 2.500 1,96 Com base nesses dados, é correto concluir que a a) maior variância dos salários entre as três empresas corresponde à empresa Y b) variância dos salários da empresa X é inferior à variância dos salários da empresa Y. c) média geométrica dos desvios padrão dos salários das três empresas é 504 reais. d) menor variância dos salários entre as três empresas corresponde à empresa Z e o seu valor é maior que 2.400 (R$)2 e) diferença entre a variância dos salários da empresa X e a variância dos salários da empresa Z é igual a 1.024 (R$)2. Como foi fornecido o coeficiente de variação e a média, vamos fazer o seguinte. Vamos multiplicar esses dois valores para obter os respectivos valores de desvio padrão. Empresa Número de empregados Média salarial Coeficiente de variação (%) Desvio padrão X 80 1.800 4,50 81 Y 100 2.000 3,20 64 Z 120 2.500 1,96 49 Obtidos os valores de desvio padrão, vamos às alternativas. Notamos que o maior desvio padrão é o da empresa X. Consequentemente, a maior variância também é a da empresa X (pois a variância é o desvio padrão ao quadrado). Portanto, as alternativas A e B estão erradas. Na letra C, pede-se a média geométrica dos valores de desvio padrão. Fica assim: G = 3 81× 64 × 49 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 35 PROFESSOR: VÍTOR MENEZES Para calcular a raiz, decompomos cada número em fatores primos. G = 3 234 × 26 × 7 Note que temos dois expoentes que não são múltiplos de 3. Portanto, o resultado da raiz acima não é um número inteiro. Logo, não pode ser igual a 504 reais. Se na hora da prova o candidato não conseguisse ver isto, bastaria calcular quanto é 504 ao cubo. Depois, bastaria comparar este valor com 81× 64 × 49 e ver se ambos são iguais ou não. 81× 64 × 49 = 254.016 Calcular 504 ao cubo é meio demorado. Calcular 500 ao cubo é mais fácil. 5003 = 125 000. 000. Ou seja, 504 ao cubo é muito maior que 254.016. Novamente, a alternativa está incorreta. Creio que essa questão tenha pretendido levar o candidato a confundir a fórmula de média geométrica. Temos que lembrar que média geométrica é sempre a raiz enésima. Se são três elementos, a raiz será cúbica. Caso o candidato se esquecesse deste detalhe e calculasse a raiz quadrada, ele acharia o seguinte: G = 2 34 × 26 × 7 2 = 32 × 23 × 7 = 504 E acabaria marcando, INCORRETAMENTE, a alternativa C. Na alternativa D, afirma-se que a menor variância é a da empresa Z. Como ela tem o menor desvio padrão, de fato, sua variância será a menor. Na mesma alternativa, afirma-se que o valor de sua variância é superior a 2.400 R$2. Para achar a variância, basta elevar o desvio padrão ao quadrado. σ 2 = 49 × 49 = 2 401. Alternativa correta. Vamos à alternativa E. Afirma-se que a diferença entre a variância da empresa X e da empresa Z é igual a 1.024 R$2. A variância de X é 812. A variância de Z é 492. Fazendo a diferença temos: 812 − 49 2 = ? O candidato pode perfeitamente fazer a conta e verificar que a alternativa está errada. Só uma sugestão para facilitar as contas: podemos fatorar essa subtração. 812 − 49 2 = 81( − )4 9 × 81( + )49 812 − 49 2 = 81( − 49) × ( )130 CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 36 PROFESSOR: VÍTOR MENEZES Na expressão acima, temos uma multiplicação por 130 (que é múltiplo de 10). Portanto, o resultado da conta será um múltiplo de 10. Se é múltiplo de 10, termina em zero. Se o algarismo das unidades é zero, o número procurado não pode ser 1.024. Resposta: D. EC 15 Auditor Fiscal ICMS/BA – 2004 [FCC] Sabe-se que a altura média dos 5.000 habitantes de uma cidade X é igual à altura média de uma outra cidade Y com 10.000 habitantes, ou seja, igual a 1,70m. O desvio-padrão correspondente encontrado para a população da cidade X é 2 cm e para a população da cidade Y é 5 cm. Então, a variância das alturas da população das duas cidades reunidas é: a) 12,25 cm2 b) 16,00 cm2 c) 18,00 cm2 d) 24,50 cm2 e) 29,00 cm2 O exercício deu o desvio padrão da cidade X. Para achar a variância, basta elevar ao quadrado. A variância da cidade X é igual a 4 cm2 (=2 ao quadrado). E como se chega na variância? Basta fazer a média dos desvios ao quadrado (média esta calculada em relação a 1,70, que é a altura média da cidade). Ou seja: Xσ 2 = 1 × ∑ ( )X − 1 70, 2 5 000. 4 = 1 × ∑ ( )X − 1 70, 2 5 000. Multiplicando cruzado: ∑ ( )X − 1 70, 2 = 4 × 5 000. A variância das alturas na cidade Y é igual a 25 cm2. Basta elevar o desvio padrão fornecido ao quadrado. Como é obtida esta variância? Esta variância é igual à média dos desvios ao quadrado (desvios esses calculados em relação a 1,70m, que é a altura média na cidade). Yσ 2 = 1 × ∑ ( )Y − 1 70, 2 10 000. 25 = 1 × ∑ ( )X − 1 70, 2 10 000. Multiplicando cruzado: ∑ ( )X − 1 70, 2 = 25 ×10 000. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 37 PROFESSOR: VÍTOR MENEZES Pois bem. Agora juntamos as pessoas das duas cidades. A altura média continua sendo de 1,70 (já que as duas cidades tinham médias iguais). E a variância? Fica em quanto? Para achar a variância, vamos somar todos os quadrados dos desvios (desvios estes calculados em relação a 1,70). Depois disso, dividimos o resultado por 15.000 (pois essa nova população tem 15.000 habitantes, resultado da soma dos habitantes de X e Y). Com esse procedimento, obtemos justamente a variância da nova população. σ 2 = 1 × ( )∑ ( X − ,1 )70 2 + ∑ (Y − ,1 )7 0 2 15 000. Substituindo os valores dos somatórios: σ 2 = 1 × ( )4 × 5 000. 15 000. σ 2 = 1 × 270 000. 15 000. + 25 ×10 000. = 18 A nova variância é de 18 cm2. Resposta: C Um detalhe. Note bem na fórmula a que chegamos: σ 2 = 1 × ( )4 × 5 000. + 25 ×10 000. 15 000. Na fórmula acima temos as variâncias das duas cidades, multiplicadas pelos números de habitantes. peso da variância da cidade X: número de habitantes da cidade peso da variância da cidade Y: número de habitantes da cidade 2σ = 1 × ( )4 × 5.000 + 25 × 10 .000 15 .000 variância da cidade X variância da cidade Y A variância das duas cidades reunidas é uma média ponderada das variâncias de cada cidade. E os pesos de ponderação são os números de habitantes (ou número de elementos de cada conjunto). Não são raras as questões que pedem a variância da populaçãoresultante da união de dois conjuntos. Nesse caso específico, em que as médias das cidades X e Y são iguais, até que não deu tanto trabalho. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 38 PROFESSOR: VÍTOR MENEZES Quando as médias são diferentes, encontrar a variância da união dos dois conjuntos já fica um pouco mais trabalhoso. Por ser um assunto que não é muito cobrado, e para não deixar a leitura da aula “pesada”, vou colocar o procedimento em anexo. Vou deixar duas opções. Uma sem usar fórmulas (o que exige um pouco de prática com somatório) e outra com a fórmula. Quem tiver mais facilidade com exatas, recomendo gravar como é o método, sem precisar decorar a fórmula (afinal, já temos tanta coisa para decorar para um concurso, não é mesmo?). Quem tem a memória privilegiada (ou seja, decora qualquer coisa), aí vale a pena dar uma conferida na fórmula lá do anexo. E para quem não tem tanta familiaridade com exatas, acho que entender este caso em que as médias são iguais já está mais que ótimo. Vejamos outro exemplo: EC 16 Analista de Regulação – Economista – ARCE/2006 [FCC] Uma administradora de imóveis realizou um estudo sobre todos os imóveis alugados em duas regiões, A e B, levantando o seguinte quadro: Região Qdade de imóveis alugados Valor médio dos aluguéis Coeficiente de variação A 1.000 R$ 500,00 20% B 4.000 R$ 500,00 30% (Observação: no enunciado original, é dada a definição de coeficiente de variação.) A variância conjunta de A e B, isto é, a variância dos valores dos aluguéis das regiões A e B reunidas é, em R$2, igual a: a) 20.000 b) 25.000 c) 32.500 d) 40.000 e) 62.500 Como as duas médias são iguais a 500,00, a média das duas regiões reunidas também será igual a 500,00. Portanto, a variância conjunta (ou seja, das duas regiões tomadas conjuntamente) será a média ponderada das variâncias individuais. Os pesos de ponderação são os números de elementos de cada conjunto. Precisamos achar as variâncias das duas regiões. Multiplicando o coeficiente de variação pela média, temos justamente o valor do desvio padrão. Aσ = ×A CVA = 500 × ,0 2 = 100 � Aσ 2 = 10 000. Bσ = ×B CVB = 500 × 0 3, = 150 � Bσ 2 = 22 500. E agora podemos calcular a variância conjunta: σ 2 = 1 × ( )10 000. ×1 000. + 22 500. × 4 000. 5 000. Simplificando: www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 39 PROFESSOR: VÍTOR MENEZES σ 2 = ( )2 × .1 000 + 22 500. × 0 8, σ 2 = ( )2 000. + 18 000. = 20 000. Resposta: A. EC 17 Analista BACEN/2006 – Área 5. [FCC] Em um colégio, a média aritmética das alturas dos 120 rapazes é de m centímetros com uma variância de d2 centímetros quadrados (d>0). A média aritmética das alturas das 80 moças é de (m-8) centímetros com desvio padrão igual a 20d/21 centímetros. Se o correspondente coeficiente de variação encontrado para o grupo de rapazes é igual ao coeficiente de variação encontrado para o grupo de moças, tem-se que a média aritmética dos dois grupos reunidos é de: a) 162,00 cm b) 164,6 cm c) 164,8 cm d) 166,4 cm e) 168,2 cm O coeficiente de variação para as alturas dos homens é: d m O coeficiente de variação para as alturas das mulheres é: 20d 21 = 20d m − 8 21× (m − )8 Os dois coeficientes de variação são iguais. Logo: d = 20d �m 21× (m − )8 1 = 20 m 21× (m − )8 Multiplicando cruzado: m21 − 21× 8 = 20m m = 21× 8 = 168 Portanto, a média das alturas dos homens é de 168 centímetros. E a média das alturas das mulheres é de 160 cm. A média geral, considerando homens e mulheres, é a média ponderada entre a média dos homens e a média das mulheres. Os pesos são, respectivamente, o número de homens e o número de mulheres. X = 168 ×120 + 160 × 80 200 www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 40 PROFESSOR: VÍTOR MENEZES Apenas tentando diminuir um pouco as contas, podemos considerar que: 168 ×120 = 8 ×120 + 160 ×120 Logo: X = 8 ×120 + 160 ×120 + 160 × 80 200 Colocando o 160 em evidência: X = 8 ×120 + 160 × 120( 200 X = 960 + 160 = 4 8, 200 + )80 = 8 ×120 + 160 200 + 160 = 164 8, Resposta: C. EC 18 Analista – Área documentação. Especialidade – Estatística – MPU/2007 [FCC] Uma empresa tem duas filiais Z e W. Um levantamento sobre os salários dos empregados dessas filiais revelou para a média e o desvio padrão dos salários das duas filiais os seguinte valores (em R$): Filial Z: Filial W: ZX = 400 00, WX = 500 00, e S Z e SW = ,20 00 = 25 00, Com base nesses resultados, é verdade que: a) as dispersões absolutas dos salários das filiais Z e W são iguais. b) o coeficiente de variação dos salários das duas filiais não diferem. c) o coeficiente de variação dos salários de Z é menor que o coeficiente de variação dos salários da filial W. d) o salário médio dos funcionários dessa empresa é de 450 reais. e) o salário médio dos funcionários dessa empresa é superior a 450 reais. Letra A. O termo dispersão absoluta pode se referir a várias grandezas (como variância, desvio padrão, desvio médio). É usado para diferenciar essas medidas daquelas fruto de uma divisão (como o coeficiente de variação). O coeficiente de variação, por sua vez, é chamado de medida de dispersão relativa (lembrem-se de que relação é sinônimo de divisão; esse coeficiente é a divisão entre duas outras medidas – o desvio padrão e a média aritmética). A medida de dispersão fornecida foi o desvio padrão. Ele não é igual para as duas empresas. Alternativa errada. Letra B. www.pontodosconcursos.com.br CURSO ON-LINE – ESTATÍSTICA PARA ICMS/SP 41 PROFESSOR: VÍTOR MENEZES Vamos calcular os coeficientes de variação. CVZ = S Z = 20 1 = ZX 400 20 CVW = SW = 25 1 = WX 500 20 Realmente os coeficientes de variação são iguais. Alternativa correta. Letra C. Alternativa errada. Os coeficientes de variação são iguais, conforme cálculos do item anterior. Letra D. Não temos como calcular a média geral, considerando as duas filiais. A média geral é uma média ponderada entre as médias de cada filial. Os pesos são os números de empregados em cada filial. Como não foi informado quantos empregados há em cada filial, não podemos determinar o valor da média geral. Apenas sabemos que é um valor entre R$ 400,00 e R$ 500,00. Se o número de empregados for o mesmo nas duas filiais, a média geral estará bem no meio entre 400 e 500 (será de 450). Se a filial Z tiver mais funcionários, a média geral estará mais próxima de 400. Se a filial W tiver mais funcionários, a média geral estará mais próxima de 500. Alternativa errada. Letra E. Alternativa errada, pelo mesmo motivo da letra D. Resposta: B 9 Outra forma de cálculo da variância Há uma outra forma de cálculo
Compartilhar