Baixe o app para aproveitar ainda mais
Prévia do material em texto
CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 1 www.pontodosconcursos.com.br Aula 5 – Senado Federal – Parte 2 Estatística ...................................................................................................................................... 2 Classe ............................................................................................................................................. 8 Limites de classe ............................................................................................................................ 8 Amplitude de um intervalo de classe ............................................................................................ 9 Amplitude total da Distribuição .................................................................................................... 9 Ponto médio de uma classe .......................................................................................................... 9 Tipos de frequências ................................................................................................................... 10 Medidas de Posição ..................................................................................................................... 15 Médias ......................................................................................................................................... 15 Propriedades da média aritmética .............................................................................................. 19 Cálculo Simplificado da Média Aritmética .................................................................................. 21 Mediana (Md) .............................................................................................................................. 35 Moda ........................................................................................................................................... 49 Moda Bruta ................................................................................................................................. 51 Processo de Czuber ..................................................................................................................... 51 Processo de King ......................................................................................................................... 52 Propriedades da Moda ................................................................................................................ 53 Medidas de dispersão ou variabilidade ...................................................................................... 55 Desvio Absoluto Médio (Dm) ...................................................................................................... 56 Desvio padrão e Variância ........................................................................................................... 61 Propriedades da Variância .......................................................................................................... 68 Propriedades do Desvio‐padrão .................................................................................................. 69 Método simplificado para o desvio padrão e variância .............................................................. 71 Medida de dispersão relativa ...................................................................................................... 77 Coeficiente de Variação de Pearson (CVP) .................................................................................. 77 Relação das questões comentadas nesta aula ............................................................................ 80 Gabaritos ..................................................................................................................................... 93 CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 2 www.pontodosconcursos.com.br Estatística A Estatística, ramo da Matemática Aplicada, teve origem na história do homem. Desde a Antiguidade, vários povos registravam o número de habitantes, de nascimentos, de óbitos, distribuíam equitativamente terras ao povo. Na Idade Média colhiam-se informações, geralmente com finalidades tributárias ou bélicas. No início do século XVIII o estudo de tais fatos foi adquirindo feição verdadeiramente científica. A palavra foi proposta pela primeira vez no século XVII, em latim, por Schmeitzel na Universidade de Lena e adotada pelo acadêmico alemão Godofredo Achenwall. As tabelas tornaram-se mais completas, surgiram as representações gráficas e o cálculo das probabilidades, e a Estatística deixou de ser uma simples catalogação de dados numéricos para se tornar o estudo de “como chegar a conclusões sobre o todo (população), partindo da observação de partes do todo (amostras)”. Podemos dizer, então, que a Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados para a utilização dos mesmos na tomada de decisões. A coleta, organização e a descrição dos dados estão a cargo da Estatística Descritiva. A análise e a interpretação dos dados ficam a cargo da Estatística Inferencial. O aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam obter conclusões que transcendam os dados obtidos inicialmente. Vamos à primeira fase de um processo estatístico. Imagine que você foi o encarregado para fazer uma pesquisa sobre a altura dos alunos do Ponto dos Concursos. Como são muitos alunos, você decidiu realizar uma pesquisa com apenas 40 alunos. Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta alunos, que compõem uma amostra dos alunos do Ponto, resultando a seguinte tabela de valores: 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 3 www.pontodosconcursos.com.br 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 Obviamente, quando você começa a sua pesquisa, os seus dados não estão organizados. A esses dados desorganizados denominamos dados brutos. A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva. O próximo passo, após realizar a coleta dos dados, é organizar esses dados em ordem crescente ou decrescente. Denominamos os dados dispostos em ordem crescente ou decrescente de rol. Em suma, um rol é um arranjo de dados numéricos brutos em ordem crescente ou decrescente. Colocar os dados brutos em rol é uma das fases da Estatística Descritiva. À diferença entre o maior e o menor número do rol chama-se amplitude total dos dados. Então vamos lá... Coloquemos os dados em ordem crescente! 150 155 156 160 161 162 164 168 151 155 156 160 161 163 165 169 152 155 157 160 161 163 166 170 153 155 158 160 161 164 167 172 154 156 158 160 162 164 168 173 Um pouco melhor ou não? Agora, podemos saber, com relativa facilidade, qual a menor estatura (150 cm) e qual a maior (173 cm); que a amplitude total de variação foi de 173 – 150 = 23 cm. 01. (Economista - Instituto de Previdência do Estado de Santa Catarina – FEPESE/2006) Verifique os conjuntos A, B, C e D abaixo, no formato de rol e assinale a alternativa correta. CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 4 www.pontodosconcursos.com.br a) A amplitude total do conjunto C é igual a 0,28. b) Não é possível calcular a amplitude total do conjunto D, pois estamos diante de um roldecrescente. c) A amplitude de todos os conjuntos é igual a 7. d) A amplitude total do conjunto A é 2,1. e) A amplitude total do conjunto B é o dobro da amplitude total do conjunto A. Resolução O primeiro passo é organizar os conjuntos A, B, C e D em formato de rol. Tanto faz organizar em ordem crescente ou decrescente. Por questão de costume, organizarei em ordem crescente. A 0,05 0,5 1 2 3 5 5,1 B 0,25 0,5 1 3 7 10 10,35 C 0,01 0,02 0,03 0,04 0,05 0,06 0,07 D 1 2 2 3 3 4 5 A amplitude total de um conjunto é a diferença entre o maior elemento e o menor elemento. Assim: a) A amplitude total do conjunto C é igual a 0,07 – 0,01 = 0,06. A letra A é, portanto, falsa. b) A amplitude total do conjunto D é 5 – 1 = 4. A letra B é, portanto, falsa. c) A amplitude de todos os conjuntos é igual a 10,35 – 0,01 =10,34. A letra C é, portanto, falsa. d) A amplitude total do conjunto A é igual a 5,1 – 0,05 = 5,05. A letra D é, portanto, falsa. e) A amplitude total do conjunto B é igual a 10,35 – 0,25 = 10,1. Portanto a amplitude total do conjunto B é o dobro da amplitude total do conjunto A e a alternativa E é verdadeira. Letra E CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 5 www.pontodosconcursos.com.br 02. (Auditor Interno do Poder Executivo- Secretarias de Estado da Fazenda e da Administração – 2005 – FEPESE) Os pesos de 80 pacientes internados em um hospital estão relacionados na tabela abaixo. Com referência a essa tabela, determine a amplitude total. Assinale a única alternativa correta. a) 49 b) 53 c) 79 d) 80 e) 97 Resolução A amplitude total de um conjunto é a diferença entre o maior elemento e o menor elemento. O maior elemento desse conjunto é 99 (4ª coluna e 6ª linha) e o menor elemento é 50 (9ª coluna e 7ª linha). Assim a amplitude total é 99 – 50 = 49. Letra A Vamos começar um estudo pormenorizado das distribuições de frequências, seus elementos e propriedades. Voltemos ao exemplo inicial de nossa aula para entendermos as próximas explicações. CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 6 www.pontodosconcursos.com.br Imagine que você foi o encarregado de fazer uma pesquisa sobre a altura dos alunos do Ponto dos Concursos. Como são muitos alunos, você decidiu realizar uma pesquisa com apenas 40 alunos. Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta alunos, que compõem uma amostra dos alunos do Ponto, resultando a seguinte tabela de valores: 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 Denominamos os dados dispostos em ordem crescente ou decrescente de rol. 150 155 156 160 161 162 164 168 151 155 156 160 161 163 165 169 152 155 157 160 161 163 166 170 153 155 158 160 161 164 167 172 154 156 158 160 162 164 168 173 Denominamos frequência o número de alunos que fica relacionado a um determinado valor da variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de frequência. Por exemplo, temos 4 alunos com 161 cm de altura. Portanto 4 é a frequência do dado 161 cm. Vamos relacionar cada dado com a sua frequência correspondente. Estat. (cm) Freq. Estat. (cm) Freq. Estat. (cm) Freq. 150 1 158 2 167 1 151 1 160 5 168 2 CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 7 www.pontodosconcursos.com.br 152 1 161 4 169 1 153 1 162 2 170 1 154 1 163 2 172 1 155 4 164 3 173 1 156 3 165 1 157 1 166 1 Total 40 O processo dado é ainda inconveniente, já que exige muito espaço, mesmo quando o número de valores da variável é de tamanho razoável. Sendo possível, a solução mais aceitável, pela própria natureza da variável contínua, é o agrupamento em vários intervalos. Assim, se um dos intervalos for, por exemplo, 154 158 (154 ≤ x< 158), em vez de dizermos que a estatura de 1 aluno é 154 cm; de 4 alunos, 155 cm; de 3 alunos, 156 cm; e de 1 aluno, 157 cm, diremos que 9 alunos têm estaturas entre 154, inclusive, e 158 cm, exclusive. Deste modo, estaremos agrupando os valores da variável em intervalos, sendo que, em Estatística, preferimos chamar os intervalos de classes. O símbolo ٟ será muito utilizado e significa que incluímos o limite inferior do intervalo e excluímos o limite superior do intervalo. Chamando de frequência de uma classe o número de valores da variável pertencentes à classe, os dados da tabela acima podem ser dispostos como na próxima tabela, denominada distribuição de frequência com intervalos de classe: Estaturas de 40 alunos do Ponto dos Concursos Estaturas (cm) Frequência 150 154 4 154 158 9 158 162 11 162 166 8 166 170 5 170 174 3 CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 8 www.pontodosconcursos.com.br Total 40 Ao agruparmos os valores da variável em classes, ganhamos em simplicidade, mas perdemos em pormenores. Não sabemos mais qual a altura exata de cada um dos alunos. O que pretendemos com a construção dessa nova tabela, é realçar o que há de essencial nos dados e, também tornar possível o uso de técnicas analíticas para sua total descrição, até porque a Estatística tem por finalidade específica analisar o conjunto de valores, desinteressando-se por casos isolados. Analisemos, agora, detalhadamente, cada um dos elementos de uma distribuição de frequências. Elementos de uma distribuição de frequência Estaturas de 40 alunos Ponto dos Concursos Estaturas (cm) Frequência 150ٟ154 4 154ٟ158 9 158ٟ162 11 162ٟ166 8 166ٟ170 5 170ٟ174 3 Total 40 Classe É cada um dos grupos ou intervalos obtidos a partir do agrupamento ou conjunto de dados. Por exemplo, a terceira classe é 158ٟ162. Limites de classe Denominamos limites de classe os extremos de cada classe. O menor número é o limite inferior da classe ( infl ) e o maior número, o limite superior da classe ( supl ). Na segunda classe, por exemplo, temos: CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 9 www.pontodosconcursos.com.br inf 154l = e sup 158l = Amplitude de um intervalo de classe Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do intervalo que define a classe. É obtida pela diferença entre os limites superior e inferior dessa classe e designamos por h . Assim, sup infh l l= − Por exemplo, na terceira classe da tabela acima, temos: 162 158 4h = − = Amplitude total da Distribuição Amplitude total da distribuição (AT) é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo). máx mínAT l l= − Em nosso exemplo, temos: 174 150 24 24AT AT cm= − = ⇒ = É evidente que, se as classes possuem o mesmo intervalo, verificamos a rela AT K h= ⋅ . Essa expressão é de fácil compreensão, visto que são 6 classes e que a amplitude de cada classe é igual a 4. Assim, a amplitude total é igual a 6 x 4 = 24. Ponto médio de uma classe Ponto médio de uma classe ( ix ) é, como o próprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais. Para obtermos o ponto médio de uma classe, calculamos a média aritmética dos limites da classe. inf suplim lim 2 i i ix += Assim, o ponto médio da quarta classe, em nosso exemplo é: CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 10 www.pontodosconcursos.com.br4 4inf sup 4 4 lim lim 162 166 164 2 2 x x + += ⇒ = = 4 164x cm= O ponto médio de uma classe é o valor que a representa. Se as amplitudes dos intervalos de classes forem constantes (como aconteceu no nosso exemplo), podemos calcular os pontos médios das classes da seguinte maneira: i) Calculamos o primeiro ponto médio. ii) Para calcular os próximos pontos médios, basta adicionar a amplitude de cada classe ao ponto médio da classe anterior. Dessa forma, como o primeiro ponto médio é 152 cm, o próximo ponto médio é 152 + 4 = 156. O terceiro ponto médio é 156 + 4 = 160 cm. Estaturas (cm) Xi 150ٟ154 152 154ٟ158 156 158ٟ162 160 162ٟ166 164 166ٟ170 168 170ٟ174 172 Tipos de frequências Frequências simples ou absolutas ( if ) São os valores que realmente representam o número de dados de cada classe. A soma das freqüências simples é igual ao número total dos dados. 1 k i i f n = =∑ O símbolo ∑ significa somatório. Nesse caso, como k = 6 (número de classes), então CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 11 www.pontodosconcursos.com.br ݂ ୀଵ ݏ݂݅݃݊݅݅ܿܽ ݍݑ݁ í݊݀݅ܿ݁ ݅ ݒܽݎ݅ܽ ݀݁ 1 ܽ 6. ݂ ୀଵ ൌ ଵ݂ ଶ݂ ଷ݂ ସ݂ ହ݂ ݂ ൌ 4 9 11 8 5 3 ൌ 40 Frequências relativas ( ifr ) São os valores das razões entre as frequências simples e a frequência total, normalmente expressas em porcentagem. i iffr n = Lembre-se que para transformar qualquer fração para a forma percentual devemos multiplicá-la por 100%. No nosso exemplo, a freqüência relativa da terceira classe é: 3 3 3 11 100% 27,5% 27,5% 40 40 ffr fr= = ⋅ = ∴ = Evidentemente o somatório das frequências relativas é igual a 1 (100%). O propósito das frequências relativas é o de permitir a análise ou facilitar as comparações de cada classe com o total de observações. Frequência absoluta acumulada crescente – “abaixo de” ( fac ) É o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe. 1 2 ...i ifac f f f= + + + O procedimento para o cálculo desta frequência é o seguinte: i) Repete-se a frequência absoluta da primeira classe. ii) Para calcular a próxima frequência acumulada, devemos somar a frequência acumulada anterior com a frequência absoluta da classe correspondente. CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 12 www.pontodosconcursos.com.br Estaturas (cm) if fac 150 154 4 4 154 158 9 13 158 162 11 24 162 166 8 32 166 170 5 37 170 174 3 40 Total 40 O que significa existirem 24 alunos com estatura abaixo de 162 cm (limite superior da terceira classe). Frequência absoluta acumulada decrescente ( fad ) É o total das frequências de todos os valores superiores ao limite inferior do intervalo de uma dada classe. 1 ...i i i kfad f f f+= + + + O procedimento para o cálculo desta frequência é o seguinte: i) Repete-se a frequência absoluta da última classe. ii) Para calcular a próxima frequência acumulada (de baixo para cima), devemos somar a frequência acumulada anterior com a frequência absoluta da classe correspondente. CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 13 www.pontodosconcursos.com.br Estaturas (cm) if fad 150 154 4 40 154 158 9 36 158 162 11 27 162 166 8 16 166 170 5 8 170 174 3 3 Total 40 O que significa existirem 27 alunos com estatura igual ou superior a 158 cm (limite inferior da terceira classe). Podemos representar essas frequências acumuladas na forma percentual (frequência relativa acumulada) dividindo pelo total de observações (n) e multiplicando por 100%. 03. (Economista - Instituto de Previdência do Estado de Santa Catarina – FEPESE/2006) Em uma pesquisa realizada em uma empresa prestadora de serviços de limpeza, obteve-se a distribuição de freqüência apresentada na tabela que segue. Analise os dados e assinale a alternativa correta. a) Somente 5% dos empregados recebem o salário com valor superior a R$ 1.400,00. b) O valor médio de salário da empresa é de R$ 799,00. c) A porcentagem de empregados que ganham salários dentro da primeira classe estabelecida é de 10%. CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 14 www.pontodosconcursos.com.br d) A porcentagem de empregados que ganham menos que R$ 1.100,00 por mês é de 50 %. e) 25% dos empregados recebem um salário entre R$ 1.100,00 e R$ 1.200,00. Resolução O total de empregados é igual a 96 (basta somar as frequências das classes). a) Quantos empregados recebem salário com valor superior a R$ 1.400,00? A resposta dessa pergunta é a frequência da última classe: quatro. Como queremos expressar essa quantidade em termos percentuais, devemos dividi-la pelo total de empregados. 4 96 · 100% ؆ 4,17% Falsa b) Ainda não estudamos “valor médio”. Esta alternativa também é falsa. c) Para calcular a porcentagem de empregados que ganham salários dentro da primeira classe, devemos dividir a frequência da primeira classe por 96 e multiplicar por 100%. 8 96 · 100% ؆ 8,34% Falsa d) Os empregados que ganham menos que R$ 1.100,00 pertencem à primeira, segunda, terceira e quarta classes. Temos 8 + 10 + 16 + 14 = 48 empregados (frequência acumulada crescente). Para expressar esse número em termos percentuais, devemos dividir por 96 e multiplicar por 100%. 48 96 · 100% ൌ 50% Verdadeiro! CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 15 www.pontodosconcursos.com.br e) São 25 empregados que recebem o salário entre R$ 1.100,00 e R$ 1.200,00 e esse número, em termos percentuais é 25 96 · 100% ؆ 26,04% Falsa Letra D Medidas de Posição Nos itens anteriores, vimos como resumir um conjunto de dados em tabelas de frequência e também como representá-los graficamente. Agora, a partir dos valores assumidos por uma variável quantitativa, vamos estabelecer medidas correspondentes a um resumo da distribuição de tais valores. Estabeleceremos um valor médio ou central e um valor indicativo do grau de variabilidade ou dispersão em torno do valor central. Como valores centrais vamos estudar a média, a mediana (e outras medidas separatrizes como o decil, quartil, percentil, etc) e a moda. Médias Uma ideia bastante importante é a de média. Estudaremos apenas a média aritmética. Vejamos um exemplo. Sabendo-se que a produção leiteira diária de uma vaca, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, temos para produção média da semana: 10 14 13 15 16 18 12 98 14 7 7 x + + + + + += = = Logo, 14 litrosx = . Ou seja, para calcular a média aritmética de uma lista de números, devemos somar os valores e dividir pela quantidade de dados. 1 2 3 ... nx x x xx n + + + += Em suma, média aritmética para o rol é o quociente da divisão da soma dos valores da variável pelo número deles: CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 16 www.pontodosconcursos.com.br ixx n = ∑ Dados agrupados ●Sem intervalos de classe Consideramos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Nº de meninos fi 0 2 1 6 2 10 3 12 4 4 Neste caso, como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos levaa calcular a média aritmética ponderada, dada pela fórmula: i ix fx n ⋅= ∑ O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna correspondente aos produtos i ix f . ix if i ix f 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 78i ix f =∑ CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 17 www.pontodosconcursos.com.br Î A primeira linha nos diz que existem 2 famílias com nenhum filho homem, totalizando 0 filhos. Î A segunda linha nos diz que existem 6 famílias com 1 filho homem, totalizando 6 filhos homens. Î A terceira linha nos diz que existem 10 famílias com 2 filhos homens, totalizando 20 filhos homens. E assim sucessivamente. No total, essas 34 famílias, possuem juntas 78 filhos homens. Temos, então: 78 2,3 34 i ix fx n = = =∑ Isto é, 2,3 meninosx = Observação: Sendo x uma variável discreta, como interpretar o resultado obtido, 2 meninos e 3 décimos de menino? O valor médio 2,3 meninos sugere, neste caso, que o maior número de famílias tem 2 meninos e 2 meninas, sendo, porém, a tendência geral de uma leve superioridade numérica em relação ao número de meninos. ● Com intervalos de classe Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula i ix fx n = ∑ Onde xi é o ponto médio da classe. Ora, quando temos dados distribuídos em classes perdemos informações. Não temos mais as alturas exatas de cada um dos alunos. Olhe, por exemplo, para a segunda classe da tabela seguinte. Temos 9 alunos com a altura entre 154 (inclusive) e 158 cm. Não sabemos a altura de cada um dos 9 alunos. Convencionamos que os 9 alunos possuem 156 cm (ponto médio da classe). CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 18 www.pontodosconcursos.com.br Estaturas de 40 alunos do Ponto dos Concursos Estaturas (cm) Frequência 150 154 4 154 158 9 158 162 11 162 166 8 166 170 5 170 174 3 Total 40 Vamos, inicialmente, abrir uma coluna para os pontos médios e outra para os produtos i ix f . Estaturas (cm) if ix i ix f 150 154 4 152 608 154 158 9 156 1404 158 162 11 160 1760 162 166 8 164 1312 166 170 5 168 840 170 174 3 172 516 Total 40 6440i ix f =∑ Neste caso, CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 19 www.pontodosconcursos.com.br 6440 161 cm 40 i ix fx n = = =∑ Vamos agora conhecer algumas propriedades importantíssimas sobre média aritmética para que possamos garantir alguma eventual questão teórica sobre este assunto e aproveitar para aprendermos um método mais fácil para calcular média aritmética em distribuições de frequências. Propriedades da média aritmética i) A média aritmética sempre existe e é única. ii) Somando-se (ou subtraindo-se) uma constante c de todos os valores de uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante. iii) Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante c , a média do conjunto fica multiplicada (ou dividida) por essa constante. iv) A soma algébrica dos desvios tomados em relação à média é nula. v) A soma dos quadrados dos desvios tomados em relação à média aritmética é um valor mínimo. Vamos verificar essas propriedades através de exemplos. Consideremos a sequência de dados (2,4,6,8,10,10,12,12), calculemos sua média e verifiquemos as propriedades acima: 2 4 6 8 10 10 12 12 8 x + + + + + + += 8x∴ = Consideremos uma constante c=2. Adicionando essa constante a todos os valores da sequência acima, temos a sequência (4,6,8,10,12,12,14,14). E a nova média será: 4 6 8 10 12 12 14 14' 8 x + + + + + + += ' 10x∴ = Observe que ' 2x x= + . Multipliquemos agora a constante c=2 e obtemos a sequência (4,8,12,16,20,20,24,24) cuja média é: CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 20 www.pontodosconcursos.com.br 4 8 12 16 20 20 24 24'' 8 x + + + + + + += '' 16x∴ = Observe que '' 2x x= ⋅ . Ainda trabalhando na sequência (2,4,6,8,10,10,12,12). Sabemos que a média aritmética desse conjunto de dados é 8x = . Denominamos desvio em relação à média a diferença entre cada elemento de um conjunto de valores e a média aritmética. Para o exemplo dado, temos: 1 1 5 5 2 2 6 6 3 3 7 7 4 4 8 8 6 2 4 2 2 4 0 4 d x x d x x d x x d x x d x x d x x d x x d x x = − = − = − = = − = − = − = = − = − = − = = − = = − = Facilmente verificamos que a soma dos desvios em relação à média é igual a zero. De fato, 6 4 2 0 2 2 4 0id =− − − + + + + =∑ Finalmente, verifiquemos a 5ª propriedade. Calculemos a soma dos quadrados dos desvios em relação à média aritmética: 2 2 2 2 2 2 2 2 2( 6) ( 4) ( 2) 0 2 2 4 4id = − + − + − + + + + +∑ 2 96id =∑ A propriedade nos diz que, para este conjunto A, o valor 96 é um valor mínimo. Isso porque, se construirmos um conjunto dos desvios 'id formado pela diferença entre os elementos ix do conjunto e uma constante que não seja a média, ou seja, um conjunto dos desvios em torno de um valor qualquer diferente da média e, feito isso, acharmos o conjunto 2( ')id e em seguida calcularmos o seu somatório 2( ')id∑ , este último valor será maior do que 96. Por exemplo, calculemos a soma dos quadrados dos desvios em relação ao número 5 (diferente da média aritmética 8). 2 2 2 2 2 2 2 2 2( ') ( 3) ( 1) 1 3 5 5 7 7id = − + − + + + + + +∑ 2( ') 168id =∑ CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 21 www.pontodosconcursos.com.br Assim, 2 2( ') ( )i id d>∑ ∑ . De posse dessas propriedades, vamos aprender um método simplificado (através de uma questão resolvida) para o cálculo da média aritmética em distribuições de frequências. Esse método só é válido nos casos em que as amplitudes das classes são constantes! Cálculo Simplificado da Média Aritmética 04. (PETROBRAS 2008 – Administrador Júnior – CESGRANRIO) A tabela abaixo apresenta os pesos de um grupo de pessoas e suas respectivas frequências. Não há observações coincidentes com os extremos das classes. Classes (em kgf) Frequências 40 – 50 2 50 – 60 5 60 – 70 7 70 – 80 8 80 – 90 3 O peso médio do conjunto de pessoas, em kgf, é (A) 60 (B) 65 (C) 67 (D) 70 (E) 75 Resolução I Para calcular a média aritmética de uma distribuição de frequências, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio. CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 22 www.pontodosconcursos.com.br Abriremos inicialmente uma coluna para os pontos médios das classes (xi) e em seguida multiplicaremos esses valores pelas suas respectivas frequências. O ponto médio é a média aritmética dos extremos da classe. Por exemplo, o ponto médio da primeira classe é 40 50 90 45 2 2 + = = . Classes (em kgf) Frequências xi xi.fi 40 – 50 2 45 90 50 – 60 5 55 275 60 – 70 7 65 455 70 – 80 8 75 600 80 – 90 3 85 255 Basta-nos agora somar os valores da coluna i ix f e dividir pela quantidade de observações. 90 275 455 600 255 1675 67 2 5 7 8 3 25 i ix fx kgf n + + + += = = =+ + + + ∑ Letra C Resolução II Baseado nas propriedades da média aritmética que descrevi na anteriormente, podemosagora resolver essa questão usando um artifício: calcular a média com o auxílio da variável transformada. Este método que irei descrever só poderá ser utilizado se as amplitudes de TODAS classes forem iguais. No nosso exemplo, as amplitudes de todas as classes são iguais a 10 kgf (50 – 40 = 60 – 50 = ... = 90 – 80 = 10). Média aritmética i) Somando-se (ou subtraindo-se) uma constante qualquer de todos os valores de uma variável, a média do conjunto fica aumentada (ou CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 23 www.pontodosconcursos.com.br diminuída) dessa constante. ii) Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante qualquer, a média do conjunto fica multiplicada (ou dividida) por essa constante. A mudança de variável será feita da seguinte forma: subtrairemos certa constante a todos os valores da variável. Assim, a média aritmética também será subtraída. Em seguida, dividiremos por outra constante todos os valores obtidos. Assim, a média aritmética será dividida por essa constante. A constante que iremos subtrair será qualquer um dos pontos médios. A constante que iremos dividir será a amplitude das classes. Daremos origem a uma variável Y definida por iX XY h −= , onde Xi é o ponto médio de uma classe qualquer e h é amplitude das classes. Daremos preferência ao ponto médio da primeira classe! Dessa forma, a variável transformada será 45 10 XY −= . Assim, 1 45 45 0 10 Y −= = 2 55 45 110Y −= = 3 65 45 210Y −= = 4 75 45 3 10 Y −= = 5 85 45 410Y −= = Não foi coincidência!! Se fizermos essa mudança de variável (subtrair o ponto médio da primeira classe e dividir pela amplitude das classes), a variável transformada sempre assumirá os valores 0,1,2,3,4,... Construímos a seguinte tabela: yi Frequências 0 2 1 5 2 7 3 8 4 3 CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 24 www.pontodosconcursos.com.br Calcularemos a média aritmética da variável transformada Y. Para isso, multiplicaremos os valores obtidos pelas suas respectivas frequências: yi Frequências yi.fi 0 2 0 1 5 5 2 7 14 3 8 24 4 3 12 A média será 0 5 14 24 12 55 2, 2 2 5 7 8 3 25 i iy fy kgf n + + + += = = =+ + + + ∑ . Essa é a média da variável transformada Y! Se 45 10 XY −= , então concluímos que 10 45X Y= ⋅ + . Agora aplicamos as propriedades da média aritmética. A média de X será a média de Y multiplicada por 10 e adicionada 45 unidades. Se X aY b= + , então X aY b= + 10 2,2 45 67X kgf= ⋅ + = . Letra C Deixe-me resumir o método (admitindo que escolheremos o primeiro ponto médio para a mudança de variável e que as amplitudes de todas as classes são iguais): i) Construa a coluna da variável transformada Y, constituída pelos números naturais 0,1,2,3,4,5... (Você não precisa fazer o cálculo para descobrir os valores da variável Y. Eles sempre assumirão esses valores.) CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 25 www.pontodosconcursos.com.br ii) Multiplique os valores da variável transformada pelas respectivas frequências, some os valores e divida por n (n é o somatório das frequências). Assim, calculamos a média da variável transformada. iii) Para calcular a média da variável original, devemos multiplicar a média aritmética encontrada pela amplitude e somar o ponto médio da primeira classe. Vamos resolver novamente a questão utilizando o dispositivo prático. Classes (em kgf) Frequências 40 – 50 2 50 – 60 5 60 – 70 7 70 – 80 8 80 – 90 3 Abrimos a coluna da variável transformada e multiplicamos pelas respectivas frequências. Classes (em kgf) Frequências yi yi.fi 40 – 50 2 0 2x0=0 50 – 60 5 1 5x1=5 60 – 70 7 2 7x2=14 70 – 80 8 3 8x3=24 80 – 90 3 4 3x4=12 0 5 14 24 12 55 2, 2 2 5 7 8 3 25 i iy fy kgf n + + + += = = =+ + + + ∑ Agora, multiplicamos esse valor pela amplitude dos intervalos (10) e adicionamos o ponto médio da primeira classe (45). 10 2,2 45 67X kgf= ⋅ + = CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 26 www.pontodosconcursos.com.br Vamos calcular novamente a média aritmética das estaturas dos 40 alunos do Ponto dos Concursos. Estaturas de 40 alunos do Ponto dos Concursos Estaturas (cm) Frequência 150 154 4 154 158 9 158 162 11 162 166 8 166 170 5 170 174 3 Total 40 Já que as amplitudes são constantes (154 – 150 = ... = 174 -170 = 4 ), podemos aplicar o dispositivo prático com o auxílio da variável transformada. Abrimos a coluna da variável transformada e multiplicamos pelas respectivas frequências. Estaturas (cm) if iy i iy f⋅ 150 154 4 0 4 x 0 = 0 154 158 9 1 9 x 1 = 9 158 162 11 2 11 x 2 = 22 162 166 8 3 8 x 3 = 24 166 170 5 4 5 x 4 = 20 170 174 3 5 3 x 5 =15 Total 40 90i iy f⋅ =∑ CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 27 www.pontodosconcursos.com.br 90 2, 25 40 i iy fy n = = =∑ Agora, multiplicamos esse valor pela amplitude dos intervalos (4) e adicionamos o ponto médio da primeira classe ( 150 154 152 2 + = ). 4 2,25 152 161X cm= ⋅ + = . 05. (Auditor IBGE – CESGRANRIO 2010) A tabela abaixo apresenta a distribuição de frequências das idades de um grupo de crianças. Classes (em anos) fi 0 �- 2 5 2 �- 4 2 4 �- 6 4 6 �- 8 2 8 �- 10 7 A média das idades dessas crianças, em anos, é (A) 5,0 (B) 5,2 (C) 5,4 (D) 5,6 (E) 5,8 Resolução Já que as amplitudes são constantes (2 – 0 = 4 – 2 = ... = 10 – 8 = 2), podemos calcular a média aritmética com o auxílio da variável transformada. CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 28 www.pontodosconcursos.com.br i) Construa a coluna da variável transformada Y, constituída pelos números naturais 0,1,2,3,4,5... ii) Multiplique os valores da variável transformada pelas respectivas frequências, some os valores e divida por n (n é o somatório das frequências). Assim, calculamos a média da variável transformada. iii) Para calcular a média da variável original, devemos multiplicar a média aritmética encontrada pela amplitude e somar o ponto médio da primeira classe. yi fi i iy f⋅ 0 5 0 1 2 2 2 4 8 3 2 6 4 7 28 Total 20 44 44 2, 2 20 i iy fy n = = =∑ Agora, multiplicamos esse valor pela amplitude dos intervalos (2) e adicionamos o ponto médio da primeira classe ( 0 2 1 2 + = ). 2 2, 2 1 5,4X = ⋅ + = . Letra C 06. (Estatístico – Pref. Manaus 2004 CESGRANRIO) Analise as afirmativas a seguir, a respeito da média aritmética. I - a soma dos resíduos em relação à média aritmética é sempre igual a zero; II - é em relação à média aritmética que a soma dos valores absolutos dos resíduos é mínima; CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 29 www.pontodosconcursos.com.br III - é em relação à média aritmética que a soma dos quadrados dos resíduos é mínima. Está(ão) correta(s) a(s) afirmativa(s): (A) II, somente. (B) I e II somente. (C) I e III somente. (D) II e III somente. (E) I, II e III. Resolução Questão puramente teórica! Uma digna aula sobre média aritmética. Vamos analisar cada um dos itens: I. A soma dos resíduos em relação à média aritmética é sempre igual a zero. (VERDADEIRO)Já justifiquei essa propriedade com um exemplo. Ei-lo novamente. Consideremos a sequência de dados (2,4,6,8,10,10,12,12). A média aritmética é dada por 2 4 6 8 10 10 12 12 8 x + + + + + + += 8x∴ = Sabemos que a média aritmética desse conjunto de dados é 8x = . Denominamos desvio ou resíduo em relação à média a diferença entre cada elemento de um conjunto de valores e a média aritmética. Para o exemplo dado, temos: 1 1 5 5 2 2 6 6 3 3 7 7 4 4 8 8 6 2 4 2 2 4 0 4 d x x d x x d x x d x x d x x d x x d x x d x x = − = − = − = = − = − = − = = − = − = − = = − = = − = CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 30 www.pontodosconcursos.com.br Facilmente verificamos que a soma dos desvios em relação à média é igual a zero. De fato, 6 4 2 0 2 2 4 0id =− − − + + + + =∑ . Obviamente essa não foi uma demonstração matemática. Apenas ilustrei a propriedade através de um exemplo. De fato, qualquer que seja a distribuição de dados, a soma dos desvios em relação à média sempre é igual a zero! II - é em relação à média aritmética que a soma dos valores absolutos dos resíduos é mínima. (FALSO) A proposição é falsa, pois é em relação à mediana (estudaremos ainda nesta aula) que a soma dos valores absolutos dos resíduos é mínima. III - é em relação à média aritmética que a soma dos quadrados dos resíduos é mínima. (VERDADEIRO) Voltemos ao nosso exemplo: a sequência (2,4,6,8,10,10,12,12). Os desvios em relação à media já foram calculados. Para calcular a soma dos quadrados, devemos elevar cada resíduo ao quadrado e depois somar. 2 2 2 2 2 2 2 2 2( 6) ( 4) ( 2) 0 2 2 4 4id = − + − + − + + + + +∑ 2 96id =∑ A propriedade nos diz que, para este conjunto A, o valor 96 é um valor mínimo. Isso porque, se construirmos um conjunto dos desvios 'id formado pela diferença entre os elementos ix do conjunto e uma constante que não seja a média, ou seja, um conjunto dos desvios em torno de um valor qualquer diferente da média e, feito isso, acharmos o conjunto 2( ')id e em seguida calcularmos o seu somatório 2( ')id∑ , este último valor será maior do que 96. Por exemplo, calculemos a soma dos quadrados dos desvios em relação ao número 5 (diferente da média aritmética 8). 2 2 2 2 2 2 2 2 2( ') ( 3) ( 1) 1 3 5 5 7 7id = − + − + + + + + +∑ 2( ') 168id =∑ CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 31 www.pontodosconcursos.com.br Assim, 2 2( ') ( )i id d>∑ ∑ . Letra C 07. (MPE-RO CESGRANRIO 2005) A tabela apresenta uma distribuição de frequência dos salários dos 200 empregados de certa empresa. Salário (R$) Frequência 260 – 520 50 520 – 1040 100 1040 – 1560 30 1560 - 2600 20 O salário médio, aproximadamente, vale: (A) R$ 600,00 (B) R$ 780,00 (C) R$ 890,50 (D) R$ 1 040,00 (E) R$ 1430,00 Nessa questão as amplitudes não são constantes!! Portanto, não poderemos calcular a média aritmética com o auxílio da variável transformada. Para calcular a média aritmética de uma distribuição de frequências, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio. Abriremos inicialmente uma coluna para os pontos médios das classes (xi) e em seguida multiplicaremos esses valores pelas suas respectivas frequências. CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 32 www.pontodosconcursos.com.br Lembre-se que para calcular o ponto médio das classes, basta calcular a média aritmética dos extremos das classes, por exemplo, o primeiro ponto médio é 260 520 390 2 + = . 19.500 78.000 39.000 41.600 178.100 890,50 200 200 i ix fx n + + += = = =∑ Letra C 08. (TCE/SC 2006 – FEPESE) Para um estudo sobre bolsas escolares a serem distribuídas em determinada região realizou-se uma pesquisa com 50 famílias, apurando-se o número de filhos de cada uma delas. Os dados estão representados na tabela abaixo: Assinale a alternativa que representa a média do número de filhos na pesquisa realizada. a) 1,94 Salário (R$) xi fi xi.fi 260 – 520 390 50 19.500 520 – 1040 780 100 78.000 1040 – 1560 1300 30 39.000 1560 - 2600 2080 20 41.600 CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 33 www.pontodosconcursos.com.br b) 0,34 c) 1,62 d) 0,62 e) 1,34 Resolução Neste caso, como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: i ix fx n ⋅= ∑ O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna correspondente aos produtos i ix f . ix if i ix f 0 14 0 1 16 16 2 11 22 3 7 21 4 2 8 ݔ ݂ ൌ 67 Î A primeira linha nos diz que existem 14 famílias com nenhum filho, totalizando 0 filhos. Î A segunda linha nos diz que existem 16 famílias com 1 filho, totalizando 16 filhos. Î A terceira linha nos diz que existem 11 famílias com 2 filhos, totalizando 22 filhos homens. E assim sucessivamente. No total, essas 50 famílias, possuem juntas 67 filhos . Temos, então: CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 34 www.pontodosconcursos.com.br ݔҧ ൌ ∑ ݔ ݂ ݊ ൌ 67 50 ൌ 1,34 Letra E 09. (TCE/SC 2006 – FEPESE) Na Figura 1 é possível visualizar o resultado de uma pesquisa sobre o tempo despendido pelos funcionários de uma empresa no deslocamento de suas residências até o local de trabalho. Assinale a alternativa que representa o tempo médio que os funcionários levam para se deslocarem de suas residências até a empresa. a) 9,84 minutos b) 7,84 minutos c) 5,84 minutos d) 8 minutos e) 4 minutos Resolução Podemos resolver essa questão pelo “método tradicional” (pelos pontos médios) ou pelo método simplificado. Nesta questão, os valores são tão “pequenos” (e, além disso, são inteiros) que não vale a pena fazer pelo método simplificado. Teríamos apenas trabalho em construir a distribuição de frequências. O ponto médio da CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 35 www.pontodosconcursos.com.br Æ primeira classe é 2. Æ segunda classe é 6. Æ terceira classe é 10. Æ quarta classe é 14. Devemos multiplicar cada ponto médio pela sua frequência, somar esses valores e dividir pelo total de observações (19+32+33+16=100). Assim, ݔҧ ൌ 2 · 19 6 · 32 10 · 33 14 · 16 100 ൌ 7,84 Letra B Mediana (Md) A mediana é outra medida de posição definida como número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. Dados não-agrupados Dada uma série de valores, como, por exemplo: 5,10,13,12,7,8,4,3,9. De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (colocar os dados brutos em rol) dos valores. 3,4,5,7,8,9,10,12,13. Em seguida, tomamos aquele valor central que apresenta o mesmo número de elementos à direita e à esquerda. Em nosso exemplo, esse valor é o número 8, já que, nessa série, há 4 elementos acima dele e quatro abaixo. Temos então, Md=8. CURSO ON-LINE – MATEMÁTICAE RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 36 www.pontodosconcursos.com.br Se, porém a série dada tiver um número par de termos, a mediana será, por definição, qualquer dos números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto médio. Assim, a série de valores 2,6,7,10,12,13,18,21 tem para mediana a média aritmética entre 10 e 12. Logo, 10 12 11 2 11 Md Md += = ∴ = Verificamos que, estando ordenados os valores de uma série e sendo n o número de elementos da série, o valor mediano será: - o termo de ordem 1 2 n + , se n for ímpar. - a média aritmética dos termos de ordem e 1 2 2 n n + , se n for par. Observações: i) O valor da mediana pode coincidir ou não com um elemento da série. Quando o número de elementos da série é ímpar, há coincidência. O mesmo não acontece, porém, quando esse número é par. ii) A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa é uma das diferenças marcantes entre a mediana e a média (que se deixa influenciar, e muito, pelos valores extremos). iii) A mediana é também designada por valor mediano. Dados Agrupados Sem intervalos de classe Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada. Xi fi fac 2 2 2 4 6 8 CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 37 www.pontodosconcursos.com.br 6 10 18 8 12 30 10 9 39 Verificamos facilmente que o número de elementos da distribuição é ímpar. Desta forma, temos apenas uma posição central. Posição central: 39 1 20 2 + = Temos então que a mediana será o termo da 20ª posição. Através da frequência acumulada temos que Md=8. Xi fi fac 2 2 2 4 6 8 6 10 18 8 12 30 10 10 40 Neste segundo exemplo, o número de elementos da distribuição é par, e, como vimos, teremos duas posições centrais: 40 =20 e 20 1 21 2 + = Novamente, através da frequência acumulada verificamos que as duas posições centrais são iguais a 8. Assim, 8 8 8 2 Md += = . E como último exemplo: Xi fi fac 2 2 2 4 6 8 CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 38 www.pontodosconcursos.com.br 6 10 18 8 12 30 10 6 36 Como o número de elementos é par, teremos duas posições centrais. 36 =18 e 18 1 19 2 + = . O termo de posição 18 é igual a 6 e o termo de posição 19 é igual a 8. Temos então que a mediana será 6 8 7 2 Md += = . 10. (Economista - Instituto de Previdência do Estado de Santa Catarina – FEPESE/2006) Ao fazer um levantamento amostral do preço de combustível em 5 postos de abastecimento, foram obtidos os seguintes valores (em reais) para o litro da gasolina: 2,57; 2,36; 2,60; 2,37 e 2,44. Diante desses dados assinale a frase correta: a) A diferença entre a média e a mediana é de R$ 0,03. b) A média é uma medida que não leva em contra todos os valores do conjunto que está sendo analisado, entretanto, para os dados apresentados é uma alternativa para a análise estatística dos resultados, pois a amplitude total do conjunto de dados é bastante pequena. c) A mediana dos dados obtidos é R$ 2,60. d) A média é uma medida preferida nos estudos estatísticos, pois ela não é afetada pelos maiores valores do conjunto de valores dados. e) Como todos os valores obtidos são diferentes pode-se afirmar que os dados obtidos tem 5 valores modais. Resolução Para calcular a média aritmética basta somar os valores e dividir por 5. CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 39 www.pontodosconcursos.com.br ݔҧ ൌ 2,57 2,36 2,60 2,37 2,44 5 ൌ 2,468 Para calcular a mediana devemos dispor os dados em rol (ordem crescente ou decrescente) e verificar o termo que fica “no meio”. Rol: 2,36 ; 2,37 ; 2,44 ; 2,57 ; 2,60 Logo, a mediana é 2,44. a) A diferença entre a média e a mediana é de 2,468 – 2,44 = 0,028. A alternativa A é falsa. Porém, o gabarito oficial foi justamente esta alternativa. Considerando que a moeda Real trabalha com 2 casas decimais, “considerando” a média 2,47, então a diferença seria 2,47 - 2,44 = 0,03. Esta é a alternativa menos errada. b) O cálculo da média leva em consideração todos os valores do conjunto. Falsa c) Falsa, pois a mediana é 2,44. d) Falsa. A média é afetada pelos maiores valores do conjunto de valores dados. Por exemplo, temos os salários de 5 pessoas: R$ 200,00 ; R$ 150,00 ; R$ 400,00 ; R$ 550,00 ; R$ 24.700,00 A média é igual a R$ 5.200,00 (valor bastante afetado pelo valor extremo R$ 24.700,00). “Estatística: a ciência que diz que se eu comi um frango e tu não comestes nenhum, teremos comido, em média, meio frango cada um.” Pitigrilli – Italiano (1893-1975)-Escritor e) Ainda não estudamos moda estatística. Mas já adiantando: quando todos os dados são diferentes, a distribuição é denominada amodal (sem moda). Falsa. Em tempo: moda é o termo que aparece com maior frequência em um rol. Letra A (gabarito oficial (menos errada)). E quanto ao cálculo da mediana em distribuições de frequências? Vejamos através das próximas questões resolvidas. CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 40 www.pontodosconcursos.com.br 11. (PETROBRAS 2008 – Administrador Júnior – CESGRANRIO) A tabela abaixo apresenta os pesos de um grupo de pessoas e suas respectivas frequências. Não há observações coincidentes com os extremos das classes. O valor aproximado, em kgf, do peso mediano do conjunto de pessoas é (A) 67 (B) 68 (C) 69 (D) 70 (E) 71 Resolução A mediana é outra medida de posição definida como número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. No cálculo da mediana em uma distribuição de frequência não teremos a preocupação de determinarmos se o número de elementos é par ou ímpar. Os passos básicos para determinar a mediana de uma distribuição serão: i) Descobrir a classe mediana. ii) Aplicar a fórmula da mediana para distribuição de frequências. Para determinarmos a classe mediana, deveremos calcular o valor 2 n . Em seguida comparamos esse valor com os valores da frequência absoluta acumulada crescente. Procuraremos a classe cuja frequência acumulada seja maior ou igual ao valor de 2 n . No nosso caso, n=2+5+7+8+3=25. Assim, 25 12,5 2 2 n = = . Devemos construir a coluna de frequência absoluta acumulada crescente. Classes (em kgf) Frequências 40 – 50 2 50 – 60 5 60 – 70 7 70 – 80 8 80 – 90 3 CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 41 www.pontodosconcursos.com.br E como se constrói essa coluna? Para a primeira classe devemos simplesmente repetir a frequência absoluta. Para as outras, devemos somar a frequência absoluta da classe com a frequência acumulada anterior. Deixe-me mostrar no exemplo: Ou seja, Para determinar a classe mediana, devemos comparar cada uma das frequências acumuladas com o valor 12,5. Quando encontrarmos o primeiro valor que for maior ou igual a 12,5 teremos determinado a classe mediana. Classes(em kgf) Frequências Fac 40 – 50 2 2 50 – 60 5 2+5=7 60 – 70 7 7+7=14 70 – 80 8 8+14=22 80 – 90 3 3+22=25 Classes (em kgf) Frequências Fac 40 – 50 2 2 50 – 60 5 7 60 – 70 7 14 70 – 80 8 22 80 – 90 3 25 Classes (em kgf) Frequências Fac CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 42 www.pontodosconcursos.com.br Estamos prontos para aplicarmos a fórmula da mediana. inf 2 ANT i n fac Md l h f ⎡ ⎤−⎢ ⎥= + ⋅⎢ ⎥⎢ ⎥⎣ ⎦ Precisaremos dos seguintes valores: Æ Limite inferior da classe mediana ( inf 60l = ). Æ 12,5 2 n = ÆFrequência acumulada da classe anterior à classe mediana ( 7ANTfac = ). Æ Frequência absoluta da classe mediana ( 7if = ) Æ Amplitude da classe mediana ( 70 60 10h = − = ) A mediana é dada por: inf 12,5 72 60 10 67,85 68 7 ANT i n fac Md l h cm f ⎡ ⎤−⎢ ⎥ −⎡ ⎤= + ⋅ = + ⋅ ≅ ≅⎢ ⎥ ⎢ ⎥⎣ ⎦⎢ ⎥⎣ ⎦ Letra B 12. (Auditor IBGE – CESGRANRIO 2010) A tabela abaixo apresenta a distribuição de frequências das idades de um grupo de crianças. 40 – 50 2 2 50 – 60 5 7 60 – 70 7 14 70 – 80 8 22 80 – 90 3 25 Classe mediana (14 > 12,5) CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 43 www.pontodosconcursos.com.br Classes (em anos) fi 0 �- 2 5 2 �- 4 2 4 �- 6 4 6 �- 8 2 8 �- 10 7 A mediana da distribuição de frequências apresentada é (A) 5,5 (B) 5,6 (C) 5,7 (D) 5,8 (E) 5,9 Resolução Os passos básicos para determinar a mediana de uma distribuição serão: i) Descobrir a classe mediana. ii) Aplicar a fórmula da mediana para distribuição de frequências. Para determinarmos a classe mediana, deveremos calcular o valor 2 n . Em seguida comparamos esse valor com os valores da frequência absoluta acumulada crescente. Procuraremos a classe cuja frequência acumulada seja maior ou igual ao valor de 2 n . No nosso caso, n = 20. Logo, 20 10 2 2 n = = . Devemos construir a coluna de frequência absoluta acumulada crescente. Classes (em anos) fi Fac 0 �- 2 5 5 2 �- 4 2 7 4 �- 6 4 11 CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 44 www.pontodosconcursos.com.br Vamos procurar a classe mediana. Basta olhar para a coluna de frequências acumuladas e comparar com o valor 10 2 n = . A primeira frequência acumulada que for maior ou igual a 10 caracterizará a classe mediana. Verificamos facilmente que 11>10. Coloquei em vermelho os valores que utilizaremos na fórmula da mediana. Precisaremos dos seguintes valores: Æ Limite inferior da classe mediana ( inf 4l = ). Æ 10 2 n = ÆFrequência acumulada da classe anterior à classe mediana ( 7ANTfac = ). 6 �- 8 2 13 8 �- 10 7 20 Classes (em anos) fi Fac 0 �- 2 5 5 2 �- 4 2 7 4 �- 6 4 11 6 �- 8 2 13 8 �- 10 7 20 Classe mediana (11 > 10) CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 45 www.pontodosconcursos.com.br Æ Frequência absoluta da classe mediana ( 4if = ) Æ Amplitude da classe mediana ( 6 4 2h = − = ) A mediana é dada por: inf 10 72 4 2 5,5 4 ANT i n fac Md l h f ⎡ ⎤−⎢ ⎥ −⎡ ⎤= + ⋅ = + ⋅ =⎢ ⎥ ⎢ ⎥⎣ ⎦⎢ ⎥⎣ ⎦ Letra A (MPE-RO CESGRANRIO 2005) O enunciado a seguir refere-se às questões de números 13 e 14. A tabela apresenta uma distribuição de frequência dos salários dos 200 empregados de certa empresa. Salário (R$) Frequência 260 – 520 50 520 – 1040 100 1040 – 1560 30 1560 - 2600 20 13. O salário mediano vale, aproximadamente: (A) R$ 600,00 (B) R$ 780,00 (C) R$ 890,50 CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 46 www.pontodosconcursos.com.br (D) R$ 1 040,00 (E) R$ 1 430,00 Resolução Os passos básicos para determinar a mediana de uma distribuição serão: i) Descobrir a classe mediana. ii) Aplicar a fórmula da mediana para distribuição de frequências. Para descobrir a classe mediana devemos calcular 2 n . Como n = 200, temos que 100 2 n = . E o que fazer agora? Construir a coluna das frequências acumuladas. Salário (R$) Frequência fac 260 – 520 50 50 520 – 1040 100 150 1040 – 1560 30 180 1560 - 2600 20 200 Novamente em vermelho os valores que utilizaremos na fórmula da mediana. Precisaremos dos seguintes valores: Æ Limite inferior da classe mediana ( inf 520l = ). Æ 100 2 n = ÆFrequência acumulada da classe anterior à classe mediana ( 50ANTfac = ). Æ Frequência absoluta da classe mediana ( 100if = ) Classe mediana (150 > 100) CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 47 www.pontodosconcursos.com.br Æ Amplitude da classe mediana ( 1040 520 520h = − = ). Observe que nessa questão as amplitudes não são constantes. Para o cálculo da mediana deveremos utilizar a amplitude da classe mediana!! Cuidado... A mediana é dada por: inf 100 502 520 520 780 100 ANT i n fac Md l h f ⎡ ⎤−⎢ ⎥ −⎡ ⎤= + ⋅ = + ⋅ =⎢ ⎥ ⎢ ⎥⎣ ⎦⎢ ⎥⎣ ⎦ Letra B 14. O terceiro quartil, aproximadamente, vale: (A) R$ 600,00 (B) R$ 780,00 (C) R$ 890,50 (D) R$ 1 040,00 (E) R$ 1 430,00 Resolução O método para calcular o terceiro quartil (e as outras medidas separatrizes como decis, percentis e os outros quartis) é muito parecido com o da mediana. Em tempo: os decis dividem a distribuição em 10 partes de mesma frequência. Os percentis dividem a distribuição em 100 partes de mesma frequência. Os quartis dividem a distribuição em 4 partes de mesma frequência. A mediana divide a distribuição em 2 partes de mesma frequência. Diferença: ao invés de calcularmos o valor 2 n calcularemos 3 4 n . O denominador é igual a 4 porque trata-se de um quartil (dividimos a distribuição em quatros partes). O numerador é 3n porque estamos calculando o terceiro quartil. Então, a única coisa que vai mudar na fórmula, é que ao invés de utilizarmos 2 n utilizaremos 3 4 n . E para calcular a classe do terceiro quartil deveremos procurar a frequência acumulada que é maior ou igual a 3 4 n . A fórmula do terceiro quartil ficará CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 48 www.pontodosconcursos.com.br 3 inf 3 4 ANT i n fac Q l h f ⎡ ⎤−⎢ ⎥= + ⋅⎢ ⎥⎢ ⎥⎣ ⎦ Já que n = 200, então 3 3 200 150 4 4 n ⋅= = . E o que fazer agora? Construir a coluna das frequências acumuladas. Salário (R$) Frequência fac 260 – 520 50 50 520 – 1040 100 150 1040 – 1560 30 180 1560 - 2600 20 200 Novamente em vermelho os valores que utilizaremos na fórmula da mediana. Precisaremos dos seguintes valores: Æ Limite inferior da classe mediana ( inf 520l = ). Æ 3 150 4 n = Classe do terceiro quartil (150=150) CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 49 www.pontodosconcursos.com.br ÆFrequência acumulada da classe anterior à classe do terceiro quartil ( 50ANTfac = ). Æ Frequência absoluta da classe do terceiro quartil ( 100if = ) Æ Amplitude da classe do terceiro quartil ( 1040 520 520h = − = ). Observe que nessa questão as amplitudes não são constantes. Para o cálculo do terceiro quartil deveremos utilizar a amplitude da classe do terceiro quartil!! Cuidado... O terceiroquartil é dado por: 3 inf 3 150 504 520 520 1040 100 ANT i n fac Q l h f ⎡ ⎤−⎢ ⎥ −⎡ ⎤= + ⋅ = + ⋅ =⎢ ⎥ ⎢ ⎥⎣ ⎦⎢ ⎥⎣ ⎦ Letra D Moda Foi Karl Pearson quem introduziu em Estatística pela primeira vez,no século XIX, o conceito de moda, talvez baseado no próprio significado da palavra. A moda é definida como sendo aquele valor ou valores que ocorrem com maior frequência em um rol. Baseado neste contexto, um conjunto de valores pode apresentar mais de uma moda. Neste caso dizemos ser plurimodal, caso contrário, será unimodal, ou ainda, amodal (quando todos os valores das variáveis em estudo apresentarem uma mesma frequência). i) Para dados não agrupados em classe Para a identificação da moda em um conjunto ordenado de valores não agrupados em classe, basta verificar, no conjunto, aquele valore que aparece com maior frequência. Exemplos: X1={1,2,3,4,5,6} (Conjunto amodal) X2={10,10,12,13,18} Mo=10 (Conjunto Unimodal) CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 50 www.pontodosconcursos.com.br X3={100,100,200,200,300,600} Mo=100 e Mo=200 (Conjunto bimodal) ii) Para dados agrupados – não agrupados em classe Quando os dados estiverem dispostos em uma Tabela de Frequência, não agrupados em classe, a localização da moda é imediata, bastando para isso, verificar na tabela, qual o valor predominante. Estatura (m) Freq. 1,60 3 1,62 8 1,64 12 1,70 20 1,73 10 1,80 7 1,83 3 1,88 1 Na tabela o valor modal é 1,70m, isto porque é o resultado que apresenta o maior número de alunos (20). iii) Dados agrupados em classe Tratando-se de dados agrupados em classe, a moda não é percebida tão facilmente como nos casos anteriores. Para tal, utilizamos diversos processos na sua obtenção. Mas qualquer que seja o processo adotado, o primeiro passo é identificar a classe que contém a maior frequência. A esta classe denominamos classe-modal. Aprenderemos a determinar a moda da distribuição de frequências pelo método da moda bruta, pelo Método de Czuber e pelo Método de King. Se a questão não especificar qual das fórmulas a ser empregada, pedindo apenas que se calcule a moda, usaremos a fórmula de Czuber. CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 51 www.pontodosconcursos.com.br Consequentemente, só empregaremos a fórmula de King quando assim for solicitado expressamente. Moda Bruta De todos os processos, este é o mais elementar, bastando, para isso, tomar o ponto médio da classe modal (aquela que contém a maior frequência). Na próxima tabela, verificamos, de imediato, que a distribuição possui apenas uma Moda e, que ela está contida na classe 4 � 6 chamada Classe Modal. Logo, o ponto médio da classe modal o caso, Nota 5, é conhecida como Moda Bruta. Notas Classe fi 0 � 2 27 2 � 4 16 4 � 6 34 6 � 8 17 8 �10 16 110if =∑ Processo de Czuber O processo utilizado por Czuber leva em consideração as frequências anterior e posterior à Classe Modal. Moc = Moda (Processos de Czuber) 1 máx antf fΔ = − 2 máx postf fΔ = − h = amplitude do intervalo de classe il = Limite inferior da classe modal Assim, a moda de Czuber é dada por CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 52 www.pontodosconcursos.com.br 1 1 2 C iMo l h ⎡ ⎤Δ= + ⋅⎢ ⎥Δ + Δ⎣ ⎦ Observação: A demonstração desta fórmula foi colocada por mim no site do Ponto dos Concursos no link http://www.pontodosconcursos.com.br/artigos3.asp?prof=249&art=5103&idpag=4 No nosso exemplo, 1 2 34 16 18 34 17 17 2 4i h l Δ = − = Δ = − = = = Logo, 184 2 5,0285 18 17 5,0285 C C Mo Mo ⎡ ⎤= + ⋅ =⎢ ⎥+⎣ ⎦ ∴ = Processo de King No processo proposto por King, é considerada a influência sobre a classe modal das freqüências das classes anterior e posterior. A inconveniência deste processo é justamente não levar em consideração a frequência da classe modal. post K i ant post f Mo l h f f ⎡ ⎤= + ⋅⎢ ⎥+⎢ ⎥⎣ ⎦ No nosso exemplo, 17 16 2 4 post ant i f f h l = = = = Logo, CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 53 www.pontodosconcursos.com.br 174 2 5,0303 17 16 5,0303 K K Mo Mo ⎡ ⎤= + ⋅ =⎢ ⎥+⎣ ⎦ ∴ = Propriedades da Moda Somando-se (ou subtraindo-se) uma constante c de todos os valores de uma variável, a moda do conjunto fica aumentada (ou diminuída) dessa constante. Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante c , a moda do conjunto fica multiplicada (ou dividida) por essa constante. 15. (AFRFB 2009 ESAF) Considere a seguinte amostra aleatória das idades em anos completos dos alunos em um curso preparatório. Com relação a essa amostra, marque a única opção correta: 29, 27, 25, 39, 29, 27, 41, 31, 25, 33, 27, 25, 25, 23, 27, 27, 32, 26, 24, 36, 32, 26, 28, 24, 28, 27, 24, 26, 30, 26, 35, 26, 28, 34, 29, 23, 28. a) A média e a mediana das idades são iguais a 27. b) A moda e a média das idades são iguais a 27. c) A mediana das idades é 27 e a média é 26,08. d) A média das idades é 27 e o desvio-padrão é 1,074. e) A moda e a mediana das idades são iguais a 27. Resolução Média aritmética: Rol: 23, 23, 24, 24, 24, 25, 25, 25, 25, 26, 26, 26, 26, 26, 27, 27, 27, 27, 27, 27, 28, 28, 28, 28, 29, 29, 29, 30, 31, 32, 32, 33, 34, 35, 36, 39, 41. A mediana será o termo de ordem 37 1 19º 2 + = . Logo, a mediana é 27. ixx n = ∑ 1052 28,43 37 x = ≅ CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 54 www.pontodosconcursos.com.br A moda é definida como sendo aquele valor ou valores que ocorrem com maior frequência em um rol. A moda é 27. Letra E 16. (AFRF 1998) Os dados seguintes, ordenados do menor para o maior, foram obtidos de uma amostra aleatória, de 50 preços (Xi) de ações, tomadas numa bolsa de valores internacional. A unidade monetária é o dólar americano. 4,5,5,6,6,6,6,7,7,7,7,7,7,8,8,8,8,8,8,8,8,8,9,9,9,9,9,9,10,10,10,10,10,10,10,10,1 1,11,12,12,13,13,14, 15,15,15,16,16,18,23. Assinale a opção que corresponde ao preço modal. a) 8 b) 23 c) 7 d) 10 e) 9 Resolução Questão muito fácil! Basta verificar o valor de maior frequência. Facilmente verifica-se que a moda é 8, pois ele tem a maior frequência (aparece mais vezes). Letra A 17. (AFRF/ESAF/1996) Para efeito desta questão, considere os seguintes dados. DISTRIBUIÇÃO DE FREQUENCIAS DAS IDADES DOS FUNCIONÁRIOS DA EMPRESA ALFA, EM 01.01.90 Classes de Idades (anos) if Pontos Médios (PM) 19,5�24,5 2 22 24,5�29,5 9 27 29,5�34,5 23 32 CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 55 www.pontodosconcursos.com.br 34,5�39,5 29 37 39,5�44,5 18 42 44,5�49,5 12 47 49,5�54,5 7 52 Total 100 Marque a opção que representa a moda das idades dos funcionários em 1º/01/90. a) 35,97 b) 36,26 c) 36,76 d) 37,03 e) 37,31 Resolução O primeiro passo é determinar a classe modal (maior frequência). A classe modal é a quarta classe 34,5�39,5, cuja frequência é 29. A frequência anterior à classe modal é 23, e temos que Δ1=29 – 23 = 6. A frequência posterior à classe modal é 18 e temos que Δ2=29 – 18 = 11. O limite inferior da classe modal é 34,5 e a amplitude da classe modal é 5. Assim, a moda de Czuber será Letra B Medidas de dispersão ou variabilidadeDiscutimos diversas maneiras de obter um valor que fosse representativo para os demais em um dado conjunto. Muitas vezes apenas os cálculos ou apresentações de um valor específico para um conjunto qualquer não são suficientes para caracterizar uma distribuição ou um conjunto de valores. O grau ao qual os dados numéricos tendem a dispersar-se (afastar-se) em torno de um valor chama-se variação ou dispersão dos dados. Dispõe-se de várias medidas de dispersão. Estudaremos as mais importantes. 1 1 2 C iMo l h ⎡ ⎤Δ= + ⋅⎢ ⎥Δ + Δ⎣ ⎦ 634,5 5 36,26 6 11C Mo ⎡ ⎤= + ⋅ =⎢ ⎥+⎣ ⎦ CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 56 www.pontodosconcursos.com.br Desvio Absoluto Médio (Dm) Aprendemos que a soma algébrica dos desvios tomados em relação à média é nula. Assim, não nos importaria “criar” uma medida de dispersão que utilize a soma algébrica dos desvios, pois essa, como sabemos, é sempre zero. Temos duas alternativas a tomar: trocar o sinal dos desvios negativos (calcular o módulo dos desvios) ou elevar os desvios negativos ao quadrado (pois todo número elevado ao quadrado não é negativo). Ao tomar a primeira posição, damos origem ao desvio absoluto médio e ao tomar a segunda posição damos origem à variância. O desvio absoluto médio também é chamado apenas de desvio médio ou desvio absoluto. Desvio médio é a média aritmética dos valores absolutos dos desvios da distribuição, em relação a uma medida de tendência central: média ou mediana. Na presente aula limitar-nos-emos apenas em relação à média aritmética. 1 n i i X X Dm n = − = ∑ Quando os dados se apresentarem ordenados em uma tabela de frequência com dados agrupados em classe ou dados isolados ponderados, utilizaremos a seguinte fórmula: 1 n i i i X X f Dm n = − ⋅ = ∑ Denominamos desvio em relação à média a diferença entre cada elemento de um conjunto de valores e a média aritmética. (2,4,6,8,10,10,12,12) A média aritmética dessa lista de números é igual a 8. Por exemplo, o desvio em relação à média do primeiro número é 2 – 8 = - 6. 1 1 5 5 2 2 6 6 3 3 7 7 4 4 8 8 6 2 4 2 2 4 0 4 d x x d x x d x x d x x d x x d x x d x x d x x = − = − = − = = − = − = − = = − = − = − = = − = = − = CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 57 www.pontodosconcursos.com.br Para calcular o desvio absoluto médio, devemos considerar o valor absoluto (módulo) dos valores acima obtidos. Onde di é a diferença entre cada valor e a média aritmética. Vejamos um exemplo do cálculo do desvio absoluto médio em uma distribuição de frequências. O primeiro passo é calcular a média aritmética da distribuição (se possível utilizando o método simplificado). Em seguida, devemos calcular cada desvio em relação à média, tomar seus valores absolutos, multiplicar cada resultado pela frequência da classe, somar todos os valores e dividir por n. Quando os dados se apresentarem ordenados em uma tabela de frequência com dados agrupados em classe ou dados isolados ponderados, utilizaremos a seguinte fórmula: 1 5 2 6 3 7 4 8 6 2 4 2 2 4 0 4 d d d d d d d d = = = = = = = = idDam n = ∑ 6 4 2 0 2 2 4 4 8 Dam + + + + + + += 3Dam = 1 n i i i X X f Dam n = − ⋅ = ∑ CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 58 www.pontodosconcursos.com.br 18. (AFRF 2002.2/ESAF) O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100, obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes Frequência (f) 29,5-39,5 4 39,5-49,5 8 49,5-59,5 14 59,5-69,5 20 69,5-79,5 26 79,5-89,5 18 89,5-99,5 10 Assinale a opção que corresponde ao desvio absoluto médio do atributo X. a) 16,0 b) 17,0 c) 16,6 d) 18,1 e) 13,0 Resolução O primeiro passo, como foi dito, é calcular a média aritmética da distribuição. Já que as amplitudes são constantes (iguais a 10), então poderemos utilizar o método breve. Lembrando que devemos abrir uma coluna para a variável transformada y, que é formada pela sequência dos números naturais. Classes (f) yi 29,5-39,5 4 0 39,5-49,5 8 1 49,5-59,5 14 2 CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 59 www.pontodosconcursos.com.br 59,5-69,5 20 3 69,5-79,5 26 4 79,5-89,5 18 5 89,5-99,5 10 6 Para calcular a média aritmética, devemos multiplicar os valores da variável transformada pelas suas respectivas frequências. Somar os valores e dividir por “n”. Classes (f) yi yi.f 29,5-39,5 4 0 0 39,5-49,5 8 1 8 49,5-59,5 14 2 28 59,5-69,5 20 3 60 69,5-79,5 26 4 104 79,5-89,5 18 5 90 89,5-99,5 10 6 60 Essa é a média da variável transformada. Para calcular a média da variável original, devemos multiplicar a média aritmética encontrada pela amplitude e somar o ponto médio da primeira classe. 350 3,5 100 y = = 1x y h x= ⋅ + CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 60 www.pontodosconcursos.com.br Para calcular o desvio absoluto médio, devemos calcular o módulo da diferença entre cada ponto médio e a média aritmética. Calculamos o primeiro ponto médio, que é a média aritmética entre 29,5 e 39,5. Logo, o primeiro ponto médio é igual a 34,5. Para calcular os próximos pontos médios, basta adicionar a amplitude das classes. Ou seja, o próximo ponto médio é igual a 34,5 + 10 = 44,5. Classes (f) Xi 29,5-39,5 4 34,5 39,5-49,5 8 44,5 49,5-59,5 14 54,5 59,5-69,5 20 64,5 69,5-79,5 26 74,5 79,5-89,5 18 84,5 89,5-99,5 10 94,5 A média aritmética é igual a 69,5. O desvio da primeira classe é 34,5 – 69,5 = - 35. O módulo desse desvio é 35. Faremos da mesma maneira o cálculo nas próximas classes. Classes (f) Xi │Xi-X│ 29,5-39,5 4 34,5 35 39,5-49,5 8 44,5 25 49,5-59,5 14 54,5 15 59,5-69,5 20 64,5 5 69,5-79,5 26 74,5 5 3,5 10 34,5x = ⋅ + 69,5x = CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 61 www.pontodosconcursos.com.br 79,5-89,5 18 84,5 15 89,5-99,5 10 94,5 25 O próximo passo é multiplicar cada desvio pela sua respectiva frequência. Classes (f) Xi │Xi-X│ │Xi-X│.f 29,5-39,5 4 34,5 35 140 39,5-49,5 8 44,5 25 200 49,5-59,5 14 54,5 15 210 59,5-69,5 20 64,5 5 100 69,5-79,5 26 74,5 5 130 79,5-89,5 18 84,5 15 270 89,5-99,5 10 94,5 25 250 Estamos prontos para calcular o desvio absoluto médio. Basta somar os valores da última coluna e dividir por n. Letra E Desvio padrão e Variância De todas as medidas de dispersão apresentadas até aqui, o Desvio Padrão é o mais utilizado, e cuja definição nada mais é do que a raiz quadrada da média aritmética dos quadrados dos desvios. O conceito de desvio padrão está intimamente ligado ao estudo da variância. Essas duas medidas de dispersão apresentam uma 1300 13 100 Dam = = CURSO ON-LINE – MATEMÁTICA E RACIOCÍNIO LÓGICO - SENADO PROFESSOR: GUILHERME NEVES 62 www.pontodosconcursos.com.br peculiaridade: teremos que prestar atenção se questão será com amostras ou com a população. Suponhamos que desejamos conhecer alguma coisa sobre determinada população – por exemplo, a média salarial, o desvio padrão das
Compartilhar