Baixe o app para aproveitar ainda mais
Prévia do material em texto
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 1 Raciocínio Lógico-Quantitativo para Traumatizados Aula 14 Estatística Descritiva. 14. Estatística Descritiva ......................................................................................................... 2 14.1 Introdução ..................................................................................................................... 2 14.2. Tipos de Variáveis ......................................................................................................... 4 14.3. Técnicas de Descrição Gráfica .................................................................................. 5 14.3.1. Descrição Gráfica de Variáveis Qualitativas ................................................................... 5 14.3.2. Descrição Gráfica de Variáveis Quantitativas Discretas ................................................. 6 14.3.3. Descrição Gráfica de Variáveis Quantitativas Contínuas ................................................ 8 14.4. Caracterização de uma Distribuição de Frequências .................................. 11 14.4.1. Medidas de Posição ........................................................................................................ 11 14.4.2. Medidas de Dispersão .................................................................................................... 22 14.4.3. Momentos de uma Distribuição de Frequências ............................................................ 31 14.4.4. Medidas de Assimetria ................................................................................................... 32 14.4.5. Medidas de Achatamento ou Curtose ............................................................................ 36 14.5. Ramo-e-Folhas ........................................................................................................... 37 14.6. Memorize para a prova ........................................................................................... 39 14.7. Exercícios de Fixação ............................................................................................... 41 14.8 Gabarito ........................................................................................................................ 47 14.9 Resolução dos Exercícios de Fixação ................................................................. 47 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 2 14. Estatística Descritiva Prezado(a) amigo(a), iniciamos hoje uma nova parte do nosso curso, a Estatística. Estudaremos essa matéria ao longo de oito aulas (incluindo esta). Todos, ou quase todos, devem ter cursado esta disciplina quando fizeram a Faculdade. Provavelmente, parte do conteúdo que ensinaremos será “matéria nova” para a grande maioria (com exceção dos matemáticos/estatísticos que integram a turma). Assim, teremos que vencer, juntos, a barreira da familiarização com alguns conceitos/noções inéditos. O que fazer, se assuntos mais avançados como regressão linear múltipla e testes de hipóteses não paramétricos (poderíamos citar outros tópicos) têm sido cobrados nas provas? A atitude correta seria não estudá-los? Cair no erro do auto-engano? É claro que não, pois não podemos brigar com a realidade dos fatos. Temos que ser pragmáticos: precisamos nos adequar às exigências da(s) banca(s), e não o contrário. Nós mesmos não aprendemos a regressão múltipla, muito menos testes de hipóteses não paramétricos, nas disciplinas de Estatística oferecidas pela Escola Politécnica da USP e pela Escola Naval. Entendeu o tamanho da “encrenca” em que você se meteu? (risos!) Brincadeira ... O nosso principal objetivo é treiná-lo para “matar” qualquer questão de Estatística que aparecer na prova. Estamos cientes de que você não entenderá 100% de todos os conceitos que serão apresentados. Mas isso não tem importância, desde que você memorize todos os bizus/macetes que serão ensinados! Quem disse que entender toda a matéria é pré-requisito para “arrebentar” em uma prova? Last but not least: fé na missão que se inicia! Estamos iniciando um trabalho de base em Estatística. Não temos em mente um edital específico. Mas certamente cobriremos a totalidade da maioria dos editais interessantes. Nesta aula, apresentamos alguns tópicos que são normalmente cobrados em concursos públicos, tais como gráficos, tabelas, medidas de posição e de variabilidade, dentre outros. A matéria é exposta após uma breve introdução sobre a ciência Estatística. 14.1 Introdução A Estatística é a ciência que se preocupa em coletar, analisar e fazer inferências a partir de dados. A sua matéria-prima é um conjunto de dados. Ela é uma ciência meio, e não fim, sendo útil em vários campos do conhecimento, tais como física, engenharia, medicina, atuária, biologia, economia, administração, etc. Métodos estatísticos nos ajudam a entender o problema da variabilidade. Mas o que seria a variabilidade? A idéia é simples. Diversas observações de um sistema ou fenômeno não produzem exatamente o mesmo resultado. E isto ocorre porque sistemas/fenômenos físicos estão sujeitos à variabilidade. Considere, por exemplo, o consumo mensal de energia elétrica da sua casa. Você observa o mesmo consumo mensal todos os meses? É claro que não! Às Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 3 vezes, o consumo varia consideravelmente, como nos meses de verão (devido ao uso de ar-condicionado, ventilador, etc.) e de inverno (por causa da utilização de sistemas de aquecimento, secadora de roupas, etc.). Outro exemplo prático seria a arrecadação mensal de tributos do governo. O governo precisa saber quais são as fontes potenciais de variabilidade no sistema de arrecadação. É aí que entra a Estatística, pois ela é capaz de descrever a variabilidade e de indicar quais fontes de variabilidade são mais importantes ou quais têm impacto significativo sobre o desempenho da arrecadação. A Estatística pode ser dividida em duas partes: a Estatística Descritiva, que aborda a organização e a descrição dos dados experimentais, e a Inferência Estatística (ou Estatística Indutiva), cujo objetivo é inferir propriedades de um agregado maior (a população) a partir de um conjunto menor (a amostra). A inferência estatística não é exata; as suas induções1 sempre possuem um determinado grau de incerteza. Uma população ou universo é um conjunto de elementos com pelo menos uma característica comum. A população pode ser finita ou infinita. Por exemplo, o número de pneus defeituosos produzidos em um dia por uma determinada fábrica, é uma população de tamanho finito. Já as observações obtidas pela medição diária de gases de efeito estufa representam uma população de tamanho infinito. A característica comum deve delimitar de forma exata quais os elementos que pertencem à população e quais os que não pertencem. Considere, por exemplo, a população dos indivíduos do sexo masculino inscritos no próximo concurso para Analista Técnico da Receita Federal. Essa população não inclui as pessoas do sexo feminino que farão o mesmo concurso. Depois que caracterizamos a população, procedemos ao levantamento de dados acerca da característica (ou características) de interesse no estudo em questão. Na maioria dos problemas de inferência estatística, é impossível ou impraticável observar toda a população. Devemos então restringir nossas observaçõesa uma parte da população, isto é, a uma amostra proveniente dessa população. Uma amostra é, portanto, um subconjunto finito de uma população, e todos os seus elementos serão examinados para a realização do estudo estatístico desejado. Quanto maior a amostra, mais precisas e confiáveis serão as induções realizadas sobre a população. No limite, resultados 100% confiáveis podem ser obtidos através do exame completo da população. Na prática, isso não é necessário, pois induções suficientemente precisas e confiáveis podem ser realizadas desde que o tamanho da amostra seja corretamente dimensionado. Esperamos que você tenha entendido a nossa breve explicação sobre a Inferência Estatística. Voltaremos a este assunto, de forma bastante 1 A indução é um processo de raciocínio em que, partindo-se do conhecimento de uma parte, procura-se tirar conclusões sobre o todo. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 4 detalhada, em aulas posteriores. A partir deste ponto, voltaremos a nossa atenção para o foco desta aula, que é o estudo da Estatística Descritiva. 14.2. Tipos de Variáveis A função da Estatística Descritiva é organizar as informações contidas nos resultados observados. De forma geral, podemos ter cada um dos elementos de uma população ou amostra associado a mais de uma característica de interesse. Por exemplo, o conjunto dos elementos sob investigação pode ser uma amostra da população dos candidatos do sexo masculino inscritos no último concurso de Auditor da Receita Federal. Este é o conjunto dos elementos fisicamente definidos e considerados. Para este conjunto, as variáveis (características) de interesse poderiam ser: idade, peso e altura. Nesta aula, veremos apenas o caso de variáveis unidimensionais, em que apenas uma característica de interesse está associada a cada elemento do conjunto examinado. Há casos, porém, em que duas ou mais características precisam ser simultaneamente estudadas (veremos em aulas posteriores). A característica de interesse poderá ser qualitativa ou quantitativa. Tem-se, portanto, variáveis qualitativas ou quantitativas. A variável será qualitativa quando resultar de uma classificação por tipos ou atributos, como, por exemplo: a) População: moradores de uma cidade. Variável: sexo (masculino ou feminino). b) População: peças produzidas por uma máquina. Variável: qualidade (perfeita ou defeituosa). Por outro lado, a variável será quantitativa quando seus valores forem expressos em números. As variáveis quantitativas podem ser discretas ou contínuas. Uma variável contínua é aquela cujos possíveis valores pertencem a um intervalo de números reais e que resulta de uma mensuração, como, por exemplo, a estatura de um indivíduo. Uma variável discreta é aquela cujos possíveis valores formam um conjunto finito ou enumerável de números, e que resultam, freqüentemente, de uma contagem. Exemplos de variáveis discretas: a) População: casais residentes em um distrito de uma cidade. Variável: número de filhos. b) População: carros produzidos em uma linha de montagem. Variável: número de defeitos por unidade. Exemplos de variáveis contínuas: Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 5 a) População: detergentes de uma certa marca e tipo. Variável: peso líquido. b) População: peças produzidas por uma máquina. Variável: diâmetro externo. A Estatística Descritiva pode descrever os dados através de gráficos, distribuições de frequência ou medidas associadas a essas distribuições, conforme veremos a seguir. 14.3. Técnicas de Descrição Gráfica Primeiramente, devemos verificar as frequências dos diversos valores observados de uma variável. A frequência de um dado valor de uma variável (qualitativa ou quantitativa) é definida como o número de vezes que esse valor foi observado. Seja fi a frequência do i-ésimo valor observado. Se o número total de elementos observados é n, então vale a relação (1) ∑ = = k f 1i i n em que k denota o número de diferentes valores existentes da variável. A associação das respectivas frequências a todos os diferentes valores observados define a distribuição de frequências do conjunto de valores observados. Também podemos trabalhar com a noção de frequência relativa de um valor observado, definida como (2) n f p ii = . Observe que (3) ∑ = = k 1 1 i ip . 14.3.1. Descrição Gráfica de Variáveis Qualitativas O gráfico obtido por meio do cálculo das frequências ou frequências relativas poderá ser um diagrama de barras, um diagrama circular ou qualquer outro tipo de diagrama equivalente. Exemplo. Considere um grupo de 147 candidatos a um curso de MBA, classificados segundo a sua graduação, conforme a Tabela 1. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 6 Tabela 1: formação de graduação. Formação Frequências Freq. Relativa (%) Engenheiros 45 30,61 Administradores 38 25,85 Economistas 35 23,81 Contadores 16 10,88 Outros 13 8,84 Total 147 100,00 Os dados estão representados por meio de um diagrama de barras e por um diagrama circular (veja as duas figuras a seguir). 14.3.2. Descrição Gráfica de Variáveis Quantitativas Discretas A descrição gráfica de variáveis quantitativas discretas é normalmente feita por meio de um diagrama de barras. Como a variável é quantitativa, seus valores numéricos podem ser representados num eixo horizontal. Neste caso, as barras do diagrama serão verticais. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 7 Exemplo. Considere a variável “número de defeitos por unidade” obtidos a partir de produtos retirados de uma linha de produção. Seja o conjunto de 20 valores obtidos conforme a Tabela 2. Tabela 2: distribuição de frequências. xi fi pi 0 8 0,20 1 14 0,35 2 10 0,25 3 4 0,10 4 2 0,05 5 2 0,05 Total 40 1,00 A figura abaixo mostra o diagrama de barras associado aos dados da Tabela 2. Também é possível representar graficamente os dados da Tabela 2 utilizando as frequências acumuladas, que serão denotadas por Fi. A frequência acumulada, em qualquer ponto do eixo horizontal (ou eixo das abscissas), é a soma das frequências de todos os valores menores ou iguais ao valor correspondente a esse ponto. De forma análoga, também temos as frequências relativas acumuladas Pi. A Tabela 3 ilustra as frequências e frequências relativas acumuladas para os dados da Tabela 2. A figura a seguir mostra o gráfico das frequências acumuladas. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 8 Tabela 3: frequências acumuladas. xi Fi Pi 0 8 0,20 1 22 0,55 2 32 0,80 3 36 0,90 4 38 0,95 5 40 1,00 14.3.3. Descrição Gráfica de Variáveis Quantitativas Contínuas O diagrama de barras não é usado na descrição gráfica de variáveis quantitativas contínuas2. O Exemplo a seguir ilustra a técnicausualmente empregada na prática. Exemplo. Considere a variável comprimento de peças produzidas em uma fábrica, dada em centímetros: 10,4 10,5 10,8 10,2 10,6 10,6 10,2 10,7 10,4 10,5 10,3 10,5 10,4 10,7 10,4 10,9 10,5 10,3 10,6 10,5 10,4 10,5 10,6 10,9 10,7 Na Tabela 4, temos os dados acima organizados em termos de frequências e de frequências relativas, simples e acumuladas. Tabela 4: distribuição das frequências e das frequências acumuladas. 2 Devido à natureza contínua da variável. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 9 xi fi Fi pi Pi 10,2 2 2 0,08 0,08 10,3 2 4 0,08 0,16 10,4 5 9 0,20 0,36 10,5 6 15 0,24 0,60 10,6 4 19 0,16 0,76 10,7 3 22 0,12 0,88 10,8 1 23 0,04 0,92 10,9 2 25 0,08 1,00 25 1,00 A próxima figura é uma representação gráfica das duas primeiras colunas da Tabela 4. É importante que você aprenda a interpretar corretamente o gráfico da figura a seguir. Por exemplo, a frequência 2 associada ao valor 10,3 quer dizer, na verdade, que temos dois valores compreendidos entre os limites 10,25 e 10,35, que foram aproximados, no processo de medição, para 10,3. Portanto, uma representação gráfica correta deverá associar a frequência 2 ao intervalo 10,25 - 10,35. Isto é feito por meio de uma figura formada com retângulos cujas áreas representam as frequências dos diversos intervalos existentes. Tal figura é denominada histograma. 10.2 10.3 10.4 10.5 10.6 10.7 10.8 10.9 11 0 1 2 3 4 5 6 7 x f No caso das variáveis contínuas, as frequências sempre serão associadas a intervalos de variação da variável e não a valores individuais. Tais intervalos são chamados de classes de frequências. Estas classes são usualmente representadas pelos seus pontos médios. Variáveis contínuas também podem ser representadas pelo polígono de frequências, que é obtido unindo-se os pontos médios dos patamares do histograma. Para completar a figura, consideram-se duas classes laterais com Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 10 frequência nula3. A figura a seguir ilustra o polígono de frequências correspondente ao histograma da figura anterior. 10.2 10.3 10.4 10.5 10.6 10.7 10.8 10.9 11 0 1 2 3 4 5 6 7 x f A figura a seguir mostra os gráficos das frequências relativas acumuladas e do polígono de frequências relativas acumuladas (ou ogivas percentuais4) relativos ao último exemplo. 10.2 10.3 10.4 10.5 10.6 10.7 10.8 10.9 11 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 x P 3 Exceto no caso de variáveis essencialmente positivas cujo histograma se inicia no valor zero, pois não haveria sentido em se considerar um intervalo com valores negativos. 4 O polígono de frequências acumuladas também pode ser chamado de ogiva. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 11 Na prática, às vezes é necessário agrupar os dados em classes de frequência que englobam diversos valores da variável. A frequência de cada classe será, nesse caso, igual à soma das frequências de todos os valores existentes dentro da classe. Este procedimento corresponde a uma diminuição proposital da precisão com que os dados foram computados. O problema a resolver, em tais casos, é o de determinar qual o número k de classes a constituir, qual o tamanho ou amplitude h dessas classes e quais os seus limites. Seja R a amplitude do conjunto de dados, ou seja, a diferença entre o maior e o menor dos valores observados. Fixado o número k de classes, resulta (4) k R h ≈ . 14.4. Caracterização de uma Distribuição de Frequências A distribuição de frequências de uma variável quantitativa também pode ser caracterizada por grandezas numéricas denominadas medidas da distribuição de frequências. As medidas buscam sumarizar as informações disponíveis sobre o comportamento de uma variável. Há medidas de posição, de dispersão, de assimetria e de achatamento ou curtose. As medidas de posição e de dispersão são as mais importantes na prática e servem para localizar as distribuições e caracterizar a sua variabilidade. 14.4.1. Medidas de Posição As medidas de posição servem para localizar a distribuição de frequências sobre o eixo de variação da variável em questão. Estudaremos, neste texto, a média, a mediana e a moda. A média e a mediana indicam, por critérios diferentes, o centro da distribuição de frequências, ou seja, são medidas de tendência central. A moda, por sua vez, indica a região de maior concentração de frequências na distribuição. Média Aritmética Suponha que você more em São Paulo (capital) e que esteja planejando uma viagem de carro para o Rio de Janeiro (capital) pela rodovia BR-116 (rodovia Pres. Dutra) no próximo feriadão. Qual seria o tempo gasto na viagem? Bem, a resposta “mais exata”, do ponto de vista estatístico, uma vez que o tempo de viagem é uma grandeza aleatória (o tempo de viagem varia em função de fatores sobre os quais não temos controle tais como congestionamentos devidos a acidentes com veículos, fiscalizações da Polícia Rodoviária, etc.), seria fornecer a distribuição de frequências dos tempos de viagem de carro para o Rio de Janeiro (vamos admitir que você viaje de carro com alguma frequência para o Rio de Janeiro e que tenha coletado esse conjunto de dados). Porém, ninguém espera que você dê como resposta uma distribuição Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 12 de frequências dos tempos de viagem. O que se espera é que você forneça o tempo esperado ou médio que será gasto na viagem. Como calculamos a média de uma distribuição de frequências? Responderemos essa pergunta na sequência. A média aritmética, ou média, de um conjunto de n números nxxx ,...,, 21 é definida por (leia-se “x barra”) (5) n x n x n xxx x n j j n ∑ ∑ == +++ = =121 ... . Exemplo. A média dos números 3, 4, 8, 11 e 13 é 8,7 5 1311843 = ++++ =x Se k valores distintos observados kxxx ,...,, 21 ocorrerem com as frequências kfff ,...,, 21 , respectivamente, a média será (6) ∑ ∑ ∑ ∑ = = = = === +++ +++ = k j jj k j jj k j j k j jj k kk px n xf f xf fff xfxfxf x 1 1 1 1 21 2211 ... ... em que pj denota a j-ésima frequência relativa. Exemplo. Se 4, 7, 5, 2 ocorrerem com as frequências 3, 2, 4 e 1, respectivamente, a média aritmética será de 8,4 1423 12)45()27()34( = +++ ×+×+×+× =x Mencionamos acima que a média caracteriza o centro da distribuição de frequências; fazendo uma analogia com a mecânica, poderíamos interpretar a média como sendo o “centro de gravidade” de uma distribuição de frequências. Podemos destacas as seguintes propriedades da média: a) multiplicando-se todos os valores de uma variável por uma constante, a média do conjunto fica multiplicada por essa constante. Seja x a variável de interesse, c um valor constante e y = cx. Então xcy = . b) somando-se ou subtraindo-seuma constante a todos os valores de uma variável, a média do conjunto fica acrescida ou diminuída dessa constante. Seja x a variável de interesse, c um valor constante e cxy ±= . Então cxy ±= . Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 13 Média Aritmética de Dados Agrupados Quando os dados são apresentados em uma distribuição de frequências, todos os valores incluídos num certo intervalo de classe são considerados coincidentes com o ponto médio do intervalo. As fórmulas (5) e (6) serão válidas para esses dados agrupados quando se interpretar jx como o ponto médio e jf como a frequência de classe correspondente. Exemplo. Seja a distribuição em classes de frequência dada na Tabela 5. Temos que 0,55 100 500.5 === ∑ n fx x ii . Tabela 5: cálculo da média. Classe (limites reais) fi xi xifi 40,0 ─ 45,0 6 42,5 255 45,0 ─ 50,0 16 47,5 760 50,0 ─ 55,0 32 52,5 1.680 55,0 ─ 60,0 24 57,5 1.380 60,0 ─ 65,0 14 62,5 875 65,0 ─ 70,0 6 67,5 405 70,0 ─ 75,0 2 72,5 145 100 5.500 Outros Tipos de Média Podemos definir outros tipos de média de um conjunto de dados, tais como a média geométrica gx , a média harmônica hx e a média ponderada px dadas por (7) n ng xxxx .... 21= , Exemplo. A média geométrica dos números 2, 4 e 8 é: 464842 33 ==××=gx (8) n h xxx n x 1 ... 11 21 +++ = , Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 14 Exemplo. A média harmônica dos números 2, 4 e 8 é: 43,3 8 1 4 1 2 1 3 ≈ ++ =hx (9) n nn p www xwxwxw x +++ +++ = ... ... 21 2211 . em que nwww ,...,, 21 denotam fatores de ponderação ou pesos. Exemplo. O desempenho em um curso de graduação é avaliado por meio das notas obtidas nas provas bimestrais P1 e P2 e pela nota de Atividades (A). Sabendo-se que a P2 tem peso 5, que a P1 tem peso 2 e que A tem peso 3, determine a média final do aluno que obteve as seguintes notas (em uma escala de 0 a 10): P1 = 5,0, P2 = 4,5 e A=8,5. 4,535,5 10 5,53 352 )5,83()5,45()0,52( ≈== ++ ×+×+× =px Relação entre as médias aritmética, geométrica e harmônica A média geométrica de um conjunto de números positivos nxxx ,...,, 21 é menor do que ou igual à sua média aritmética, mas é maior do que ou igual à sua média harmônica: média harmônica ≤ média geométrica ≤ média aritmética Mediana A mediana caracteriza o centro de uma distribuição de frequências com base na ordem dos valores que formam o conjunto de dados. A mediana é o valor que ocupa a posição central dos dados ordenados. A mediana é o valor que divide a distribuição ao meio, deixando os 50% menores valores de um lado e os 50% maiores valores do outro lado. A mediana de um conjunto de n valores ordenados, sendo n ímpar, é definida como o valor de ordem (n+1)/2 desse conjunto. Se n for par, consideraremos a mediana como o valor médio entre os valores de ordem n/2 e (n/2) + 1 do conjunto de dados. Exemplo. A mediana dos nove valores já ordenados, 12 14 15 19 20 22 26 27 30 é igual a 20. A mediana dos oito valores já ordenados, 12 14 15 19 20 26 27 30 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 15 é igual a (19+20)/2 = 19,5. A mediana (md) de uma distribuição em classes de frequências é dada pela expressão (10) md md a i h f Fn Lmd × − += )2/( em que iL é o limite inferior da classe que contém a mediana, n é o número de elementos do conjunto de dados, aF é a soma das frequências das classes anteriores à que contém a mediana, mdf é a frequência da classe que contém a mediana e mdh é a amplitude da classe que contém a mediana. A expressão (10) supõe que os valores observados da variável tenham se distribuído homogeneamente dentro das diversas classes. Exemplo. Considere os dados da Tabela 5, repetidos abaixo na Tabela 6. Tabela 6 Classe (limites reais) fi 40,0 ─ 45,0 6 45,0 ─ 50,0 16 50,0 ─ 55,0 32 55,0 ─ 60,0 24 60,0 ─ 65,0 14 65,0 ─ 70,0 6 70,0 ─ 75,0 2 100 A mediana é 375,545 32 2250 0,50 =× − +=md . Em certos casos práticos, como aqueles que envolvem distribuições de frequência com valores extremos, é mais conveniente usar a mediana como medida de tendência central, pois a média sofre influência de valores extremos. Neste caso, a mediana fornecerá uma melhor idéia do centro da distribuição de frequências da variável sob análise. A mediana de uma distribuição em classes de frequências pode ser geometricamente interpretada como o ponto tal que uma vertical por ela traçada divide a área sob o histograma em duas partes iguais. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 16 A mediana e a média são coincidentes quando a distribuição é simétrica. Em distribuições assimétricas, a média tende a deslocar-se para o lado da cauda mais longa (vide figura abaixo). A mediana divide o conjunto ordenado de dados em dois subconjuntos com igual número de elementos. Há outras maneiras de se dividir os dados ordenados. Os quartis (Q1, Q2, Q3) dividem o conjunto ordenado de valores em quatro subconjuntos com igual número de elementos. O primeiro quartil (Q1) ou quartil inferior (Qi) delimita os 25% menores valores; o segundo quartil é a própria mediana e o terceiro quartil (Q3) ou quartil superior (Qs) é o valor que separa os 25% maiores valores (veja a próxima figura). Além dos quartis, podemos definir os decis (D1, D2,..., D9), que são os valores que dividem os dados ordenados em dez partes iguais (note que a mediana corresponde ao quinto decil D5) e os percentis, que são os valores que dividem os dados ordenados em 100 partes iguais, sendo representados por P1, P2,..., P99 (a mediana é o percentil P50). De maneira geral, os quartis, decis e percentis e outros valores obtidos mediante subdivisões dos dados em partes iguais são denominados quantis. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 17 Moda A moda é dada pelo valor mais freqüente (ou de máxima frequência). Sendo assim, a moda para o conjunto de dados da Tabela 2 é 1 e, no caso da Tabela 6, a classe modal é 50,0 ─ 55,0. Pode haver, entretanto, mais de uma moda em um conjunto de valores. Se houver apenas uma moda, a distribuição é dita unimodal. Se houver duas, é bimodal. No caso de distribuições de frequência em classes de mesma amplitude, é comum definir-se a moda (mo) como um ponto pertencente à classe modal, dado por (11) h dd d Lmo i 21 1 + += , em que iL é o limite inferior da classe modal, 1d é a diferença entre a frequência da classe modal e a da classe imediatamente anterior, 2d é a diferença entre a frequência da classe modal e a da classe imediatamente seguinte e h é a amplitude das classes. A fórmula (11) corresponde ao cálculo da moda pelo Método de Czuber. Exemplo. Considere os dados da Tabela 6. Então 0,50=iL , 1616321 =−=d , 824322 =−=d, 5=h e a moda é 333,535 816 16 0,50 ≈× + +=mo . A moda também pode ser calculada pelo Método de King: Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 18 h ff f Lmo antpost post i + += , em que iL denota o limite inferior da classe modal, postf é a frequência da classe posterior à classe modal, antf é a frequência da classe anterior à classe modal e h é a amplitude da classe modal. Caso a questão da prova não especifique, deverá ser utilizado o método de Czuber. Relação Empírica entre a Média, a Mediana e a Moda Para as curvas de frequência unimodal moderadamente inclinadas (assimétricas), a seguinte relação empírica é válida (12) )(3 mdxmox −×=− ou seja, Média ─ Moda = 3(Média - Mediana). A figura abaixo mostra as posições relativas da moda, mediana e média para uma distribuição de frequência (levemente) inclinada para a direita. Já caiu em prova! (Agente Fiscal de Rendas SP/2009/FCC). Para resolver as questões de números 1 e 2, considere a tabela de frequências relativas abaixo, que mostra a distribuição dos valores arrecadados, em 2008, sobre determinado tributo, referente a um ramo de atividade escolhido para análise. Sabe-se que: Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 19 I – As frequências absolutas correspondem às quantidades de recolhimentos, sendo as frequências relativas do segundo e terceiro intervalos de classe iguais a x e y, respectivamente. II – A média aritmética da distribuição, valor arrecadado por recolhimento, é igual a R$ 3.350,00 (valor encontrado considerando que todos os valores incluídos num certo intervalo de classe são coincidentes com o ponto médio desse intervalo). Valores Arrecadados (R$) Frequências Relativas 1.000,00 |---------- 2.000,00 0,10 2.000,00 |---------- 3.000,00 x 3.000,00 |---------- 4.000,00 y 4.000,00 |---------- 5.000,00 0,20 5.000,00 |---------- 6.000,00 0,10 Total 1,00 1. A porcentagem de recolhimentos com valores arrecadados maiores ou iguais a R$ 3.000,00 é A) 70% B) 65% C) 55% D) 45% E) 40% Resolução Seja a Tabela abaixo, em que xi denota o ponto médio da classe i, pi representa a frequência relativa da classe i e Pi é a frequência acumulada da classe i. Classes (em R$ mil) xi pi Pi 1,0 |--- 2,0 1,5 0,10 0,10 2,0 |--- 3,0 2,5 x 0,10 + x 3,0 |--- 4,0 3,5 y 0,10 + x + y 4,0 |--- 5,0 4,5 0,20 0,30 + x + y 5,0 |--- 6,0 5,5 0,10 0,40 + x + y Total 1,00 Temos duas frequências relativas incógnitas: x e y. Logo, precisaremos montar um sistema de duas equações a duas incógnitas para resolver x e y. O enunciado diz que 35,3=x (em R$ mil). Portanto, )10,05,5()20,05,4(5,35,2)10,05,1(35,3 ×+×+++×=== ∑ yxpxx i ii 35,355,090,05,35,215,0 =++++ yx Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 20 75,15,35,2 =+ yx (1) Por outro lado, sabemos que 1=∑ i ip ⇒ 00,140,0 =++ yx ⇒ 60,0=+ yx (2) Chegamos então ao sistema =+ =+ 60,0 75,15,35,2 yx yx Cuja solução é: 35,0=x e 25,0=x . A versão final da Tabela é: Classes (em R$ mil) xi pi Pi 1,0 |--- 2,0 1,5 0,10 0,10 2,0 |--- 3,0 2,5 0,35 0,45 3,0 |--- 4,0 3,5 0,25 0,70 4,0 |--- 5,0 4,5 0,20 0,90 5,0 |--- 6,0 5,5 0,10 1,00 Total 1,00 E a porcentagem de recolhimentos com valores arrecadados maiores ou iguais a R$ 3.000,00 é: 0,25 + 0,20 + 0,10 = 0,55 = 55%. GABARITO: C 2. Utilizando o método da interpolação linear, tem-se que o valor da respectiva mediana é A) R$ 3,120,00 B) R$ 3,200,00 C) R$ 3,400,00 D) R$ 3,600,00 E) R$ 3,800,00 Resolução Classes (em R$ mil) xi pi Pi 1,0 |--- 2,0 1,5 0,10 0,10 2,0 |--- 3,0 2,5 0,35 0,45 3,0 |--- 4,0 (classe da mediana) 3,5 0,25 0,70 4,0 |--- 5,0 4,5 0,20 0,90 5,0 |--- 6,0 5,5 0,10 1,00 Total 1,00 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 21 A mediana é o valor que divide a distribuição ao meio, deixando os 50% menores valores de um lado e os 50% maiores valores do outro lado. Fazendo a interpolação linear (regra de três), temos que: (4,0 – 3,0) = 1,0 (amplitude da classe da mediana) está para X (amplitude na classe da mediana correspondente à mediana) assim como (70% – 45%) está (50% – 45%): 45,050,0 45,070,00,1 − − = X ⇒ 05,0 25,00,1 = X ⇒ 20,0 25,0 05,0 ==X Logo: md = 3,0 + 0,2 = R$ 3,2 mil. GABARITO: B Já caiu em prova! (APOFP-SP/2009/ESAF) Determine a mediana das seguintes observações: 17, 12, 9, 23, 14, 6, 3, 18, 42, 25, 18, 12, 34, 5, 17, 20, 7, 8, 21, 13, 31, 24, 9 A) 13,5 B) 17 C) 14,5 D) 15,5 E) 14 Resolução A mediana de um conjunto de n valores ordenados, sendo n ímpar, é definida como o valor de ordem (n+1)/2 desse conjunto. Se n for par, a mediana poderia ser definida como qualquer valor situado entre o de ordem n/2 e o de ordem (n/2)+1. Por simplificação, para n par, consideraremos a mediana como o valor médio entre os valores de ordem n/2 e (n/2)+1 do conjunto de dados Total de elementos do conjunto = n = 23 (ímpar) Mediana (número ímpar de elementos) => Posição = (n+1)/2 = 24/4 = 12 Vamos colocar os elementos do conjunto em ordem crescente: 3, 5, 6, 7, 8, 9, 9, 12, 12, 13, 14, 17, 17, 18, 18, 20, 21, 23, 24, 25, 31, 34, 42 Elemento na Posição 12 = 17 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 22 GABARITO: B 14.4.2. Medidas de Dispersão Pense na seguinte situação: uma pessoa faz quatro refeições por dia, enquanto que outra não faz nenhuma refeição por dia. Na média, ambas fazem duas refeições por dia. Isto quer dizer que os dois indivíduos estão bem alimentados? A resposta óbvia é não. É para isso que servem as medidas de dispersão, isto é, medidas de como os dados estão agrupados: mais ou menos próximos entre si (mais ou menos dispersos). As medidas de dispersão indicam o quanto os dados se apresentam dispersos em torno da região central. Desta forma, caracterizam o grau de variabilidade existente nos dados. As seguintes medidas de dispersão nos interessam: a amplitude, a variância, o desvio padrão, o coeficiente de variação e o desvio interquartílico. Amplitude A amplitude já foi mencionada nesta aula, sendo definida como a diferença entre o maior valor e o menor valor do conjunto de dados: (13) minmax xxR −= . Na prática, a amplitude não é muito usada como medida de dispersão. Exemplo. A amplitude do conjunto 3, 3, 4, 5, 5, 6, 7, 7, 7, 10 é 10 – 3 = 7. Variância A variância de um conjunto de dados pode ser calculada pela fórmula (14) ∑ = −= n i ix xx n s 1 22 )( 1 . Se kxxx ,...,, 21 ocorrerem com as frequências kfff ,...,, 21 (∑ = = k f 1i i n ), respectivamente, a variância5 será dada por 5 Em (14) e (15), consideramos que os dados se referem a uma população finita de tamanho n. Caso os dados estejam associados auma amostra de tamanho n, o fator n que aparece no denominador do lado direito de (14) e (15) deve ser substituído por n-1. A justificativa matemática para o uso do fator (n-1) será apresentada em outra aula, mas já podemos adiantar que ela está relacionada a problemas de inferência estatística. Para grandes valores de n, a diferença entre as duas definições torna-se desprezível. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 23 (15) ∑ = −= k i iix xxf n s 1 22 )( 1 . A variância tem, entre outras, as seguintes propriedades: a) multiplicando-se todos os valores de uma variável por uma constante, a variância do conjunto fica multiplicada pelo quadrado dessa constante. Seja x a variável de interesse, c um valor constante e y = cx. Então 222 xy scs = . b) somando-se ou subtraindo-se uma constante a todos os valores de uma variável, a variância não se altera. Seja x a variável de interesse, c um valor constante e y = x + c. Então 22 xy ss = . Demonstraremos mais adiante que (14) pode ser reescrita na forma 2 22 11 −= ∑∑ i i i ix x n x n s , que é uma fórmula “maceteada” para o cálculo da variância. Questão (INÉDITA). Considere o conjunto de dados {2, 5, 8, 11, 14}. Então a variância desse conjunto é A) 8 B) 20,25 C) 18 D) 24 E) 22 Resolução A média do conjunto é 8 5 1411852 = ++++ =x e a variância .18 5 )814()811()88()85()82()( 22222 2 2 = −+−+−+−+− = − = ∑ n xx s i x GABARITO: C Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 24 Questão (INÉDITA). Sejam os conjuntos de números {2, 5, 8, 11, 14} e {2, 8, 14}, Assinale a opção com a variância dos conjuntos combinados ou reunidos. A) 8 B) 20,25 C) 18 D) 24 E) 22 Resolução A variância dos conjuntos combinados (s2) é definida por 21 1 2 2 )( nn xx s n i i + − = ∑ = em que x é a média dos conjuntos combinados, dada por , 21 1 nn x x n i i + = ∑ = em que n1 = 5 é o número de elementos do conjunto 1, n2 = 3 é o número de elementos do conjunto 2 e n1 + n2 = n = 8 (número de elementos resultante da agregação dos dois conjuntos). A média dos conjuntos combinados é igual a .8 8 64 35 14821411852 == + +++++++ =x Logo, a variância dos conjuntos combinados é 25,20 8 )814(2)811()88(2)85()82(2)( 22222 21 2 2 = −×+−+−×+−+−× = + − = ∑ nn xx s i Solução alternativa: Média do 1º conjunto: .8 5 1411852 1 = ++++ =x Média do 2º conjunto: .8 3 1482 2 = ++ =x Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 25 Variância do 1º conjunto: .18 5 )814()811()88()85()82()( 22222 1 2 12 1 = −+−+−+−+− = − = ∑ n xx s i Variância do 2º conjunto: .24 3 )814()88()82()( 222 2 2 22 2 = −+−+− = − = ∑ n xx s i A variância dos conjuntos combinados pode ser calculada por meio da média ponderada das variâncias dos conjuntos: .25,20 35 243185 21 2 22 2 112 = + ×+× = + + = nn snsn s GABARITO: B Já caiu em prova! (Adm. Jr./REFAP/2007/CESGRANRIO - adaptada). O setor de recursos humanos de uma empresa tem o hábito de divulgar separadamente a média e a variância das notas das avaliações dos funcionários do sexo feminino e do masculino. Na última avaliação, os resultados obtidos foram: Feminino Masculino Número de funcionários 20 30 Média 6 7 Variância 3,4 4 A média e a variância das notas dos funcionários dessa empresa, respectivamente, valem: A) 6,5 e 3,7 B) 6,6 e 3,4 C) 6,6 e 3,8 D) 7,5 e 3,7 E) 13,0 e 7,5 Resolução Dados: n1 = 20, 1x = 6 e 2 1s = 3,4 (conjunto feminino); n2 = 30, 2x = 7; 2 2s = 4 (conjunto masculino). A média dos conjuntos combinados corresponde à média ponderada das médias dos conjuntos: .6,6 3020 730620 21 2211 = + ×+× = + + = nn xnxn x Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 26 Variância dos conjuntos combinados: .8,376,3 3020 4304,320 21 2 22 2 112 ≈= + ×+× = + + = nn snsn s O resultado acima, 3,4 < (s2 = 3,76) < 4, faz sentido. Considere um conjunto com uma variância muito pequena e outro com uma variância muito grande, sendo que ambos tem aproximadamente o mesmo número de elementos. Então espera-se que a variância dos conjuntos combinados seja um resultado intermediário, ou seja, situado entre os extremos. GABARITO: C Desvio Padrão O desvio padrão de um conjunto de dados é a raiz quadrada positiva da variância, ou seja, (16) 2xx ss += . O desvio padrão está na mesma unidade da variável, sendo, por isso, de maior interesse na prática. Exemplo. Determine o desvio padrão do conjunto 2, 5, 8, 11, 14. Vimos que esse conjunto possui variância igual a 18. Logo, 24,418 ≈=xs . Coeficiente de Variação O coeficiente de variação é definido como o quociente entre o desvio padrão e a média, sendo frequentemente expresso em porcentagem: (17) x s xcv x=)( . Esta medida caracteriza a dispersão dos dados em termos relativos a seu valor médio. Exemplo. Determine o coeficiente de variação do conjunto 2, 5, 8, 11, 14. O conjunto tem média 8 e desvio padrão 4,24. Portanto, %5353,0 8 24,4 )( =≈=xcv . Desvio Interquartílico O desvio interquartílico, definido por Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 27 (18) isQ QQd −= , em que Qd denota o desvio interquartílico, sQ é o quartil superior e iQ o quartil inferior, pode ser usado como uma medida de dispersão. Em distribuições mais dispersas, os valores dos quartis ficam mais distantes. Em distribuições simétricas, a distância entre o quartil inferior e a mediana é igual à distância entre a mediana e o quartil superior, enquanto que em distribuições assimétricas essas distâncias são diferentes. Exemplo. O primeiro e o terceiro quartis da distribuição das alturas dos estudantes da Universidade de São Paulo são 165,56 cm e 178,59 cm, respectivamente. Calcule o desvio interquartílico dessa distribuição. 03,1356,16559,178 =−=−= isQ QQd cm. Já caiu em prova! (Agente Fiscal de Rendas SP/2006/FCC). Considerando as respectivas definições e propriedades relacionadas às medidas de posição e de variabilidade, é correto afirmar: A) Concedendo-se um reajuste de 10% em todos os salários de uma empresa, tem-se também que a respectiva variância fica multiplicada por 1,10. B) Definindo-se coeficiente de variação (CV) como sendo o quociente da divisão do desvio padrão pela respectiva média aritmética (diferente de zero) de uma sequência de valores, tem-se então que CV também poderá ser obtido dividindo a correspondente variância pelo quadrado da média aritmética. C) Subtraindo um valorfixo de cada salário dos funcionários de uma empresa, tem-se que o respectivo desvio padrão dos novos valores é igual ao valor do desvio padrão dos valores anteriores. D) Dividindo todos os valores de uma sequência de números estritamente positivos por 4, tem-se que o respectivo desvio padrão fica dividido por 2. E) Em qualquer distribuição de valores em estudo, a diferença entre a mediana e a moda é sempre diferente de zero. Resolução Análise das alternativas: A) A variância de um conjunto de dados é dada por n nx n xx n x n xxxx n xx s n i i n i i n i ii n i i x 2 11 2 1 22 1 2 2 2)2()( +−= +− = − = ∑∑∑∑ ==== Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 28 2 11 221 2 221 2 2 112 −=−=+−= ∑∑ ∑∑ == == n i i n i i n i i n i i x x n x n x n x xx n x s 2 11 22 11 −= ∑∑ == n i i n i ix x n x n s => Esta fórmula é importante para a prova! Considere que ix representa o salário do i-ésimo empregado. Se é concedido um reajuste de 10% em todos os salários (então o salário reajustado passará a valer ix1,1 ), tem-se que a nova variância s'x 2 é igual a 2 11 2 2 11 22 1,121,1 1 1,1 1 )1,1( 1 ' − = − = ∑∑∑∑ ==== n i i n i i n i i n i ix x n x n x n x n s −= − = − = ∑∑∑∑∑∑ ====== 2 11 2 2 11 2 2 11 22 1121,1 1 21,1 1 21,1 1,121,1 ' n i i n i i n i i n i i n i i n i ix x n x n x n x n x n x n s 22 21,1' xx ss = ou seja, a nova variância ficará multiplicada pelo quadrado da constante (1,102 = 1,21) ⇒ FALSA. B) O Coeficiente de Variação (CV) é definido como o quociente entre o desvio padrão e a média, sendo frequentemente expresso em porcentagem: cv(x) = sx x ≠ sx x 2 = sx 2 x 2 ⇒ FALSA. C) A variância tem, entre outras, as seguintes propriedades: - multiplicando-se todos os valores de uma variável por uma constante, a variância do conjunto fica multiplicada pelo quadrado dessa constante. Seja x a variável de interesse, c um valor constante e y = cx. Então 222 xy scs = . - somando-se ou subtraindo-se uma constante a todos os valores de uma variável, a variância não se altera. Seja x a variável de interesse, c um valor constante e y = x + c. Então 22 xy ss = . Portanto, esta alternativa é VERDADEIRA. D) Dividindo todos os valores de uma série por 4, tem-se que o desvio padrão também ficará dividido por 4 ⇒ FALSA. E) Esta afirmação é verdadeira somente para distribuições assimétricas ⇒ FALSA. GABARITO: C Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 29 Diagrama de Caixa Um diagrama de caixa ou box plot é um retângulo que representa o desvio interquartílico. Esse retângulo indica, portanto, a faixa dos 50% dos valores mais típicos da distribuição. O retângulo é dividido no valor correspondente à mediana; assim, ele indica o quartil inferior, a mediana e o quartil superior (vide as próximas duas figuras). As observações que estiverem acima do limite superior ou abaixo do limite inferior estabelecidos serão denominados pontos exteriores e representadas por asteriscos ou pontos. Essas observações são destoantes das demais e podem ou não ser o que chamamos de outliers ou valores atípicos6. Exemplo. Considere um conjunto de dados com os seguintes percentis: 0% 25% 50% 75% 100% 1,7524 4,6901 5,7004 6,1768 7,3658 A próxima figura é um box plot do conjunto de dados que gerou a tabela de percentis acima. A cauda inferior é longa e isto indica que a distribuição é assimétrica. Note também a presença de outliers na parte inferior do box plot (são os pontos vermelhos). 6 A média aritmética é sensível a outliers. Um único valor “ruim” do conjunto de dados pode distorcer a média, ou seja, pode mover a média para longe do centro da distribuição de frequências. As médias geométrica e harmônica, assim como a aritmética, também não são robustas a outliers. Elas são úteis quando os dados são bem modelados pela distribuição log-normal ou quando a distribuição é fortemente assimétrica. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 30 1 2 3 4 5 6 7 V a lo re s A figura abaixo mostra o histograma associado ao box plot do exemplo. 1 2 3 4 5 6 7 8 0 10 20 30 40 50 60 70 80 90 _______________________________________________________ A próxima figura reforça a relação do box plot com o histograma. A distribuição da esquerda é simétrica, enquanto que a da direita é assimétrica. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 31 Os box plots da figura abaixo mostram a comparação dos tamanhos das pétalas em duas amostras das espécies de flor-de-lis versicolor e virginica7. versicolor virginica 3 3.5 4 4.5 5 5.5 6 6.5 7 V a lo re s A existência de um outlier nos dados da espécie versicolor é indicada pelo ponto vermelho na parte inferior esquerda da figura. 14.4.3. Momentos de uma Distribuição de Frequências O momento de ordem t associado às observações nxxx ,...,, 21 é definido como (19) n x M n i t i t ∑ == 1 . Define-se o momento de ordem t centrado em relação a uma constante a como (20) n ax M n i t i a t ∑ = − = 1 )( . O caso do momento centrado em relação a média x é de especial interesse em Estatística e será designado por momento centrado de ordem t, dado por (21) n xx m n i t i t ∑ = − = 1 )( . 7 Conjunto de dados de Fisher. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 32 As expressões (19), (20) e (21) podem ser reescritas levando-se em consideração as frequências dos diferentes valores existentes (lembre que ∑ = = k i i nf 1 ). Tem-se, então, respectivamente, (22) n fx M k i i t i t ∑ == 1 , (23) n fax M i k i t i a t ∑ = − = 1 )( , (24) n fxx m k i i t i t ∑ = − = 1 )( , Observe que o momento de ordem 1 é igual à média, ou seja, (25) xM =1 , pois ∑ = = n i ix n M 1 1 1 (basta aplicar (19) com t=1). O momento centrado de ordem 1 (ou de primeiraordem) é nulo (26) 01 =m , porque 0 11 )( 1 1111 1 =−= −= −=−= ∑∑∑∑ ==== xxxnx n xx n xx n m n i i n i n i i n i i . O momento centrado de segunda ordem é a variância (27) 22 xsm = haja vista que, 2 1 2 2 )( 1 x n i i sxx n m ∑ = =−= . 14.4.4. Medidas de Assimetria Assimetria é o grau de desvio, ou afastamento da simetria, de uma distribuição. As distribuições alongadas à direita são ditas positivamente assimétricas, e as alongadas à esquerda, negativamente assimétricas. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 33 O momento centrado de terceira ordem pode ser usado como medida da assimetria de uma distribuição. Entretanto, uma medida mais conveniente de assimetria, por ser adimensional, é dada pelo coeficiente de assimetria (A), definido como a razão entre o momento centrado de terceira ordem e o cubo do desvio padrão: (28) . 3 3 xs m A = O coeficiente de assimetria (28) indica o sentido da assimetria e pode ser usado para comparar vários casos porque é adimensional. A assimetria também pode ser medida pelo primeiro coeficiente de assimetria de Pearson: (29) .1 x p s mox A − = em que x é a média, mo denota a moda e xs é o desvio padrão. Para evitar o emprego da moda em (29), pode-se adotar a fórmula empírica (média – moda) = 3(média - mediana), de forma que (29) pode ser reescrita como 2 )(3 p x A s mdx = − conhecida como segundo coeficiente de assimetria de Pearson. Uma outra medida de assimetria, denominada coeficiente quartílico de assimetria (Aq), é definida pela fórmula (30) 13 13 2 QQ QmdQ Aq − +− = . Já caiu em prova! (Assessor Especializado/IPEA/2004/FCC). Numa distribuição de frequências com assimetria negativa mais de 50% dos dados situam-se A) sobre a média B) acima da média C) entre a média e a moda D) entre a média e a mediana E) acima da mediana Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 34 Resolução Assimetria Negativa ou à Esquerda: Média < Mediana < Moda 2 3 4 5 6 7 8 Assimetria Negativa (você puxa a seta com a mão esquerda): 1) A seta puxa a média 2) A moda está no topo 3) A mediana está no meio Note que uma distribuição de frequências com assimetria negativa é alongada à esquerda. A mediana é o valor que divide a distribuição ao meio, deixando os 50% menores valores de um lado e os 50% maiores valores do outro lado. Logo, numa distribuição de frequências com assimetria negativa, mais de 50% dos dados estão acima da média (pois a média é menor do que a mediana). Assimetria Positiva ou à Direita: Média > Mediana > Moda ou Moda < Mediana < Média Moda Mediana Média Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 35 0 1 2 3 4 5 6 7 8 9 0 a 10 10 a 20 20 a 30 30 a 40 40 a 50 Assimetria Positiva ou à Direita (você puxa a seta com a mão direita): 1) A seta puxa a média 2) A moda está no topo 3) A mediana está no meio GABARITO: B Já caiu em prova! (Analista IRB/2004/ESAF) O desenho esquemático (diagrama de caixa) apresentado abaixo representa o resumo de cinco números {51,00;54,75;69,50;78,00;95,00} para um conjunto de observações amostrais do atributo Y. Assinale a opção que dá o valor do coeficiente de assimetria de Pearson para a amostra em apreço. A) -0,269 B) -0,500 C) 0,000 D) 0,294 E) -0,294 Resolução Temos cinco números: {51,00;54,75;69,50;78,00;95,00}. É razoável admitir que eles representem as seguintes medidas: Moda Mediana Média Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 36 - Valor Mínimo = 51,00 - Q1 = 54,75 - Mediana (md) = 69,50 - Q3 = 78,00 - Valor Máximo = 95,00 Note que o diagrama de caixa apresentado não representa de forma fidedigna as cinco medidas do atributo Y. Paciência! Não vale a pena brigar com a banca. O objetivo é ser aprovado no concurso! Vimos que o primeiro coeficiente de assimetria de Pearson é dado pela fórmula .1 x p s mox A − = Entretanto, não é possível calcular o coeficiente de assimetria de Pearson com os dados da questão (quais são os valores da média e da moda?). O que está acontecendo nesta questão? Calma ... pode ser que a banca tenha alguma outra medida de assimetria em mente. Que tal calcular o coeficiente quartílico de assimetria? Não custa nada. Então vamos lá! 269,0 75,5478 )50,692(75,54782 13 13 −= − ×−+ = − −+ = QQ mdQQ Aq . Coeficiente quartílico de assimetria = -0,269 GABARITO: A 14.4.5. Medidas de Achatamento ou Curtose As medidas de curtose visam caracterizar a forma da distribuição quanto ao seu achatamento. A referência para comparação é dada pela distribuição normal, modelo probabilístico teórico de grande aplicação prática que será visto nas próximas aulas8. Diz-se que a distribuição normal é mesocúrtica (veja a figura abaixo). As distribuições mais achatadas que a normal são platicúrticas e as menos achatadas são leptocúrticas. 8 Não fique preocupado se você nunca ouviu falar da curva normal, pois ela será vista nas próximas aulas. Neste momento, basta que você saiba que o formato da curva normal lembra um sino. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 37 A caracterização do achatamento de uma distribuição só tem sentido se a distribuição for aproximadamente simétrica. Entre as possíveis medidas de achatamento, temos o coeficiente do momento de curtose (a4), definido como a razão entre o momento centrado de quarta ordem e a quarta potência do desvio padrão: (31) . 4 4 4 xs m a = Esse coeficiente é adimensional, sendo menor que três para as distribuições platicúrticas, igual a três para a normal e maior que três para as distribuições leptocúrticas. Outra medida de curtose também empregada, denominada coeficiente percentílico de curtose, baseia-se nos quartis e percentis e é definida por: (32) 1090 PP Q K − = em que Q é a metade da distância interquartílica, ou seja, Q = (Q3-Q1)/2. 14.5. Ramo-e-Folhas Vimos que o histograma e os gráficos em barras dão uma idéia da forma da distribuição da variável sob consideração. Um procedimento alternativo para resumir um conjunto de valores, com o objetivo de se obter uma idéia da forma de sua distribuição, é o diagrama de ramo-e-folhas. Exemplo 10 (baseado em questão do AFPS/2002/ESAF) Construa o ramo-e-folhas associado às seguintes observações: 82, 90, 90, 93, 99, 100, 100, 101, 101, 102, 102, 102, 103, 104, 104, 105, 107, 107, 107, 107, 107, 110, 111, 113, 115, 115, 116, 117, 119, 120, 120, 121, 121, 124, 125, 125, 125, 127, 130, 130, 134, 135,135, 135, 136, 140, 143, 145, 148. Não existe uma regra fixa para construir o diagrama de ramo-e-folhas, mas a idéia básica é dividir cada observação em duas partes: a primeira (o ramo) é Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 38 colocada à esquerda de uma linha vertical, a segunda (a folha) é colocada à direita. Assim, para os valores 90 e 93, o 9 é o ramo e 0 e 3 são as folhas. O diagrama de ramo-e-folhas correspondente às observações amostrais deste exemplo é o seguinte: 8 | 2 8 | 9 | 003 9 | 9 10| 0011222344 10| 577777 11| 013 11| 55679 12| 00114 12| 5557 13| 004 13| 5556 14| 03 14| 5 15| 15| 8 Na tabela abaixo, fi denota a frequência simples e Fi é a freqüência acumulada das observações: Ramos Folhas fi Fi 8 2 1 1 8 0 1 9 003 3 4 9 9 1 5 10 0011222344 10 15 10 577777 6 21 11 013 3 24 11 55679 5 29 12 00114 5 34 12 5557 4 38 13 004 3 41 13 5556 4 45 14 03 2 47 14 5 1 48 15 0 48 15 8 1 49 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 39 A tabela acima mostra que foram acumuladas 24 observações até a última folha do sétimo ramo. Note que há 49 observações no total e que a mediana corresponde à 1ª folha do oitavo ramo, cujo valor é 115. 14.6. Memorize para a prova - A frequência de um dado valor de uma variável (qualitativa ou quantitativa) é definida como o número de vezes que esse valor foi observado. - A associação das respectivas frequências a todos os diferentes valores observados define a distribuição de frequências do conjunto de valores observados. - A frequência acumulada de um dado valor é igual a soma das frequências de todos os valores menores ou iguais ao valor em consideração. - Um histograma é um gráfico da distribuição de frequências de uma variável quantitativa. - As medidas de posição servem para localizar a distribuição de frequências sobre o eixo de variação da variável (eixo horizontal). - A média, a mediana e a moda são medidas de posição. - Média aritmética: ∑ = = +++ = n i i n x nn xxx x 1 21 1... - Média geométrica: n n i i n ng xxxxx /1 1 21 .... == ∏ = - Média harmônica: ∑ = = +++ = n i in h x n xxx n x 121 11 ... 11 - Média ponderada: ∑ ∑ = == +++ +++ = n i i n i ii n nn p w xw www xwxwxw x 1 1 21 2211 ... ... - A mediana é o valor que divide a distribuição ao meio, deixando os 50% menores valores de um lado e os 50% maiores valores do outro lado. - A moda é dada pelo valor mais freqüente (ou de máxima frequência). - As medidas de dispersão caracterizam o grau de variabilidade existente nos dados. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 40 - Variância: ∑ = −= n i ix xx n s 1 22 )( 1 . - Média de dois conjuntos combinados ( nnn =+ 21 ): ∑ = + = n i ix nn x 121 1 - Variância de dois conjuntos combinados: 21 2 22 2 112 nn snsn s + + = - Desvio padrão: 2xx ss += . - As distribuições alongadas à direita são ditas positivamente assimétricas, e as alongadas à esquerda, negativamente assimétricas. - Desvio interquartílico: isQ QQd −= - Um diagrama de caixa ou box-plot é um retângulo que representa o desvio interquartílico. Esse retângulo indica, portanto, a faixa dos 50% dos valores mais típicos da distribuição. O retângulo é dividido no valor correspondente à mediana; assim, ele indica o quartil inferior, a mediana e o quartil superior. - Momento de ordem t: ∑ = = n i t it x n M 1 1 - Momento centrado de ordem t: ∑ = −= n i t it xx n m 1 )( 1 - Coeficiente de assimetria: 3 3 xs m A = - Primeiro coeficiente de assimetria de Pearson: x p s mox A − =1 - Segundo coeficiente de assimetria de Pearson: x p s mdx A )(3 2 − = - Coeficiente quartílico de assimetria: 13 13 2 QQ QmdQ Aq − +− = - As medidas de curtose visam caracterizar a forma da distribuição quanto ao seu achatamento. A referência para comparação é dada pela distribuição normal. A distribuição normal é mesocúrtica. As Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 41 distribuições mais achatadas que a normal são platicúrticas e as menos achatadas são leptocúrticas. - Coeficiente do momento de curtose (k): . 4 4 4 xs m a = - Coeficiente percentílico de curtose (k): 1090 PP Q K − = em que Q = (Q3- Q1)/2 14.7. Exercícios de Fixação 1. (ICMS-RJ/2009/FGV) Para comparar as rendas de dois grupos de pessoas, A e B, foram preparados diagramas de caixas (box-plots) com os valores observados dos salários, representados na figura a seguir: A respeito desses diagramas, considere as seguintes afirmativas: I. O salário médio dos dois grupos é o mesmo. II. A distribuição dos salários no grupo A é assimétrica à direita. III. Há mais pessoas no grupo A do que no grupo B. Assinale: A) se somente a afirmativa I for verdadeira. B) se somente a afirmativa II for verdadeira. C) se somente a afirmativa III for verdadeira. D) se somente as afirmativas I e II forem verdadeiras. E) se somente as afirmativas II e III forem verdadeiras. 2. (ICMS-RJ/2008/FGV) Uma companhia utiliza um sistema de avaliação de desempenho de seus funcionários por meio de dois indicadores de performance: Qualidade das tarefas e a Tempestividade com que as tarefas são realizadas. Os funcionários receberam, na última avaliação, as medidas indicadas na tabela a seguir: Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 42 Medidas Indicador Qualidade Tempestividade Média 50 25 Desvio-Padrão 10,0 6,0 Coeficiente de Variação (%) 20 24 Com base na tabela, é correto afirmar que: A) a média aritmética não é uma boa medida para representar a performance dos funcionários em face do elevado nível de dispersão das avaliações. B) as avaliações da Qualidade foram mais dispersas do que as avaliações da Tempestividade. C) as avaliações da Qualidade foram mais homogêneas do que as da Tempestividade. D)os funcionários demoram mais para realizar as tarefas, mas a qualidade das tarefas, mas a qualidade das tarefas é melhor. E) nada se pode afirmar sem o conhecimento do tamanho da amostra. 3. (ICMS-RJ/2007/FGV) Considere as informações contidas no Box Plot abaixo, referente aos salários dos engenheiros de uma empresa, por sexo. É correto afirmar que: A) o salário médio dos homens é igual ao das mulheres. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 43B) a distribuição dos salários das mulheres é assimétrica negativa. C) o desvio interquartílico dos salários das mulheres é maior do que o dos homens. D) a distribuição dos salários dos homens é atípica. E) o salário mediano das mulheres é superior ao dos homens. 4. (ATM-Recife/2003/ESAF) Em uma amostra para obter-se informações sobre a distribuição salarial de homens e mulheres, encontrou-se que o salário médio vale R$ 1.200,00. O salário médio observado para homens foi de R$ 1.300,00 e para as mulheres foi de R$ 1.100,00. Assinale a opção correta: A) O número de homens na amostra é igual ao número de mulheres. B) O número de homens na amostra é o dobro do número de mulheres. C) O número de homens na amostra é o triplo do número de mulheres. D) O número de mulheres na amostra é o dobro do número de homens. E) O número de homens na amostra é o quádruplo do número de mulheres. 5. (AFRF/2001/ESAF) Numa amostra de tamanho 20 de uma população de contas a receber, representadas genericamente por X, foram determinadas a média amostral M = 100 e o desvio-padrão s = 13 da variável transformada (X ─ 200)/5. Assinale a opção que dá o coeficiente de variação amostral de X: A) 3,0% B) 9,3% C) 17,0% D) 17,3% E) 10,0% (AFRF/2002/ESAF) Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de frequências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a frequência relativa acumulada. Não existem observações coincidentes com os extremos das classes. As questões de 6 a 11 referem-se a esses ensaios. Classes P (%) 70-90 5 90-110 15 110-130 40 130-150 70 150-170 85 170-190 95 190-210 100 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 44 6. Assinale a opção que dá o valor médio amostral de X. A) 140,10 B) 115,50 C) 120,00 D) 140,00 E) 138,00 7. Assinale a opção que corresponde à estimativa do quinto decil da distribuição de X. A) 138,00 B) 140,00 C) 136,67 D) 139,01 E) 140,66 8. Seja S o desvio padrão do atributo X. Assinale a opção que corresponde à medida de assimetria de X como definida pelo primeiro coeficiente de Pearson. A) 3/S B) 4/S C) 5/S D) 6/S E) 0 9. Assinale a opção que corresponde à estimativa da frequência relativa de observações de X menores ou iguais a 145. A) 62,5% B) 70,0% C) 50,0% D) 45,0% E) 53,4% 10. Considere a transformação Z=(X-140)/10. Para o atributo Z encontrou-se 7 2 1 . 1.680i ii Z f= =∑ , onde fi é a frequência simples da classe i e Zi o ponto médio de classe transformado. Assinale a opção que dá a variância amostral do atributo X. A) 720,00 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 45 B) 840,20 C) 900,10 D) 1200,15 E) 560,30 11. Entende-se por curtose de uma distribuição seu grau de achatamento em geral medido em relação à distribuição normal. Uma medida de curtose é dada pelo quociente 90 10 Q k P P = − onde Q é a metade da distância interquartílica e P90 e P10 representam os percentis de 90% e 10%, respectivamente. Assinale a opção que dá o valor da curtose k para a distribuição de X. A) 0,263 B) 0,250 C) 0,300 D) 0,242 E) 0,000 12. (ICMS-SP/2006/FCC) O histograma de frequências absolutas, abaixo, demonstra o comportamento dos valores arrecadados de um determinado tributo, no ano de 2005, em uma região a ser analisada: Observação: Considere que todos os intervalos de classe de histograma são fechados à esquerda e abertos à direita. Utilizando-se as informações contidas neste histograma, calculou-se a média aritmética destes valores arrecadados, considerando que todos os valores incluídos num certo intervalo de classe são coincidentes com o ponto médio deste intervalo. Também calculou-se a mediana de tais valores pelo método da Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 46 interpolação linear. Então, o módulo da diferença entre a média aritmética e a mediana é igual a A) R$ 100,00 B) R$ 400,00 C) R$ 800,00 D) R$ 900,00 E) R$ 1.000,00 13. (Analista Técnico da SUSEP/2006/ESAF) Para um conjunto determinado de números positivos temos: X como a média aritmética, G como a média geométrica e H como a média harmônica, podemos afirmar que A) X menor ou igual a G menor ou igual a H. B) G maior do que X maior do que H. C) X menor ou igual a H menor ou igual a G. D) H menor ou igual a G menor ou igual a X . E) H maior do que G maior do que X . 14. (Analista do BACEN/2006/FCC) A média aritmética dos valores das vendas diárias realizadas pelas 50 empresas do Setor A é de R$ 1.000,00, com desvio padrão de R$ 100,00. Sabe-se ainda que a média aritmética dos valores das vendas diárias realizadas pelas 200 empresas do Setor B é de R$ 2.000,00, com desvio padrão de R$ 200,00. A variância em (R$)2 dos valores das vendas diárias realizadas pelos dois setores reunidos é A) 34.000,00 B) 50.000,00 C) 194.000,00 D) 207.500,00 E) 288.000,00 15. (ICMS-RJ/2010/FGV) A média, a mediana e a variância das idades de um grupo de vinte pessoas são, hoje, iguais, respectivamente, a 34, 35 e 24. Daqui a dez anos, os valores da média, da mediana e da variância das idades dessas pessoas serão, respectivamente: A) 44, 35 e 34 B) 44, 45 e 12 C) 44, 45 e 24 D) 34, 35 e 12 E) 44, 45 e 124 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 47 14.8 Gabarito 1 – B 2 – C 3 – C 4 – A 5 – B 6 – E 7 – C 8 – A 9 – A 10 – B 11 – D 12 – A 13 - D 14 – C 15 - C 14.9 Resolução dos Exercícios de Fixação 1. (ICMS-RJ/2009/FGV) Para comparar as rendas de dois grupos de pessoas, A e B, foram preparados diagramas de caixas (box-plots) com os valores observados dos salários, representados na figura a seguir: A respeito desses diagramas, considere as seguintes afirmativas: I. O salário médio dos dois grupos é o mesmo. II. A distribuição dos salários no grupo A é assimétrica à direita. III. Há mais pessoas no grupo A do que no grupo B. Assinale: A) se somente a afirmativa I for verdadeira. B) se somente a afirmativa II for verdadeira. C) se somente a afirmativa III for verdadeira. D) se somente as afirmativas I e II forem verdadeiras. E) se somente as afirmativas II e III forem verdadeiras. Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados Profs. Alexandre Lima e Moraes Junior Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 48 Resolução Um diagrama de caixa ou box-plot é um retângulo que representa o desvio interquartílico. Esse retângulo indica, portanto, a faixa dos 50% dos valores mais típicos da distribuição. O retângulo é dividido no valor correspondente à mediana; assim, ele indica o quartil inferior, a mediana e o quartil superior. Análise das afirmativas: I- Os diagramas de caixas indicam que as medianas dois grupos A e B são iguais e não as suas
Compartilhar