Prévia do material em texto
1 ESTATÍSTICA DESCRITIVA Prof. Sérgio Carvalho # Conceitos Iniciais Imprescindíveis A prova não vai lhe perguntar o que é a Estatística, mas convém que saibamos que ela é um ramo da matemática, e que trabalha com elementos de pesquisa ou com modelos probabilísticos. Como nosso alvo é a Estatística Básica, a maior parte do nosso trabalho será focado nos elementos de pesquisa, ficando os tais modelos probabilísticos (Distribuição Binomial e Distribuição Normal) para o final do nosso Curso. Daí, por hora, basta ficarmos com a idéia de que trabalharemos com elementos de pesquisa. Como é isso? Por exemplo: suponhamos que há uma sala com duzentas pessoas, e eu pretendo realizar uma pesquisa, para saber qual a idade de cada uma delas. Ora, como não tenho bola de cristal, o jeito será perguntar, de uma por uma: Quantos anos você tem? Já pensaram, que pergunta deselegante... Mas é o jeito! Para eu trabalhar com elementos de pesquisa, o primeiro e inevitável passo será a coleta dos dados. Pois bem, eu acabei de questionar aquelas duzentas pessoas e já estou de posse das respostas que cada uma delas me passou. Ok? Vejamos algumas dessas respostas: {28 anos, 35 anos, 17 anos, 14 anos, 22 anos, 31 anos, 45 anos, ...} Facilmente se vê que esses dados estão desordenados, uma vez que acabaram de ser recebidos (coletados) e ainda não foram submetidos a nenhuma espécie de organização. São os chamados dados brutos! É fácil supor que, se pretendo fazer uma análise, um estudo mais aprofundado desses elementos, será imprescindível que os organizemos. Claro! Será mais fácil trabalhar com os dados organizados que com dados brutos. Organizar os dados é, portanto, a segunda etapa do processo estatístico! A forma mais básica de organização dos dados é o conhecido rol, o qual consiste, tão somente, em um arranjo dos dados brutos em ordem crescente ou decrescente. Normalmente, em prova, o rol vem com dados em ordem crescente! Tomando aqueles dados brutos e os transformando em rol, teremos: {14 anos, 17 anos, 22 anos, 28 anos, 31 anos, 35 anos, 45 anos, ...} O rol não é a única maneira de organização dos dados. É apenas uma delas, a mais simples! Uma vez que estivermos com os elementos da pesquisa, coletados e organizados, será conveniente descrevê-los. Descrever os dados é o mesmo que apresentá-los. E isso poderá ser feito também de várias formas. Poderemos apresentar os dados por meio de uma tabela, por meio de um gráfico, ou outra qualquer. O fato é que, ao concluirmos essas três fases iniciais do processo estatístico – coleta, organização e descrição dos dados – somente então estaremos aptos a passar às duas etapas finais, que consistem em proceder à análise dos elementos para, enfim, chegarmos a uma conclusão ou tomada de decisão. Obviamente que a Estatística não se prestará a um objetivo tão pobre como o de meramente coletar dados de pesquisa para dispô-los numa tabela. Claro que não! O alcance da Estatística é maior: aqueles elementos servirão a uma análise, porque, ao final, queremos chegar a uma conclusão! Existe uma decisão a ser tomada, e o será com base na conclusão a qual a análise dos dados nos conduzir! 2 A Estatística está na vida das pessoas, muito mais do que elas imaginam! Não há um só medicamento vendido nas farmácias que não tenha sido submetido a rigorosos controles estatísticos! Antes de virar “remédio”, aquela droga foi testada um zilhão de vezes. Primeiro em bichos e depois em gente. E foram anotados os efeitos colaterais causados pela droga, em cada uma das vezes que elas foram tomadas pelos pacientes. Esses dados foram analisados, para gerar uma conclusão. Aquela substância só se transforma em medicamento e chega às prateleiras se a conclusão for satisfatória e os riscos estiverem dentro de um padrão aceitável. Esse é apenas um minúsculo exemplo. São milhares deles! Os autores costumam classificar a Estatística em Descritiva e Inferencial. Nossa memorização passará pelo alfabeto: neste, o D vem antes do I. Assim, a Estatística Descritiva (a do D) englobará as etapas iniciais do processo estatístico, quais sejam, a coleta, a organização e a descrição dos dados. Já a Estatística Inferencial (a do I), se encarregará da análise dos dados e tomada de decisão, que são as etapas finais do processo. Ficou fácil: a Estatística do D vem antes da Estatística do I. Pode-se resumir as três etapas da Estatística Descritiva em uma única palavra: síntese! Daí, coletar os dados, organizá-los e descrevê-los é o mesmo que fazer a síntese dos dados. Ok? Voltemos àquele exemplo inicial, das duzentas pessoas na sala. Minha pesquisa é sobre a idade de cada uma delas. Ora, se eu tiver tempo e paciência para extrair a informação de todas as pessoas da sala, estarei trabalhando com a população inteira. População, na Estatística, é, pois, o conjunto universo do qual extraímos a informação! No exemplo da sala, aquelas duzentas pessoas serão a população! E se trabalho com a população inteira, estarei fazendo um estudo estatístico chamado censo! Ou seja, o censo é uma forma de fazer uma pesquisa estatística, em que todos os elementos da população são consultados! Mas se eu considerar que duzentas pessoas é muita gente, e que eu perderia muito tempo e dinheiro para coletar os dados de todos eles, haveria uma outra forma possível para trabalharmos? Sim! Ao invés de usarmos toda a população para coletar as respostas, escolheremos apenas uma parte menor dela, um subgrupo, que terá o poder de representá-la por inteiro. Suponhamos, então, que eu decidi fazer a pergunta a apenas cinqüenta pessoas. Esse grupo menor será chamado de amostra, e estaremos realizando um estudo estatístico por amostragem. Atentemos para o fato de que amostra não é meramente um pedaço menor da população! Não é só isso! A característica fundamental da amostra é a da representatividade! Claro! Não adiantaria eu escolher uma única pessoa e perguntar a sua idade. Essa única resposta, certamente, não teria o poder de representar a população toda. Não poderíamos estender à população uma conclusão oriunda de um subgrupo não-significativo. Concordam? Daí, uma pergunta: Mas, professor, qual seria o número mínimo de elementos de uma população que poderia ser adotado, para que possamos considerá-lo uma amostra? Boa pergunta! Existem cálculos para isso! E os veremos, oportunamente! Por enquanto, basta-nos saber que de um lado existe a população, e esta relaciona-se com o conceito de censo; de outro lado existe a amostra, relacionada com o conceito de amostragem! Ok? Mais adiante, numa próxima aula, veremos como o conhecimento desses dois conceitos tem sido exigido em questões de provas recentes, envolvendo cálculos e tudo mais! (E veremos como é um negócio fácil...)3 Se eu estudei a idade das pessoas daquela sala, então a minha variável estatística era idade. Se eu for estudar peso, a variável será o peso. Se eu for estudar a religião praticada pelas pessoas, essa será a variável. Em suma, variável estatística é o objeto do estudo! Podemos classificar as variáveis estatísticas em variáveis quantitativas e em variáveis qualitativas. Serão quantitativas quando lhes pudermos atribuir um valor numérico. Qual a sua idade? A resposta é um número? Sim! Então, idade é uma variável quantitativa. Quantos livros você lê por ano? A resposta é um número? Sim! Então, número de livros lidos por ano é uma variável quantitativa. Por outro lado, se pergunto qual a sua cor preferida, a resposta não é um valor numérico. Logo, a variável será dita qualitativa. Essa primeira classificação é bem simples. Concordam? Existe ainda uma subclassificação! Variáveis Quantitativas poderão ser ditas discretas ou contínuas. Serão variáveis quantitativas discretas (também chamadas descontínuas) aquelas que forem obtidas por um processo de contagem. Se para responder à pergunta “Quantas pessoas moram na sua casa?” você precisa fazer uma contagem, então estamos diante de uma variável discreta. Já as variáveis contínuas são aquelas obtidas por um processo de medição! Se alguém perguntar o seu peso, você precisará subir numa balança e medir. Assim, peso é uma variável contínua. Essas dicas – contagem para variável discreta e medição para variável contínua – são conceitos mnemônicos, ou seja, usados para auxiliar a memorização. E os conceitos formais, quais seriam? Vamos aprender por meio de dois exemplos. Considere a reta abaixo, formada por resultados possíveis à pergunta “Quantas pessoas moram na sua casa?” Teremos: 1 2 3 4 5 6 7 8 9 ... Ora, sejam quantas forem as pessoas entrevistadas, todas as respostas recairão sempre sobre os valores inteiros (1, 2, 3, 4, 5 etc). Ou seja, jamais alguém poderá dizer que moram 3,75 pessoas em sua casa! Concordam? Por isso dizemos que a variável discreta é também chamada variável descontínua. Porque entre um resultado possível e outro existe uma descontinuidade. Certo? Agora, consideremos a seguinte reta de resultados possíveis abaixo, e que estejamos investigando o peso de um grupo de pessoas. Vejamos: 10 20 30 40 50 60 70 80 90 ... Poderia alguém responder que pesa 64,325kg? Claro! Observamos facilmente que para esta variável não há qualquer descontinuidade entre um resultado possível e outro! Ou seja, a variável contínua pode assumir qualquer resultado. Esses conceitos – variável discreta e variável contínua – bem como a quase totalidade dos demais conceitos estudados nesta aula inaugural, não têm sido cobrados nas provas mais recentes da Esaf. Costumavam sê-lo, e muito, em provas mais antigas. Sendo assim, por que temos que estudá-los? Primeiramente, porque ainda continuam presentes nos programas atuais. E depois porque não há, simplesmente, como saltar esse conhecimento básico. Ele terá, sim, sua utilidade, como veremos ao longo das aulas. 4 Constarão de qualquer programa de Estatística Básica de concurso tópicos como Medidas de Posição, Medidas Separatrizes, Medidas de Dispersão, Medidas de Assimetria, Medidas de Curtose, entre outros. Ora, estudaremos o que significa e como se calcula cada uma dessas medidas! O que precisamos saber é que todos esses cálculos serão realizados com base nos dados de um determinado conjunto. Chegamos ao ponto: a maneira mais usual de um conjunto de dados ser apresentado em uma prova qualquer é por meio de uma tabela, que receberá o nome de Distribuição de Frequências! Voltemos ao exemplo daquela sala de aula, com duzentas pessoas, e eu quero saber agora quantos livros cada um lê por ano. Pois bem, para simplificar minha vida, eu posso estabelecer alguns intervalos, que representarão as respostas daquelas pessoas. Por exemplo: pessoas que lêem de 0 a 5 livros por ano (cinco exclusive!); que lêem de 5 a 10 livros por ano (dez exclusive!); que lêem de 10 a 15 (quinze exclusive!); e de 15 a 20. Colocando essas classes de resultados numa coluna da tabela, teremos: Classes (número de livros lidos por ano) fi (pessoas) 0 !--- 5 5 !--- 10 10 !--- 15 15 !--- 20 Total Para complementar a tabela, agora eu pedirei: “Por gentileza, pessoas que lêem entre zero e quatro livros por ano, levantem a mão!” Percebam que nesse momento se fará um silêncio constrangedor... e todos meio com vergonha de erguer a mão e revelar que não são leitores assim tão assíduos como gostariam de ser... Mas aí eu insisto: “Vamos lá, minha gente! É só para eu preencher a tabela...” Resultado: 108 corajosas (e preguiçosas) pessoas ergueram a mão. Repetindo a pergunta para leitores de cinco a nove livros por ano, 72 pessoas se pronunciaram. Nova pergunta, agora para o intervalo de 10 a 14 livros, e apenas 18 pessoas ergueram o braço. Finalmente, na última pergunta, duas míseras pessoas (o que é diferente de duas pessoas míseras!), levantaram a mão. Informando o resultado desta pesquisa na tabela, teremos o seguinte: Classes (número de livros lidos por ano) fi (pessoas) 0 !--- 5 5 !--- 10 10 !--- 15 15 !--- 20 108 72 18 2 Total 200 Pronto, meus amigos! Estamos diante de uma Distribuição de Frequências! Trata-se, portanto, de uma tabela que retratará o resultado de uma pesquisa realizada. A característica marcante da Distribuição de Frequências é que a variável estudada estará subdivida em classes! Dedicaremos o restante desta aula inteira a conhecer e a dissecar uma Distribuição de Frequências! Exploraremos ao máximo essa tabela, pois ela se tornou, por assim dizer, a alma de uma prova de Estatística Básica! Saber trabalhar com uma Distribuição de Frequências é meio caminho andado para se fazer uma boa prova! 5 No sentido inverso, se você não tiver desenvoltura para trabalhar com a Distribuição, estará em maus lençóis na hora da prova! Ok? A Distribuição de Frequências é nada mais que uma tabela, por meio da qual conheceremos o resultado de uma pesquisa realizada. O exemplo mostrado na aula de apresentação contemplava um grupo de duzentas pessoas que seriam questionadas sobre o número de livros que cada uma delas lêem por ano. (Lembrados?) Assim, o resultado desta enquete foi transcrito para uma tabela, e apresentado da forma seguinte: Classes(número de livros lidos por ano) fi (pessoas) 0 !--- 5 5 !--- 10 10 !--- 15 15 !--- 20 108 72 18 2 Total 200 Pronto, meus amigos! Estamos diante de uma Distribuição de Frequências! Trata-se, portanto, de uma tabela que retratará o resultado de uma pesquisa realizada. A característica marcante da Distribuição de Frequências é que a variável estudada estará subdivida em classes! As classes serão, portanto, as subdivisões da nossa variável. É um conceito intuitivo. Basta olharmos, e concluímos que essa Distribuição acima possui quatro classes: à 1ª Classe) Pessoas que lêem entre zero e cinco livros por ano; à 2ª Classe) Pessoas que lêem entre cinco e dez livros por ano; à 3ª Classe) Pessoas que lêem entre dez e quinze livros por ano; à 4ª Classe) Pessoas que lêem entre quinze e vinte livros por ano; Observem que cada classe será margeada por dois limites, chamados respectivamente de limite inferior (linf) e limite superior (lsup). Esses limites são justamente os valores que você está enxergando no início e no fim de cada classe. Assim, teremos que: à 1ª Classe) linf=0 e lsup=5 à 2ª Classe) linf=5 e lsup=10 à 3ª Classe) linf=10 e lsup=15 à 4ª Classe) linf=15 e lsup=20 Facilmente vocês já observaram que onde acaba uma classe, começa a próxima! Não é verdade? Ou seja, o limite superior de uma classe é igual ao limite inferior da classe seguinte. Agora uma pergunta interessante, a qual você deverá tentar responder apenas olhando para a tabela. Ok? Uma pessoa que lê exatamente 10 (dez) livros por ano entrará na contagem da segunda classe ou da terceira? Veja a tabela novamente: Classes (número de livros lidos por ano) fi (pessoas) 0 !--- 5 5 !--- 10 10 !--- 15 15 !--- 20 108 72 18 2 6 Total 200 Vemos que 10 é limite superior da segunda classe e inferior da terceira. Mas, e aí? Quem lê 10 livros participará de qual das classes, segunda ou terceira? Para responder a essa pergunta, precisamos conhecer o significado de intervalo de classe! E esse conceito será definido com base no símbolo que estiver presente entre os limites da classe. No caso do exemplo acima, o símbolo presente é este: !---- Essa simbologia tem um significado. Ampliemos o símbolo para explicarmos melhor: Linf Lsup A presença do tracinho vertical no lado do limite inferior significa que ele estará incluído no intervalo de classe. Falamos em intervalo fechado à esquerda. A ausência do tracinho vertical no lado do limite superior quer dizer que este limite estará excluído do intervalo! Falaremos em intervalo aberto à direita. Daí, se analisarmos a segunda classe, teremos: 5 10 Esta classe possui como limites os valores 5 e 10. Porém, uma pessoa que lê exatamente 10 (dez) livros não entrará na contagem desta segunda classe, uma vez que 10 é limite superior desta classe, e aqui temos que o intervalo é aberto à direita. Ou seja, o limite superior está excluído desta contagem, embora faça parte da classe como um de seus limites! Você conclui: classe é uma coisa; intervalo de classe é outra. Quem define o intervalo é a simbologia que separa os limites das classes. Este símbolo que vimos acima (ı----) é aquele com o qual trabalharemos sempre! É, por assim dizer, a simbologia clássica! Trabalharemos sempre com essa consideração: intervalo fechado à direita e aberto à esquerda. E por que será sempre assim? Porque nossa elaboradora, a Esaf, considera que em uma Distribuição de Frequências, trabalha-se sempre com variáveis contínuas! Todos lembrados do que é uma variável contínua? É aquela que pode assumir qualquer resultado. Em outras: entre um resultado possível e outro, não pode haver qualquer descontinuidade. E se não pode haver descontinuidade entre resultados possíveis da variável, faz-se necessário que onde termine uma classe, comece a próxima. Alguém dirá: mas professor, número de livros lidos por ano é uma variável discreta! Sim. Eu sei que é. Eu só usei essa variável para ilustrar o que é uma Distribuição de Frequências. Não fui muito rigoroso com o exemplo. Ok? Mas na prova, para efeito de uma questão teórica, fica valendo o seguinte: na Distribuição de Frequências, trabalhamos com variáveis contínuas! 7 Outras simbologias há na definição de outros tipos de intervalos de classe. Como não são de nosso interesse, não trataremos a seu respeito. O próximo elemento que estudaremos é a amplitude da classe. Um conceito muito simples. Amplitude será, para nós, sinônimo de tamanho. Amplitude da classe será, portanto, o tamanho da classe. Representaremos esse conceito com a letra h (minúscula). Observando a nossa tabela, percebemos facilmente que todas as classe apresentam a mesma amplitude (o mesmo tamanho). Senão, vejamos: Classes 0 !--- 5 5 !--- 10 10 !--- 15 15 !--- 20 à h=5 à h=5 à h=5 à h=5 Pergunta: é obrigatório que todas as classes tenham a mesma amplitude? Não! Não é obrigado! Mas é isso é algo esperado. A quase totalidade das Distribuições de Frequência trazidas em provas usa classes de mesma amplitude. Mas isso não é uma regra. É apenas o usual. Na prova do AFRF de 2005, por exemplo, a Esaf inovou e apresentou uma Distribuição em que nem todas as classes possuíam a mesma amplitude. Oportunamente veremos os efeitos, na resolução das questões, do fato de estarmos diante de uma Distribuição de Frequência com classes de amplitudes diversas. Ok? A rigor, não muda quase nada. Falemos agora sobre o chamado Ponto Médio. O que vem a ser? Ora, o nome é sugestivo: Ponto Médio (PM) é aquele valor que está rigorosamente no meio da classe. Cada classe possui, portanto, seu próprio Ponto Médio. Às vezes é possível determinar o PM de uma classe, só de olhar para ela. É o caso do nosso exemplo. Vejamos: qual é o valor que está exatamente entre 0 e 5? É 2,5. Concordam? Claro! Daí, 2,5 é o PM da primeira classe. Mas se tivéssemos uma classe com os seguintes limites: 19,5 !--- 24,5. Pode ser que não seja assim tão imediata a determinação desse PM. Assim, calcularemos o PM da classe somando seus limites, e dividindo esse resultado por dois. Ou seja: PM=(Linf+Lsup)/2. Assim, para a classe 19,5 !--- 24,5 , teríamos: PM=(19,5+24,5)/2=22. Só isso! Agora voltemos a nossa Distribuição de Frequências, e construamos a coluna dos PontosMédios. Teremos: Classes PM 0 !--- 5 5 !--- 10 10 !--- 15 15 !--- 20 2,5 7,5 12,5 17,5 Alguém conseguiu observar uma relação qualquer entre os Pontos Médios? Sim? Vemos que a diferença entre dois pontos médios consecutivos foi sempre igual a uma constante. Perceberam? Ou dito de outra forma: o próximo Ponto Médio é sempre igual ao anterior somado a uma constante. Neste caso, essa constante é 5. Ora, onde foi mesmo que vimos esse valor 5? Foi este também o valor da amplitude das classes! 8 Concluiremos assim: sempre que todas as classes de uma Distribuição de Frequências tiverem a mesma amplitude (mesmo h), observaremos que o próximo Ponto Médio será igual ao anterior somado àquela amplitude. É este o primeiro atalho do nosso Curso! Um bem simples, é verdade, mas não deixa de ser um atalho! Assim, na hora de construirmos a coluna dos Pontos Médios, a primeira coisa a observar é se todas as classes têm a mesma amplitude. Se for o caso, você irá apenas descobrir o valor do primeiro Ponto Médio (o PM da primeira classe). Daí, basta sair somar este PM com o h e prosseguir realizando essa mesma operação, até chegar à última classe. No nosso exemplo, sabemos que h=5, logo, teremos: Classes PM 0 !--- 5 5 !--- 10 10 !--- 15 15 !--- 20 2,5 à 1º PM, calculado! (2,5+5) = 7,5 (7,5+5) = 12,5 (12,5+5)= 17,5 Pois bem! Já conhecemos quais os elementos de uma Distribuição de Frequências. Agora precisamos saber por que essa tabela é chamada assim. O que vêm a ser essas tais frequências? É sobre isso que falaremos a seguir. Comecemos repetindo a tabela do nosso exemplo: Classes (número de livros lidos por ano) fi (pessoas) 0 !--- 5 5 !--- 10 10 !--- 15 15 !--- 20 108 72 18 2 Total 200 Observemos que a segunda coluna nos revela o número de elementos que participa da classe correspondente. Ou seja, o valor 108 na primeira classe da coluna do fi significa que há 108 pessoas no conjunto que lêem entre zero e cinco livros por ano (cinco exclusive). Assim, concluímos: a coluna do fi, chamada frequência absoluta simples, indica o número de elementos que faz parte da classe correspondente. Só isso. É a frequência de mais fácil compreensão! E a mais importante delas também! Precisaremos conhecer os valores da fi para podermos resolver quase todas as questões de uma prova. 9 Podemos, assim, unir os dois esquemas de transformação em um só, e chegaremos ao seguinte: De simples para acumulada: somar com a diagonal fac (iguais na primeira classe) fi fad (iguais na última classe) (comparam-se os dois somatórios) Fac (iguais na primeira classe) Fi Fad (iguais na última classe) De acumulada para simples: próxima acumulada – acumulada anterior Na seqüência, trocaremos apenas algumas palavras sobre o que venha a ser um Histograma. O Histograma é o gráfico estatístico que existe para representar os dados de uma Distribuição de Frequências. Relacione sempre: Histograma para Distribuição de Frequências! Ok? É muito fácil construir um Histograma. No eixo horizontal, anotaremos os limites das classes; e no eixo vertical, as frequências absolutas simples. Trabalhemos com a seguinte Distribuição de Frequências, e tentemos construir o Histograma. Teremos: Xi Fi 0 --- 10 10 --- 20 20 --- 30 30 --- 40 40 --- 50 3 4 3 2 1 n=13 fi 0 10 20 30 40 50 (Classes) A primeira classe, que vai de zero a dez, tem fi igual a 3. Assim, o retângulo que representará essa classe no histograma será o seguinte: 4 3 2 1 10 fi 0 10 20 30 40 50 (Classes) Viram? A base do retângulo é definida pelos limites da classe, enquanto sua altura é definida pela frequência absoluta simples daquela classe. Não é fácil? Facílimo! Para a segunda classe, sabendo que o fi=4, teremos: fi 0 10 20 30 40 50 (Classes) A essa altura, todos já entenderam a feitura do Histograma, não é isso? Assim, vou logo completar o gráfico, com base nos dados daquela Distribuição de Frequências apresentada acima. Teremos: fi 0 10 20 30 40 50 (Classes) Enfim! Professor, mas por que foi mesmo que você apresentou o Histograma exatamente neste momento? Porque é possível, embora muito raro, que a sua prova apresente o conjunto a ser trabalhado por meio de um gráfico como esse! Ou seja, em vez de apresentar a Distribuição de Frequências, a questão trará um Histograma! E aí? O que fazer? Ora, com a mesma facilidade que você construiu um Histograma partindo de uma Distribuição de Frequências, você poderá fazer o caminho de volta, e construir 4 3 2 1 4 3 2 1 4 3 2 111 a Distribuição, partindo de um Histograma! Concordam? Repito: é muito raro vir um Histograma na prova. Mas não é impossível. E já aconteceu! Querem ver um exemplo? Caiu numa prova bem antiga de Técnico da Receita Federal, do tempo em que esse cargo se chamava TTN. O Histograma trazido pela prova foi o seguinte: fi 12 10 8 6 4 2 2 4 6 8 10 12 14 16 idades E aí? Você saberia transformar esse gráfico numa Distribuição de Frequências? Claro. Ficaria o seguinte: Classes fi 2 --- 4 4 --- 6 6 --- 8 8 --- 10 10 --- 12 12 --- 14 14 --- 16 2 6 10 12 8 6 4 # Medidas de Posição: Nosso presente estudo dará início à análise das chamadas Medidas de Posição. Porém, antes de as conhecermos, convém muitíssimo que nós saibamos quais são as formas pelas quais um conjunto pode ser apresentado numa prova. As mais comuns formas de apresentação de um conjunto são as três seguintes: 1ª) Rol: aqui os elementos do conjunto estarão dispostos numa ordem que pode ser crescente ou decrescente. São exemplos de rol: (1,2,3,4,5) (1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5) E assim por diante! Não é muito comum encontrarmos um rol numa questão de prova, mas também não é algo impossível. Entre as últimas provas da Receita, pôde-se ver um rol na prova de 1998 e na de 2005. Entendido o que é um rol? Ótimo. 2ª) Dados Tabulados: Vamos trabalhar com esse segundo exemplo de rol, acima. Será possível apresentarmos os elementos desse conjunto na forma de uma tabela? Claro que sim! 12 Vamos ver como é que fica: Xi fi 1 3 2 4 3 3 4 2 5 1 Vejam que a coluna do Xi apresenta os elementos (individualizados) do conjunto; e a coluna do fi (a nossa conhecidíssima frequência absoluta simples) indica o número de vezes que o elemento aparece no conjunto! Assim, vemos que o elemento 1 (Xi=1) aparece três vezes naquele rol (fi=3); o elemento 2 (Xi=2) aparece quatro vezes (fi=4), e assim por diante. Se quisermos saber quantos elementos há neste conjunto, o que teremos que fazer? Ora, teremos que somar a coluna da frequência absoluta simples – fi. Daí, já podemos guardar a seguinte informação: sempre que quisermos saber o n (número de elementos de um conjunto), e esse conjunto estiver apresentado na forma de uma tabela, basta somarmos os valores da coluna da frequência absoluta simples! Ok? Assim, teremos: Xi fi 1 3 2 4 3 3 4 2 5 1 n=13 Uma discussão existe acerca desta segunda forma de apresentação dos dados: há autores que dizem que se trata de um tipo de Distribuição de Frequências; outros dizem que não! Ora, para efeito de concurso, essa discussão não nos interessa em nada! O que interessa é que você precisará saber trabalhar a questão de todo jeito! Assim, para nós, aparecendo um conjunto na prova, e esse conjunto estando apresentado desta forma que acabamos de ver acima, diremos que estamos diante de Dados Tabulados! E só! Ok? 3ª) Distribuição de Frequências: Essa já é nossa velha conhecida! Na Distribuição de Frequências, diferentemente do que ocorre no rol e nos dados tabulados, os elementos do conjunto estarão agrupados em classes, em vez de serem apresentados de forma individualizada! Exemplo: 13 Xi fi 0 -- 10 3 10 -- 20 4 20 -- 30 3 30 -- 40 2 40 -- 50 1 n=13 Essencialmente, o que diferencia a Distribuição de Frequências das outras duas formas de apresentação de um conjunto, vistas acima, é exatamente o fato de aqui, na Distribuição, os dados estarem agrupados em classes! Já usamos uma aula anterior para estudar com minúcia os elementos de uma Distribuição, não é verdade? Essencialmente, são essas as três formas mais usuais de apresentação de um conjunto: Rol, Dados Tabulados e Distribuição de Frequências. Porém, não são as únicas. Vamos aproveitar o ensejo para apresentar um tipo de gráfico, chamado de Histograma! Já falamos sobre esse gráfico na aula passada! Lembrados? Trabalhemos com a Distribuição de Frequências do exemplo acima, e tentemos construir o Histograma. (Isso, inclusive, já foi feito)! Teremos: fi 0 10 20 30 40 50 (Classes) Pois bem! O que fizemos nesta aula, até o momento, foi conhecer as maneiras pelas quais a Esaf, ou qualquer outra elaboradora, pode se utilizar para apresentar um conjunto de elementos numa prova de Estatística. Uma vez fornecido o conjunto – seja na forma de um rol, ou de dados tabulados, ou de Distribuição de Frequências, ou de um Histograma, ou de um Diagrama de Ramos e Folhas – já poderão ser solicitados, nas questões da prova, os cálculos de uma infinidade de medidas estatísticas! Ou seja, para um determinado conjunto, pode-se pedir o cálculo de: à Medidas de Tendência Central (Média, Moda, Mediana); à Medidas Separatrizes (Mediana, Quartis, Decis, Centis); à Medidas de Dispersão (Amplitude Total, Desvio Absoluto, Desvio Padrão, Variância, Coeficiente de Variação, Desvio Quartílico, Variância Relativa); 4 3 2 1 14 à etc, etc. Considerando que o Histograma será transformado em uma Distribuição de Frequências e que o Diagrama de Ramos e Folhas será transformado num Rol, resta que as três formas básicas de apresentaçãodos dados serão, realmente: o Rol, os Dados Tabulados e a Distribuição de Frequências. Assim, para cada uma das medidas estatísticas que formos estudar, aprenderemos como ela será calculada para o caso de o conjunto estar na forma de um Rol, ou de Dados Tabulados ou de Distribuição de Frequências. Ok? Então vamos lá! Começaremos conhecendo as Medidas de Tendência Central – Média Aritmética, Moda e Mediana. # A Média Aritmética: X Quando falarmos simplesmente em Média, saiba que estaremos nos referindo à Média Aritmética. Ok? Existem outras espécies de Média, além da Aritmética, que serão estudadas oportunamente. Comecemos pelo cálculo da Média de um Rol. Estou certo que esse é um cálculo que todos nós já realizamos. Suponhamos que você ainda está na faculdade. O semestre começou, e você nem se deu conta disso. Eis que chegou o dia da primeira prova! A sua nota foi um desastre: nota 3 (três). Que lástima! Aí você disse: “Valha-me Deus, as aulas já começaram!” (Meio tardia essa descoberta...!) O fato é que você procurou se redimir da nota baixa que tirou, e dedicou esforços para a segunda prova. O resultado se fez perceber, e você conseguiu agora tirar um 8 (oito). Ora, você sabia que para passar por média, teria que tirar um notaço na terceira e última prova, uma vez que a média naquela sua faculdade era 7 (sete). Assim, virou várias noites estudando e se dedicando àquela disciplina, de sorte que conseguiu, merecidamente, tirar um 10 (dez) na terceira prova. Tão logo recebeu esta última nota, você correu às contas, pois desejava saber se havia passado por média, ou se necessitaria fazer a prova final. Suas contas foram as seguintes: à ( ) 3 21 3 1083 = ++ =7,0 Parabéns! Você acaba de provar que é um aluno cobra! (Aquele que passa se arrastando)! Mas passou, não foi? Isso é o que importa! (Igual no concurso: se você passar em último lugar, vai ganhar o mesmo salário de quem passou em primeiro)! Vejamos novamente as notas das três provas dessa pessoa: (3, 8, 10). Isto é um rol? Sim! Então, esta conta que foi feita para o cálculo da média das notas foi, rigorosamente, o mesmo cálculo que se faz para se descobrir a Média Aritmética de um conjunto apresentado na forma de um rol. Ou seja: somam-se as notas, e divide-se este resultado pelo número de provas. Falando-se de um modo genérico: somam-se os elementos do conjunto, e divide-se esse resultado pelo número de elementos do conjunto! Colocando-se essa definição em uma fórmula, usando-se da linguagem estatística, teremos que: 15 n Xi X ∑= Onde: à X é a Média Aritmética; à Σ é o sinal de somatório. O que vier após este símbolo deverá ser somado! à Xi é cada elemento do conjunto; à n é o número de elementos do conjunto. Só isso! Nada mais fácil que se calcular a Média de um rol. Pena que o Rol seja tão raro em provas...! # A TRANSIÇÃO: Esta palavra – Transição – está em destaque, porque nos acompanhará longamente durante nosso Curso! Aprenderemos, meus queridos, que há uma maneira facílima de migrarmos de uma fórmula de Rol para a fórmula de Dados Tabulados. Da mesma forma, há como migrarmos da fórmula dos Dados Tabulados para a fórmula da Distribuição de Frequências! E essa maneira de fazer a migração de uma fórmula para outra é justamente a tal da Transição que vamos aprender agora! Vamos lá! 1º) Como passar da fórmula do Rol para a dos Dados Tabulados? Manda a primeira transição que façamos o seguinte: à Repete-se a fórmula do rol; e à Acrescenta-se no numerador da fórmula, sempre junto ao sinal de somatório (Σ), a frequência absoluta simples fi. Só isso! Assim, se eu já aprendi que a fórmula usada para se calcular a Média Aritmética de um conjunto apresentado na forma de um rol é: à n Xi X ∑= ... ... então, querendo agora construir a fórmula da Média Aritmética para um conjunto apresentado na forma de Dados Tabulados, eu só precisarei seguir o que manda a transição! E teremos: Para Dados Tabulados: n Xi X ∑= ...... Viram? Bastou repetir a fórmula do Rol (já conhecida!) e acrescentar o fi no numerador, junto ao sinal de somatório! Usamos a primeira Transição! fi 16 E agora, caso queiramos construir a fórmula da Média Aritmética para uma Distribuição de Frequências, como devemos proceder? Aí surge a segunda transição. Vejamos. 2º) Como passar da fórmula dos Dados Tabulados para a da Distribuição de Frequências? Manda a segunda transição que façamos o seguinte: à Repete-se a fórmula dos Dados Tabulados; e à Troca-se o Xi (elemento individualizado do conjunto) por PM (Ponto Médio) da classe! E é só isso! Mas qual seria o motivo de essa transição se fazer desta forma? Ora, por uma razão muito simples. Basta comparar as duas primeiras formas de apresentação (Rol e Dados Tabulados) com a Distribuição de Frequências, e veremos que naquelas estamos sempre trabalhando com Xi (elementos individualizados do conjunto). Mas na Distribuição de Frequências, nós deixamos de trabalhar com elementos individualizados, uma vez que agora nossa variável passará a ser agrupada em classes! Daí, na Distribuição, não há mais que se falar em elemento individualizado Xi. Terá ele que ser substituído por aquele elemento que melhor representa cada classe. E esse elemento é justamente o Ponto Médio! Assim, conhecendo a fórmula da Média Aritmética para Dados Tabulados, e aplicando o que nos manda a segunda transição, teremos que a Média para uma Distribuição de Frequências será dada por: n fi X ∑= . A boa notícia, meus amigos, é que essa mesmíssima transição, que acabamos de aprender, não se aplica somente a fórmulas de Média Aritmética. Não! Vai muito além disso! Vamos usá-la para a memorização de várias outras medidas estatísticas, a exemplo do Desvio Absoluto, do Desvio Padrão, da Variância, entre outras. Primeiro, vejamos se ficou mesmo bem memorizada a nossa Transição! Teremos: Resumo da Transição: 1º) Você memoriza a fórmula do Rol; 2º) Repete a fórmula do Rol e acrescenta fi no numerador, sempre junto ao sinal de somatório, e aqui chegamos à fórmula dos Dados Tabulados; 3º) Repete a fórmula dos Dados Tabulados e troca-se Xi por PM (Ponto Médio), e aqui chegamos à fórmula da Distribuição de Frequências! # Resumo das Fórmulas da Média Aritmética: à Média Aritmética para Rol: n Xi X ∑= à Média Aritmética para Dados Tabulados: n Xifi X ∑= . PM17 à Média Aritmética para Distribuição de Frequências: n PMfi X ∑= . Agora, considerando que em aproximadamente 99% dos casos o conjunto vem, na prova, expresso na forma de uma Distribuição de Frequências, convém que nos dediquemos mais a esta forma de apresentação! # Algumas Propriedades da Média Aritmética: Considere o seguinte conjunto original (um rol): {1, 2, 3, 4, 5} Qual é a média deste conjunto? Teremos: (1+2+3+4+5)/5=15/5 à X =3 E se agora tomarmos cada elemento (Xi) daquele conjunto original, e resolvermos adicionar cada um deles à constante 10, por exemplo. O que teremos? Ora, teremos um novo conjunto: {11, 12, 13, 14, 15}. Concordam? Assim, já não mais estamos diante daquela variável original, e sim de uma variável transformada! Transformada por meio de quê? De uma operação de soma! E qual é a Média desse novo conjunto (dessa nova variável)? Façamos as contas: (11+12+13+14+15)/5=65/5 à X =13. Ora, nem precisaríamos ter feito essa conta! Pois existe uma propriedade que diz: somando-se todos os elementos do conjunto com uma constante, a Média do novo conjunto será igual à Média do conjunto original também somada com aquela mesma constante! Foi verdade isso? Sim. A Média do conjunto original era X =3. Nós somamos cada elemento do conjunto original com constante 10. Daí, a Média do novo conjunto será a média anterior (3) somada também à constante 10. Ou seja, a nova Média será 13. E se serve para soma, serve também para subtração! Agora consideremos que cada elemento daquele conjunto original será multiplicado pela constante 10. Ok? O que ocorrerá àquele conjunto? Será transformado em outro. Passaremos a ter: {10, 20, 30, 40, 50}. Não se trata mais da variável original e sim de uma variável transformada! Transformada por quem? Por uma operação de multiplicação! Calculando a média do novo conjunto, teremos: (10+20+30+40+50)/5=150/5 à X =30. E nem precisaríamos ter feito este cálculo, pois existe uma propriedade da Média que diz: multiplicando-se cada elemento de um conjunto original por uma constante, a nova Média será igual à média anterior também multiplicada pela mesma constante! Senão, vejamos: a média do conjunto original era X =3. Nós multiplicamos cada elemento do conjunto original pela constante 10. Daí, a Média do novo conjunto será a média anterior (3) multiplicada também pela constante 10. Ou seja, a nova Média será 30. E se serve para produto, serve também para divisão! Para melhorar a nossa vida e a nossa memorização, resumiremos essas propriedades todas em uma única (e pequena) frase: A MÉDIA É INFLUENCIADA PELAS QUATRO OPERAÇÕES! Ok? É essa a frase que deve ficar guardada em nossa memória! 18 # MODA: Mo Esse é um dos assuntos prediletos das alunas! Qualquer concurseira de respeito sabe que Moda é aquilo que está em evidência. É isso mesmo? Assim na vida, assim na Estatística. Moda, em sentido estatístico, será aquele elemento que mais aparece no conjunto! Só isso! Nada mais fácil! Vamos aprender a reconhecer a moda de um rol, de dados tabulados e de uma distribuição de frequências. Vamos lá. à Moda do Rol: Analise o conjunto abaixo, e me diga qual é o elemento que se sobressai aos demais: {1, 1, 2, 2, 2, 3, 3, 3, 3, 5, 5, 7, 7, 10} Facilmente se vê que o elemento de maior frequência, aquele que mais aparece no conjunto, é o elemento Xi=3,0. Está terminado! A Moda desse conjunto é 3. Diremos: Mo=3. E não se fala mais nisso! Vocês acham, sinceramente, que a Esaf iria colocar uma questão como essa em prova? Quem pensou que não errou! Confira a questão abaixo, extraída do AFRF-1998: (AFTN-98) Os dados seguintes, ordenados do menor para o maior, foram obtidos de uma amostra aleatória, de 50 preços (Xi) de ações, tomada numa bolsa de valores internacional. A unidade monetária é o dólar americano. 4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13,14, 15, 15, 15, 16, 16, 18, 23 Com base nestes dados, assinale a opção que corresponde ao preço modal. a) 7 b) 23 c) 10 d) 8 e) 9 Sol.: Vejam que o conjunto foi apresentado na forma de um rol. E seus elementos representam preços. Daí, a questão pede que se calcule o preço modal. Se os elementos representassem salários, a questão pediria o salário modal. Se os elementos representassem pesos, a questão pediria o peso modal. Se representassem idades, a idade modal. E assim por diante! Pois bem! Aqui, usaremos a técnica milenar do dedo. Basta colocar o dedo em cima dos elementos do conjunto, e contar, para descobrir aquele que aparece mais vezes que os demais! Conclusão: o elemento Xi=8 é o que mais aparece. É aquele de maior frequência. Logo, é a Moda desse conjunto e a resposta da questão! E acreditem: isso valeu um ponto numa prova de Auditor-Fiscal da Receita Federal. Isso corrobora a minha tese de que nem só de questões difíceis se faz uma prova! Também existem as fáceis, as muito fáceis, as facílimas, e as estupidamente bestas! E essas nós não podemos errar, nem em pesadelo. Pois bem. Mais algumas informações: à Se o conjunto apresenta uma só moda, será dito conjunto modal. Mas, considere o rol abaixo: {1, 2, 2, 2, 3, 3, 5, 7, 7, 7, 9, 10} Quem é a moda desse conjunto? Não é apenas uma, mas são duas: o elemento 2 e o elemento 7. Estamos, pois, diante de um conjunto dito bimodal. 19 E se houver três ou mais modas em um conjunto? Então estaremos diante de um conjunto multimodal. Atente agora para o seguinte conjunto: {1, 2, 3, 4, 5} Quem arrisca dizer qual é a Moda dele? Existe algum elemento que se destaca em relação aos demais? Um elemento que aparece mais que os outros? Não! Nenhum elemento se destaca. Daí, concluímos que não há moda neste rol, de sorte que estamos diante de um conjunto amodal. Conclusão: diferentemente da Média Aritmética, que sempre existe e é única, a Moda pode existir, pode não existir e, no primeiro caso, pode haver uma, ou duas, ou várias Modas em um mesmo conjunto! Alguma dúvida para a Moda de um rol? Creio que não! Adiante. à Moda de Dados Tabulados: Aqui estamos diante do que há de mais fácil neste Curso! Ora, sabemos que a Moda é o elemento de maior frequência. Assim, diante do conjunto seguinte, tente dizer qual é o elemento modal: Xi fi 1 2 3 4 5 2 3 7 5 1 Neste caso, de o conjunto estar apresentado na forma de Dados Tabulados, sequerprecisamos aplicar a técnica do dedo. Basta deslizar pela coluna da frequência absoluta simples (fi), procurando pela maior fi. Ao encontrarmos, saberemos que o elemento Xi a que ela se refere será a Moda do conjunto! Assim: Xi fi 1 2 3 4 5 2 3 7 5 1 A Moda do conjunto é 3. Só e somente só! Viram como é fácil? Essa aí nunca caiu em prova, até agora! à Moda para Distribuição de Frequências: Aqui estamos diante de uma questão de prova em potencial. Há dois métodos distintos para calcularmos a Moda de uma Distribuição: A Moda de Czuber e a Moda de King. Precisamos saber que a regra é trabalharmos com o método de Czuber. Dito de outra forma: só calcularemos a Moda de uma distribuição de frequências pelo método de King se a questão expressamente o determinar! Ok? 20 Consideremos o seguinte conjunto, supondo que represente os pesos de um grupo de crianças: Classes fi 0-10 2 10-20 4 20-30 7 30-40 5 40-50 2 Comecemos aprendendo o cálculo da Moda de Czuber. São dois passos: 1º) Identificar a classe modal. Ora, classe modal é aquela de maior frequência absoluta simples (maior fi). Só isso! Neste caso, a maior fi é 7, de sorte que a terceira classe será a classe modal. Teremos: Classes fi 0-10 2 10-20 4 20-30 7 30-40 5 40-50 2 Até aqui, tudo tranqüilo? Tranqüilíssimo! Pois bem. O segundo passo consiste em: 2º) Aplicar a Equação da Moda de Czuber. É a seguinte: h pa alMo .inf ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ Δ+Δ Δ += Observem que os elementos desta fórmula serão extraídos daquela Classe Modal que acabamos de identificar no primeiro passo. Ok? Assim, o limite inferior (linf) a que se refere a equação é o limite inferior da classe modal; a amplitude (h) a que se refere a equação é a amplitude da classe modal. E esses deltas da fórmula, significam o quê? Delta significa diferença. Quando falamos em Δa estamos nos referindo à diferença anterior. E quando falamos em Δp estamos nos referindo à diferença posterior. Tanto Δa quanto Δp serão calculados com base em um mesmo referencial: a frequência absoluta simples da classe modal. Assim: à Δa é a diferença entre a fi da classe modal e a fi da classe anterior; e à Δp é a diferença entre a fi da classe modal e a fi da classe posterior. No caso do nosso exemplo teremos: Classes fi 0-10 2 10-20 4 20-30 7 30-40 5 40-50 2 Finalmente, resta-nos aplicar a fórmula de Czuber. E teremos que: Δa=3 Δp=2 21 à h pa alMo .inf ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ Δ+Δ Δ += à 10. 23 320 ⎥⎦ ⎤ ⎢⎣ ⎡ + +=Mo à Mo=26 à Resposta! Pode haver questão mais fácil do que esta? Não pode! E cai na prova, exatamente desse jeito! Um ponto garantido a mais para nós. Aprendamos agora o cálculo da Moda de King. Em dois passos: 1º) Identificar a Classe Modal. Já sabemos fazer isso: a classe modal é sempre aquela de maior frequência absoluta simples! 2º) Aplicar a equação de King, que é a seguinte: h fafp fplMo .inf ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ + += Os dados da equação da Moda de King serão também extraídos da Classe Modal. Assim: linf se referirá ao limite inferior da classe modal; h é a amplitude da classe modal. E estas fp e fa, o que são? São, respectivamente: à fp: frequência absoluta simples da classe posterior à da classe modal; e à fa: frequência absoluta simples da classe anterior à da classe modal. Nesta fórmula não calcularemos deltas, ou seja, não faremos diferenças. Tomaremos as próprias frequências simples, a anterior e a posterior à fi da classe modal. Assim, para o nosso exemplo, teremos que: Classes fi 0-10 2 10-20 4 20-30 7 30-40 5 40-50 2 Daí: à h fafp fplMo .inf ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ + += à 10. 54 520 ⎥⎦ ⎤ ⎢⎣ ⎡ + +=Mo à Mo=25,56 à Resposta! Quero chamar atenção para um detalhe: na Moda de Czuber (que é a regra!), o numerador do colchete é o Δa, enquanto o numerador da Moda de King é a fp. Perceberam isso? Não pode errar a fórmula, senão a questão está perdida! Vou frisar novamente: só usaremos o cálculo da Moda de King se a questão mandar expressamente. Se ela não o fizer, trabalharemos com a Moda de Czuber, que é a moda dos deltas, que é a regra! Ok? Vamos dar uma olhadinha no rol abaixo: à {1, 2, 2, 3} Quem é a Moda deste rol? É 2. Concordam? E se tomarmos cada elemento deste conjunto original e os somarmos à constante 10, por exemplo, o que ocorrerá? Passaremos a ter um novo conjunto. O seguinte: fa fp 22 à {11, 12, 12, 13} Quem é a nova Moda? É 12. E nem precisávamos ter feito este cálculo, uma vez que existe uma propriedade que afirma que: somando todos os elementos do conjunto a uma mesma constante, a nova moda será a anterior também somada àquela constante! E se serve para soma, serve também para subtração! Tomemos novamente o conjunto original. E se multiplicarmos cada elemento daquele conjunto pela constante 10, o que ocorreria? Chegaríamos ao seguinte conjunto: à {10, 20, 20, 30} E a nova Moda é 20, como já poderíamos prever. Sim! Pois há uma propriedade, segundo a qual: multiplicando todos os elementos de um conjunto original por uma mesma constante, a nova moda será a anterior também multiplicada pela mesma constante! E se serve para multiplicação, serve também para divisão! Resumo da história: a Moda, a exemplo da Média Aritmética, também é influenciada pelas quatro operações! # Mediana: Md Como o próprio nome pode sugerir, a Mediana é aquele elemento que está rigorosamente no meio do conjunto, dividindo-o em duas partes iguais, ou seja, em duas metades! O cálculo da Mediana é quase sempre uma questão certa na prova! Uma questão que não podemos e não iremos errar de jeito nenhum! à Mediana para o Rol: Consideremos o seguinte conjunto: à {10, 20, 30, 40, 50}Só olhando, seremos capazes de dizer qual é o elemento que está no meio deste conjunto? Claro! É o elemento 30. Concordam? Ficaram dois elementos à sua direita, e dois à sua esquerda. Ele está, portanto, no meio do conjunto. E sendo assim, é a Mediana! à {10, 20, 30, 40, 50} Md=30 Vocês perceberam que o conjunto acima tem um número ímpar de elementos. Para ele, temos que n=5. Sempre que isso ocorrer, ou seja, sempre que o conjunto tiver um número ímpar de elementos, significa que só haverá uma posição central. E o elemento que ocupar esta posição central será a própria Mediana do conjunto! Há um cálculo que podemos fazer para descobrir qual é a posição central, no caso de o conjunto apresentar um número ímpar de elementos. Este cálculo é o seguinte: à Posição Central = (n+1)/2 Isto é para quando n for um número ímpar! Reparem bem que o resultado desta conta não é a Mediana do conjunto, e sim a sua posição central. O elemento que ocupar esta posição central será, este sim, a Mediana. No nosso exemplo, tínhamos n=5. (Um número ímpar, o que indica a existência de uma única posição central)! Assim, faremos: (n+1)/2=(5+1)/2=3ª Posição! 23 Esta é a posição central do conjunto! Daí, usando novamente a técnica milenar do dedo, você vai contar as posições do conjunto, até chegar à terceira. O elemento que a ocupar será a Mediana que estamos procurando! Teremos: à {10, 20, 30, 40, 50} 3ª Posição à Md=30 E se o conjunto tiver um número par de elementos? Aí a história é outra. Vejamos. Se nosso conjunto for o seguinte: à {10, 20, 30, 40, 50, 60} Quantos elementos há? Seis elementos. Temos, pois: n=6. Um número par de elementos! Sempre que isso ocorrer, ou seja, sempre que houver um número par de elementos no conjunto, significa que haverá duas posições centrais! Estas posições centrais poderão ser encontradas da seguinte forma: à 1ª Posição Central: (n/2) à 2ª Posição Central: a vizinha posterior. Neste caso, em que n=6, teremos: à 1ª Posição Central: (n/2)=6/2= 3ª Posição! à 2ª Posição Central: a vizinha posterior = 4ª Posição! As duas posições centrais estão, portanto, identificadas. Resta descobrir quais são os dois elementos que as ocupam. E vejam o que será feito para calcularmos a Mediana. Teremos: à {10, 20, 30, 40, 50, 60} 4ª Posição à 30 Md=(30+40)/2 à Md=35, 3ª Posição à 40 Ou seja, se n é um número par, descobriremos quais são os dois elementos que ocupam as duas posições centrais, somaremos esses elementos e dividiremos o resultado desta soma por dois. Assim, chegaremos à Mediana do conjunto! Ficou evidenciado neste exemplo que a Mediana não necessariamente terá que ser um dos elementos do conjunto! Viram? Esse valor 35 não é um dos elementos! E no entanto é a Mediana! A prova do Fiscal da Receita de 1998 cobrou uma questão para se determinar a Mediana de um rol. Fazendo uma pequena e irrelevante adaptação, foi o seguinte: (AFTN-98) Os dados seguintes, ordenados do menor para o maior, foram obtidos de uma amostra aleatória, de 50 preços (Xi) de ações, tomada numa bolsa de valores internacional. A unidade monetária é o dólar americano. 4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13,14, 15, 15, 15, 16, 16, 18, 23 Assinale a opção que corresponde à mediana: 24 a) 9,0 b) 9,5 c) 8,0 d) 8,5 e) 10 Sol.: Estamos diante de um rol de 50 elementos. Portanto, n=50, que é um número par! Se n é um número par, teremos duas posições centrais, que serão, respectivamente: à 1ª Posição Central: (n/2)=50/2= 25ª Posição à 2ª Posição Central: a vizinha posterior = 26ª Posição Sabendo disso, e usando a milenar técnica do dedo, contaremos os elementos, para saber quais deles ocupam estas duas posições centrais. Vamos lá: 4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13,14, 15, 15, 15, 16, 16, 18, 23 Os dois elementos que ocupam as duas posições centrais são, ambos, iguais a 9. Nem precisaremos perder tempo somando-os e dividindo o resultado por dois. Concordam? Basta dizer que a Mediana é igual a 9 e pronto! Daí: Md=9 à Resposta! # Mediana para Distribuição de Frequências: Esta, sim, é questão muito provável na sua prova! Consideremos o seguinte conjunto: Classes fi 0-10 2 10-20 4 20-30 7 30-40 5 40-50 2 Se ele representa, suponhamos, os pesos de um grupo de crianças, então a questão lhe pedirá que encontre o peso mediano; se fossem idades, a questão pediria a idade mediana; se fossem salários, o salário mediano. E assim por diante! O primeiro passo é identificar a Classe Mediana! Para isso, trilharemos o seguinte caminho: à Calcular a fração da Mediana: (n/2). No cálculo da mediana de uma distribuição de frequências, não faz nenhuma diferença se n é par ou é ímpar. Seja como for, o nosso cálculo será sempre esse mesmo: (n/2). à Construirmos a coluna da fac (frequência absoluta acumulada crescente). à Compararemos os valores da fac com o resultado da fração da mediana (n/2), fazendo a seguinte pergunta: Esta fac é maior ou igual a (n/2)? Começaremos a fazer esta pergunta desde a fac da primeira classe (lá em cima) e a repetiremos, descendo fac por fac, até que a resposta seja SIM. Quando a resposta for sim, pararemos, procuraremos a classe correspondente, e esta será a nossa Classe Mediana. Vamos fazer isso? Teremos: 25 Classes fi 0-10 2 10-20 4 20-30 7 30-40 5 40-50 2 n=20 à n/2 = 10 Agora, construindoa fac, teremos: Classes fi fac 0-10 2 2 10-20 4 6 20-30 7 13 30-40 5 18 40-50 2 20 n=20 Fazendo a pergunta, teremos: Classes fi fac 0-10 2 2 à 2 é maior ou igual a 10? Não! (Adiante!) 10-20 4 6 à 6 é maior ou igual a 10? Não! (Adiante!) 20-30 7 13 à 13 é maior ou igual a 10? SIM! (PARAMOS AQUI!) 30-40 5 18 40-50 2 20 n=20 E a terceira classe é a nossa classe mediana! Uma vez conhecedores da Classe Mediana, faremos com ela um desenho! Vejamos novamente nosso conjunto: Classes fi fac 0-10 2 2 10-20 4 6 20-30 7 13 30-40 5 18 40-50 2 20 n=20 Traremos essa classe mediana aqui para fora, e nosso desenho será construído da seguinte maneira: à Na parte de cima do desenho, colocaremos os limites da classe. Teremos: Limites da Classe: 20 30 Até aqui, tudo bem? Na parte de baixo do desenho, colocaremos as frequências absolutas acumuladas crescentes (fac) associadas a esses dois limites! Como assim? Vejamos: se eu perguntar quantos elementos já foram acumulados até o limite inferior 20, o que você responderá? Veja o conjunto novamente: àClasse Mediana! 26 Classes Fi Fac 0-10 2 2 10-20 4 6 20-30 7 13 30-40 5 18 40-50 2 20 n=20 Teremos acumulado 6 elementos, concordam? E se eu perguntar quantos elementos já foram acumulados até o limite superior 30, o que você dirá? Vejamos no conjunto: Classes Fi Fac 0-10 2 2 10-20 4 6 20-30 7 13 30-40 5 18 40-50 2 20 Teremos acumulado 13 elementos! Conclusão: na hora de identificar as frequências acumuladas associadas aos dois limites da classe mediana, estas fac serão, sempre e respectivamente, a fac da classe anterior, e a fac da própria classe mediana! Assim, complementando nosso desenho, teremos: Limites da Classe: 20 30 fac associadas: 6 13 Faltando quase nada para terminarmos o desenho! Agora perguntaremos: qual é a posição da Mediana? É o resultado da fração (n/2). Quanto? 10. Pois bem! Esse 10 corresponde à posição, e posição corresponde à frequência acumulada. Assim, localizaremos a décima posição do conjunto na parte de baixo do desenho. Teremos: Limites da Classe: 20 30 fac associadas: 6 10 13 Ora, a esta décima posição corresponde qual elemento dentro da classe? Corresponde à Mediana. Assim, concluiremos o desenho, fazendo: Limites da Classe: 20 Md 30 fac associadas: 6 10 13 É preciso agora que você releia com calma os passos necessários à feitura deste desenho acima. À primeira vista, parece ser complicado. Mas não é! Quando nos habituarmos a trabalhar com ele, estejam certos de que se tornará facílimo! Uma vez diante deste desenho, marcaremos o pedaço da classe que vai do limite inferior até a Mediana, e procuraremos por quatro valores. Os seguintes: 27 Limites da Classe: 20 Md 30 fac associadas: 6 10 13 Encontrando estes quatro valores, teremos: Limites da Classe: 20 Md 30 fac associadas: 6 10 13 Os quatro valores encontrados preencherão os quatro espaços de uma igualdade entre duas frações. Uma dessas frações será composta pelos valores referentes à classe inteira. E a segunda delas, pelos valores referentes à classe quebrada! Teremos: 7 10 4 X 28 10 x 7 4 Multiplica-se cruzando, e teremos: à X=(4x10)/7 à X=5,71 Agora, resta-nos olhar para o desenho, e constataremos que para chegar à Mediana, teremos que somar o limite inferior ao X que acabamos de calcular. Teremos: Md=20+X à Md=20+5,71 à Md=25,71 à Resposta! Façamos mais um exemplo: uma questão de fiscal da Receita: (AFRF-2002.2) Para a solução das duas próximas questões utilize o enunciado que segue. O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de frequências seguinte: Classes Frequência (f) 29,5-39,5 4 39,5-49,5 8 49,5-59,5 14 59,5-69,5 20 69,5-79,5 26 79,5-89,5 18 89,5-99,5 10 Assinale a opção que corresponde à estimativa da mediana amostral do atributo X. a) 71,04 d) 68,08 b) 65,02 e) 70,02 c) 75,03 Sol.: A questão pediu o cálculo da Mediana da Distribuição de Frequências. Vamos fazer isso apenas seguindo os passos que aprendemos acima, como se estivéssemos seguindo uma receita de bolo. Não tem errada! Vamos: 1º) Encontrar o valor do n (somando a coluna da fi) e calcular a fração da Mediana (n/2). Teremos: Classes fi 29,5-39,5 4 39,5-49,5 8 49,5-59,5 14 59,5-69,5 20 69,5-79,5 26 79,5-89,5 18 89,5-99,5 10 n=100 à (n/2)=50 2º) Construir a coluna da fac (frequência absoluta acumulada crescente): 29 Classes fi fac 29,5-39,5 4 4 39,5-49,5 8 12 49,5-59,5 14 26 59,5-69,5 20 46 69,5-79,5 26 72 79,5-89,5 18 90 89,5-99,5 10 100 n=100