Prévia do material em texto
Estatística Núcleo de Educação a Distância www.unigranrio.com.br Rua Prof. José de Souza Herdy, 1.160 25 de Agosto – Duque de Caxias - RJ Reitor Arody Cordeiro Herdy Pró-Reitoria de Pós-Graduação e Pesquisa (PROPEP) Emilio Antonio Francischetti Pró-Reitoria de Administração Acadêmica (PROAC) Carlos de Oliveira Varella Núcleo de Educação a Distância (NEAD) Márcia Loch Produção: Gerência de Desenho Educacional - NEAD Desenvolvimento do material: Jhoab Pessoa de Negreiros, Sergio Ricardo Pereira de Mattos e Tereza Luzia de Mello Canalli 1ª Edição Copyright © 2020, Unigranrio Nenhuma parte deste material poderá ser reproduzida, transmitida e gravada, por qualquer meio eletrônico, mecânico, por fotocópia e outros, sem a prévia autorização, por escrito, da Unigranrio. Pró-Reitoria de Graduação (PROGRAD) Virginia Genelhu de Abreu Francischetti Pró-Reitoria de Pós-Graduação Lato Sensu e Extensão (PROPEX) Nara Pires Sumário Apresentação ..................................................................................... 9 Objetivos Gerais ................................................................................. 11 Conceitos Básicos Para início de conversa... ..................................................................... 13 Objetivo ............................................................................................ 15 1. População ............................................................................ 17 2. Amostra .............................................................................. 18 2.1 Tamanho de uma Amostra ..................................................... 19 2.2 Amostragem ........................................................................ 22 2.3 Técnicas de Amostragem ....................................................... 23 3. Variáveis ............................................................................. 26 Referências ........................................................................................ 29 Exercícios .......................................................................................... 30 Representação Gráfica e Tabular Para início de conversa… ................................................................... 33 Objetivo ........................................................................................... 35 1. Tipos de Gráficos .................................................................. 37 1.1 Gráficos em Coluna ............................................................... 37 1.2 Gráfico de Linha ................................................................... 37 1.3 Gráfico em Setor Circular ....................................................... 38 1.4 Histograma .......................................................................... 40 1.5 Pictograma .......................................................................... 41 2. Tipos de Tabelas ................................................................... 42 2.1 Confecção de uma Tabela Simples .......................................... 42 2.1.1 Título da Tabela ................................................................... 43 2.1.2 Cabeçalho ........................................................................... 44 2.1.3 Coluna Indicadora ................................................................ 44 2.1.4 Corpo da Tabela ................................................................... 45 2.2 Séries Estatísticas ................................................................. 46 2.2.1 Histórica, Cronológica ou Temporal .......................................... 46 2.2.2 Geográfica, Espacial ou Territorial ............................................ 47 2.2.3 Específica ou Categórica ........................................................ 48 3. Distribuição de Frequência .................................................... 48 3.1 Tabela Primitiva .................................................................... 49 3.2 Rol ..................................................................................... 49 3.3 Construção de Distribuição de Frequências ................................ 50 Referências ........................................................................................ 59 Medidas de Posição Para início de conversa… ................................................................... 61 Objetivo ............................................................................................ 63 1. Média ................................................................................. 65 1.1 Média Aritmética Simples de uma Amostra de Dados ................ 65 1.1.1 Dados não Agrupados em Classes ........................................... 65 1.1.2 Dados Agrupados em Classes ................................................. 66 1.2 Média Aritmética Ponderada ................................................... 67 1.3 Média Geométrica (G) .......................................................... 68 1.4 Média Harmônica Simples (H) ............................................... 69 2. Moda .................................................................................. 71 2.1 Dados Não Agrupados em Classes ........................................... 71 2.2 Dados Agrupados em Classes ................................................. 72 3. Mediana ( Md ) .................................................................... 73 3.1 Dados Não Agrupados em Classes .......................................... 74 3.2 Dados Agrupados em Classes ................................................. 75 3.3 Separatriz ............................................................................ 75 3.3.1 Percentil .............................................................................. 76 3.3.1.1 Dados Agrupados em Classes ................................................ 76 3.3.2 Decil ................................................................................... 79 3.3.2.1 Dados Agrupados em Classes ................................................. 79 3.3.3 Quartil ................................................................................ 79 2.3.3.1 Dados Agrupados em Classes ................................................. 80 Referências ........................................................................................ 83 Exercícios Resolvidos ........................................................................... 85 Medidas de Dispersão Para início de conversa… ................................................................... 91 Objetivos ........................................................................................... 93 1. Variância e Desvio Padrão ...................................................... 95 1.1 Variância e Desvio Padrão de Dados Não Agrupados em Classes .. 95 1.1.1 Variância e Desvio Padrão de uma População ........................... 95 1.1.2 Variância e Desvio Padrão de uma Amostra de Dados ................ 96 1.2 Variância e Desvio Padrão de Dados Agrupados em Classes ....... 99 2. Coeficiente de Variação (CV) .................................................. 100 3. Desvio Médio (DM) ........................................................................ 106 Referências ........................................................................................ 109 Exercícios .......................................................................................... 110 Medidas de Assimetria e Curtose Para início de conversa… ................................................................... 113 Objetivos ...........................................................................................115 1. Assimetria ........................................................................... 117 2. Curtose ............................................................................... 124 Referências ........................................................................................ 129 Exercícios .......................................................................................... 131 Correlação e Regressão Linear Para início de conversa… ................................................................... 135 Objetivos .......................................................................................... 137 1. Diagrama de Dispersão .......................................................... 139 2. Coeficiente de Correlação Linear de Pearson ............................. 141 2.1 Nível de Significância ............................................................ 145 3. Equação de Regressão ........................................................... 147 Referências ........................................................................................ 153 Exercícios .......................................................................................... 155 Introdução ao Estudo da Probabilidade Para início de conversa... ..................................................................... 159 Objetivos ........................................................................................... 161 1. Espaço Amostral ................................................................... 163 2. Evento ................................................................................ 164 3. Definição Clássica de Probabilidade ......................................... 166 3.1 Propriedades da Probabilidade ................................................ 168 Exercícios Propostos: ........................................................................... 175 Referências ........................................................................................ 177 Probabilidade Condicional e Teorema de Bayes Para Início de Conversa… .................................................................. 179 Objetivo ............................................................................................ 181 1. Probabilidade Condicionada .................................................... 183 2. Teorema de Bayes ................................................................ 186 Exercícios Propostos ............................................................................ 195 Referências ........................................................................................ 199 Considerações Finais ........................................................................... 200 Apresentação A Estatística, ainda que não da maneira como a conhecemos atualmente, é utilizada desde antes da Era Cristã. De acordo com relatos históricos, no ano de 2238 a.C., o imperador chinês Yao realizou um censo (do latim, Censere, que significa “taxar”) populacional. Um outro exemplo, datado de 578-534 a.C., relata que o imperador romano Sérvio Túlio fez um censo para determinar o número de pessoas “aptas” para compor seu exército. Naquele período, a Estatística ainda não tinha status de ciência, e seus objetivos eram basicamente tributários (calcular o imposto devido por cada família em função do número de pessoas que a compunham), bélicos (total de possíveis “soldados” de um império) e para aferição da riqueza de um governante. Cabe também comentar que o Livro de Números, da Bíblia Sagrada, recebeu esse nome (na versão de origem latina) em alusão aos dois censos nele relatados. Na Idade Média, foram realizados diversos censos, dentre os quais destacamos o Doomsday Book (FERNANDES apud PARANÁ, 2010), realizado em 1066, na Inglaterra, por Guilherme, o Conquistador. No século XVI, os dados sociais coletados – como nascimentos e óbitos – começaram a passar por uma análise sistemática. No século XVIII, a Estatística, batizada com esse nome por Godofredo Achenwall em alusão ao termo latino status, obteve estrutura de ciências. Os dados que antes eram o objetivo final, tornaram-se o ponto de partida para busca de regularidades e possíveis previsões. Dessa forma, buscavam-se conclusões sobre o todo, partindo da observação de uma de suas “partes”. As tabelas foram aperfeiçoadas e surgiram as representações gráficas. O aprimoramento do Cálculo de Probabilidades – que já existia desde o 9Estatística século XVII – alavancou ainda mais tal ciência. Atualmente, ela é aplicada em praticamente todas as áreas de conhecimento humano, nos auxiliando na tomada de decisões de uma maneira mais estruturada. Com o advento da tecnologia e por uma necessidade cada vez maior de analisar dados e deles tirar conclusões, precisamos aprender essa ciência e utilizá-la como uma pujante ferramenta. As tabelas foram aperfeiçoadas e surgiram as representações gráficas. O aprimoramento do Cálculo de Probabilidades (que já existia desde o século XVII) alavancou mais ainda tal ciência. Atualmente ela é aplicada em praticamente todas as áreas de conhecimento humano, nos auxiliando na tomada de decisões de uma maneira mais estruturada. Com o advento da tecnologia, e uma necessidade cada vez maior de analisar dados e deles tirar conclusões, precisamos aprender esta Ciência e utilizá-la como uma pujante ferramenta. 10 Estatística Objetivos Gerais Desenvolver o pensamento estatístico por meio de situações-problema. 11Estatística Conceitos Básicos Para início de conversa... Antes de nos aprofundarmos no estudo desta disciplina, veremos alguns conceitos básicos necessários à aprendizagem dos temas. Falaremos sobre o Método Estatístico, população, amostra, técnicas de amostragem e os diferentes tipos de variáveis. Um método, de maneira geral, é um conjunto de meios dispostos convenientemente para se chegar ao fim desejado. Existem diferentes tipos de método: científicos (dedutivo, experimental, estatístico etc.) e outros não científicos (tentativa e erro etc.). No Método Estatístico, em virtude da impossibilidade de mantermos constantes as causas, admitimos suas variações e tentamos determinar a influência que coube a cada uma delas. Esse método é de suma importância quando se deseja, partindo da análise de uma parte dos dados (amostra), obter resultados (inferir) válidos para o todo (população). Neste capítulo, veremos algumas técnicas de amostragem que nos permitirão extrapolar conclusões, ainda que não seja possível avaliar todos os elementos do conjunto. 13Estatística https://www.lexico.pt/extrapolar/ Objetivo Conceituar os principais termos estatísticos: População, Amostra e Variável. 15Estatística 1. População Estatisticamente falando, uma população é o conjunto da totalidade dos indivíduos sobre o qual se faz uma inferência. Isto é, é o conjunto constituído por todas as unidades experimentais (ou observacionais) que apresentam pelo menos uma característica comum e ela pode ser finita ou infinita. Por exemplo, todos os professores da Unigranrio formam uma população (no caso, finita). Eles poderiam até ter outras coisas em comum, mas o fato de todos lecionarem na mesma instituição faz deles um exemplo de população. Mas, qual a importância disso? Com o auxílio da Estatística podemos, dentre outras coisas, fazer previsões sobre uma população, tomando como base os dados de apenas um “pedaço” desse conjunto (isto é, uma inferência). Por exemplo, não precisamos entrevistar todos os eleitores para prever qual candidato deve vencer a eleição. É importante observar que isso é uma previsão e, como tal, está sujeita a uma margem de erro (que pode ser previamente determinada). Quando a pesquisa envolve dados de toda a população, dizemos que houve um censo. No Brasil, o censo demográfico começou em1872, com o objetivo de contar a população brasileira e extrair informações sobre as características desses habitantes. Atualmente, o Instituto Brasileiro de Geografia e Estatística (IBGE) é o responsável pelo recenseamento, sendo que tal processo costuma ocorrer a cada dez anos (1940,1950, 1960, 1970 etc.). Para fazermos uma pesquisa Estatística com resultados válidos, devemos executar algumas tarefas. A seguir, explicaremos cada passo a ser seguido. 1. Definir a variável É a delimitação do problema, isto é, definir o que você irá pesquisar. 2. Realizar a pesquisa É o momento de coletar os dados correspondentes às variáveis escolhidas. 17Estatística 3. Organizar os dados É a parte de elaborar tabelas ou gráficos a partir dos dados coletados. 4. Analisar os resultados Utilizando diferentes conceitos estatísticos, analisamos os resultados obtidos na amostra, objetivando tirar conclusões válidas para a população. 2. Amostra Na Estatística, é necessário definir um outro conjunto além da população. Esse conjunto é chamado de amostra e, à medida que você avançar nos estudos nesta disciplina, perceberá a sua importância. Contudo, a definição de uma amostra é bem simples, trata-se do subconjunto finito de uma população. Veja os seguintes exemplos: ▪ Exemplo 1 População: O conjunto de todos os torcedores de um determinado time de futebol. Amostra: O conjunto dos torcedores desse mesmo time que têm mais que 18 anos. ▪ Exemplo 2 População: O conjunto de todas as baleias de uma determinada região. Amostra: O conjunto de baleias dessa mesma região que possuem um chip de monitoramento remoto, de coleta de dados, que visa o estudo e preservação desse animal. ▪ Exemplo 3 População: Conjunto de pessoas portadoras de HIV (soropositivas HIV), no Brasil. Amostra: Conjunto das pessoas portadoras de HIV (soropositivas HIV) que fazem tratamento no Hospital Universitário Gaffrée Guinle. 18 Estatística Veja, agora, um esquema em que exemplificamos uma população estatística e algumas de suas possíveis amostras: Figura 1: Exemplo de uma população e algumas de suas diferentes amostras. Fonte: Elaborado pelos autores. Dependendo do contexto, um mesmo conjunto pode desempenhar o papel de população ou de amostra. Por exemplo, todos os alunos da Universidade Unigranrio podem ser considerados uma população, da qual todos os alunos que estudam no Campus Duque de Caxias compõem uma amostra. Porém, se consideramos como população todos os universitários brasileiros, o conjunto de todos os alunos da Unigranrio se torna uma amostra. 2.1 Tamanho de uma Amostra Na maioria das vezes, não é possível trabalhar com o universo populacional, isto é, realizar o censo. Em alguns casos, por se tratar de uma população infinita; em outros; por se tratar de uma população demasiadamente extensa, o que normalmente demanda muito tempo e um custo elevado. Em algumas situações, existem inviabilizações naturais, por exemplo: ao pesquisar uma determinada espécie de um pássaro, é praticamente impossível capturar todos. Por isso, precisamos “escolher” alguns elementos da população para População Exemplos de amostras Importante 19Estatística a realização da pesquisa. Mas, quantos elementos precisam ser utilizados de modo que a amostra seja representativa? Para esse cálculo, podemos utilizar a fórmula descrita a seguir: Para o cálculo do tamanho da amostra de uma população considerada finita, utilizaremos: Sendo o valor correspondente ao nível de confiança que o pesquisador deseja para a sua pesquisa. O nível de confiança, também chamado de coeficiente de confiança, é a probabilidade de uma pesquisa ter os mesmos resultados quando a mesma é aplicada em um conjunto de dados, dentro do mesmo perfil amostral e com a mesma margem de erro. Por exemplo, se o nível de confiança de uma pesquisa é de 95%, isso implica que se a mesma for aplicada 100 vezes, gerará resultados dentro da margem de erro estipulada em 95 casos. Normalmente, consideramos um nível de confiança maior ou igual a 95%. Cada percentual remete a um valor para . Por exemplo, um nível de confiança de 95% equivale ao valor de . Veja, na tabela a seguir, alguns valores de em função do nível de confiança desejado na pesquisa. Nível de confiança Valor de Z 80% 1,28 90% 1,64 95% 1,96 99% 2,58 Os valores apresentados na tabela surgem a partir de alguns cálculos baseados em algumas teorias matemáticas. Entretanto, foge ao escopo deste capítulo abordar tais assuntos. O “N” na fórmula representa o tamanho da população; e o , a margem de erro estipulada para as pesquisas. Um erro de 3% significa que o resultado ( ) ( ) ( ) 2 2 2 0,5. 0,5. 1. Z N n Z N e = + − 20 Estatística obtido pode ter uma variação aceitável de até 3 pontos percentuais, para mais ou para menos, em relação ao valor real. Se em uma pesquisa, o candidato A tem 25% das intenções de votos, e o candidato B tem 27%, eles serão considerados tecnicamente empatados, em virtude da margem de erro que, no primeiro caso, varia entre 22% e 28%, e no segundo, entre 24% e 30%. Para reduzirmos a margem de erro, precisamos aumentar o nível de confiança ou o tamanho da amostra e vice e versa. Normalmente, quando uma população possui mais de 100.000 elementos, ela é considerada como infinita. Para esses casos, utilizamos a seguinte fórmula: Como é de se esperar, a fórmula depende somente do “Z”, que é o nível de confiança, e do “e” que representa o erro na pesquisa, já que estamos considerando uma população infinita. Existem outras fórmulas para a determinação do número de elementos de uma amostra, estas envolvem outros parâmetros não estudados neste material. ▪ Exemplo 4: Calcule o tamanho de uma amostra, de nível de 95%, com uma margem de erro de 4%, sabendo-se que a população possui 5000 elementos. Como a população é finita, temos: (Importante: 4% equivale a 0,04) Aproximadamente, 535 pessoas. 2 2. Zn e = Importante ( ) ( ) ( ) ( ) ( ) ( ) 2 2 2 2 2 2 0,5. . 0,5. 1 . 0,5. 1,96 .5000 0,5. 1,96 5000 1 .0,04 4802 534,83 8,9784 Z N n Z N e n n = + − = + − = = 21Estatística Se esse mesmo problema fosse relativo à uma população com mais 100.000 elementos, usaríamos a fórmula para uma população infinita do seguinte modo. Aproximadamente, 600 pessoas. 2.2 Amostragem Para que uma amostra seja representativa e, consequentemente, possa ser utilizada para extrapolarmos as conclusões para a população, é necessário que sigamos determinadas regras na seleção de seus elementos. Esse processo de escolha se chama amostragem. Observe o exemplo a seguir: ▪ Exemplo 5: Uma nutricionista decide verificar a incidência de obesidade em um determinado município, com cerca de cento e vinte mil habitantes. Como é inviável pesar e medir todos os habitantes, ela decidiu fazê- lo com alguns moradores (amostra). Para tal, montou um quiosque de assistência em uma praça do centro desta cidade, no qual ofereceu alguns serviços básicos de saúde, dentre eles, o cálculo do Índice de Massa Corpórea (IMC) de todos os voluntários. Os resultados foram alocados na tabela a seguir: Peso Normal Obesidade grau 1 Obesidade grau 2 Obesidade grau 3 Homens 21 19 23 7 Mulheres 558 186 120 66 ( ) 2 2 2 2 2. 1,96 2. 0,04 1,96 0,08 24,5 600,25 Zn e n n n n = = = = = 22 Estatística Analisando os resultados obtidos, ela verificou que 21 homens estavam com o peso normal (30%) e 49 tinham algum grau de obesidade. Daí, concluiu que 70% dos homens do referido município tinham algum grau de obesidade. Será que essa conclusão é válida? Se não, por quê? Antes de respondermos a tais indagações, primeiro veremos as técnicas de amostragem. 2.3 Técnicas de Amostragem A amostragem pode ser probabilística ou não probabilística. Na primeira, cada elemento da população tem a mesma chance de ser escolhido, atribuindo à amostra maior caráter de representatividadee ressaltando sua importância, uma vez que as conclusões da pesquisa estão vinculadas exatamente a essas amostras. Na segunda, a seleção dos elementos da população que irão compor a amostra depende exclusivamente do julgamento do pesquisador ou do entrevistador no campo (que é algo muito subjetivo). Nela, não se pode extrapolar os resultados da pesquisa para a população. A seguir, explicaremos alguns casos e daremos exemplos. a. Aleatória simples: É feito um sorteio por meio de um dispositivo aleatório. Por exemplo, associar cada elemento da população a um papel com um número diferente e colocá-lo dentro de uma urna para, depois, enfiar a mão na urna e escolher um papel qualquer. b. Estratificada: Nessa técnica, a população é dividida em subpopulações, denominadas estratos, dos quais retiramos os elementos. Por exemplo, se queremos uma amostra de 300 pessoas, podemos dividi-la em dois estratos (sexo masculino e feminino) e pesquisar 150 homens e 150 mulheres. Voltando ao exemplo 5, foram entrevistados 70 homens e 930 mulheres, ou seja, o resultado obtido não pode ser extrapolado para a população, pois a quantidade de homens entrevistados foi insignificante em relação à de mulheres (ao compararmos com esses percentuais na população). c. Por conveniência: Se um pesquisador precisa testar um novo medicamento antirretroviral (ARV) em portadores do vírus HIV, não seria conveniente ele ficar no calçadão da cidade perguntando 23Estatística a cada transeunte se o mesmo é portador do vírus e se deseja participar do teste de um novo medicamento? Nesse caso, ele deve utilizar a amostra que lhe convém, como ir em um hospital de referência da doença e procurar voluntários para o teste. Os medicamentos antirretrovirais (ARV) agem inibindo a multiplicação do HIV no organismo, evitando assim o enfraquecimento do sistema imunológico. Atualmente, há 22 desses medicamentos. O AZT é bem conhecido. d. Sistemática: Nesse caso, o pesquisador cria uma “regra” de escolha da amostra. Por exemplo, ele dispõe de 2000 prontuários médicos, organizados em gavetas, por ordem alfabética. Decide escolher os dez primeiros de cada gaveta, para fazer parte de sua amostra. A distribuição das técnicas de amostragem habitualmente utilizadas pode ser resumida no esquema da Figura 2: Figura 2: Técnicas habituais de amostragem. Fonte: Elaborado pelos autores. ▪ Exemplo: Vamos supor que um cientista social deseja investigar a democratização do acesso à internet em um determinado Curiosidade Técnicas habituais de amostragem Probabilística (ou aleatória) Não probabilística Aleatória simples Por conglomerado Sistemática Estratificada Por conveniência Intencional 24 Estatística município que possui cerca de 130.000 habitantes e um baixo Índice de Desenvolvimento Humano (IDH). Faremos, a seguir, uma descrição de todo o processo: I. Definição do problema: ele quer verificar se o acesso à internet está disponível a todos os moradores ou apenas aos de melhor poder aquisitivo. Além disso, em qual local esse acesso se dá (na residência, no trabalho, na escola, universidade etc.). II. Realização da pesquisa com a definição do tipo de amostragem e do tamanho da amostra: como a população tem mais do que 100.000 indivíduos (que para efeito de cálculo de tamanho de amostra é considerada infinita) se torna inviável a realização da pesquisa em todas as residências. Após a escolha dos parâmetros (95% de nível de confiança e 3% de erro máximo), foi feito o seguinte cálculo para a determinação do tamanho da amostra: O pesquisador decidiu que faria 1068 entrevistas e optou pela amostragem estratificada, por entender que o acesso a tal serviço variava de acordo com algumas especificidades. Cada um dos quatro distritos foi considerado um estrato; nestes, foram realizadas 267 entrevistas. Além disso, foram visitados bairros de periferia e os principais centros comerciais de cada distrito. Foram visitados também os arredores das instituições de ensino em diversos horários. À medida do possível, foram escolhidas pessoas de diferentes faixas etárias. Formando, assim, um diversificado público-alvo. III. Após as entrevistas, o pesquisador organizou os dados em diversas tabelas (por local e por faixa etária). Expôs, convenientemente, os resultados em gráficos. IV. Analisou os resultados, em busca de possíveis erros e não os encontrou. Concluiu que o percentual de pessoas com acesso à internet, geograficamente falando, era praticamente o mesmo em todo o município. Porém, ao observar os gráficos por faixa etária, 2 22 1,96 1,96 1067,11 2. 2. 0,03 0,06 Zn e = = = 25Estatística verificou que os mais idosos não dispunham desse serviço. De posse deste estudo, solicitou à prefeitura que ofertasse um curso de informática voltado à terceira idade e que definisse políticas públicas nesse sentido. 3. Variáveis Uma variável é o conjunto de resultados possíveis de um fenômeno. As variáveis podem ser divididas em qualitativas ou quantitativas. Na variável qualitativa, os valores são expressos por atributos. Caso esses atributos possam ser ordenados, ela é chamada de qualitativa ordinal. Caso não admitam tal ordenação, é chamada de qualitativa nominal. No caso da quantitativa, se os valores forem expressos apenas por números inteiros, dizemos que ela é discreta. Se os valores forem números decimais, dizemos que é contínua. ▪ Exemplo 6: Cor dos olhos: Qualitativa (pois é um atributo) nominal (não existe uma ordem predeterminada, que organize as cores dos olhos). ▪ Exemplo 7: Nível de escolaridade: Qualitativa (é um atributo, não um número) ordinal (aceita ordenação). Por exemplo, nível fundamental completo, nível médio completo, nível superior completo. ▪ Exemplo 8: Número de seguidores no Facebook, de uma determinada pessoa: Quantitativa (é um número) discreta (não podemos ter, por exemplo, 41,5 seguidores, apenas um número inteiro de seguidores). ▪ Exemplo 9: Velocidade de download de um plano de internet: Quantitativa (é um número) contínua (podemos ter um valor que não seja um número inteiro, por exemplo, 131,37 Mbps). 26 Estatística Figura 3: Resumo dos diferentes tipos de variáveis. Fonte: Elaborado pelos autores. Ao realizarmos uma pesquisa, devemos nos preocupar com os possíveis resultados de um fenômeno (variáveis). Por exemplo, se o pesquisador fizer a pergunta “Que comida você mais gosta?”, teria uma quantidade praticamente infinita de variáveis possíveis. Isso tornaria inviável a organização e a análise dos dados. Nesse caso, uma opção seria reescrever a pergunta como “Dentre as opções de comida a seguir, qual você mais gosta?” Isso restringiria o número de possíveis respostas para um quantitativo aceito pelo pesquisador. Neste capítulo, conhecemos um pouco da história da Estatística e sua ascensão ao status de ciência. Vimos as principais etapas na realização de uma pesquisa (definir o problema, coletar e organizar os dados, expô- los por meio de gráficos e analisá-los objetivando tirar conclusões válidas). Diferenciamos o conceito de amostra do de população estatística, dando exemplos em diferentes áreas do conhecimento científico. Em seguida, estudamos as principais técnicas de amostragem e o uso das fórmulas para determinação do tamanho ideal de amostra, dados os parâmetros (nível de confiança e erro máximo). Vimos que as variáveis podem ser classificadas em qualitativa (nominal ou ordinal) ou quantitativas (discreta ou contínua), citando exemplos de cada caso. Assim, de uma maneira geral, trabalhamos com os conceitos básicos da disciplina Estatística. Tipos de variáveis Quantitativa (ou numérica) Discreta Contínua Qualitativa (ou categórica) Nominal Ordinal Importante 27Estatística 28 Estatística Referências FERNANDES, M. C. Estudando estatística e conhecendo um pouco de história da matemática. O professor PDE e os desafios da escola pública paranaense. (CadernosPDE). Curitiba, 2010. Disponível em: www. diaadiaeducacao.pr.gov.br/portals/cadernospde/pdebusca/producoes_ pde/2010/2010_utfpr_mat_artigo_maria_concilia_fernandes.pdf. Acesso em: 17 jun. 2019. 29Estatística http://www.diaadiaeducacao.pr.gov.br/portals/cadernospde/pdebusca/producoes_pde/2010/2010_utfpr_mat_artigo_maria_concilia_fernandes.pdf http://www.diaadiaeducacao.pr.gov.br/portals/cadernospde/pdebusca/producoes_pde/2010/2010_utfpr_mat_artigo_maria_concilia_fernandes.pdf http://www.diaadiaeducacao.pr.gov.br/portals/cadernospde/pdebusca/producoes_pde/2010/2010_utfpr_mat_artigo_maria_concilia_fernandes.pdf Exercícios 1. Classifique as asserções em verdadeiras (V) ou falsas (F) e marque o item que exibe a ordem correta das respostas. ( ) A cor dos olhos de uma pessoa é um exemplo de variável quantitativa ordinal. ( ) O bairro onde uma pessoa reside é um exemplo de variável qualitativa nominal. ( ) O nível de escolaridade de uma pessoa é um exemplo de variável qualitativa ordinal. a. V, F, V. b. F, V, V. c. V, V, F. d. F, F, V. e. V, V, V. 2. A série estatística que se caracteriza por apresentar o tempo variável, mantendo-se fixos o local e a espécie, é denominada de: a. Série Finita. b. Série Variável. c. Série Específica. d. Série Geográfica. e. Série Temporal. 30 Estatística 3. Estatisticamente falando, uma amostra é: a. Qualquer exemplo de variável. a. Algo no qual você testa as tuas hipóteses. b. Um subconjunto finito de uma população. c. É um conjunto que tem um exemplo que representa bem o conjunto de dados. d. A metade da população. Gabarito 1)B; 2)E; 3)C. 31Estatística Representação Gráfica e Tabular 33Estatística Para início de conversa… É comum vermos, no nosso cotidiano, reportagens que fazem uso de gráficos e tabelas para resumir as informações que pretendem difundir. Assuntos como a variação do câmbio, o grau de satisfação do cidadão com seu governante ou as intenções de voto dos eleitores são frequentemente divulgadas de maneira gráfica e tabular. Essa utilização se dá em função da facilidade de “leitura” de um gráfico – por exemplo, uma variação de um determinado dado, exibida por meio de um gráfico em linha, pode ser percebida até mesmo por uma pessoa fora do meio acadêmico. Apesar dessa aparente simplicidade, essa forma de apresentação de dados deve seguir rigorosos critérios de elaboração. A exposição, de forma adequada, dos resultados de uma pesquisa é de suma importância. Nesta unidade de aprendizagem, veremos os principais tipos de gráficos e tabelas e quais os critérios utilizados para a escolha do tipo que melhor se adequada aos dados em questão. 35Estatística Objetivo Identificar os principais elementos de uma Distribuição de Frequências e interpretar tabelas e gráficos. 37Estatística 1. Tipos de Gráficos A exposição de dados por meio de gráficos facilita a “leitura” e o entendimento dos resultados da pesquisa. Existem inúmeros tipos de gráficos, mas, aqui, trataremos apenas dos mais importantes. Cabe lembrar que os exemplos a seguir foram construídos com o auxílio do software Excel. 1.1 Gráficos em Coluna Normalmente, esse tipo de gráfico exibe as categorias ao longo do eixo horizontal e os valores no eixo vertical. Quando há muitas categorias de dados, esse tipo de gráfico se torna inviável, pelo espaço que ocupa. O Gráfico 1, a seguir, exibe o preço da cesta básica, no Rio de janeiro. Preço da cesta básica, em reais, Rio de Janeiro, abril/18 a março/19 360.00 abr /1 8 380.00 400.00 420.00 440.00 460.00 480.00 500.00 ma io/ 18 jun /1 8 jul/ 18 ago /1 8 set/ 18 out /1 8 nov /1 8 dez /1 8 jan /1 9 fev /1 9 ma r/1 9 Gráfico 1: Gráfico em coluna. Fonte: Elaborado pelo autor. 1.2 Gráfico de Linha Esse tipo de gráfico é recomendado para mostrar dados contínuos, exibidos em intervalos de tempo iguais. As linhas ou colunas de uma 38 Estatística tabela podem ser facilmente plotadas em um gráfico de linha. Ele é muito utilizado para mostrar a variação periódica (quinzenal, mensal, bimestral, semestral etc.) de um valor, como o preço de um produto. O Gráfico 2, a seguir, exibe os mesmos dados do exemplo anterior, porém, utilizando um gráfico de linha. Preço da cesta básica, em reais, Rio de Janeiro, abril/18 a março/19 abr /1 8 390.00 410.00 430.00 450.00 470.00 490.00 510.00 ma io/ 18 jun /1 8 jul/ 18 ago /1 8 set/ 18 out /1 8 dez /1 8 jan /1 9 fev /1 9 ma r/1 9 nov /1 8 Gráfico 2: Gráfico de linha. Fonte: Elaborado pelo autor. Para plotar um gráfico no Excel, digite os dados no programa, selecione as colunas que deseja representar graficamente, clique no menu “Inserir”, depois na opção “Gráfico”, e escolha o tipo que deseja usar. 1.3 Gráfico em Setor Circular Esse gráfico é construído com base em um círculo, que é dividido em tantos setores circulares quantos forem os tipos de dados, e a área ocupada por cada setor é proporcional aos valores que cada um deles representam. Importante 39Estatística As condições necessárias à utilização desse tipo de gráfico são: ▪ os dados devem exibir os tamanhos dos itens de uma série, de maneira proporcional à soma de seus valores; ▪ temos que ter apenas uma série de dados e nenhum dos dados pode ser negativo; ▪ é aconselhável que não tenhamos valores nulos (nem desprezíveis em relação ao todo) e que o número de categorias seja no máximo seis. Exemplos de utilização de gráfico em setor circular: ▪ mostrar a contribuição de cada filial, no faturamento de uma empresa; ▪ mostrar a composição (quais os ingredientes e suas proporções) de um determinado produto; ▪ exibir os diferentes tipos de despesas que compõem o custo total de uma empresa, mostrando que parte do todo cada uma delas representa. Vejamos um exemplo de uma tabela de dados e sua respectiva representação gráfica em setor circular: Gasto de uma família, por tipo de despesa (março, 2019) Tipos de despesa Valor gasto (em Reais) Alimentação 500 Educação 300 Saúde 100 Moradia 1000 Transporte 100 A soma de todas as despesas é R$ 2.000,00. Para determinarmos a porcentagem relativa a cada uma delas, dividimos cada valor por dois mil e, 40 Estatística depois, multiplicamos o resultado por cem. Por exemplo, se quisermos saber a porcentagem correspondente à alimentação, fazemos . Assim, a alimentação corresponde à 25% do total, a Educação consome 15%, Saúde 5%, Moradia 50% e Transporte 5%. Representando graficamente, temos: Representando graficamente, temos: Alimentação Educação Saúde Moradia Transporte 1.4 Histograma Esse tipo de gráfico é utilizado para a representação de dados oriundos de uma tabela de distribuição de frequência. Vejamos, a seguir, uma tabela de distribuição de frequência e sua representação gráfica. Idade dos alunos da disciplina Estatística, Unigranrio, em 2018 Classes (Idades, em anos) Frequência simples 20 |– 30 14 30 |– 40 13 40 |– 50 10 50 |– 60 7 41Estatística 60 |– 70 1 70 |– 80 5 Fre qu ên cia 20 30 40 50 60 70 80 Idade dos alunos da disciplina Estatística, Unigranrio, 2018. 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 1.5 Pictograma É um gráfico no qual se utiliza um símbolo ou imagem sugestiva da variável em estudo. Por exemplo, para cada cinco clientes insatisfeitos, foi utilizado um “emoji zangado”. Para cada cinco clientes muito satisfeitos, foi utilizado um “emoji feliz”. Grau de satisfação com o pós-venda da empresa (março, 2019) Grau de satisfação Número de clientes Insatisfeito 20 Satisfeito 25 Muito satisfeito 15 42 Estatística Grau de satisfação com o pós-venda da empresa, março de 2019 Insatisfeito Satisfeito 0 Muito satisfeito 5 10 15 20 25 30 2. Tipos de Tabelas De acordo com o Instituto Brasileiro de Geografia e Estatística (IBGE), uma tabela é a forma não discursiva de apresentação de informações, das quais os dados numéricos, dispostos em uma ordemdeterminada, se destacam como informação central. Quando há uma grande variedade (qualitativa ou quantitativa) de dados a ser exposta, o uso da tabela facilita sua leitura e interpretação. 2.1 Confecção de uma Tabela Simples Uma tabela deve ser completa em si mesma, de maneira que não precisemos recorrer ao texto para saber do que trata. Seus elementos fundamentais são: título, cabeçalho, coluna indicadora e corpo. Para complementar uma tabela, devemos citar a fonte dos dados (a fim de dar-lhes credibilidade) e, caso haja necessidade, as notas (que esclarecem o conteúdo) e as chamadas. 43Estatística 2.1.1 Título da Tabela O título deve ser explicativo, contendo a natureza do fato (o que), as variáveis (como), a abrangência geográfica (onde) e temporal dos dados (quando). Vejamos exemplos de títulos adequados: Exemplo 1: Distribuição dos indivíduos no mercado formal de empregos, por sexo, no município do Rio de Janeiro, 2018. Ocupação Feminino Masculino Engenharias 22% 78% Educação 64% 36% Saúde 71% 29% Outros 51% 49% Exemplo 2: Número de registro de agravo de violência contra mulher, por estado da Região Sudeste, Brasil, 2018. Estados da Região Sudeste Número de Registros Espírito Santo 1.108 Minas Gerais 941 Rio de Janeiro 1.460 São Paulo 1.852 Total 5.361 Exemplo 3: Frequências das ocorrências das características gerais da violência familiar e doméstica contra a mulher, por mês, em Duque de Caxias – RJ, Brasil, no primeiro quadrimestre de 2018. Violência Familiar e Doméstica Número de Registros Janeiro 527 Fevereiro 386 Março 178 44 Estatística Abril 292 Total 1383 2.1.2 Cabeçalho É a parte superior da tabela, na qual se especifica o conteúdo das colunas. Exemplo: Distribuição dos indivíduos no mercado formal de empregos, por sexo, no município do Rio de Janeiro, 2018. Cabeçalho Ocupação Feminino Masculino Engenharias 22% 78% Educação 64% 36% Saúde 71% 29% Outros 51% 49% 2.1.3 Coluna Indicadora É a parte da tabela na qual se especifica o conteúdo das linhas. Exemplo: Número de registros de agravo de violência contra mulher, por estado da Região Sudeste, Brasil, 2018. Coluna indicadora Estados da Região Sudeste Número de Registros Espírito Santo 1.108 Minas Gerais 941 Rio de Janeiro 1.460 São Paulo 1.852 Total 5.361 45Estatística 2.1.4 Corpo da Tabela É o conjunto de linhas e colunas. Ele deve conter apenas os dados realmente relevantes à análise a qual se propõe. As linhas são retas horizontais imaginárias, nas quais se inscrevem os dados. Uma célula é a intersecção entre uma linha e uma coluna. Exemplo: Frequências das ocorrências das características gerais da violência familiar e doméstica contra a mulher, por mês, em Duque de Caxias – RJ, Brasil, no primeiro quadrimestre de 2018. Corpo da tabela Violência Familiar e Doméstica Número de Registros Janeiro 527 Fevereiro 386 Março 178 Abril 292 Total 1383 A figura a seguir exibe um resumo dos itens que compõem uma tabela. Tabela 1: Título Coluna indicadora Cabeçalho Conteúdo da linha Célula Fonte: Nota Exemplo de tabela: Número de casos notificados e confirmados de sarampo, por município de residência, Amazonas, 2018. Importante Co lun a Corpo da tabela 46 Estatística Municípios Notificados Confirmados Manaus 8.561 7.729 Outros municípios 2.343 1.748 Total 10.904 9.477 Note que a célula de uma tabela não pode ser deixada vazia. De acordo com as normas tabulares do IBGE, quando o valor for zero, devemos preenchê-la com um traço horizontal (um hífen). Se não tivermos os dados, colocamos três pontos. Se houver dúvida quanto à exatidão de determinado valor, escrevemos um ponto de interrogação. Caso o valor seja muito pequeno para ser expresso pela unidade utilizada, preenchemos a célula com um número zero. 2.2 Séries Estatísticas Estatisticamente falando, uma série é um tipo de tabela que exibe a distribuição de um conjunto de dados, em função de sua espécie, época ou do local ao qual se referem. Uma série pode ser classificada de acordo com o elemento que sofre variação. Vejamos, agora, essa classificação. 2.2.1 Histórica, Cronológica ou Temporal Quando ocorre a variação do tempo, em um determinado local. Exemplo: Número de casos confirmados de sarampo, no município do Rio de Janeiro, 2011-2018. Variação dos anos Ano Casos confirmados 2011 3 2012 0 2013 0 47Estatística 2014 3 2015 0 2016 0 2017 0 2018 16 Observe que a tabela acima mostra a evolução de uma mesma doença, no mesmo local, em diferentes anos (há variação apenas do período). 2.2.2 Geográfica, Espacial ou Territorial Quando há a variação do local, em um determinado instante. Exemplo 1: Número de homicídios, por região, Brasil, em 2016. Variação das regiões Região Número de mortes Norte 7.903 Nordeste 24.863 Sudeste 16.815 Sul 7.289 Centro-Oeste 5.647 Exemplo 2: Número de homicídios por cem mil habitantes, por região, Brasil, 2016. Variação das regiões Região Taxa por cem mil habitantes Norte 44,55 Nordeste 43,68 Sudeste 19,47 Sul 24,76 Centro-Oeste 36,06 48 Estatística Note que a tabela acima exibe o número absoluto de homicídios, por região brasileira, em 2016. Observe que, se expusermos os mesmos dados de maneira relativa (taxa a cada cem mil habitantes), perceberemos que a região onde houve mais homicídios no período citado, em relação ao total da população, é a Norte. Observe, ainda, que uma exposição de dados de maneira não adequada (por má-fé ou por desconhecimento) pode nos levar a uma interpretação errada do fato. 2.2.3 Específica ou Categórica Quando houver variação da especificação, em um determinado tempo e local. Exemplo 1: Número de escolas por etapa de ensino, Brasil, 2017. Variação das etapas de ensino Etapa de ensino Número de escola Creches 67.902 Pré-escolas 105.200 Anos iniciais do + Ensino Fundamental 115.372 Anos finais do Ensino Fundamental 62.394 Ensino Médio 28.558 3. Distribuição de Frequência Ao estudarmos conjuntos de dados numéricos com uma grande quantidade de elementos, é conveniente organizá-los e resumi-los em tabelas chamadas distribuição de frequências. Por constituir-se no tipo de série estatística mais importante para a Estatística Descritiva, faremos um estudo mais detalhado a respeito dessas distribuições. Como a confecção de uma tabela de distribuição de frequência pode ser um processo longo, para melhor entendimento, explicaremos cada uma de suas etapas, a partir dos seguintes exemplos: 49Estatística 3.1 Tabela Primitiva Denominamos tabela primitiva um agrupamento de dados não ordenados numericamente. Exemplo 1: Os dados abaixo representam a idade, por paciente, após o diagnóstico, em uma amostra de 24 pacientes tratados na Clínica-Escola de Fisioterapia da Unigranrio, em 2005. 8 7 11 10 8 9 7 8 10 12 11 7 7 6 9 10 9 11 9 10 6 12 8 8 Exemplo 2: Supondo que um administrador, objetivando excelência no atendimento em sua empresa, decidiu fazer uma pesquisa de satisfação e entrevistou 50 clientes. A fim de adequar os produtos oferecidos à faixa etária atendida, perguntou (dentre outras coisas) a idade de cada entrevistado. As respostas dadas nesse item do questionário estão listadas a seguir: 23 59 31 22 38 75 36 72 29 38 29 55 56 41 50 45 32 45 25 79 35 25 73 37 57 39 22 34 28 21 42 51 54 25 36 72 26 23 44 33 45 44 42 28 43 22 41 69 31 41 3.2 Rol Denominamos rol o agrupamento de dados após a sua ordenação numérica (em geral, usa-se a ordenação crescente). Exemplo 3: O conjunto abaixo representa o rol do Exemplo 1 deste tópico. 6 6 7 7 7 7 8 8 8 8 8 9 50 Estatística 9 9 9 10 10 10 10 11 11 11 12 12 Exemplo 4: O conjunto abaixo representa o rol do Exemplo 2 deste tópico. 21 22 22 22 23 23 25 25 25 26 28 28 29 29 31 31 32 33 34 35 36 36 37 38 38 39 41 41 41 42 42 43 44 44 45 45 45 50 51 54 55 56 57 59 69 72 72 73 75 79 3.3 Construção de Distribuição de Frequências O nosso desafio, agora, consiste em dispor dados de uma tabelaprimitiva (ou rol) de outro modo. A tabela que construiremos a seguir recebe o nome de Distribuição de Frequências, assim chamada porque relaciona variáveis quantitativas com contagens (ou frequências) do número de valores que se enquadram em cada categoria. Uma distribuição de frequências pode ser sem intervalos de classes ou com intervalos de classes. Os exemplos 5 e 6 elucidam a construção de cada um desses dois tipos. Exemplo 5: Construir uma distribuição de frequências para os dados abaixo: Número de sessões de fisioterapia, por paciente, após o diagnóstico, em uma amostra de 24 pacientes tratados na Clínica-Escola de Fisioterapia da Unigranrio, em 2005 6 6 7 7 7 7 8 8 8 8 8 9 9 9 9 10 10 10 10 11 11 11 12 12 Note que esse agrupamento é formado por números inteiros e com uma amplitude pequena, pois o menor deles é 6 e o maior é 12, o que sugere 51Estatística a construção de uma distribuição de frequência sem intervalos de classes. Assim, após a sua construção, vamos obter a seguinte tabela: Número de sessões de fisioterapia, por paciente, após o diagnóstico, em uma amostra de 24 pacientes tratados na Clínica-Escola de Fisioterapia da Unigranrio, em 2005 Idade (xi) frequência (fi) 6 7 8 9 10 11 12 2 4 5 4 4 3 2 Total 24 Fonte: Clínica-Escola de Fisioterapia da Unigranrio. Exemplo 6: Construir uma distribuição do mesmo tipo para os dados abaixo: Idade dos clientes entrevistados, da empresa Y (março, 2019) 21 22 22 22 23 23 25 25 25 26 28 28 29 29 31 31 32 33 34 35 36 36 37 38 38 39 41 41 41 42 42 43 44 44 45 45 45 50 51 54 55 56 57 59 69 72 72 73 75 79 Observe que, diferentemente dos dados do exemplo 5, agora temos uma amplitude grande, o que torna inviável construir uma distribuição de frequência sem intervalos de classe. Existem algumas regras para determinar o número de classes e a amplitude delas; optamos por utilizar, neste texto, o método conhecido como Regra de Sturges. a. Determinação do número de classe (representado pela letra “K”), em função do total de dados (representado pela letra n) 52 Estatística K=1+3,22 . log10n Número de classes Total de dados Substituindo “n” por 50 (já que temos 50 dados) e, depois, calculando, com o auxílio de uma calculadora científica, o valor do logaritmo de 50, temos: K=1+3,22 =.log log 50 K=1+3,22 .1,69 K=1+5,44 K=6,44 Utilizaremos 6 classes, ou seja, 6 linhas. b. Determinação da amplitude total (ou amostral) e da amplitude da classe A amplitude total (AT) é a diferença entre o maior e o menor valor da tabela. No nosso caso, esses valores são, respectivamente, 79 e 21. Daí: AT = 79-21=58 ATA amplitude de cada classe (h) é definida pela fórmula. h = k Substituindo os valores de e de , calculados anteriormente, temos: AT 58 h = = 9,7 k 6 Arredondando esse valor, cada classe terá a amplitude igual a 10. c. Construção da tabela, utilizando os resultados anteriores No nosso exemplo, teremos seis linhas, e cada linha terá amplitude igual a 10. A primeira classe tem como limite inferior o número 20 e limite superior o número 30. Essa classe, representada por , deve conter todos os valores maiores ou iguais a 20 e menores do que 30. Observe que, se o valor fosse exatamente igual a 30, faria parte da classe . As classes precisam englobar todos os dados iniciais. 53Estatística Idade dos clientes entrevistados, Filial 1 (março, 2019) Classes (Idades, em anos) Frequência simples 20 |– 30 14 30 |– 40 12 40 |– 50 11 50 |– 60 7 60 |– 70 1 70 |– 80 5 Ou seja, nos dados, há 14 números que estão entre 20 (inclusive) e 30 O limite inferior da primeira classe é 20 e o superior é 30 Determinação das frequências acumuladas, pontos médios e frequências relativas simples de cada classe Idade dos clientes entrevistados, Filial 1 (março, 2019) Classes (Idades, em anos) Frequência simples Frequência acumulada 20 |– 30 14 14 30 |– 40 12 14+12=26 40 |– 50 11 14+12+11=37 50 |– 60 7 14+12+11+7=44 60 |– 70 1 14+12+11+7+1=45 70 |– 80 5 14+12+11+7+1+5=50 A frequência acumulada de uma determinada classe é igual à soma de todas as frequências simples até a classe em questão. 54 Estatística Para determinarmos a frequência relativa simples de uma classe, dividimos a frequência simples pelo total e, depois, multiplicamos o resultado obtido por cem. Se quisermos o ponto médio de uma classe, basta somarmos os seus limites (inferiores e superiores) e dividirmos o resultado por dois. Completando a tabela com esses dados, teremos: Classes (Idades, em anos) Frequência simples Frequência acumulada Ponto médio da classe Frequência relativa simples (em %) 20 |– 30 14 14 25 14 . 100 = 28 50 30 |– 40 12 26 35 12 . 100 = 24 50 40 |– 50 11 37 45 11 . 100 = 22 50 50 |– 60 7 44 55 7 . 100 = 14 50 60 |– 70 1 45 65 1 . 100 = 2 50 70 |– 80 5 50 75 5 . 100 = 10 50 Nesta unidade, vimos as normas do Instituto Brasileiro de Geografia e Estatística (IBGE) para a confecção de uma tabela. Aprendemos a identificar o título, o cabeçalho, a fonte e o corpo de uma tabela. Definimos série estatística e sua classificação (em histórica, geográfica ou específica). Vimos, detalhadamente, a confecção de uma tabela de distribuição de frequências, inclusive com o cálculo do número de classes e sua amplitude. Em seguida, aprendemos a confeccionar os principais tipos de gráficos e a identificar o mais adequado para cada caso. Esse tema é de suma importância tanto no meio acadêmico, quanto no nosso cotidiano, visto que é comum o uso de gráficos em reportagens sobre finanças, esportes, saúde, previsão do tempo, educação e em tantos outros temas relevantes. 55Estatística Exercícios 1. Os dados a seguir representam o peso (massa) em Quilogramas, de 70 pacientes atendidos em uma clínica ortopédica, no mês de março de 2019. Complete a tabela de distribuição de frequência desses dados e responda o que se pede: Classes (em kg) Frequência simples Frequência acumulada Ponto médio da classe Frequência relativa simples (em %) 40 |– 50 10 50 |– 60 15 60 |– 70 20 70 |– 80 10 80 |– 90 7 90 |– 100 8 a. Qual a porcentagem de pacientes que têm 40 kg ou mais, porém, menos do que 70 kg? b. Qual a porcentagem de pacientes que têm 60 kg ou mais, porém, menos do que 90 kg? c. Qual a frequência acumulada da terceira classe? d. Qual o limite inferior da segunda classe? e. Um paciente com 70 kg está enquadrado em qual dessas classes? 2. A tabela a seguir representa os dados de 150 pacientes atendidos em um determinado hospital, no mês de abril de 2019. Represente os dados por meio de um gráfico de setor circular, com o auxílio do Excel. 56 Estatística Número de consultas, por Especialidade Médica (abril, 2019) Especialidade médica Número de consultas Ortopedia Clínica Médica Pediatria Otorrino Ginecologia 20 45 38 12 35 Total 150 3. Represente a tabela a seguir, por meio de um gráfico em barras: Gasto de uma família, por tipo de despesa (março, 2019) Tipos de despesa Valor gasto (em reais) Alimentação 500 Educação 300 Saúde 100 Moradia 1000 Transporte 100 GABARITO 1. Preenchendo a tabela, temos: Classes (em kg) Frequência simples Frequência acumulada Ponto médio da classe Frequência relativa simples (em %) 40 |– 50 10 10 45 10 . 100 = 14,29 70 50 |– 60 15 25 55 15 . 100 = 21,43 70 57Estatística 60 |– 70 20 45 65 20 . 100 = 28,57 70 70 |– 80 10 55 75 10 . 100 = 14,29 70 80 |– 90 7 62 85 7 . 100 = 10 70 90 |– 100 8 70 95 8 . 100 = 11,42 70 a. Qual a porcentagem de pacientes que têm40 kg ou mais, porém, menos do que 70 kg? Podemos somar as frequências simples até a terceira classe e dividir o resultado pelo total. 10 + 15 + 20 45Assim, teremos: = = 64,29%. 70 70 Outra maneira de fazer seria somar as frequências relativas até a terceira classe (14,29% + 21,43% + 28,57% = 64,29%). b. Qual a porcentagem de pacientes que têm 60 kg ou mais, porém, menos do que 90 kg? 20 + 10 + 7 37 = = 52,85% 70 70 c. Qual a frequência acumulada da terceira classe? 45. d. Qual o limite inferior da segunda classe? 50. e. Um paciente com 70 kg está enquadrado em qual destas classes? Na quarta classe, pois a terceira contempla valores maiores ou iguais a 60, porém, menores do que 70 kg. Por exemplo, um paciente com 69,9 kg estaria na terceira. 58 Estatística 2. Para fazermos o gráfico no Excel, precisamos seguir os seguintes passos: ▪ Digitamos a tabela no Excel e a selecionamos. ▪ No menu “Inserir”, clicamos na opção “Gráfico” e, depois, escolhemos o tipo “Pizza”. Ortopedia Clínica Médica Pediatria Otorrinolaringologista Ginecologia Número de consultas por especialidade médica (abril, 2019) 13% 30% 25% 8% 23% 3. Utilizando o Excel, teremos: Alimentação Educação Saúde Moradia Transporte Gasto de uma família, por tipo (março, 2019) 0 100 200 400 500 600 700 800 900 1000 1100 59Estatística Referências FONSECA, J. S.; MARTINS, G. A. Curso de estatística. 6 ed. São Paulo: Atlas, 1992. MEYER, P. L. Probabilidade: aplicações à estatística. 2 ed. Rio de Janeiro: LTC, 1983. TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2 ed. São Paulo: Atlas, 1985. TRIOLA, M. F. Introdução à estatística. 10 ed. Rio de Janeiro: LTC, 2008. Medidas de Posição 61Estatística Para início de conversa… Neste capítulo, veremos que as Medidas de Posição nos fornecem, de forma resumida, o comportamento de fenômeno em estudo. Dentre elas, destacamos as Medidas de Tendência Central (as principais são a Média, Moda e a Mediana) e as Separatrizes (Percentis, Decis, Quartis etc.). Estudaremos, também, que as Separatrizes têm como função separar os dados em “n” partes, com a mesma quantidade de elementos cada. Já as de Tendência Central são usadas quando queremos escolher adequadamente um valor que represente, de alguma forma, o conjunto de todos os dados. 63Estatística Objetivo Reconhecer e utilizar as Medidas de Posição na resolução de problemas. 65Estatística 1. Média Para iniciarmos nossos estudos, é importante compreendermos o conceito de média. Esta é encontrada quando somamos todos os dados e os dividimos pelo número de dados. É o número “médio”. 1.1 Média Aritmética Simples de uma Amostra de Dados Vamos, agora, conhecer alguns exemplos de média aritmética simples, com casos de dados agrupados e não agrupados em classes. 1.1.1 Dados não Agrupados em Classes Seja uma lista de n (n > 1) números Reais, x1, x2, x3, ..., xn. A média aritmética simples é definida como: _ x1+x2+x3+...+ xnx = n Isto é, a média aritmética simples é igual à soma de todos os valores dividida pela quantidade total de dados. Exemplo 1: A média aritmética simples da seguinte sequência (12, 30, 13, 9, 12, 8, 7) é calculada da seguinte maneira: _ 12 + 30 + 9 + 12 + 8 + 7 91 x = = = 13 n 7 A média é uma medida que depende de todos os dados da sequência. Por isso, não deve ser utilizada quando a sequência tiver valores extremos (outliers). Cada número tem exatamente a mesma importância (o mesmo peso) que os demais. Note que, se somarmos, subtrairmos, multiplicarmos ou dividirmos cada elemento de uma determinada sequência por uma constante, a média aritmética simples ficará acrescida, diminuída, multiplicada ou dividida por essa constante. Importante 66 Estatística 1.1.2 Dados Agrupados em Classes Se estivermos trabalhando com uma distribuição de frequências com intervalos de classes, devemos utilizar a seguinte fórmula para determinar a média: _ ∑ ( x1 . fi )x = n Em que: O sinal ∑ significa somatório. xi representa o ponto médio da classe i fi representa a frequência simples da classe i Exemplo 2: Suporemos que a tabela de distribuição de frequência a seguir represente o peso (em kg) de 42 pacientes de uma clínica de tratamento renal. Classes (em kg) Frequência simples ( fi ) 20 |– 30 4 30 |– 40 9 40 |– 50 16 50 |– 60 7 60 |– 70 1 70 |– 80 5 n = 42 67Estatística Para determinarmos a média aritmética simples, primeiro precisamos determinar ∑ ( xi . fi ). Depois, substituímos esse valor na fórmula. Completando a tabela, teremos: Classes (em kg) Frequência simples ( fi ) Ponto médio da classe ( xi ) xi . fi 20 |– 30 4 25 25 . 4 = 100 30 |– 40 9 35 35 . 9 = 315 40 |– 50 16 45 45 . 16 = 720 50 |– 60 7 55 55 . 7 = 385 60 |– 70 1 65 65 . 1 = 65 70 |– 80 5 75 75 . 5 = 375 n = 42 ∑ ( xi . fi ) = 1960 Substituindo os valores na fórmula, temos: _ ∑ ( xi . fi ) 1960 ~x = = = 46,66 n 42 1.2 Média Aritmética Ponderada Nesse tipo de média, os números possuem pesos diferentes. É muito utilizada, por exemplo, no cálculo de notas compostas por diversos instrumentos avaliativos, que têm importâncias (pesos) diferentes. Exemplo 3: A nota bimestral de um colégio é composta de três instrumentos avaliativos, valendo dez pontos cada. Cada aluno deverá fazer um teste (peso 1), um trabalho (peso 2) e uma prova (peso 7). Digamos que um aluno tenha obtido nota 6,5 no teste, 7,0 no trabalho e 5,5 na prova. Para determinarmos sua nota, devemos efetuar o seguinte cálculo: 1 . (nota do teste) + 2 . (nota do trabalho) + 7 . (nota da prova) Nota bimestral = 1 + 2 + 7 68 Estatística 1.3 Média Geométrica (G) Seja uma sequência com n (n > 1) números reais positivos. A média geométrica será igual à raiz n-ésima do produto de todos os seus elementos. Ou seja, n G = √(x1 ) . (x2 ) . (x3 ) . ... . (xn ) Exemplo 4: Determine a média geométrica dos dados (9; 11 e 15). Substituindo os valores na fórmula, obtemos: a a ~G = √9 . 11 . 15 = √ 1.485 = 11,40 Exemplo 5: A tabela a seguir exibe a taxa de aumento do salário mínimo, entre os anos de 2015 e 2018. Determine a taxa média de aumento, no período citado. Aumento percentual do salário mínimo no Brasil, de 2015 a 2018 Ano Taxa de Reajuste Concedida 2015 8,84% 2016 11,68% 2017 6,48% 2018 1,81% A média pedida equivale a um valor (percentual), que, se fosse concedido igualmente mês a mês, produziria o mesmo montante (valor final) que essas taxas aplicadas sucessivamente no valor inicial. Esse problema pode ser resolvido utilizando-se o conceito de média geométrica, conforme descrito a seguir: 4 8,84 11,68 6,48 1,81 G = √(1 + ) . (1 + ) . (1 + ) . ( 1+ ) 100 100 100 100 69Estatística 4 G = √(1 + 0,884) . (1 + 0,1168) . (1 + 0,0648) . (1 + 0,0181) 4 ~ G = √(1 + 1,0884) . (1 + 1,1168) . (1 + 1,0648) . (1 + 1,0181) = 1,071409 1,071409 - 1 = 0,071409 (ou 7,1409%) Isso significa que, se fossem concedidos quatro aumentos anuais, iguais e sucessivos de7,1409%, teríamos o mesmo valor final que temos ao conceder, respectivamente, 8,84%, 11.68%, 6,48% e, depois, 1,81%. Para efeito de comparação, faremos o cálculo mês a mês, das duas situações, supondo um salário inicial de R$ 1.000,00. Valor final com as taxas dadas (8,84%, 11,68%, 6,48% e 1,81%) Valor final com as taxas médias (7,1409% em todos os meses) Primeiro mês 1.088,40 1.071,40 Segundo mês 1.215,52 1.147,90 Terceiro mês 1.294,28 1.229,87 Quarto mês 1.317,70 1.317,70 Isso não significa que, para o trabalhador, seria a mesma coisa receber esses aumentos ou a média de aumento salarial anual. Observe, na tabela, que ele teria uma perda mensal nos salários. 1.4 Média Harmônica Simples (H) Seja uma lista de n (n > 1) números reais positivos, x1, x2, x3, ..., xn. A média harmônica simples é definida como: - nH = 1 1 1 ... 1 + + + x1 x2 x3 xn Importante 70 Estatística Isto é, é igual ao inverso da média aritmética simples dos inversos dos dados. Normalmente utilizamos esse tipo de média quando estamos tratando de dados inversamente proporcionais entre si, tais como vazão de um fluído e o tempo de escoamento ou velocidade e tempo de viagem. Exemplo 6: Calcule a média harmônica da sequência 3, 8, 6 e 12: Substituindo na fórmula, obtemos: _ 4 4 4 96 ~H = = = = = 5,65 1 1 1 1 8 + 3 + 4 + 2 17 17 + + + 3 8 6 12 24 24 Exemplo 7: Uma padaria recebeu uma encomenda de última hora. O administrador sabe que a matriz, sozinha, demoraria 6 horas para produzir o pedido. Se fosse só a filial, seriam necessárias 8 horas. Se elas trabalhassem simultaneamente, quanto tempo seria necessário para terminar a encomenda? Calculando a média harmônica simples, temos: _ 2 2 48 ~H = = = = 6,85 horas 1 1 7 7 + + 6 8 24 Como as duas fariam simultaneamente, o tempo se reduziria à metade. Ou seja, juntas, demorariam, aproximadamente, 3,42 horas. Só para conferir, vamos supor que a encomenda fosse de 240 bolos. Se a matriz levaria 6 horas para concluir, isso significa que ela faz 40 bolos por hora; já a filial precisaria de 8 horas, ela faz 30 unidades por hora. Logo, juntas, fazem 70 bolos por hora. Se têm que fazer 240 bolos, precisam de 240 = 3,42 horas. 70 Exemplo 8: Uma torneira demora 6 horas para encher um reservatório. Uma segunda saída de água, sozinha, demoraria 12 horas para encher o mesmo recipiente. Quanto tempo seria necessário para que as duas torneiras, simultaneamente abertas, enchessem o recipiente? _ 2 2 H = = = 8 1 1 3 + + 6 12 12 71Estatística Como as duas torneiras estarão abertas simultaneamente, esse tempo se reduz ao meio, ou seja, serão necessárias 4 horas. Para fazer um teste, supomos que a capacidade do reservatório seja de 120 litros. Se uma torneira demora 6 horas para enchê-lo, ela derrama 20 litros a cada hora; a segunda, pelo mesmo raciocínio, entorna 10 litros por hora. Juntas, derramam 30 litros por hora. Como são 120 litros, precisam de 4 horas, juntas, para completar a tarefa. 2. Moda A moda (Mo ) é o dado que tem maior frequência simples, ou seja, é o que mais se repete. Essa medida pode ser utilizada para dados qualitativos ou quantitativos, isto é, podemos determinar a moda de dados não numéricos ou numéricos. 2.1 Dados Não Agrupados em Classes Uma sequência pode ser amodal (não ter moda), bimodal (ter exatamente duas modas) ou multimodal (ter três ou mais modas). Se todos os valores tiverem a mesma frequência absoluta, a sequência será amodal. Exemplo 9: A moda da sequência a seguir é o elemento “21”, pois ele tem a maior frequência absoluta, isto é, é o número que mais se repete nessa sequência. 12 21 10 11 30 31 21 31 21 17 16 14 16 22 21 11 25 12 31 15 Exemplo 10: A moda da sequência a seguir é o elemento “Paulo”, que se repete mais vezes que os demais. Ana Diana Paulo Marta João Andressa Ricardo Paulo Carlos José Maria Pedro Carla Paulo Alessa Ygor 72 Estatística 2.2 Dados Agrupados em Classes Existem diferentes maneiras para determinarmos a moda de uma distribuição de frequência em intervalos de classes. Destacamos a Moda de King, a Moda de Pearson e a Moda de Czuber. Neste capítulo, optamos pelo uso da fórmula da Moda de Czuber, abaixo descrita: h . ( fi - fi - 1 ) Mo = li + [ ] ( fi - fi - 1 ) + ( fi - fi + 1 ) Em que: i é a classe modal (a classe que tem maior frequência simples) h é a amplitude da classe li é o limite inferior da classe modal fi é a frequência absoluta simples da classe modal f i - 1 é a frequência absoluta simples da classe anterior à classe modal Exemplo 11: A tabela a seguir exibe a altura, em centímetros, de 50 alunos participantes de um projeto de Educação Física, denominado “Projeto Futebol”. Determine a moda desse conjunto de dados. Altura (em cm) dos alunos participantes do “Projeto Futebol”, da Escola X, 2018 Classe modal Classes (em centímetros) Frequência simples ( Fi ) 130 |– 140 2 140 |– 150 5 150 |– 160 4 160 |– 170 21 170 |– 180 14 180 |– 190 4 n = 50 73Estatística Nesse caso, teremos: h . ( fi - fi - 1 ) Mo = li + [ ] ( fi - fi - 1 ) + ( fi - fi + 1 ) Em que: i é a quarta classe, pois é a que possui a maior frequência simples h é a amplitude da classe, que, no nosso caso, é igual a 10 li é o limite inferior da quarta classe, que é 160 fi é a frequência absoluta simples da quarta classe, que é 21 f i - 1 é a frequência absoluta simples da terceira classe, que é 4 f i + 1 é a frequência absoluta simples da quinta classe, que é 14 Substituindo os valores na fórmula, temos: 10 . ( 21 - 4 ) Mo = 160 + [ ] ( 21 - 4 ) + ( 21 - 14 ) 10 . (17 ) Mo = 160 + [ ] (17 ) + ( 7 ) 170 ~ Mo = 160 + = 167,08 24 3. Mediana ( Md ) A mediana é o termo que ocupa a posição central da sequência, já organizada de forma crescente ou decrescente. 74 Estatística 3.1 Dados Não Agrupados em Classes Se a sequência tiver uma quantidade ímpar de elementos, a mediana será o termo central. Se a quantidade de elementos for par, devemos somar os dois elementos centrais da sequência e dividir o resultado por dois. Exemplo 12: Esta sequência possui 9 elementos. A mediana é o termo do meio. 8 11 15 22 25 29 32 37 41 4 elementos 4 elementos Mediana Exemplo 13: Esta sequência possui 8 elementos. Precisamos somar os dois elementos do meio e dividir a resposta por dois. 11 19 21 24 26 29 41 43 24 + 26 50 Md = = = 25 2 2 A mediana, ao contrário da média, não é afetada por valores extremos. Observe que as duas sequências a seguir têm a mesma mediana, apesarde o último elemento da segunda ser o cêntuplo da primeira. Cêntuplo é um número multiplicativo que significa aquele que contém cem vezes a mesma quantidade, ou seja, o que é cem vezes o outro. Importante Glossário 75Estatística 2 14 15 27 31 39 42 49 51 Mediana 2 14 15 27 31 39 42 49 5100 3.2 Dados Agrupados em Classes A mediana é o número que divide uma série ordenada de dados em duas outras com a mesma quantidade de elementos. Para dados distribuídos em classes, utilizamos a seguinte fórmula para determinação da mediana: ∑ fi - fi - 1 ( 2 ) . hP50 = li + [ ] fi Em que: i é a classe que contém o elemento mediano da distribuição, ou seja, que contém a posição ∑ fi . Essa classe é denominada de classe mediana. 2 h é a amplitude da classe mediana li é o limite inferior da classe mediana f i é a frequência absoluta simples da classe mediana Fi - 1 é a frequência acumulada da classe anterior à classe mediana. Observe que a letra “F” maiúscula diz respeito à frequência acumulada, enquanto a letra “f ” minúscula representa a frequência simples. 3.3 Separatriz São valores que ocupam posições no rol (ou seja, uma amostra já ordenada), dividindo-o em partes iguais. As principais separatrizes são o percentil, o decil e o quartil. 76 Estatística 3.3.1 Percentil Divide um rol em cem partes de mesma frequência. Existem 99 percentil: P1, P2, P3, ..., P97, P98, P99. Como os quartis e decis são um subcaso de percentil, estudaremos apenas o caso geral (o percentil). 1% 1% 1% 1% 1% ... 1% 1% 1% 1% P1 P99 3.3.1.1 Dados Agrupados em Classes Para determinarmos um percentil x, representado por Px, de dados agrupados em classes, utilizamos a seguinte fórmula: x . ∑ fi - fi - 1 ( 100 ) . hPx = li + [ ] fi Em que: i é a classe que contém o elemento central da distribuição, ou seja, a classe que contém a posição n.∑ fi . 100 . No caso da mediana, esse valor sempre será a metade do somatório das frequências simples h . é a amplitude da classe li é o limite inferior da classe que contém a posição central da distribuição f1 é a frequência absoluta simples da classe que contém a posição central da distribuição Fi - 1 é a frequência acumulada da classe anterior à classe que contém a posição central da distribuição. Observe que a letra “F” maiúscula diz 77Estatística respeito à frequência acumulada, enquanto a letra “f ” minúscula representa a frequência simples. Exemplo 14: Determine o percentil 50 da seguinte tabela de distribuição de frequência: Altura (em cm) dos alunos participantes do “Projeto Futebol”, da Escola X, 2018 Classes (em centímetros) Frequência simples ( fi ) 130 |– 140 2 140 |– 150 5 150 |– 160 4 160 |– 170 21 170 |– 180 14 180 |– 190 10 ∑ fi = 56 Primeiro, devemos determinar a frequência acumulada de cada classe: Classes (em centímetros) Frequência simples ( fi ) Frequência acumulada ( Fi ) 130 |– 140 2 2 140 |– 150 5 2+ 5 =7 150 |– 160 4 2 +5 + 4 = 11 160 |– 170 21 2 +5+ 4+ 21 = 32 170 |– 180 14 2 +5+ 4 + 21 +14= 46 180 |– 190 10 2 +5+ 4 + 21 +14+ 10 = 56 Essa sequência possui 56 elementos (∑ fi = 56). Nós queremos determinar o percentil 50 (x = 50). A posição central é determinada por Classe utilizada para o percentil 50. Nela, encontra-se o 28o termo 78 Estatística x.∑ fi 50.56 = = 28 100 100 Isto é, a classe que buscamos é aquela que possui o vigésimo oitavo elemento da sequência. No nosso exemplo, será a quarta classe. Observe que o percentil 50 equivale à mediana de uma distribuição de frequências, pois ambos a dividem ao meio. i é a quarta classe h é a amplitude da quarta classe,que é igual a li é o limite inferior da quarta classe, que é 160 fi é a frequência (absoluta) simples da quarta classe, que é 21 Fi - 1 é a frequência acumulada da terceira classe, que é 11 Substituindo na fórmula, temos: x . ∑ fi - fi - 1 ( 100 ) . hPx = li +[ ] fi 50 . 56 - 11 ( 100 ) . 10P50 = 160 +[ ] 21 28 . 11 P50 = 160 +[ ]. 10 21 28 . 11 P50 = 160 +[ ]. 10 = 160 + 8,09 = 168,09 21 79Estatística 3.3.2 Decil Divide o conjunto de dados em dez partes, todas com a mesma quantidade de elementos. Há 9 decis: D1, D2, D3, D4, D5, D6, D7, D8 e D9. Observe que 10% dos dados são menores ou iguais ao primeiro decil (D1 ) ou, ainda, 30% dos dados são iguais ou menores que o terceiro decil (D3 ). 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% D1 D2 D3 D4 D5 D6 D7 D8 D9 3.3.2.1 Dados Agrupados em Classes Se quisermos calcular um decil de dados agrupados, calculamos o percentil equivalente a ele. Assim, utilizaremos apenas a fórmula de percentil. Por exemplo, o sexto decil tem o mesmo valor do percentil 60, conforme tabela abaixo. Decil Percentil equivalente Decil Percentil equivalente Primeiro Percentil 10 Sexto Percentil 60 Segundo Percentil 20 Sétimo Percentil 70 Terceiro Percentil 30 Oitavo Percentil 80 Quarto Percentil 40 Nono Percentil 90 Quinto Percentil 50 3.3.3 Quartil Divide o conjunto de dados em quatro partes, todas com a mesma quantidade de elementos. Note que 25% dos dados têm valores menores ou iguais ao primeiro quartil (Q 1 ) ou, ainda, 75% dos dados têm valores menores ou iguais ao terceiro quartil (Q 3 ). 80 Estatística 25% 25% 25% 25% Q1 Q2 Q3 2.3.3.1 Dados Agrupados em Classes Se quisermos determinar um quartil de dados agrupados, devemos calcular o percentil equivalente a ele, conforme a tabela abaixo. Quartil Percentil equivalente Primeiro Percentil 25 Segundo Percentil 50 Terceiro Percentil 75 Exemplo 15: Determine o terceiro quartil (Q3 ) da seguinte distribuição: Classes (em centímetros) Frequência simples ( fi ) Frequência acumulada ( Fi ) 28,5 |– 30 2 2 30,0 |– 31,5 2 4 31,5 |– 33,0 19 23 33,0 |– 34,5 17 40 34,5 |– 36,0 10 50 36,0 |– 37,5 8 58 37,5 |– 39,0 2 60 ∑ fi = 56 81Estatística Como o terceiro quartil equivale ao percentil 75, temos: x . ∑ fi - fi - 1 ( 100 ) . hPx = li +[ ] fi 75 . 60 - 40 ( 100 ) . 1,5P75 = 34,5 +[ ] 10 45 - 40 P75 = 34,5 +[ ] . 1,5 10 5 P75 = 34,5 +[ ] . 1,5 = 34,5 + 0,75 = 35,25 10 Nesta unidade, estudamos as Medidas de Posição. Vimos, detalhadamente, as medidas de tendência central (especialmente a média aritmética, a moda e a mediana) e as separatrizes (as principais são percentis, decis, quintis e quartis). As medidas de tendência central recebem esse nome pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Já as separatrizes são assim chamadas, pois têm como finalidade separar (dividir) uma distribuição em partes iguais. Vimos a definição e a fórmula para o cálculo dessas