Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central Estatística Descritiva Unidade 1 - Conceitos iniciais e medidas de tendência central Rafaela Rodrigues Oliveira Amaro Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central Introdução É interessante observarmos que nossa vida é cercada por números e em diversas situações somos defrontados com grande quantidade de informações em formato numérico, ou seja, muitos dados. Contudo, sua disposição e a forma no qual estes dados são organizados interfere na eficiência da interpretação de tais informações. Seria possível encontrar uma maneira de organizar estes dados de um modo melhor? Visando facilitar a leitura e identificação da possível relação entre eles? Você já ouviu falar sobre medidas de tendência central? Conhece média, moda e mediana? Se não, esta será a oportunidade de aprender sobre estes importantes conceitos que permeiam o estudo da estatística descritiva, permitindo entender as tendências ou padrões a partir de um conjunto de dados. As respostas às indagações feitas serão respondidas ao decorrer deste capítulo. Vamos começar? Ótimo estudo para você! 1. Introdução à Estatística A estatística está presente em nossa vida em diversas situações, mas você pode se perguntar, onde? O que a estatística agrega para mim? Em quais contextos os conhecimentos que propõe e sistematiza serão úteis em minha vida? Para começar nossa familiarização com os conceitos relacionados à estatística, considere as afirmativas abaixo, muito recorrentes em nosso cotidiano: ❏ [...] 29,8% dos brasileiros consomem refrigerantes pelo menos cinco vezes por semana. Fonte: Ministério da Saúde/jun 2019. ❏ [...] as mulheres têm rendimento habitual médio mensal de todos os trabalhos no valor de R$ 1.764, enquanto os homens, R$ 2.306. Fonte: IBGE/ jun 2019. ❏ [...] a cobertura vacinal na população com 65 e mais anos é de 54,8%. Fonte: IA SAÚDE. IP-RAM/jun 2019. Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central Outra maneira de encontrar dados estatísticos são em formato de tabelas e/ou gráficos, como os apresentados a seguir: Tabela 1- Peso médio e altura média de meninos e meninas de um a doze anos. Fonte: OMS. Figura 1: Gráfico da proporção de alunos do nível médio por turno. Fonte: ABRES. Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central E agora? Reconhece discursos semelhantes a estes? Com certeza a sua resposta será sim, pois é comum encontrar estas informações em relatórios, reportagens jornalísticas, informativos contidos em jornais e/ou revistas entre outras situações. Essa larga utilização estatística é justificável, pois, por intermédio da coleta de dados, é possível obter e relacionar informações como as acima ou no contexto desejado, de maneira a facilitar a leitura e interpretação. Para conceituarmos, de maneira formal, tem-se, conforme Larson e Farber (2016), que a estatística consiste na ciência que coleta, organiza e interpreta dados para a tomada de decisões. Neste contexto, dado é conceituado como qualquer informação obtida por meio de observações, contagens medições ou respostas. A estatística pode ser classificada como descritiva ou indutiva. A primeira, que é objeto de estudo deste curso também recebe o nome de dedutiva e trabalha com o objetivo de coletar e tabular dados. Assim, as informações são reduzidas de maneira a possibilitar uma clara interpretação dos dados. Já a estatística indutiva ou inferência estatística baseia-se em resultados encontrados a partir do estudo de uma amostra da população, buscando induzir, inferir ou ponderar as normas habituais da população da qual a amostra pertence (CASTANHEIRA, 2013). A quantidade de dados analisados para um estudo estatístico varia conforme o contexto, assim, é possível trabalhar com todas as informações ou com parte delas. Desta forma, somos apresentados a dois conceitos fundamentais em nosso estudo: população e amostra. População é o conjunto de todos os dados, medições, respostas ou contagens que se deseja informações. Já amostra é um subconjunto da população, ou seja, uma parte do conjunto de todos os dados a serem analisados (LARSON E FARBER, 2016). 1.1. Variáveis qualitativas e quantitativas Quando uma pesquisa estatística se inicia, normalmente, o pesquisar se encontrará cercado de informações obtidas pela coleta de dados. Assim, é necessário organizar esse material, para, então, conseguir elaborar um resumo e, consequentemente, ser possível analisar e interpretar as informações. Um fator importante a ser considerado é a natureza dos dados a serem estudados, pois é o que determinará a adoção da metodologia estatística mais adequada. A coleção de dados ou, simplesmente, as variáveis podem ser qualitativas quando estão associadas a situações como cor dos olhos, marca de biscoito, preferência artística, entre outros exemplos, logo, representam entradas não numéricas. Já, as variáveis quantitativas consistem em contagens ou medidas Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central numéricas e são traduzidas por valores numéricos. Variáveis quantitativas são subdivididas em discretas ou contínuas sendo ditas discretas quando as informações são limitadas e contínuas, quando pertencem a um intervalo definido por infinitos valores (MORETIM, 2010). Você sabia? No Brasil, os dados oficiais sobre informações do país são encontrados no Instituto Brasileiro de Geografia e Estatística (IBGE), assim basta acessar o endereço eletrônico <http:www.ibge.gov.br> e pesquisar os dados desejados. Existem também dados em órgãos internacionais como a Organização das Nações Unidas (ONU) que podem ser encontrados no site: <https://nacoesunidas.org/>. 1.2. Distribuição de frequência De maneira a tornar os dados mais fáceis de serem interpretados, é necessário aplicar técnicas para organizar um conjunto de informações de maneira a encontrar possíveis padrões. Agora, imagine que foi pesquisado em uma autoescola, durante uma semana, as idades das pessoas que conseguiram obter sua carteira de habilitação (sem distinguir a categoria). Observe a seguir o resultado da coleta de dados: 18, 23, 60, 20, 19, 35, 43, 20, 20, 21, 34, 54, 18, 24, 23, 28, 24, 25, 43, 19, 20, 28, 40, 31, 31, 39, 29, 23, 22, 22, 30, 29, 21, 34, 25, 19, 20, 23, 20, 29, 34, 30, 24, 22, 40. O que podemos concluir sobre estas informações? O que tais dados podem agregar para um possível estudo acercada relação entre a idade e obtenção da habilitação? Bem, em uma rápida observação destes números, pequena ou nenhuma informação é transmitida, logo, se torna necessária a organização deste conteúdo, de forma a prover um entendimento possível a tais dados. Inicialmente, vamos ordenar estes valores, ou seja, colocá-los em ordem crescente ou decrescente para melhorar nossa percepção acerca destas informações: 18, 18, 19, 19, 19, 20, 20, 20, 20, 20, 20, 21,21, 22, 22, 22, 23, 23, 23, 23, 24, 24, 24, 25, 25, 28, 28, 29, 29, 29, 30, 30, 31, 31, 34, 34, 34, 35, 39, 40, 40, 43, 43, 54, 60. http://www.ibge.gov.br/ https://nacoesunidas.org/ Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central Houve melhora! Porém, ainda não é possível elaborar conclusões. O que mais seria possível fazer? Uma alternativa seria agrupar os valores iguais e, para isso, verificaremos em nosso conjunto de dados tal possibilidade. A quantidade de vezes que se repete um número é chamada de frequência (f). De acordo com Larson e Farber (2016, p.32), a frequência ou frequência absoluta de uma classe é o número de entrada de dados em uma classe. Assim, de acordo com os dados que estamos estudando, foi possível construir a Tabela 2. Ela é um típico exemplo de distribuição de frequência, ou seja, é uma tabela na qual uma de suas colunas é apresentada a frequência de cada entrada, que equivale a contagem respectiva a ocorrência de cada resultado (MORETIM, 2010). Idade (anos) Frequência (f) 18 2 19 3 20 6 21 2 22 3 23 4 24 3 25 2 28 2 29 3 30 2 31 2 34 3 35 1 39 1 40 2 Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central 43 2 54 1 60 1 Total 45 Tabela 2: Frequência de alunos que obtiveram habilitação. Fonte: Elaborada pelo autor (2019). Neste momento, é possível tirar conclusões, como: a menor idade foi de 18 anos, a maior idade foi de 60 anos, a idade de maior frequência, ou seja, a idade mais comum entre os alunos que obtiveram a habilitação foi de 20 anos. O somatório das frequências dos valores inferiores ou iguais ao valor dado é uma informação importante a ser adicionada na composição de uma tabela. Recebe o nome de frequência absoluta e será designada por F (maiúscula), pois permite identificar a soma da frequência para a classe e todas as anteriores (VIEIRA, 2012). A tabela 3 apresenta tal informação. Idade (anos) Frequência (f) Frequência Absoluta (F) 18 2 2 19 3 3 +2 = 5 20 6 6+ 5 = 11 21 2 2 +11=13 22 3 3 +13 =16 23 4 4 +16 = 20 24 3 3 +20 = 23 25 2 2 + 23 = 25 28 2 2 + 25 = 27 29 3 3 + 27 = 30 30 2 2 + 30 = 32 Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central 31 2 2 + 32 = 34 34 3 3 + 34 = 37 35 1 1 + 37 = 38 39 1 1 + 38 = 39 40 2 2 + 39 = 41 43 2 2 + 41 = 43 54 1 1 + 43 = 44 60 1 1 + 44 = 45 Total 45 Tabela 3: Frequência acumulada dos alunos que obtiveram habilitação. Fonte: Elaborada pelo autor, 2019. Por meio da frequência acumulada, é possível obter conclusões como: entre 18 e 21 anos, 13 pessoas obtiveram habilitação ou, que de 18 a 34 anos, 37 alunos possuem sua licença. O percentual referente a cada resultado perante ao todo recebe o nome de frequência relativa e é mais uma importante informação a ser acrescentada na tabela. Assim, para encontrar esta apuração, basta dividir a frequência da categoria pelo total de elementos, em seguida, multiplicar esse resultado por 100, dado que essa informação deve ser em percentagem. É importante salientar que o resultado, fruto das somas entre as frequências relativas, deve ser equivalente a 100% ou valor aproximado (VIEIRA, 2012). Teremos, na tabela 4, esta informação disponível: Idade (anos) Frequência (f) Frequência relativa (fr %) 18 2 00 , 4245 · 1 = 4 4 19 3 00 , 7345 · 1 = 6 6 20 6 00 3, 3645 · 1 = 1 3 21 2 00 , 4245 · 1 = 4 4 Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central 22 3 00 , 7345 · 1 = 6 6 23 4 00 , 9445 · 1 = 8 8 24 3 00 , 7345 · 1 = 6 6 25 2 00 , 4245 · 1 = 4 4 28 2 00 , 4245 · 1 = 4 4 29 3 00 , 7345 · 1 = 6 6 30 2 00 , 4245 · 1 = 4 4 31 2 00 , 4245 · 1 = 4 4 34 3 00 , 7345 · 1 = 6 6 35 1 00 , 2145 · 1 = 2 2 39 1 00 , 2145 · 1 = 2 2 40 2 00 , 4245 · 1 = 4 4 43 2 00 , 4245 · 1 = 4 4 54 1 00 , 2145 · 1 = 2 2 60 1 00 , 2145 · 1 = 2 2 Total 45 100 Tabela 4: Frequência relativa dos alunos que obtiveram habilitação. Fonte: Elaborada pelo autor, 2019. Por intermédio da frequência é relativa, é possível obter implicações como: 8,89% dos alunos que obtiveram sua habilitação tem 23 anos, ou a porcentagem de alunos que alcançaram a carta de habilitação com 43 e 60 anos foi igual e equivalente a aproximadamente 2,22%. 1.3. Distribuição de frequência intervalos por intervalos de classe Ainda explorando o exemplo anterior, vamos tentar reduzir o tamanho da tabela, agrupando os resultados em faixas de valores. Estas recebem o nome de classes ou intervalos e, para realizar tal arranjo, utilizaremos o conceito de Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central intervalos de classes, ou seja, iremos agrupar os dados dentro de um intervalo pré determinado. Larson e Farber (2016) listam as etapas a serem executadas, de modo a construir uma distribuição de frequência, com base em um conjunto de dados. Segundo postulam, faz-se necessário determinar o número de classes e a amplitude ou largura de cada uma, obtida por meio da diferença entre o limite superior (maior número que pertence a classe) e o limite inferior (menor valor da classe). Vamos começar? Mãos à obra! ❏ Determine o número de classes (k), pelo método de Sturges, em que: , sendo n o tamanho do conjunto a ser estudado., og nk = 1 + 3 3 · l ❏ Encontre a largura da classe, realizando a razão entre a amplitude total dos dados (maior valor - menor valor) e a quantidade de classes que foi encontrada anteriormente. ❏ Encontre os limites de classe, para isso, basta usar o menor número como limite inferior da primeira classe e adicionar a ele a largura de classe encontrada, as subsequentes serão encontradas partindo do maior valor da classe anterior e sempre adicionando a largura da classe. ❏ Realize a contagem referente aos dados que pertencem a cada classe. Para a tabela sobre a relação entre idade e obtenção da habilitação, estamos trabalhando com 45 dados, logo o número de classes será encontrado por: , ou seja, aproximadamente 7 classes. Agora,.3 og 45 , 6 k = 1 + 3 · l = 6 4 encontraremos a amplitude total:60 - 18 = 42, este valor deve ser dividido por 7, que representa o número de classes, logo , ou seja, cada classe terá uma 24 ÷ 7 = 6 largura de 7. Agora aplicando estas informações e contando os dados pertencentes a cada classe, obtemos a tabela 5. Idade Frequência l--2481 20 24 l--30 10 30 l--36 8 36 l--42 3 Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central 42 l--48 2 48 l--54 0 54 l--60 2 Total 45 Tabela 5: Distribuição de frequência dos alunos que obtiveram habilitação. Fonte: Elaborada pelo autor, 2019. Você sabia? O símbolo l-- indica intervalo fechado para o limite superior da classe e aberto para o limite inferior, assim, por exemplo, na primeira linha, serão agrupados idades entre 18 e 24 anos. No entanto, na prática, esse intervalo equivale a 18, 19, 20, 21, 22 e 23 anos, logo, 24 anos não está presente neste intervalo e sim, no próximo. De posse de uma distribuição de frequência com intervalos de classe, é possível ver os dados mais compactados, o que facilita a leitura e formulação de conclusões acerca das classes mais ou menos frequentes dentro da situação estudada. No exemplo explorado, inferimos que a classe mais comum das idades que conseguiram a habilitação é de 18 a 24 anos e a menos frequente foi de 48 a 54 anos, com nenhuma entrada. 2. Histograma e polígonos de frequência A representação gráfica integra a representação de dados em tabelas, uma vez que facilita e concede uma imediata visualização dos dados estudados. Existe uma infinidade de gráficos que se distinguem de acordo com suas características, no entanto, os mais comuns no estudo da estatística são o histograma e o polígono de frequência. 2.1. Histograma Larson e Farber (2016) definem como um diagrama de barras aquele que representa a distribuição de frequência de um conjunto de dados. Estipulam a ele as seguintes características: ❏ A escala horizontal é quantitativa e mede os valores dos dados; Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central ❏ A escala vertical indica as frequências das classes; ❏ As barras consecutivas devem estar unidas umas às outras. E como converteremos uma tabela em um histograma? Transformaremos a tabela 2, que dispõe das frequências de idades no gráfico 2, ou seja, em um histograma. Figura 2: Histograma de frequência. Fonte: Elaborado pelo autor, 2019. A leitura de um histograma consiste em identificar a frequência que será representada pela altura, leitura no eixo vertical de certo dado, que está disposto na linha horizontal. 2.2. Polígonos de frequência Outra forma de representar uma distribuição de frequência é utilizando um polígono que une por segmentos de reta os pontos médios das bases superiores dos retângulos de um histograma, Larson e Farber (2016) ainda conceituam polígono de frequência como um gráfico de linhas que valoriza as alterações contínuas de frequência. Baseado na figura 2, que é um histograma, será construído um polígono de frequência, observe que as informações são as mesmas, o que diferencia é a linha poligonal. Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central Figura 3: Polígono de frequência. Fonte: Elaborado pelo autor, 2019. É possível construir histogramas e, consequentemente, polígonos de frequência manualmente ou por intermédio de softwares adequados, como o Excel, que será utilizado como ferramenta para elaborar os histogramas que serão apresentados a seguir. Você quer ler? Para aprender mais sobre o passo a passo de como elaborar histogramas e outros gráficos no excel, acesse o link <https://www.guiadoexcel.com.br/como-criar-um-histograma-no-excel/>, este site apresenta o passo a passo para elaborar tal estrutura. 3. Medidas de tendência central para dados não agrupados Já somos capazes de sintetizar dados provenientes de pesquisas e representá-los graficamente, permitindo interpretar e descrever padrões estatísticos; agora vamos resumir ainda mais estes dados, descobrindo um ou mais valores que sejam significativos para o estudo das informações estudadas. Denominam-se medidas de tendência central ou medidas de posição, os valores que representam uma entrada comum ou central do conjunto de dados (LARSON e FARBER, 2016). https://www.guiadoexcel.com.br/como-criar-um-histograma-no-excel/ Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central As medidas de tendência central mais comumente utilizadas e que serão abordadas neste capítulo serão a média aritmética, a moda e a mediana; os métodos para obtenção de tais resultados diferenciam-se de acordo com a maneira em que as informações estão dispostas, ou seja, quando os dados não estão agrupados e quando são agrupados em tabelas de distribuição de frequência com classes. Castanheira (2013) define média aritmética como a soma dos resultados x )( obtidos dividida pela quantidade de resultados; mediana como o valor que Md )( ocupa a posição central de um conjunto de dados ordenados e moda como a M )( o entrada de maior frequência. 3.1. Cálculo da média, moda e mediana Para exemplificar os conceitos apresentados anteriormente, suponha que você esteja gerenciando uma lanchonete e que mantenha controle das vendas dos diversos tipos de pastéis diariamente; assim foram contabilizados os seguintes valores referentes às vendas diárias do pastel de carne, durante 8 dias: 41 57 39 61 59 50 50 49 Observe que esta é uma situação em que os dados não estão agrupados, e agora? Como encontrar a média aritmética, a moda e a mediana? Bem, iniciaremos pelo cálculo da média, que compreende o resultado do somatório dos dados dividido pelo total de elementos, assim, a relação é dada por: logo, neste estabelecimento vende-se, em1x = n Σx = 8 41 + 57 + 39 + 61 + 59 + 50 + 50 +49 ≃ 5 média, 51 pastéis de carne diariamente. A moda é indicada pelo valor que mais se repete, ou seja, tem maior frequência. Como podemos observar, a moda é 50, pois aparece no conjunto de dados duas vezes. A mediana representa o valor central, a maneira para encontrá-la se distingue se o tamanho do conjunto for par ou ímpar. O procedimento para um resultado par consiste em encontrar os números referentes às posições e P 1 = ( )2 n ° e, em seguida, calcular a média aritmética entre os valoresP 2 = ( )2 n + 1 ° encontrados; é importante salientar que as posições permitem encontrar as posições dos números, uma vez que estes devem, obrigatoriamente, estar ordenados(ordem crescente ou decrescente). Após identificar posição, devemos encontrar qual número pertence a tal lugar e assim realizar a média. Para conjunto de dados de tamanho ímpar, basta encontrar a posição , associá-lo ao P = ( )2 n + 1 ° número que pertence a tal lugar, e pronto! Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central No cenário da lanchonete e do número de pastéis vendidos, inicialmente, é sempre necessário ordenar tais números, que ficarão da seguinte forma: 39, 41, 49, 50, 50, 57, 59, 61, após ordenação, vamos identificar a quantidade de elementos; observemos que são 8, logo, um algarismo par, assim, vamos encontrar as posições: e ; a quarta posição equivale ao número 50 P 1 = ( )2 8 ° = 4° P 2 = ( )2 8 + 1 ° = 5° e a quinta também, assim, concluímos que a mediana é 50. Observação: como os valores respectivos as posições das medianas foram iguais, não foi necessário calcular a média aritmética, uma vez que seria encontrado o mesmo número. Já em caso contrário, é obrigatória a realização de tal procedimento. Podemos sintetizar os métodos para encontrar as medidas de tendência central para dados não agrupados em: ❏ Média: x = n Σx ❏ Moda: número de maior frequência, que mais se repete; ❏ Mediana: se tamanho do conjunto ímpar: posições e ; P 1 = ( )2 n ° P 2 = ( )2 n + 1 ° se tamanho do conjunto par: P = ( )2 n + 1 ° 4. Medidas de tendência central para dados agrupados Dados são agrupados em tabelas de distribuição de frequência em que há intervalos ou classes. Em situações como essa, geralmente, são estudadas grandes quantidades de informações, por isso, fica inviável determinar a média, moda e mediana do conjunto pelo método de dados agrupados, assim, recorreremos a outras fórmulas que serão utilizadas para tal objetivo. 4.1. Cálculo da média, moda e mediana para dados agrupados Considere a situação hipotética de que uma construtora iniciará as obras de um condomínio e, para iniciar as obras, fez o levantamento das áreas dos 400 lotes que irão compor o empreendimento, esses valores estão dispostos na tabela 6. Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central Área ( metros quadrados) Frequência (f) 200 l---300 20 300 l---400 46 400 l---500 57 500 l---600 68 600 l---700 76 700 l---800 62 800l---900 48 900 l---1000 23 Total 400 Tabela 6: Frequência de áreas em um loteamento. Fonte:Elaborado pelo autor, 2019. Como agora será possível calcular as medidas de tendência central? Os métodos continuam os mesmos? A resposta é simples, não. Devido a quantidade de dados e por estes estarem agrupados em intervalos, as fórmulas para se obter tais resultados são diferentes. Para facilitar o cálculo destas medidas serão acrescentadas três colunas adicionais a tabela original, uma constará a frequência acumulada, outra o ponto médio de cada classe e a terceira corresponderá ao resultado do produto entre o ponto médio e sua respectiva frequência. Observe a tabela 7, já com as novas colunas e seus respectivos resultados. Área (metros quadrados) Frequência (f) Frequência acumulada (F) Ponto médio ( )xi xi · f 200 l---300 20 20 250 5000 300 l---400 46 66 350 16100 400 l---500 57 123 450 26650 500 l---600 68 191 550 37400 600 l---700 76 267 650 49400 Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central 700 l---800 62 329 750 46500 800l---900 48 377 850 40800 900 l---100 23 400 950 21850 Total 400 243700 Tabela 7: Frequência de áreas em um loteamento. Fonte: Elaborado pelo autor, 2019. A média é encontrada agora pelo somatório entre o ponto médio e sua respectiva frequência, dividido pelo total de elementos, logo: .09, 5mx = n Σx ·fi = 400 243700 = 6 2 2 Existem várias relações que permitem encontrar a moda. Aqui, adotaremos o método de King, que é expresso pela seguinte relação: ,o iM = L + fpost f + fant post · h Onde é o limite inferior que contém moda; a frequência da classe iL f post posterior à classe que contém a moda e a frequência a classe anterior a classe f ant que contém a moda. Desta forma, é muito importante identificar a classe que possui maior frequência, no caso desta tabela, o intervalo de maior frequência é entre 600 e 700 metros quadrados, com 76 entradas, logo , e i 00L = 6 2f post = 6 ; substituindo os valores na relação: onde é o limite inferior que contém8f ant = 6 iL moda, a frequência a classe posterior a classe que contém a moda, a f post f ant frequência da classe anterior à classe que contém a moda e h representa a amplitude da classe (maior valor - menor valor). . o 00 00 47, 9M = 6 + 6268 + 62 · 1 = 6 6 Observe que o valor encontrado deve estar compreendido no intervalo de maior frequência. A mediana será determinada pela igualdade: , onde é d iM = L + f ( −Faca)2 n · h iL o limite inferior que contém a mediana, n é o tamanho do conjunto, é a acaF frequência acumulada anterior à classe que contém a mediana, a amplitude da h classe e a frequência da classe. Alerte-se ao fato de que é fundamental encontrar f a classe que abriga a mediana; como o tamanho do conjunto é 400, basta calcular e (fórmulas para cálculo de mediana para00°P 1 = ( )2 400 ° = 2 01°P 2 = ( )2 400 + 1 ° = 2 dados não agrupados), agora, basta identificar onde estas posições são abrigadas. Por auxílio da frequência acumulada, é possível encontrar a classe; observe que a classe de 600 a 700m² contém tais posições, logo, será o intervalo de referência. Portanto, , n = 400, e , agora, basta substituir: i 00L = 6 aca 91F = 1 00h = 1 .d 00 00 11, 4M = 6 + 76 ( −191)2 400 · 1 = 6 8 Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central Tenha o hábito de conferir se o número encontrado se aloja no intervalo que serviu de base para o cálculo, isso permite conferir se o resultado encontrado pode estar correto ou não. Recapitulando os métodos para encontrar as medidas de tendência central para dados agrupados em: ❏ Média: x = n Σx ·fi ❏ Moda: o iM = L + fpost f + fant post · h ❏ Mediana: d iM = L + f ( −Faca)2 n · h Síntese Neste primeiro capítulo, você teve a oportunidade de ser apresentado aos principais conceitos que norteiam a estatística descritiva, e verificar a necessidade de organizar um conjunto de dados, de modo a facilitar a leitura e posterior interpretação. De modo geral, foi possível: ● Compreender os conceitos que fundamentam a estatística descritiva; ● Entender o processo de coleta e organização de dados; ● Conhecer e diferenciar as variáveis qualitativas e quantitativas; ● Conheceras definições de frequência absoluta, frequência acumulada e frequência relativa; ● Representar e interpretar dados em tabelas de distribuição de frequência com dados agrupados ou não; e em gráficos estatísticos; ● Construir e interpretar histogramas e polígonos de frequência; ● Definir as medidas de tendência central (média, moda e mediana), para dados agrupados e dados não agrupados. Estatística Descritiva - Unidade 1 - Conceitos iniciais e medidas de tendência central Bibliografia CASTANHEIRA, Nelson Pereira. Estatística aplicada a todos os níveis. Curitiba: Intersaberes, 2013. COSTA, Giovani Glaucio de Oliveira. Curso de estatística básica - Teoria e Prática. 2ªedição. São Paulo: Atlas, 2015. Disponível em: Minha Biblioteca. LARSON, Ron; FARBER, Betsy. Estatística Aplicada. 6. ed. São Paulo: Pearson, 2016. 654 p. v. único. Disponível em: Biblioteca Virtual Universitária. MORETIM, Luiz Gonzaga. Estatística Básica: probabilidade e inferência. 1. ed. São Paulo: Pearson, 2010. 376 p. v. único. Disponível em: Biblioteca Virtual Universitária MORAES, Fabíola Eugênio Arrabaça. Estatística Descritiva. 1. ed. São Paulo: Pearson, 2010. 142 p. v. único. Disponível em: Biblioteca Virtual Universitária. VIEIRA, Sônia. Elementos de Estatística. São Paulo: Atlas, 2012. Referências imagéticas: Tabela 1- Peso médio e altura média de meninos e meninas de um a doze anos. BEBÊS E CRIANÇAS. Tabela de Peso e Altura de 1 a 12 anos Meninos e Meninas. Organização Mundial da Saúde. Disponível em: <https://www.bebesecriancas.com.br/de-1-12-anos/?cn-reloaded=1>. Acesso em: 13.jun.2019. Figura 1- Gráfico da proporção de alunos do nível médio por turno. ABRES-Associação Brasileira de Estágios. Matrículas na Educação. Disponível em: <http://www.abres.org.br/v01/dados-estagiarios-estudantes-no-brasil/>. Acesso em: 13.jun.2019. https://www.bebesecriancas.com.br/de-1-12-anos/?cn-reloaded=1 http://www.abres.org.br/v01/dados-estagiarios-estudantes-no-brasil/
Compartilhar