Baixe o app para aproveitar ainda mais
Prévia do material em texto
License-511420-28046-0-0 ESTATÍSTICA Introdução à Estatística Olá! Boas-vindas a esta unidade de aprendizagem! Aqui, vamos entender um pouco a origem e evolução da estatística. Você já parou para pensar em como a estatística pode ser antiga? Desde muito tempo, nossos antepassados já contavam e classificavam informações a respeito, por exemplo, da quantidade de pessoas que viviam em determinado local. Claro, é importante saber que os métodos e as ferramentas disponíveis antigamente eram muito diferentes das que temos hoje. Mas, afinal, então, como definir o que é estatística? Em que situações podemos aplicá-la? Para entender como a estatística funciona, você precisa saber um pouco mais sobre ela. Além da sua história e evolução, você vai aprender algumas definições básicas e saber quais são os tipos de variáveis e como classificá-los. Bons estudos! License-511420-28096-0-4 ESTATÍSTICA Histórico, evolução, aplicabilidade e definições básicas da estatística: população, amostra e variáveis Não se sabe ao certo desde quando os conhecimentos e conceitos estatísticos são aplicados. A única certeza é de que o pensamento estatístico é bem antigo. Vamos ver como ele surgiu e evoluiu ao longo da história? Histórico, evolução, aplicabilidade Há registros do uso de levantamento de dados com mais de 2.000 anos na China. Você deve imaginar, entretanto, que essa atividade mudou bastante ao longo do tempo. A estatística como conhecemos hoje é fruto de anos de dedicação de inúmeros pesquisadores e profissionais de diferentes áreas. Uma delas é Florence Nightingale, que, no século XIX, através de estudos estatísticos, descobriu que a alta mortalidade dos soldados era causada por más condições de saneamento (CONSELHO FEDERAL DE ENFERMAGEM, 2012). Em uma pesquisa na internet, você pode encontrar muitos outros profissionais que contribuíram para a evolução da estatística. A partir da década de 1980, a estatística avançou rapidamente. Segundo Triola (2008), com os computadores, a estatística se tornou acessível e ágil. E no que podemos usá-la? Sua aplicabilidade é ilimitada: educação, saúde, jogos etc., pois todo dado coletável pode ser tratado estatisticamente. Definições básicas da estatística: população e amostra Para Magalhães e Lima (2015), estatística é um conjunto de técnicas que permite organizar, descrever, analisar e interpretar dados e é agrupada em três áreas: estatística descritiva, probabilidade e estatística inferencial. Cada uma será estudada License-511420-28096-0-4 ESTATÍSTICA mais profundamente em unidades posteriores. O que você deve saber agora é que só é possível fazer estudos estatísticos se conhecer bem dois conceitos: população e amostra. De acordo com Triola (2008), população é a coleção completa de dados que desejamos entender. Dela, parte a amostra, que é um subconjunto de elementos populacionais. Dê uma olhada na imagem a seguir. Fonte: Shutterstock, 2017. Perceba que o conjunto de todas as peças do quebra-cabeça forma a população, e a peça destacada em vermelho é uma possível amostra dela. Fique atento às diferenças entre população e amostra, pois nas próximas unidades você estudará os cálculos para cada situação. Você já ouviu falar em censo, correto? Ele só pode ser feito quando temos acesso a todos os dados da característica de interesse. Assim, não há necessidade de extrapolar os dados, basta quantificar e apresentá-los. Quando o censo não é possível, seja por qualquer razão (tempo, acesso etc.), utilizamos a técnica de coleta de amostras, denominada amostragem, selecionando sob certos critérios alguns elementos da população para coleta de dados. License-511420-28096-0-4 ESTATÍSTICA Definições básicas da estatística: variáveis Na estatística, tratamos dados como variáveis. Variáveis ContínuasDiscretasOrdinaisNominais Qualitativas Quantitativas Fonte: TRIOLA, 2008 (Adaptado). Para classificar as variáveis, o primeiro passo é descobrir se são numéricas ou não. Caso não sejam numéricas, são classificadas como qualitativas e retratam qualidades das variáveis. Veja a foto a seguir. Quais tipos de variáveis você conseguiria detectar? Fonte: Shutterstock, 2017. License-511420-28096-0-4 ESTATÍSTICA Agora, volte ao diagrama e note que essas variáveis ainda podem ser classificadas em mais dois tipos: as ordinais e nominais, cuja ordem influencia ou não, respectivamente, o tratamento das informações. Tome como exemplo de variável qualitativa ordinal a posição em uma fila (1º, 2º e assim por diante) e de variável qualitativa nominal a cor de cabelo (loiro, castanho etc.). E as variáveis numéricas? Estas são chamadas de quantitativas, já que expressam quantidades, e também podem ser de dois tipos: discretas e contínuas. As discretas são aquelas cuja medida é finita ou enumerável, normalmente valores inteiros, oriundos de contagens. Uma forma fácil de identificar sua natureza é verificar se é possível agrupar dados iguais. Por exemplo, as idades em anos e o peso em quilos. Quando as variáveis assumem valores nos números reais, tidas como infinitas ou não enumeráveis, são classificadas de quantitativas contínuas. Segundo Triola (2008), elas resultam de infinitos valores possíveis que correspondem a alguma escala continua que cobre um intervalo de valores sem vazios, interrupções ou saltos. Fonte: Shutterstock, 2017. License-511420-28096-0-4 ESTATÍSTICA O peso pode assumir infinitos valores em um certo intervalo. Considere uma balança de alta precisão, onde uma pessoa pesa 98,5347 kg. Perceba que dificilmente outra pessoa terá exatamente o mesmo peso, com essa precisão. Percebeu que uma mesma variável pode ser discreta ou contínua? Isso depende da sua forma de apresentação. Por exemplo, a idade apresentada em anos é classificada como quantitativa discreta, mas, se forem considerados os dias, podem surgir valores como 32,4 ou 25,7, tornando-a quantitativa contínua. É o mesmo que ocorre com o peso: considerando apenas os quilos, é uma variável discreta, mas, ao contar também os gramas, torna- se contínua. Para interpretar resultados obtidos de análises, a natureza da variável deve sempre ser considerada. Na próxima unidade, você aprofundará seus conhecimentos sobre acesso e coleta de dados, considerando fontes disponíveis e confiáveis e a forma correta de coletar amostras. License-510259-28128-0-0 ESTATÍSTICA Tipos de dados Introdução Olá estudante! Lembra o que vimos na unidade anterior? Entendemos um pouco da história da estatística e os conceitos fundamentais para nosso estudo. Percebeu que, quando desejamos conhecer alguma característica populacional, mas o acesso a todos os seus indivíduos é difícil ou impossível, podemos usar a coleta de dados por amostra? Lidar com dados não é uma tarefa difícil, mas, sim, refinada, que exige certos cuidados que nos ajudam a atingir a qualidade dos resultados que serão gerados. Nesta unidade, você verá novamente alguns conceitos apresentados na anterior e também conhecerá novos conceitos acerca da forma de apresentação dos dados e a forma adequada de coletar dados amostrais que representem bem a população de origem. Não se esqueça de que os conhecimentos que você obterá aqui estão diretamente ligados às próximas unidades que você estudará. Então, tenha muita atenção e dedicação na leitura. Vamos começar? License-510259-28478-0-5 ESTATÍSTICA Classificações, fontes de dados e tipos de coletas Você já conhece o conceito de amostra, certo? Vamos expandi-lo um pouco. Independente da forma como ela é coletada, precisa representar bem a diversidade encontrada na população. Vamos investigar mais as características atreladas aos conceitos de população e amostra? Classificações Inicialmente, vamos recapitular os conceitos de população e amostra apresentados na primeira unidade. De acordo com Triola (2008), população é o nome dado à coleção completa de todos os elementos a serem estudados,e amostra é um subconjunto de elementos da população. O autor apresenta dois outros conceitos importantes para o trabalho com dados: parâmetro e estatística. O termo parâmetro é empregado à medida numérica que descreve uma característica populacional, ao passo que estatística é o termo usado para a medida que descreve uma característica amostral. Esses termos serão utilizados ao longo das unidades e ajudam a identificar a origem do conjunto de dados. As características que um parâmetro ou estatística descrevem podem ser, por exemplo, a média, o desvio padrão ou a variância, conceitos que serão trabalhados com mais profundidade em unidades posteriores. Agora, vamos contextualizar os conceitos em um caso prático hipotético para que você os compreenda melhor. Primeiro, observe a figura a seguir. License-510259-28478-0-5 ESTATÍSTICA Fonte: egd, shutterstock, 2017. Suponha que um pesquisador verificou que, em um trecho de rodovia, transitaram entre as 16 e 20 horas uma média de 3000 carros durante todo o ano de 2015. Em 2016, ele quis verificar a média de carros no mesmo local e horários, porém, somente para o mês de dezembro. Durante a pesquisa, verificou que a média dessa amostra de tempo era de 2237 carros. Considerando esse caso, qual dado é o parâmetro e qual é a estatística? A média verificada em 2015 é um parâmetro, pois se trata de toda a informação populacional. Já a média verificada em 2016 é uma estatística, pois é uma parte da informação coletada em apenas uma parte do período, isto é, uma amostra. Fontes de dados Coletar uma amostra exige certos cuidados para não tomarmos decisões equivocadas. Quer entender o porquê? Vamos considerar dois exemplos para identificar a ideia de representatividade populacional na amostra. Bolfarine e Bussab (2005) citam um exemplo simples do cotidiano: uma sopa. License-510259-28478-0-5 ESTATÍSTICA Fonte: Liv friis-larsen, Shutterstock, 2017. Quando cozinhamos uma sopa e desejamos testar seu tempero ou temperatura, não precisamos tomar tudo, basta uma colher. Além disso, devemos mexer a sopa antes de prová-la, ou poderemos tirar conclusões equivocadas. Como? Veja: se pegarmos uma colher da borda do prato, onde a sopa está mais fria, podemos julgar que toda ela está em uma temperatura agradável, entretanto, no centro, está quente demais para ser consumida. Agora, considere outro exemplo. Uma operadora de TV por assinatura quer realizar uma pesquisa de opinião sobre a qualidade do serviço. É provável que, mesmo tendo muitos recursos, seja inviável contatar todos os seus clientes. Inúmeras razões podem levar a essa falta de informação, como a dificuldade de encontrar os clientes no horário comercial, a disponibilidade deles e até mesmo seu interesse em responder a pesquisa. Assim, é mais adequado trabalhar com uma amostra. License-510259-28478-0-5 ESTATÍSTICA O processo de trabalhar com a coleta de dados amostrais é denominado amostragem. Após optar pela amostragem, a empresa deve decidir qual é o método mais adequado à pesquisa e à natureza da população. Trataremos dos métodos de amostragem em unidades posteriores, mas já é importante citar algumas possíveis características da população que podem influenciar os resultados da pesquisa por amostragem. Para tanto, veja a figura a seguir. Fonte: Ollyy, Shutterstock, 2017. Você consegue identificar 25 pessoas de diferentes etnias, gêneros, idades, cortes de cabelo, que utilizam ou não óculos, com e sem cabelos longos etc. Que outras características você consegue identificar? Considerando que há uma diversidade de variáveis, License-510259-28478-0-5 ESTATÍSTICA imagine o que pode acontecer ao não considerá-las na pesquisa. Vamos exercitar melhor essas considerações em unidades posteriores, quando vamos tratar dos tipos de amostragem. Diante disso, podemos afirmar que as coletas de dados assumem critérios que as tornam tendenciosas ou não tendenciosas. Perceba que uma amostra tendenciosa não representa a população a qual pertence e, por essa razão, é considerada uma amostra ruim (TRIOLA, 2008). Ainda de acordo com Triola (2008), há duas fontes distintas de dados: estudos observacionais, quando coletamos informações, mas não interferimos no sujeito do estudo, ou estudos experimentais, quando aplicamos tratamentos e observamos seus efeitos no sujeito de estudo. Na próxima unidade, aprofundaremos esses conceitos. Clique na figura para assistir ao vídeo License-510259-28478-0-5 ESTATÍSTICA Tipos de coleta de dados Os dados podem ser coletados de diferentes formas e com propósitos variados. Bolfarine e Bussab (2005) destacam a importância do instrumento de coleta de dados utilizado, bem como a forma como o aplicador se comunica na abordagem da pesquisa. Por exemplo, um questionário aplicado por meio de uma entrevista oral é uma forma de coleta de dados com comunicação verbal, e a entrevista é o seu instrumento. Telefone E-mail Coleta em campo Fonte: Tachjang; studiostock; Sergey Nivens, Shutterstock.com Você pode utilizar um instrumento de outro pesquisador, quando atender às suas necessidades de sua pesquisa, ou criar um próprio. Além da aplicação de questionários, é possível utilizar acesso a bases de dados de instituições, registros como prontuários, entre outros. São inúmeras as formas de coletas de dados, e a mais adequada ao seu estudo depende do tipo de pesquisa e da forma com que o estudo é delineado. Na próxima unidade, você aprofundará seus conhecimentos sobre planejamento experimental e técnicas de amostragem e verá a importância de conduzir de forma correta seus experimentos. License-523747-28188-0-0 ESTATÍSTICA Planejamento de experimentos Introdução Você se lembra dos conceitos de população e amostra vistos nas unidades anteriores? Sabe como aplicá-los? Pois bem, depois de toda essa fundamentação teórica, está na hora de entender como trabalhar com amostras. Um exemplo de aplicação da amostragem são as pesquisas de opinião. Você já participou de alguma? Para selecionar os participantes, o responsável pelo planejamento amostral deve fazer várias considerações, aplicando as técnicas aprendidas nesta disciplina de forma adequada. Está preparado(a) para conhecer as ferramentas que podem sanar possíveis problemas de amostragem? Os conhecimentos apresentados nesta unidade vão exigir um pouco mais de atenção, pois sua aplicabilidade depende das necessidades da pesquisa e do tipo de dados disponíveis. Então, siga a leitura atentamente! License-523747-28484-0-5 ESTATÍSTICA Conceitos gerais da experimentação e tipos de amostragem Dependendo das questões que pesquisaremos e do público disponível e acessível para uma pesquisa, uma série de considerações devem ser feitas para decidir qual método de amostragem usar. Vamos investigar esse assunto! Conceitos gerais da experimentação Como definir quais elementos da população vão compor uma amostra? Bolfarine e Bussab (2005) alertam que precisamos pesquisar, planejar, executar, corrigir e analisar de forma adequada o procedimento proposto e usado de coleta de dados. A forma de planejar um experimento não é fechada como uma receita de bolo, pois depende dos objetivos de pesquisa e dos resultados que pretendemos obter com ela, do conhecimento acerca da população etc. Vamos voltar aos tipos de estudos abordados na unidade anterior para explorá-los um pouco mais e observar suas formas de condução. Os conhecimentos que você obteve em unidades anteriores sobre classificação de variáveis e tipos de estudos vão ajudá-lo a delinear seus experimentos de forma mais clara. Critérios para determinação de experimento Você se lembra dos conceitos de estudos observacionais e experimentais? O que os difere é que, nos experimentais, há interferência no sujeito objeto do estudo, diferentemente dos observacionais. Vamos aprofundar um pouco esse tema. Dentro dos estudos experimentais, há algumas variações,de acordo com os seguintes critérios apresentados por Triola (2008): controle de efeito, réplica e aleatorização. License-523747-28484-0-5 ESTATÍSTICA O controle de efeito se refere às formas de contornar possíveis efeitos que não são necessariamente provocados pela variável de estudo. Para contorná-los, Triola (2008) sugere os seguintes experimentos: cegos, nos quais o sujeito submetido ao estudo não sabe se está recebendo um tratamento ou placebo (tratamento sem efeito), e em blocos, em que grupos de participantes são submetidos a diferentes tratamentos. Em experimentos com unidades de experimento vivas, como testes com vacinas e medicamentos em humanos, a pesquisa pode contar aplicadores, isto é, pessoas designadas apenas para administração dos tratamentos que compõem o experimento. Quando esses aplicadores não são os próprios pesquisadores, é possível executar o experimento duplo-cego, uma vez que o pesquisador tem a informação de qual tratamento será administrado, mas não a repassa nem aos aplicadores nem aos sujeitos do estudo. Porém, quando o tratamento é aplicado ao sujeito pelo próprio pesquisador, esse recurso do duplo cego fica inviável. Quando tanto o sujeito da pesquisa quanto o aplicador não sabem qual é o tratamento usado, temos um estudo duplo-cego. Triola (2008) cita como exemplo o estudo de eficácia da vacina Salk, contra a poliomielite. Segundo Campos, Nascimento e Maranhão (2003), ela era produzida a partir do vírus morto e começou a ser utilizada no Brasil a partir de 1955. A partir da década de 1960, foi substituída pela vacina Sabin. Como você lidaria com os possíveis efeitos em um experimento similar? Existem várias formas, como mostra o diagrama a seguir. • Somente os pacientes não sabem se estão recebendo tratamento ou placebo. Experimento cego Experimento duplo-cego • Nem os médicos que aplicam as vacinas nem os pacientes sabem se a aplicação da vacina é um placebo ou um tratamento. Experimento em blocos • Mais tratamentos podem ser testados ao mesmo tempo, possibilitando verificar melhores formulações ou marcas. Fonte: Baseado em Triola (2008). License-523747-28484-0-5 ESTATÍSTICA Compreendeu o controle de efeito? A próxima questão abordada por Triola (2008) é a réplica, que se refere à repetição de grupos de elementos no experimento para aumentar o tamanho amostral e para que os resultados possam ser confirmados ou verificados. Imagine um trecho de terra, dividido em vários quadrantes. Nele, um pretendemos testar diferentes tipos de adubos. Para ter certeza de que os resultados obtidos não vêm de uma porção de terra muito irrigada do quadrante ou que tenha sido exposta a mais sol que as demais, podemos cultivar várias mudinhas em um mesmo quadrante, apenas variando o local do plantio. Assim, colocamos algumas plantas mais na borda, outras no centro do quadrante. Cada uma dessas mudas de um quadrante específico é uma réplica do mesmo tratamento. Por fim, a aleatorização diz respeito à forma como os dados são coletados, para que não haja viés na coleta. Segundo Triola (2008), a amostra aleatória é aquela em que os elementos são selecionados da população, com a mesma probabilidade. Vamos supor um caso clássico: o sorteio de bolas numeradas em uma urna. Para um sorteio justo, todas as bolas devem ter condições iguais de serem sorteadas: mesmo peso, formato e volume. Dessa forma, se tivermos seis bolas nessa urna, numeradas de 1 a 6, a chance de sortear qualquer uma necessariamente é de 1/6 ou cerca de 0,167. Entretanto, em certas situações, por exemplo, pesquisas com doenças raras, a aleatorização e a réplica ficam inviáveis. Tipos de amostras Bolfarine e Bussab (2005) citam dois tipos de amostras: as não probabilísticas e as probabilísticas. Você consegue imaginar as diferenças entre elas? Conforme Triola (2008), as não probabilísticas são aquelas que proporcionam fácil acesso aos dados, sem qualquer outra preocupação. Já as probabilísticas são aquelas em que cada sujeito tem chance conhecida (mas não necessariamente igual) de ser selecionado. Além disso, esse tipo de amostra nos possibilita tirar conclusões acerca da população, desde que seja executada com todo rigor necessário. License-523747-28484-0-5 ESTATÍSTICA Bolfarine e Bussab (2005) dividem em dois tipos as amostras não probabilísticas. O primeiro é a amostra criteriosa, quando utilizamos algum critério de seleção, mas que não chega a tornar a pesquisa probabilística. Um exemplo é a seleção de alunos da 3ª série do Ensino Médio para participar de uma pesquisa sobre a qualidade da escola. Podemos selecionar apenas aqueles com 75% de presença e que, portanto, usufruem mais dos espaços e serviços da escola do que os demais. Ainda assim, essa amostra não seria coletada de forma aleatória, por isso, não é considerada probabilística. O segundo é a amostra intencional, quando a seleção dos participantes é feita pela identificação ao gosto do pesquisador, muito mais que a criteriosa. Podemos citar como exemplo a seleção dos maiores especialistas em determinada doença para a validação de um instrumento de pesquisa. Quanto às amostras probabilísticas, podemos dividi-las em quatro tipos, conforme o quadro a seguir. Amostra Descrição Aleatória simples Uma amostra de n sujeitos é coletada aleatoriamente. Sistemática Escolhe-se um ponto inicial e, a seguir, é selecionado cada k-ésimo elemento da população. Estratificada A amostra tem estratos condizentes com os populacionais, por exemplo, gênero e faixa etária. Por conglomerado A população é dividida em seções e, após o sorteio de n seções, todos os sujeitos das seções serão pesquisados. Fonte: Elaborado pela autora, baseado em Triola (2008). Quer entender melhor? Observe as figuras a seguir, que representam as ideias das amostras probabilísticas. Fonte: Ajay Kumar Singh, Shutterstock, 2017. Fonte: flydragon, Shutterstock, 2017. (Adaptado). Fonte: ESB Professional, Shutterstock. (Adaptado). License-523747-28484-0-5 ESTATÍSTICA Na urna, idealmente cada objeto possui a mesma chance de ser sorteado, representado a amostragem aleatória simples. Já as fichas representadas na segunda imagem podem, por exemplo, representar a lista de moradores dos bairros de uma cidade, da qual escolhemos alguns dos bairros para fazer uma pesquisa representando uma amostragem por conglomerado. Além disso, assumindo que a lista seja de elementos de uma população, a seleção do k-ésimo elemento a partir de um ponto de partida é também a representação de amostragem sistemática. Por fim, o exemplo ilustrado na terceira figura representa uma amostragem estratificada a ser executada a fim de mensurarmos, por exemplo, a opinião de funcionários sobre o plano de saúde oferecido como benefício de uma determinada empresa, mantendo a mesma proporção de homens e mulheres. Independentemente do tipo de amostragem probabilística com a qual trabalhamos, Triola (2008) aponta um conceito muito importante: o erro amostral, que é a diferença entre o resultado amostral e o verdadeiro resultado populacional. As diferenças que encontraremos entre os resultados gerados a partir do experimento com amostras são erro amostral, já equívocos no planejamento e na execução do experimento, na manipulação da base de dados e qualquer outra situação causada pelo pesquisador causam erro não amostral. Erros não amostrais são originados quando uma ou mais das etapas de pesquisa são feitas de forma inadequada. Chegamos ao fim de mais uma unidade! Caso tenha ficado curioso sobre os tipos de amostragem, não deixe de conferir a bibliografia da disciplina. Até a próxima! License-523747-28484-0-5 ESTATÍSTICA License-397702-28192-0-0 ESTATÍSTICA Análise descritiva dos dados Introdução Você estudou na aula passada os conceitos gerais da experimentação e os tipos de amostragem e ainda viu a importância de um bom planejamento experimental para atingir resultados precisos. Agora,imagine que você tem em mãos os dados numéricos resultantes de um estudo estatístico de uma população ou amostra. Como analisar e representá-los? É aí que entra a análise descritiva dos dados, que pressupõe organizar esses dados em tabelas e gráficos. As tabelas são recursos utilizados pela estatística para organizar e facilitar a visualização e comparação dos dados. Já os gráficos trazem as mesmas informações das tabelas de forma visual, permitindo melhor compreensão das principais características dos dados. Ao longo desta aula, você compreenderá melhor como utilizar esses recursos. Vamos lá? License-397702-28480-0-7 ESTATÍSTICA Análise descritiva de dados A estatística descritiva nos possibilita organizar e descrever um conjunto de dados por meio de tabelas e gráficos, que você conhecerá ao longo desta aula. Vamos começar entendendo o que são as tabelas. Tabelas estatísticas Você sabe no que podemos utilizar as tabelas? Em artigos científicos, órgãos governamentais, empresas, jornais, entre outros, justamente por transmitirem informações rápidas aos leitores e possibilitarem comparações. Segundo Triola (2008), quando trabalhamos com grandes conjuntos de dados, muitas vezes é útil organizar e resumi-los com a construção de uma tabela que liste os seus diferentes possíveis valores (individualmente ou em grupos), juntamente com suas frequências correspondentes (ou contagens). Para a sua construção, algumas regulamentações devem ser seguidas. Fonte: karelnoppe, Shutterstock, 2017. License-397702-28480-0-7 ESTATÍSTICA Segundo Tiboni (2010), a tabela é um conjunto de observações sobre um determinado assunto, organizadas e distribuídas num quadro que apresenta a seguinte estrutura: o título, que explica o que a tabela contém, o cabeçalho, que especifica o conteúdo de cada coluna, e o rodapé, que traz demais informações sobre a tabela e a fonte dos seus dados. Veja um exemplo a seguir. Ano População Total 1980 119.002.706 1991 146.825.475 1996 157.070.163 2000 169.799.170 2010 190.755.799 Fonte: INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA, 2017. (Adaptado). A tabela é um quadro que representa de forma sintética um conjunto de dados numéricos para facilitar seu entendimento e leitura. Tipos de gráficos Conseguiu compreender o que é uma tabela? Mas ela não é a única forma de representação de dados numéricos. Conforme Magalhães e Lima (2015), muitas vezes, a informação contida nas tabelas pode ser mais facilmente visualizada em gráficos. De acordo com Tiboni (2010), os principais tipos de gráficos são os seguintes. Gráfico de linhas: representa séries cronológicas de um período grande, por exemplo, comparativos de temperaturas, série histórica do número de habitantes de determinado local ao longo de vários anos e consumo de energia elétrica. License-397702-28480-0-7 ESTATÍSTICA Gráfico de colunas ou barras: faz correspondências entre elementos de uma série estatística e a figura geométrica de um retângulo, que pode ser vertical (colunas) ou horizontal (barras). Usado para representar a taxa de fecundidade de uma mulher (número médio de filhos), a população de um local em vários anos etc. Gráfico de setores ou pizza: é representado por um círculo dividido em setores para comparar o valor de cada setor com o total. Usado, por exemplo, para ilustrar escolaridade, sexo, receita municipal, produção pecuária, entre outros. Fonte: RomanR, Shutterstock, 2017. (Adaptado). Histograma: ilustra uma distribuição de frequência por meio de retângulos justapostos, cada um relacionado a uma classe da distribuição de frequências. Como exemplos, estão a distribuição do número de filhos por famílias e a espessura de peças produzidas por uma empresa em um determinado mês. License-397702-28480-0-7 ESTATÍSTICA 30 25 20 15 10 5 0 Fr eq uê nc ia Polígono de frequências: gráfico de configuração linear obtido quando calculamos o ponto médio de cada intervalo de classe e o marcamos na parte superior do retângulo do histograma. Ao unirmos todos os pontos médios, obtemos a linha do polígono de frequências. Um exemplo é o polígono de frequência da distribuição do número de filhos por famílias. 30 25 20 15 10 5 0 Fr eq uê nc ia Ogiva: gráfico que representa a frequência acumulada, útil para determinar valores que estão abaixo de outro, por exemplo, o polígono de frequência acumulada da distribuição do número de filhos por famílias. License-397702-28480-0-7 ESTATÍSTICA 120 100 80 60 40 20 0 Fr eq uê nc ia a cu m ul ad a Diagrama de dispersão: é representado pelos eixos cartesianos x e y, cada um correspondendo às variáveis que poderão estar correlacionadas no estudo. No eixo vertical, temos y, a variável dependente, e no das abcissas, x, a variável independente. Você verá o assunto com mais profundidade em outras aulas. Clique na figura para assistir ao vídeo License-397702-28480-0-7 ESTATÍSTICA Va riá ve l D ep en de nt e Variável Independente Os gráficos estatísticos são representações visuais que possibilitam uma análise mais rápida dos dados estatísticos. Tipos de séries e séries estatísticas do IBGE Você já ouviu falar em séries estatísticas? Elas são muito úteis para representar dados como a expectativa de vida das mulheres e as taxas de desemprego, de alfabetização, de juros, entre muitos outros exemplos. Mas o que são? A distribuição de um conjunto de dados em função da época, espécie e local é chamada série estatística. De acordo com Tiboni (2010), as séries estatísticas são tabelas representadas por um conjunto de dados estatísticos, classificadas nos tipos a seguir. License-397702-28480-0-7 ESTATÍSTICA Temporal: também chamada de cronológica, histórica ou evolutiva, é a série na qual os dados são observados segundo a época de ocorrência. Por exemplo, o consumo de energia elétrica durante o ano em determinada cidade de 1970 a 2010. Geográfica: também chamada de espacial, territorial ou de localização, é a série na qual os dados são observados segundo a localidade da ocorrência. Um exemplo é o número de empresas fiscalizadas em determinado ano por estado. Específica: também chamada de categórica, é a série na qual os dados são observados segundo a modalidade de ocorrência, como ao mostrar o número de matrículas no Ensino Superior realizadas por área de ensino em 2016. Distribuição de frequências: é a série estatística na qual os dados são agrupados com suas respectivas frequências absolutas. Alguns exemplos são: o número de acidentes por dia na Rua X em julho de 2017 e a altura dos alunos da classe escolar x em março de 2017. Quando ordenadas em um determinado intervalo, as informações constituem as séries estatísticas históricas, que nos permitem verificar mudanças em indicadores como saúde, educação, habitação, trabalho, demografia e economia e aprimorar a metodologia para coleta dos dados. Você sabe onde visualizar algumas séries estatísticas? Uma fonte importante é o Instituto Brasileiro de Geografia e Estatística (IBGE). O IBGE tem como principal objetivo divulgar para os diversos públicos, como a área acadêmica, órgãos governamentais e setores privados, informações provenientes de suas pesquisas, demonstrando a realidade socioeconômica e demográfica do país, úteis como ferramentas para tomada de decisões e para agregar conhecimentos. O gráfico a seguir mostra um exemplo de série histórica com dados do IBGE. Nela, verificamos o comportamento da taxa de analfabetismo de pessoas com 10 anos ou mais de 1992 a 2011 no Brasil. License-397702-28480-0-7 ESTATÍSTICA 17 16 15 14 13 12 11 10 9 8 7 1992 1995 1998 1999 2001 2002 2003 2004 2005 2006 2007 2009 2009 2011 Fonte: INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA, 2011. (Adaptado). Você chegou ao final desta aula, que o ajudou a reconhecer a importância das tabelas, gráficos e séries estatísticas. Posteriormente, você verá os recursos tecnológicos quepodem ser aproveitados para a análise estatística em sua construção. License-393926-28196-0-0 ESTATÍSTICA Recursos tecnológicos para a análise estatística Introdução Você já aprendeu um pouco sobre tabelas, gráficos e séries históricas. Lembra que as tabelas apresentam de forma resumida resultados rápidos sobre algum assunto em estudo? O mesmo ocorre com os gráficos, que fornecem características dos dados e possibilitam comparações. Utilizar ferramentas tecnológicas como facilitadoras na análise de dados estatísticos nessas tabelas e gráficos pode tornar nosso trabalho muito mais prático. Agora, você conhecerá alguns recursos tecnológicos utilizados em análises estatísticas e ferramentas computacionais para a análise de dados estatísticos. Um programa que podemos utilizar para a análise estatística é o Microsoft Excel, por exemplo. Você será apresentado a algumas funções dele ao longo desta unidade. Vamos começar? License-393926-28482-0-4 ESTATÍSTICA Ferramentas computacionais para a análise estatística Ao longo das unidades anteriores, você conseguiu perceber como a estatística está presente em muitas áreas, não é mesmo? A informática também. Por isso, várias ferramentas tecnológicas têm sido desenvolvidas para utilização em diversos segmentos, seja por empresas públicas ou privadas e pelo público acadêmico. Tratam-se dos chamados softwares estatísticos, que auxiliam a análise estatística dos dados nas tomadas de decisão e nas pesquisas científicas. Fonte: jannoon028, Shutterstock, 2017. A estatística e a tecnologia Você já sabe que a estatística é uma ciência exata que nos fornece recursos para coletar, resumir, organizar, analisar e interpretar dados, correto? Agora, você verá como a tecnologia nos auxilia a interpretar e analisar informações por meio de tabelas e gráficos. License-393926-28482-0-4 ESTATÍSTICA Segundo Lapponi (2005), a estatística é mais do que trabalhar com números porque, mesmo com toda a praticidade dos programas estatísticos, que fornecem resultados rápidos na organização dos dados e construção de gráficos, os analistas devem saber interpretar os resultados. Na prática, o que isso significa? Perceba que, mesmo com ferramentas cada vez mais práticas para a análise de dados estatísticos, devemos ser prudentes ao utilizá-las, não agindo de forma mecanizada, mas, sim, sabendo interpretar os resultados obtidos. Suponha uma pesquisa, com a amostra já coletada. A partir dela, já podemos realizar a análise exploratória dos dados, fazer gráficos e inferências, inclusive por meios tecnológicos. Imagine agora, que, nessa mesma amostra, existem dados discrepantes (os chamados outliers), que não são retirados do conjunto de dados na hora de fazer a análise. Assim, possivelmente teremos resultados que não condizem com a realidade e faremos conclusões erradas sobre o estudo em questão. Dessa forma, apesar de toda a facilidade que as ferramentas tecnológicas proporcionam, devemos sempre estar baseados na teoria para identificar possíveis incoerências. Os recursos tecnológicos facilitam a coleta, organização, análise e interpretação de dados estatísticos. A seguir, você conhecerá alguns softwares estatísticos. Softwares estatísticos Muitos softwares ou programas estatísticos são compostos por ferramentas criadas para pessoas que possuem conhecimento na área da estatística. License-393926-28482-0-4 ESTATÍSTICA Fonte: Scanrail1, Shutterstock, 2017. Esses softwares funcionam em computadores comuns, porém são capazes de rodar também em computadores e servidores de alta performance, ampliando sua capacidade de manipulação de dados para milhões de registros de informações. Triola (2008) cita os seguintes exemplos. Statdisk: desempenha várias funções e testes estatísticos e pode gerar histogramas e diagramas de dispersão. Não é um software livre. Minitab: possui um ambiente completo para a análise de dados, por exemplo, estatística descritiva, análise das séries temporais, correlação, regressão, controle estatístico de processo, planejamento de experimentos, análise de sobrevivência, entre outros. O Minitab possui boa parte dos principais métodos estatísticos em uma interface gráfica bem organizada e pode gerar todos os tipos de gráficos estudados na unidade 4. Não é um software livre. Excel: é o software de planilha eletrônica mais conhecido e utilizado. Possui ferramentas que possibilitam muitas análises estatísticas, como cálculo de estatísticas descritivas, testes estatísticos, a juste de regressão linear, correlações, distribuições License-393926-28482-0-4 ESTATÍSTICA de probabilidade, entre outros. Pode gerar histogramas, polígonos de frequência, gráficos de colunas, linhas, setores ou pizza e diagramas de dispersão. Não é um software livre, mas seu valor é mais acessível se comparado a outros softwares pagos mencionados nesta Unidade. Além disso, temos o Libre Office, que traz uma planilha de cálculos similar e é livre. Clique na figura para assistir ao vídeo Outros softwares também amplamente conhecidos são listados a seguir. SPSS: um dos softwares mais utilizados na área acadêmica e por pesquisadores das ciências sociais, é bastante completo para a análise de dados. Não é um software livre. BioEstat: utilizado nas diversas áreas de conhecimento por estudantes e pesquisadores, mas com maior frequência na área de ciências biológicas. É prático e de fácil manuseio, além de ter licença gratuita para utilização. O avanço tecnológico de hardwares e softwares possibilita o constante crescimento das análises estatísticas em uma velocidade e volume de dados cada vez maior. License-393926-28482-0-4 ESTATÍSTICA Você já utilizou ou ao menos ouviu falar em quais desses softwares? Exploraremos mais o Excel, por ser mais acessível e de fácil utilização. Vamos começar? Utilizando o Excel Você já explorou ao menos um pouco o Excel? Que tal aprofundar um pouco seus conhecimentos? Com um pouco de conhecimento e prática, o Excel é uma ferramenta extremamente útil para análises estatísticas e manipulação da base de dados. Esse software dispõe de várias funções úteis para o manuseio e a análise de dados: planilhas, tabelas, gráficos e ferramentas estatísticas para análise exploratória dos dados. As planilhas são organizadas em linhas numeradas e colunas identificáveis por letras (A, B, C, D etc.). Cada um dos espaços é chamado de célula ou casela. Veja um exemplo na figura a seguir. Note as colunas A, B, C e D,... e as linhas numeradas em ordem crescente. Fonte: Peter Sobolev, Shutterstock, 2017. Nessas planilhas, inserimos os bancos de dados provenientes das pesquisas realizadas e, a partir deles, realizamos consultas, cálculos estatísticos, gráficos, entre outras atividades. A partir de agora, você aprenderá como utilizar esse software. License-213524-28200-0-0 ESTATÍSTICA Tipos de variáveis e distribuição de frequências de variáveis discretas Introdução Você conheceu em unidades anteriores alguns conceitos básicos de estatística e os recursos tecnológicos que nos auxiliam nas análises estatísticas. Você se lembra de alguma das ferramentas computacionais que você estudou? A principal e mais acessível delas é o Excel. Conseguiu testá-lo um pouco? Agora, você vai se aprofundar nos conceitos da estatística, aprendendo mais sobre variáveis qualitativas e quantitativas. Também verá as definições de dados brutos, rol de dados, frequências e distribuições de frequência de variáveis discretas. O objetivo é identificar as variáveis qualitativas e quantitativas em uma população ou amostra e organizá-las por meio de frequências e gráficos. Vamos em frente! License-213524-28776-0-4 ESTATÍSTICA Variáveis qualitativas e quantitativas Segundo Triola (2008), a pesquisa é uma das muitas ferramentas que podemos usar para a coleta dos dados que compõem uma população ou amostra. Esses dados podem ser quantitativos ou qualitativos.Vamos nos aprofundar nesse tema? Variáveis Vamos relembrar o conceito de variável? Conforme Tiboni (2010), as variáveis são características que podem ser observadas ou medidas em cada elemento da população. Em outras palavras, é um conjunto de resultados possíveis de um fenômeno. Temos uma variável quando conseguimos observar pelo menos uma característica nos elementos de uma população, por exemplo: sexo (masculino ou feminino), número de filhos (0,1, 2, 3,..., n), entre outras. Você lembra que as variáveis podem ser classificadas em quantitativas e qualitativas? Vamos compreender melhor a seguir. Clique na figura para assistir ao vídeo License-213524-28776-0-4 ESTATÍSTICA As variáveis são observações ou medidas de cada elemento da população e podem ser qualitativas ou quantitativas. Variáveis quantitativas As variáveis quantitativas são aquelas que podem ser medidas em uma escala quantitativa, ou seja, seus valores são expressos por números. Consegue citar alguns exemplos? Idade, salários, comprimentos, notas avaliativas, peso, níveis de colesterol, taxa de glicose etc. Fonte: Elena Abrazhevich, Shutterstock, 2017. Essas variáveis podem ser discretas ou contínuas. Conforme Tiboni (2010), as variáveis discretas assumem os valores de um conjunto enumerável, ou seja, apenas valores inteiros. Por exemplo: número de filhos, de carros em um estacionamento, de televisores em uma residência, entre outros. License-213524-28776-0-4 ESTATÍSTICA Já as variáveis contínuas assumem infinitos valores numéricos entre dois limites. Triola (2008) explica que elas resultam de infinitos valores possíveis que correspondem a alguma escala contínua que cobre um intervalo de valores sem vazios, interrupções ou saltos. Por exemplo: peso, altura, volume, idade, áreas, perímetros, diâmetros etc. Fonte: TaLaNoVa, Shutterstock, 2017. As variáveis quantitativas podem ser contínuas ou discretas. Variáveis qualitativas ou categóricas Se as variáveis quantitativas expressam números, o que as variáveis qualitativas mostram? Segundo Tiboni (2010), as variáveis qualitativas, também conhecidas como categóricas, não possuem dados quantitativos, mas, sim, expressam uma qualidade ou atributo. São definidas por várias categorias ou, ainda, representam uma classificação do indivíduo. Assim, usamos esse tipo de variável para definir sexo, raça, cor da pele, estado civil, grau de instrução, cidade natal etc. License-213524-28776-0-4 ESTATÍSTICA Elas podem ser nominais e ordinais. Temos variáveis nominais quando não existe ordenação entre as categorias. É o caso do sexo, cor dos olhos, tipo sanguíneo ou a classificação das pessoas em doente/sadio e fumante/não fumante, por exemplo. Por sua vez, as variáveis ordinais pressupõem ordenação natural entre as categorias. Por exemplo: estágio de uma doença (1º, 2º e 3º graus), mês de observação (janeiro, fevereiro e assim por diante), classificação em concursos, altura classificada como baixa, média e alta e temperatura (fria, morna e quente). As variáveis qualitativas podem ser nominais ou ordinais. Conseguiu entender as diferenças entre os tipos de variável? Que tal exercitar sua compreensão por meio de alguns exemplos? Vamos lá! Primeiro, classifique as variáveis a seguir em qualitativas, quantitativas discretas ou quantitativas contínuas. A Diâmetro: quantitativa contínua. B Salários: quantitativa contínua. C Religião: qualitativa. D Quantidade de pacientes em um hospital: quantitativa discreta. E Cargos de uma empresa: qualitativa. F Preço: quantitativa contínua. G Nome de bairros: qualitativa. H Velocidade: quantitativa discreta. I Marcas de perfume: qualitativa. J Consumo de energia elétrica: quantitativa contínua. K Grau de instrução: qualitativa. License-213524-28776-0-4 ESTATÍSTICA Agora, listamos cinco casos. Consegue dizer qual é a variável de cada um e qual seu tipo? Pense um pouco antes de ler as respostas! A Nível de satisfação dos clientes. Variável: nível de satisfação. Classificação: variável qualitativa ordinal. B Horário de partida dos aviões. Variável: horário. Classificação: variável quantitativa contínua. C Variação mensal do índice Bovespa. Variável: índice Bovespa. Classificação: variável quantitativa contínua. D Cor dos olhos dos funcionários de um banco. Variável: cor dos olhos. Classificação: variável qualitativa nominal. E Pessoas da terceira idade em uma fila de banco durante uma semana. Variável: pessoas da terceira idade. Classificação: variável quantitativa discreta. Quantas você acertou? Vamos treinar mais um pouco? Suponha que o gerente de um supermercado pesquisou a preferência dos clientes na compra de frutas. Na amostra de 50 clientes, a fruta preferida foi a goiaba. Com base nesse contexto, especifique a população, o número de elementos da amostra e o tipo de variável. Conseguiu achar a solução? Vamos à resposta. A população é o conjunto de todos os clientes do supermercado. O número de elementos da amostra é 50, e a variável é qualitativa nominal. Até agora, você estudou as variáveis e seus tipos e viu exemplos práticos. A seguir, você será apresentado a outras definições importantes para a estatística: dados brutos, rol de dados e os tipos de frequências. License-507522-36260-0-0 ESTATÍSTICA Distribuição de frequências de variáveis contínuas Introdução Você aprendeu em unidades anteriores a coletar dados e identificar variáveis quantitativas e qualitativas. Mas, como analisar todos esses dados sem precisar olhar indivíduo por indivíduo? Para responder a essas perguntas, vamos ver como sintetizar as informações para visualizar o comportamento das variáveis. Imagine que você tenha realizado uma pesquisa eleitoral em um determinado município, com o intuito de verificar se a faixa etária dos eleitores interfere na escolha de seu candidato a prefeito. Você entrevistou pessoas de diferentes idades, podendo agrupá-las por faixa etária, descobrindo, por exemplo, o número de eleitores entre 16 a 24 anos ou qual candidato obteve mais intenções de votos em cada faixa. Nesta unidade, você aprenderá a lidar com situações como a exemplificada acima, utilizando distribuições de frequências e gráficos. Vamos lá? License-507522-29120-0-4 ESTATÍSTICA Distribuição de frequências de variáveis contínuas: conceito e cálculo de intervalos e classes Para iniciarmos o estudo das distribuições de frequências, é importante que você conheça alguns conceitos fundamentais. Vamos a eles? Conceitos Primeiro, observe a tabela a seguir. Salários Número de empregados R$ 1.000,00 -| R$ 2.200,00 2 R$ 2.200,00 -| R$ 3.400,00 4 R$ 3.400,00 -| R$ 4.600,00 5 R$ 4.600,00 -| R$ 5.800,00 3 R$ 5.800,00 -| R$ 7.000,00 1 Total 15 Segundo Triola (2008), essa é uma tabela de frequências, ou tabela de distribuição de frequências, por ser constituída de classes ou categorias de valores em conjunto com a frequência (contagem) de cada classe. Chamamos cada linha da primeira coluna (Salários) de classe, que mostra seus limites inferiores e superiores. Perceba, por exemplo, que, na primeira classe, dois empregados recebem entre R$ 1.000,00 até aproximadamente R$ 2.200,00. As classes são divididas em intervalos, podendo ser abertos e/ou fechados. Vamos retomar a primeira classe do nosso exemplo. O sinal -| quer dizer que a classe compreende os valores entre R$ 1.000,01 e R$ 2.200,00, excluindo R$ 1.000,00. License-507522-29120-0-4 ESTATÍSTICA Podemos usar outros símbolos dependendo do intervalo. Observe alguns exemplos: R$ 1.000,00 |- R$ 2.200,00: a classe compreende os valores entre R$ 1.000,00 e R$ 2.199,99, excluindo R$ 2.200,00; R$ 1.000,00 |-| R$ 2.200,00: a classe compreende exatamente os valores entre R$ 1.000,00 e R$ 2.200,00; R$ 1.000,00 - R$ 2.200,00: a classe compreende os valores entre R$ 1.000,01 e R$ 2.199,99, excluindo R$ 1.000,00 e R$ 2.200,00. Perceba que podemos deixar o intervalo aberto na primeira classe(menor que R$ 2.200,00) ou fechado na última (maior que R$ 5.800,00). Tipos de frequência: absoluta ou simples e relativa Você se lembra dos tipos de frequência? Vamos relembrá-las. A frequência absoluta ou simples (fi) é a contagem de observações de cada classe. Ao somar todas, obtemos a frequência total, que é quantidade da amostra ou população do estudo. Para obtermos a frequência relativa (fri), por sua vez, devemos dividir a frequência simples absoluta pelo total e multiplicar o resultado por 100. Vamos retomar a nossa tabela com os salários? Consegue dizer qual o tipo de frequência que ela mostra? No caso, é frequência simples absoluta, pois conta em valores absolutos a quantidade de empregados que recebem salários em uma empresa. Como podemos, então, descobrir a frequência relativa? Para a primeira classe, efetuamos a seguinte operação: %i f 2 ×100= ×100=13,33 Total 15 Isso significa que 13,33% dos empregados ganham entre aproximadamente R$ 1.000,00 até R$ 2.200,00. Vamos efetuar os cálculos para as outras classes? License-507522-29120-0-4 ESTATÍSTICA Segunda classe: % 4 ×100=26,67 15 Terceira classe: % 5 ×100=33,33 15 Quarta classe: % 3 ×100=20,00 15 Quinta classe: % 1 ×100=6,67 15 Essas frequências são as mais usuais, pois a absoluta é a primeira que obtemos, e a relativa é a porcentagem de interesse de cada classe. Tipos de frequência: frequência absoluta acumulada (F aa ) e frequência relativa acumulada (Fr ac ) Agora, vamos relembrar as frequências acumuladas. A frequência absoluta acumulada (Faa) é a soma das frequências absolutas de uma determinada classe com as anteriores. Para entender melhor, veja de novo a tabela com os salários. Qual é a frequência absoluta acumulada da primeira classe? Perceba que, antes dela, não há uma classe anterior. Portanto, a resposta é 2, que é justamente o número de empregados na classe. Entretanto, na segunda classe, existe uma anterior, não é mesmo? Por isso, para descobrir a frequência absoluta acumulada, devemos somar o valor da frequência absoluta da primeira classe (2) com o da segunda (4), logo: 2 + 4 = 6 License-507522-29120-0-4 ESTATÍSTICA Isso explica que 6 empregados ganham aproximadamente de R$ 1.000,00 até R$ 3.400,00, pois agora juntamos o limite inferior da primeira classe com o da segunda. A frequência absoluta acumulada da terceira classe considera a soma da frequência anterior (6) com a frequência absoluta da terceira classe (5), então: 6 + 5 = 11 Fazendo o mesmo procedimento para a quarta classe, temos: 11 + 3 = 14 Por último, a quinta classe deve resultar no total: 14 + 1 = 15 E a frequência relativa acumulada (Fra)? Para descobri-la, devemos acumular os valores da frequência relativa e representá- los por porcentagens. Quer compreender melhor? Você se lembra que a frequência relativa da primeira classe é 13,33%, correto? A frequência relativa acumulada permanece o mesmo valor, afinal, não há uma classe anterior. Já na segunda classe, devemos somar o valor da frequência relativa da primeira classe (13,33%) com o da segunda (26,67%), resultando em: 13,33% + 26,67% = 40,00% Na prática, o que esse resultado significa? Que 40% dos empregados ganham aproximadamente de R$ 1.000,00 até R$ 3.400,00. Agora, você já sabe como proceder nas demais classes, não é mesmo? A frequência relativa acumulada da terceira classe soma a frequência relativa anterior (39,70%) com a da própria terceira classe (33,33%), logo: 40,00% + 13,33% = 73,33% License-507522-29120-0-4 ESTATÍSTICA Realizando o procedimento para a quarta classe, temos: 73,33% + 20,00% = 93,33% Por último, na quinta classe, o resultado deve novamente ser o total: 93,33% + 6,67% = 100% Também podemos dividir a frequência acumulada pelo total de elementos, evitando erros de arredondamento. Veja a quarta classe, por exemplo: %14×100=93,33 15 . Agora, podemos representar em uma tabela todas as frequências obtidas. Salários fi fri (%) Fac Frac (%) R$ 1.000,00 -| R$ 2.200,00 2 13,33 2 13,33 R$ 2.200,00 -| R$ 3.400,00 4 26,67 2 + 4 = 6 13,33 + 26,67 = 40 R$ 3.400,00 -| R$ 4.600,00 5 33,33 6 + 5 = 11 40 + 33,33 = 73,33 R$ 4.600,00 -| R$ 5.800,00 3 20,00 11 + 3 = 14 73,33 + 20 = 93,33 R$ 5.800,00 -| R$ 7.000,00 1 6,67 14 + 1 = 15 93,33 + 6,67 = 100 Total 15 100 A distribuição de frequências resume uma quantidade grande de informação, representando-a em intervalos de classe para uma melhor visualização dos dados.
Compartilhar