Baixe o app para aproveitar ainda mais
Prévia do material em texto
Apresentação de dados estatísticos José André Mota de Queiroz Introdução Nesta aula, estudaremos as formas de apresentação dos dados estatísticos mais usuais. Para isso, conheceremos como organizar os dados na forma de tabelas, seja na forma bruta, em porcentagem ou na forma de intervalos com frequências, ou em gráficos, que podem ser de linhas, colunas, barras, setores, entre outros. Objetivo de aprendizagem Ao final desta aula, você será capaz de: • conhecer quais são as diferentes maneiras de apresentar os dados estatísticos. Bons estudos! 1 Apresentação de dados estatísticos A apresentação de dados estatísticos é uma ferramenta aplicada para o resumo das informa- ções contidas nestes dados, evidenciando seus aspectos mais importantes (MARTINEZ, 2015). Para isso, é indispensável que o pesquisador faça a descrição completa das características mais marcantes dos dados, para, depois, tomar a decisão de qual ferramenta utilizará no tratamento estatístico. Assim, cabe ao pesquisador identificar se os dados são variáveis quantitativas, variáveis “numéricas”, ou seja, que expressam grandezas matemáticas (que podem ser contínuas ou discre- tas) ou variáveis qualitativas, que descrevem classificações, atributos ou qualidades (divididas em ordinal ou nominal) (MARTINEZ, 2015). FIQUE ATENTO! Os dados estatísticos podem ser classificados em variáveis quantitativas contínuas ou discretas e em variáveis qualitativas ordinal ou nominal. Para classificar as variáveis quantitativas em discretas ou contínuas, basta identificar se o valor que pode ser contado (variável quantitativa discreta) ou medido (variável quantitativa contínua). Por exemplo, a quantidade de livros em uma estante é uma variável quantitativa discreta; já a medição dos níveis de colesterol em dado grupo de pessoas será uma variável quantitativa contínua. Já para diferenciar as variáveis qualitativas em nominal ou ordinal, é necessário identificar se a ordem dos dados faz diferença. Por exemplo, ao classificar um grupo em fumantes ou não fumantes, ou se são do sexo masculino ou feminino, ou, ainda, no caso de peças de uma fábrica, em defeituosas ou não defeituosas chamamos de variável qualitativa nominal; porém, quando classificamos as pessoas de determinada cidade em classe A, B ou C, ou quanto ao salário que ganham podemos chamar de variável qualitativa ordinal. Depois de identificar a natureza dos dados, cabe ao pesquisador organizar os dados brutos. 1.1 Dados brutos Os dados brutos são aqueles que acabaram de ser coletados, porém, ainda não passaram por nenhum tratamento estatístico, nem foram organizados para serem apresentados de uma maneira mais didática, ou seja, de uma forma que facilite a interpretação do leitor das caracterís- ticas mais marcantes dos dados. Por exemplo, a quantidade de pessoas que moram nas casas de uma determinada rua foram assim coletadas: Quadro 1 – Dados brutos 4 3 2 4 6 2 1 0 4 5 2 3 6 4 3 6 2 1 0 3 1 2 3 4 0 5 0 2 1 0 Fonte: elaborado pelo autor, 2017. Assim, poderíamos representar os dados brutos em forma de rol (dados apresentados seguindo uma ordem do menor para o maior – crescente - ou do maior para o menor - decres- cente). O rol facilita que o menor e maior valor e a amplitude do intervalo dos dados (amplitude é a diferença do maior para o menor valor do intervalo de dados) seja visualizado na tabela. Quadro 2 – Dados na forma de rol 0 0 0 0 0 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 6 6 6 Fonte: elaborado pelo autor, 2017. Depois de identificar a natureza e computar os dados brutos, cabe ao pesquisador organi- zá-los em uma tabela. 1.2 Organização em tabelas Na tabela, os dados podem ser inseridos em ordem crescente ou decrescente, o que for mais conveniente para o pesquisador. Quando se trata de uma série de dados em que sua ordem é definida pelo tempo, como a quantidade de chuva mensal em uma cidade ao longo do ano, a organização deve seguir uma ordem cronológica. Além disso, os dados podem ser trabalhados por porcentagens. Algumas vezes, é útil conhecer a proporção dos valores situados em um determinado inter- valo de uma distribuição de frequências em vez do número absoluto. A frequência relativa para um intervalo é a proporção do número total de observações que nele aparece. Ela é calculada ao divi- dir-se o número de valores dentro de um intervalo pelo número total de valores na tabela (PAGANO; GAUVREAU, 2012). Assim, em uma tabela, os dados podem ser apresentados com a frequência absoluta e a frequência relativa. No exemplo da pesquisa da quantidade de pessoas que moram em casas de uma determinada rua, os dados seriam apresentados conforme tabela a seguir. Tabela 1 – Quantidade de moradores nas casas da rua x Número de pessoas Frequências absolutas Frequências relativas 0 5 16,7% 1 4 13,3% 2 6 20% 3 5 16,7% 4 5 16,7% 5 2 6,6% 6 3 10% Total 30 100% Fonte: elaborado pelo autor, 2017. FIQUE ATENTO! Dados na forma relativa são as variáveis apresentadas na forma de porcentagem, muito utilizada em tabelas e gráficos. Além disso, podemos ter uma tabela de dupla entrada, com duas variáveis sendo apresenta- das. Com a organização dos dados em uma tabela, podemos ter a dimensão de como representar em um gráfico. EXEMPLO Na autoavaliação do estado de saúde de pessoas que praticam atividade física (es- portistas) e de pessoas que não praticam nenhum esporte (sedentários), temos uma variável qualitativa nominal (esportista, sedentário) e uma variável qualitativa ordinal (bom, regular e ruim). Assim, os dados seriam apresentados conforme ta- bela a seguir. Tabela 2 – Autoavalição do estado de saúde Bom Regular Ruim Total Condição número % número % número % número % Esportista 20 80% 9 90% 0 0% 29 71% Sedentário 5 20% 1 10% 6 100% 12 29% Total 25 100% 10 100% 6 100% 41 100% Fonte: elaborado pelo autor, 2017. 1.3 Gráficos estatísticos Os gráficos estatísticos são ferramentas poderosas para descrição de dados, uma vez que possuem a capacidade de transmitir várias informações ao leitor, em apenas uma figura. Além disso, quando o gráfico é bem construído, o leitor entenderá as principais características dos dados com rapidez. Os gráficos mais utilizados são: • Linhas e curvas São indicados para representar variáveis ao longo do tempo. Para exemplificar, observe a figura a seguir, que apresenta a quantidade da venda de um carro em cada mês do ano. Figura 1 - Vendas do carro X em 2016 Fonte: elaborado pelo autor, 2017. Com os gráficos de linhas, o pesquisador observa os períodos de crescimento e decresci- mento da série de dados ao longo do tempo, fato que pode ser importante para sua pesquisa. • Barras, colunas e de setores Os gráficos de barras são usados para exibir uma distribuição de frequências para os dados nominais e ordinais. Neles, as várias “categorias”, nas quais as observações são classificadas, estão apresentadas ao longo de um eixo horizontal. Além disso, a barra vertical represente a frequência, ou a frequência relativa, das observações dentro daquela classe. As barras devem ser de igual largura e separadas uma da outra de modo a não implicar continuidade (PAGANO; GAUVREAU, 2012). Figura 2 – Gráfico de colunas Fonte: elaborada pelo autor, 2017. Há, ainda, uma variação do gráfico de barras, no qual o eixo é das categorias aparece na ver- tical, conforme figura a seguir. Figura 3 – Gráfico de barras Fonte: elaborada pelo autor, 2017. O gráfi co de setores descreve uma variável qualitativa, de preferência nominal. Ele tem a forma de um círculo dividido em setores, sendo que cada área representa uma classe da variável de interesse. A área de cada setor é proporcional à frequência relativa da classe que ele representa (MARTINEZ, 2015).Figura 4 – Gráfi co de setor Fonte: elaborado pelo autor, 2017. FIQUE ATENTO! Para um mesmo conjunto de dados, podemos construir gráfi cos de colunas, barras ou setores. Porém, para uma variável qualitativa ordinal, o mais indicado é o gráfi co de barras, pois possibilita observar a ordem das categorias. Nos gráfi cos há, ainda, a possibilidade do pesquisador trabalhar com os valores relativos, ou seja, em porcentagem. Para a transformação dos dados reais em valores relativos, basta fazer uma regra de três simples. EXEMPLO Nos valores reais representados nos gráfi cos da classifi cação do peso (subpeso, peso normal, sobrepeso e obesidade) de 960 alunos de uma escola, vimos: subpe- so (130); peso normal (430); sobrepeso (330); obesidade (70); e total (960). Assim, para encontrar a porcentagem dos dados, como “subpeso (130)” do total (960), bas- ta dividir. Veja: 130 430 subpeso = = 14% peso normalsubpeso = = 14% peso normal 130 430 subpeso = = 14% peso normal 130 430 = = 45% = = 45% 130 430 = = 45% 130 430 960 960 subpeso = = 14% peso normal 960 960 subpeso = = 14% peso normal 330 70 sobrepeso = = 34% obesidade = sobrepeso = = 34% obesidade = sobrepeso = = 34% obesidade = 330 70 sobrepeso = = 34% obesidade = 330 70 = 7% 960 960 sobrepeso = = 34% obesidade = 960 960 sobrepeso = = 34% obesidade = SAIBA MAIS! No link a seguir, você encontrará uma ferramenta que permite a visualização de gráficos de barras e de setores: <http://m3.ime.unicamp.br/recursos/1222> Os gráficos podem, ainda, serem feitos em 3D. Há vários programas, gratuitos e pagos, que constroem os gráficos a partir da inserção de dados. Uma das opções é o Excel, da Microsoft Office (que também funciona como uma planilha de cálculo). Como opções gratuitas, há o Calc da Open Office, que funciona em plataforma Linux e Windows, e o R, modelo mais complexo que os outros, porém mais completo. SAIBA MAIS! Para saber mais sobre o programa R, como instalar e tutoriais visite: <https://www.r-project.org/>. Fechamento Nesta aula, você teve a oportunidade de: • conhecer a classificação de variáveis estatísticas: qualitativa e quantitativa; • conhecer a diferença de dados brutos e rol; • conhecer várias formas de representação gráfica de um conjunto de dados. Referências CRESPO, Antônio. Estatística fácil. 18. ed. São Paulo: Editora Saraiva, 2005. LAPPONI, Juan Carlos. Estadística usando Excel. 4. ed. Rio de Janeiro: Elsevier, 2008. LEVINE, David et al. Estatística. Teoria e Aplicações. 6. ed. São Paulo: LTC, 2008. MARTINEZ, Edson Zangiacomi. Bioestatística para cursos de graduação da área da Saúde. São Paulo: Blucher, 2015. PAGANO, Marcello; GAUVREAU, Kimberlee. Princípios de Bioestatística. 2. ed. São Paulo: Cen- gage Learning, 2012. SPIEGEL, Murray R. Estatística. 3. ed. São Paulo: Makron Books, 2004. STEVENSON, William J. Estatística Aplicada à Administração. São Paulo: Editora Harbra, 2007. TOLEDO, Geraldo; OVELLE, Ivo. Estatística Básica. 2. Ed. São Paulo: Editora Atlas, 2011.
Compartilhar