Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA Juliane Silveira Freire da Silva Fundamentos, tipos e aplicação de variáveis estatísticas Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Definir variável estatística. � Identificar os tipos de variáveis. � Utilizar os diferentes tipos de variáveis em situações aplicadas. Introdução Neste capítulo, você vai aprender o que significa uma variável em esta- tística e irá verificar a importância delas para a estatística. Você também estará apto a classificar os diferentes tipos de variáveis e quais as aplicações que cada tipo de variável pode ter. Variáveis estatísticas Uma variável em estatística é a observação de uma característica em uma amostra ou em uma população. É uma informação que pode variar de elemento para elemento. Essa observação pode ser um atributo, uma contagem, uma classificação ou uma medição. São essas características que definem os diferentes tipos de variáveis. Essa é a primeira coisa a se observar quando estamos classificando os tipos de variáveis. Verificar se a resposta a essa variável é um atributo ou um número. Quando fazemos um questionário para uma pesquisa, cada uma das per- guntas realizadas do questionário será uma variável da pesquisa. Cada uma delas será uma característica diferente da amostra ou da população; cada uma delas pode variar para cada um dos elementos da minha amostra ou da minha população. Não obtemos variáveis de um questionário formal obrigatoriamente, po- demos ter bancos de dados de empresas, de acompanhamentos financeiros, dados que são levantados independentemente de questionários, como, por exemplo: valores mensais de entrada e saída, controle de estoque, valor de mercadorias, tipos de produtos em estoque, entre outros. Para definir uma população não precisamos necessariamente de pessoas. Uma população pode ser composta por pessoas, seres ou objetos, desde que todos os elementos dela tenham pelo menos uma característica comum a todos os elementos dessa população, e como consequência, a amostra que também será composta por pessoas, por seres ou por objetos com a mesma característica comum da população da qual ela foi retirada. Para fins de análise, precisamos organizar os dados das variáveis em bancos de dados. Esses bancos nos darão a oportunidade de realizar as estatísticas descritivas dos dados e, em alguns casos, as inferências estatísticas. Sempre que obtemos dados, sejam eles numéricos ou não, independentemente da clas- sificação das variáveis, precisamos organizar esses dados para que possamos, posteriormente, fazer resumos numéricos que facilitem a compreensão dos resultados das variáveis estudadas. Por exemplo, uma operadora de telefonia celular decide fazer uma pes- quisa para investigar a satisfação dos consumidores desse tipo de serviço e analisar a sua concorrência. Para isso, foi realizada uma pesquisa para descobrir com que frequência as pessoas trocam de celular, qual é o tipo de plano de telefonia móvel mais frequente entre elas, qual é o valor médio gasto com esse tipo de serviço e a satisfação com a atual operadora de telefonia móvel. Veja o Quadro 1. Fundamentos, tipos e aplicação de variáveis estatísticas2 Nome Número de aparelhos adquiridos nos últimos 5 anos Tipo de conta Valor gasto no último mês (em R$) Ope- radora atual Satisfa- ção com a ope- radora atual Mauro 1 Pré-pago 25,00 Cliente feliz Satisfeito Paula 3 Pós-pago 123,00 Telefonia ótima Indiferente Carlos 5 Pré-pago 15,00 Telefonia nova Insatisfeito Maicon 3 Pré-pago 10,00 Telefonia ótima Indiferente Juliana 2 Pré-pago 20,00 Cliente feliz Muito satisfeito Ricardo 4 Pós-pago 99,00 Cliente feliz Satisfeito Marluza 1 Pós-pago 42,00 Cliente feliz Satisfeito Caio 6 Pós-pago 199,00 Cliente feliz Satisfeito Patrícia 4 Pós-pago 149,00 Telefonia nova Satisfeito Renata 3 Pós-pago 153,00 Telefonia ótima Satisfeito Claudete 1 Pré-pago 40,00 Telefonia ótima Indiferente Vitória 5 Pós-pago 178,00 Cliente feliz Muito satisfeito Rui 4 Pós-pago 100,00 Telefonia nova Satisfeito Paulo 1 Pré-pago 60,00 Telefonia ótima Indiferente Raquel 1 Pré-pago 5,00 Telefonia ótima Insatisfeito Quadro 1. Banco de dados de uma pesquisa sobre uso do celular (Continua) 3Fundamentos, tipos e aplicação de variáveis estatísticas Quadro 1. Banco de dados de uma pesquisa sobre uso do celular Nome Número de aparelhos adquiridos nos últimos 5 anos Tipo de conta Valor gasto no último mês (em R$) Ope- radora atual Satisfa- ção com a ope- radora atual Ana 2 Pré-pago 14,00 Telefonia ótima Indiferente Antônio 4 Pós-pago 120,00 Cliente feliz Satisfeito Marcos 3 Pós-pago 79,00 Cliente feliz Satisfeito Marcelo 5 Pós-pago 66,00 Telefonia nova Satisfeito Mirian 3 Pré-pago 30,00 Telefonia nova Satisfeito (Continuação) Com esses dados no banco de dados não conseguimos tirar muitas conclu- sões dos resultados dessa pesquisa. Imagine que, em vez de 20 entrevistados, tivéssemos 200. Não conseguiríamos ter ideia do perfil pesquisado. Com base nessas variáveis, podemos obter resultados das estatísticas descritivas. Cada uma dessas variáveis pode gerar tabelas e gráficos e também é possível calcular algumas medidas de posição ou de variabilidade nas que forem numéricas. No exemplo, temos seis variáveis: nome, quantidade de celulares adquiridos nos últimos 5 anos, tipo de conta, valor pago (em R$) no último mês, operadora atual e o nível de satisfação com ela. A partir do banco de dados, podemos fazer a análise inicial estatística, a qual chamamos de estatística descritiva. Como o próprio nome sugere, esse tipo de estatística descreve os dados, resume as variáveis estudadas. Poderíamos obter tabelas e gráficos para todas as variáveis do exemplo do banco de dados sobre telefonia celular, como, por exemplo, a tabela e o gráfico da variável “tipo de plano de telefonia”, demonstrados na Figura 1 e no Quadro 2. Fundamentos, tipos e aplicação de variáveis estatísticas4 Figura 1. Tabela oriunda do banco de dados para a variável “tipo de plano de telefonia móvel”. TIPO DE PLANO pré-pago 45% pós-pago 55% Tipo de plano fi % Pós-pago 11 55 Pré-pago 9 45 Total geral 20 100 Quadro 2. Quadro oriundo do bando de dados para a variável tipo de plano de telefonia móvel Poderíamos, também, obter a média do valor gasto no último mês e a sua variabilidade. Para esses dados, o valor médio de gasto com telefonia móvel foi de R$ 76,35 com uma variabilidade em torno da média de R$ 60,55. Então, para as variáveis numéricas, podemos fazer tanto gráficos e tabelas quanto calcular algumas estatísticas que sejam interessantes para a análise. Segundo Doane e Seward (2015), um conjunto de dados pode ser constituído por muitas variáveis. As questões que podem ser exploradas e as técnicas analíticas usadas dependerão do tipo e do número de variáveis. 5Fundamentos, tipos e aplicação de variáveis estatísticas Estatística descritiva — análise que resume as variáveis, por meio de resumos ta- bulares, gráficos e numéricos. Esse tipo de estatística permite organizar tabelas de distribuição de frequências, elaborar gráficos e calcular algumas medidas numéricas como médias e desvios padrão. Estatística inferencial — quando temos as variáveis provenientes de amostras representativas e, a partir dessa amostra, fazemos inferências para a população. Tipos de variáveis As variáveis se dividem em dois grandes grupos: as variáveis qualitativas (também chamadas de variáveis categóricas ou variáveis por atributos), que são atributos observados, e as variáveis quantitativas, que são valores numéricos. Variáveis qualitativas Dentro das variáveis qualitativas há mais uma divisão: nominais ou ordinais. As variáveis qualitativas têm como resposta à variável os atributos. As variáveis qualitativas nominais são as de nível de mensuração mais simples. Elas são apenas um atributo associado a cada um dos resultadosda variável. Ou seja, a resposta dessa variável é apenas um nome associado. Nesse tipo de variável não existe nenhum tipo de ordenação. São exemplos de variáveis qualitativas nominais: sexo, raça de cachorros, nomes de empresas, marcas de carros, entre outras. Qual é seu sexo? ( ) Masculino ( ) Feminino Qual é a raça de seu cachorro? ( ) Maltês ( ) Yorkshire ( ) Labrador ( ) Buldogue ( ) Outra. Qual? Qual é a montadora do seu veículo? ( ) Ford ( ) Chevrolet ( ) Fiat ( ) Volkswagen ( ) Outra. Qual? Fundamentos, tipos e aplicação de variáveis estatísticas6 Quando temos um banco de dados, podemos codificar essas palavras para facilitar a digitação dos dados obtidos. No nosso exemplo do Quadro 1, as variáveis qualitativas nominais, são “nome” e “tipo de conta”. Poderíamos codificar a variável do banco de dados: “tipo de conta”, por exemplo, colocando o “0” para pré-pago e “1” para pós-pago. Isso serve apenas para facilitar a digitação dos dados, na posterior análise é necessário que os números sejam substituídos pelas palavras correspondentes. Não é porque os dados foram codificados que podemos permitir que uma média seja calculada, por exemplo, não podemos calcular média de sexo, por mais que usemos “0” e “1” para os sexos masculino e feminino, respectivamente. As variáveis qualitativas nominais, quando possuírem apenas duas opções de resposta, serão chamadas de variáveis qualitativas nominais dicotômicas, ou simplesmente dicotômicas ou binárias. São exemplos: sexo (masculino/ feminino); respostas a um questionamento (sim/não), entre tantas outras. Qual é seu sexo? ( ) Masculino ( ) Feminino Você votou nas últimas eleições? ( ) Sim ( ) Não As variáveis qualitativas ordinais, como o próprio nome sugere, têm uma ordem nas respostas. Elas têm um atributo, assim como as qualitativas, mas esse atributo possui uma ordem associada. Por exemplo, se a variável estudada for porte de empresas (pequena, média ou grande), existe uma ordem de grandeza. O nível de escolaridade também possui uma ordem que vai do analfabeto ao pós-doutorado. Qual é o porte da empresa em que você trabalha? ( ) Microempresa ( ) Pequena ( ) Média ( ) Grande Qual é o seu nível de escolaridade? ( ) Analfabeto ( ) Ensino Fundamental incompleto ( ) Ensino Fundamental completo ( ) Ensino Médio incompleto ( ) Ensino Médio completo ( ) Ensino Superior incompleto ( ) Ensino Superior completo 7Fundamentos, tipos e aplicação de variáveis estatísticas ( ) Pós-graduação incompleta ( ) Pós-graduação completa ( ) Mestrado incompleto ( ) Mestrado completo ( ) Doutorado incompleto ( ) Doutorado completo Nas variáveis qualitativas ordinais, enquadramos as escalas do tipo Likert. Esse tipo de variável precisa ter sempre uma quantidade ímpar de opções de resposta, pois sempre teremos o ponto neutro, o mesmo número de pontos favoráveis e desfavoráveis. Então podemos ter escalas Likert de 3, 5, 7, 9, 11 pontos. Podemos ter escalas Likert de satisfação, de concordância, de avaliação, de frequência, de importância, entre outras. Veja alguns exemplos: Escala de satisfação: ( ) Muito satisfeito ( ) Satisfeito ( ) Indiferente ( ) Insatisfeito ( ) Muito insatisfeito Escala de concordância: ( ) Concordo plenamente ( ) Concordo ( ) Não concordo nem discordo ( ) Discordo ( ) Discordo plenamente Escala de avaliação: ( ) Excelente ( ) Bom ( ) Regular ( ) Ruim ( ) Péssimo Escala de frequência: ( ) Sempre ( ) Muitas vezes ( ) Às vezes Fundamentos, tipos e aplicação de variáveis estatísticas8 ( ) Raramente ( ) Nunca Escala de importância: ( ) Muito importante ( ) Importante ( ) Indiferente ( ) Pouco importante ( ) Nada importante Observe que também podemos codificar os dados para fins de tabulação. Porém, temos que tomar cuidado que, por mais que possamos calcular médias — isso é feito em larga escala em pesquisas —, não temos exatamente uma média, pois se perguntarmos ao entrevistado um nível de satisfação categó- rico, como podemos analisá-lo como um número? Podemos, nesse caso, estar subestimando ou superestimando as respostas. Se codificássemos a escala Likert dessa forma: 5 - Muito satisfeito 4 - Satisfeito 3 - Indiferente 2 - Insatisfeito 1 - Muito insatisfeito Podemos calcular uma média com esses códigos, já que eles seguem uma escala ordinal; porém, na hora de analisar, precisamos ter bastante cuidado pois não estamos calculando uma média, uma variável em que coletamos dados numéricos. Houve, na verdade, uma “transformação” nos dados, então, na hora de mostrarmos essa resposta, precisamos encará-la como um índice médio. Supondo que a média de satisfação resultasse em 3,8; afirmaríamos que o índice médio de satisfação de 3,8 concentra os dados em média entre o “indiferente” e o “satisfeito”. Nas variáveis qualitativas ordinais, também podemos classificar as variáveis intervalares. Por exemplo, se, em uma pesquisa, em vez de perguntarmos a idade perguntarmos a faixa etária, não saberemos quantas pessoas há cada uma das idades, mas saberemos o intervalo em que cada um dos entrevistados está. Assim sendo, não poderemos calcular a média de idade, nem o desvio padrão dessas variáveis, podemos apenas ter uma aproximação desses valores considerando o ponto médio de cada um dos intervalos. 9Fundamentos, tipos e aplicação de variáveis estatísticas Qual é a sua faixa etária? ( ) 15|25 ( ) 25|35 ( ) 35|45 ( ) 45|55 Qual é a sua faixa salarial? ( ) De R$ 0,00 a R$ 1.000,00 ( ) De R$ 1.000,01 a R$ 2.000,00 ( ) De R$ 2.000,01 a R$ 4.000,00 ( ) De R$ 4.000,01 a R$ 5.000,00 ( ) Mais de R$ 5.000,01 Sempre que pudermos investigar os valores de forma quantitativa devemos contar ou medir os valores correspondentes, pois perdemos muita informação quando perguntamos variáveis que seriam quantitativas de forma intervalar. Variáveis quantitativas As variáveis quantitativas, a exemplo das variáveis qualitativas, também se dividem em dois grupos: discretas ou contínuas. Ambas são representadas por números. As variáveis quantitativas discretas são variáveis que resultam de uma contagem, portanto, podem assumir apenas valores inteiros. Segundo Doane e Seward (2015) uma variável que assume um número contável de possíveis valores que podem ser representados por um número inteiro é denominada discreta. Como exemplo, podemos usar a variável “número de aparelhos adquiridos nos últimos 5 anos” (apresentada no Quadro 1), ela tem valores numéricos que resultam em uma contagem de números inteiros. Para esse tipo de variável podemos fazer cálculos matemáticos. Já as variáveis quantitativas contínuas são resultantes de medição ou de operações matemáticas. Nesse tipo de variável, podemos ter valores fracio- Fundamentos, tipos e aplicação de variáveis estatísticas10 nados, a variável pode assumir qualquer valor em um intervalo numérico. O número de casas decimais dependerá no instrumento de medida utilizado para a mensuração da variável. Mesmo que os dados da variável sejam apresentados em forma de um número inteiro, precisamos analisar se a variável resultaria em uma medição, independentemente de o número ser apresentado inteiro, ele será considerado contínuo. Segundo Doane e Seward (2015), em geral, tratamos dados financeiros (dólares, euros, pesos) como contínuos, ainda que os preços no varejo variem de 0,01 (por exemplo, vamos de US$1,25 para US$1,26). Temos como exemplo, então, a variável “valor gasto no último mês (em R$)”. Outros exemplos de variáveis quantitativas contínuas são: tempo de abertura de uma empresa, velocidade de um veículo, peso de sacas de arroz, etc. Utilização das variáveis Todas as análises estatísticas partem das variáveis, elas são o instrumento necessário para toda análise, seja descritiva ou inferencial. Como existem diferentes tipos de variáveis, há também aplicações diferentes para cada tipo de variável. As variáveis qualitativas nominais, muitas vezes, servem para as estatísticas descritivas. Com elas podemos montar tabelas de dados categóricos (tabelasde frequência), podemos aplicar esses dados em gráficos que tornam a visu- alização mais rápida e prática e podemos utilizá-las como modo de separar outras variáveis por grupos. Já com as variáveis qualitativas ordinais, podemos realizar alguns outros procedimentos estatísticos além de tabelas e gráficos. Nesse caso também existem análises numéricas, desde que observemos que não coletamos um número e que o valor dessas operações deve ser considerado como um índice. Para as variáveis ordinais também temos algumas técnicas inferenciais como os testes não paramétricos. As variáveis quantitativas nos permitem um maior número de análises. Nas quantitativas discretas, podemos utilizar todas as técnicas descritivas, podemos calcular as medidas numéricas, montar tabelas e gráficos, também podemos utilizar da maioria das técnicas estatísticas inferenciais. Nas quantitativas contínuas, nos utilizamos também de todas as análises de estatística descritiva, além de poder fazer uso de quase todas as técnicas de estatística inferencial disponíveis. 11Fundamentos, tipos e aplicação de variáveis estatísticas Vamos, então, de um atributo a uma mensuração e a quantidade de informa- ções e análises cresce conforme a complexidade de informação das variáveis cresce. Assim sendo, é nas variáveis que a magia da estatística acontece, são elas que nos fornecem os argumentos necessários para as análises. Utilizamos as variáveis para levantamentos de pesquisas de marketing, por exemplo, quando elaboramos um questionário e investigamos um produto; ou quando levantamos os dados contábeis de uma empresa e analisamos a sua situação, além de podermos realizar correlações e análise de séries temporais. Utilizamos as variáveis quando fazemos observações qualitativas em campo ou quando coletamos dados ao longo do tempo. É com as variáveis que tudo acontece. É de suma importância saber classificar cada um dos tipos de variáveis para que não sejam feitas análises estatísticas erradas. Muitas vezes, pesquisadores perdem coletas inteiras pois não conseguem definir os tipos de variáveis que sejam compatíveis com os objetivos de análises que eles desejam. Por exemplo, um pesquisador deseja investigar a correlação entre valor investido em previdência privada e o valor do salário. Essa correlação só será passível de solução, caso essas duas variáveis sejam coletadas de forma quantitativa. Como o objetivo é uma correlação, precisamos dos dados referentes a cada um dos elementos das amostras, precisamos do valor exato. Não podemos, em hipótese alguma, perguntar a renda e o valor investido em previdência em uma escala intervalar, pois dessa maneira não conseguiremos utilizar a análise de correlação e regressão que é feita com dados numéricos e não intervalares. Muitos pesquisadores cometem esse erro, dispendem tempo e dinheiro sem conseguir cumprir os objetivos delineados antes da coleta de dados. Então, antes de iniciar qualquer levantamento ou amostra ,é preciso definir as variáveis a serem estudadas e a maneira com que elas serão medidas. Uma má escolha nesse momento pode arruinar todos os objetivos traçados. Acesse o link ou o código a seguir para conhecer mais sobre os tipos de variáveis estatísticas. https://goo.gl/FshvEK Fundamentos, tipos e aplicação de variáveis estatísticas12 DOANE, D. P.; SEWARD, L. E. Estatística aplicada à administração e economia. 4. ed. Porto Alegre: AMGH, 2015. Referência 13Fundamentos, tipos e aplicação de variáveis estatísticas Conteúdo: BIOESTATÍSTICA Juliane Silveira Freire da Silva Revisão técnica: Rute Henrique da Silva Ferreira Licenciada em Matemática Mestre em Educação Matemática Doutora em Sensoriamento Remoto Catalogação na publicação: Karin Lorien Menoncin CRB-10/2147 P228b Parenti, Tatiane. Bioestatística / Tatiane Parenti, Juliane Silveira Freire da Silva, Jamur Silveira; [revisão técnica : Rute Henrique da Silva Ferreira ]. – Porto Alegre: SAGAH, 2018. 207 p. il. ; 22,5 cm ISBN 978-85-9502-362-8 1. Bioestatística. I. Silva, Juliane Silveira Freire da. II. Silveira, Jamur. III.Título. CDU 311 Bioestatistica_LIVRO.indb 2 13/03/2018 09:16:30 Organização de dados: tabelas e gráficos Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Reconhecer por que os dados devem ser organizados em estatística. � Identificar os principais tipos de tabelas e gráficos. � Selecionar o tipo de gráfico mais adequado para cada tipo de situação. Introdução Neste capítulo, vamos calcular e aplicar métodos estatísticos à análise de dados. A partir daí, construir e analisar tabelas e gráficos utilizando as normas científicas. Por que organizamos os dados em estatística? Quando estamos coletando os dados, essa coleta ocorre de forma aleatória e, durante esse processo, não temos a capacidade de organizá-los e também não temos condições de tomar alguma decisão com base na coleta, sem o tratamento desses dados. Por esse motivo, precisamos começar a analisar os dados coletados e, de alguma forma, resumi-los para podermos visualizar os resultados de forma organizada, iniciando, assim, a análise descritiva dos dados. Primeiramente, resumimos em tabelas de distribuição de frequências e depois podemos fazer gráficos, o que visualmente é melhor para representar os dados (Figura 1). A análise descritiva dos dados ainda dispõe de outras técnicas além dessas, mas, neste capítulo, atentaremos para a análise de tabelas e gráficos. Bioestatistica_LIVRO.indb 99 13/03/2018 09:16:40 Figura 1. Exemplo de diferentes tipos de gráficos. Fonte: Araujo (2011). Título do grá�co Título do grá�co Título do grá�co Título do grá�co Série 1 (linha esquerda) Série 1 Série 2 Série 3 18 16 14 12 10 45 10,00 9,00 8,00 7,00 6,00 5,00 4,00 3,00 2,00 1,00 0,00 40 35 30 25 20 15 10 5 7 6 5 4 3 2 1 0 8 6 4 2 Série 4 Série 1 Série 2 Série 3 Série 4 Série 2 (linha direita) Categoria E, 1 Categoria A, 5 Categoria D, 2 Categoria C, 3 Categoria B, 4 Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov DezJan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Sobre a coleta de dados, é importante estarmos sempre atentos à forma como coleta- mos os dados. Precisamos, antes de qualquer coleta, estabelecer a metodologia para a escolha das unidades amostrais. Muitas vezes, quando coletamos dados, estamos interessados em poder fazer inferência para o restante da população (extrapolar para toda a população). Somente quando temos uma amostra probabilística – ou seja, os elementos da população são escolhidos por sorteio aleatório – que poderemos realizar inferências. Caso a amostra não seja probabilística, poderemos apenas fazer uma análise descritiva dos dados e o resultado dessa análise dirá respeito somente à amostra pesquisada. Organização de dados: tabelas e gráficos100 Bioestatistica_LIVRO.indb 100 13/03/2018 09:16:40 Tipos de tabelas e gráficos Existem tabelas que são para dados qualitativos, que também chamamos de tabelas para dados categóricos (Tabela 1). São tabelas simples em que se anota a frequência que cada uma das opções de resposta aparece na amostra. Sexo F Fr Masculino 63 52,5 Feminino 57 47,5 Total 120 100,0 Tabela 1. Exemplo de tabela com dados qualitativos. Conforme verificado na Tabela 1, a coluna f (frequência simples absoluta) é resultado da contagem da frequência que cada uma das palavras apareceu na amostra. Ou seja, havia 63 pessoas do sexo masculino e 57 do sexo feminino na amostra. Para calcularmos a coluna fr, precisamos ver quanto cada uma das fre- quências tem de proporção no total da amostra. Podemos resolver isso por regra de três. 120 63 100% x 120 ∙ x = 63 ∙ 100 x = 63∙100 120 = 52,5% Podemos representar essa tabela com um gráfico de setores, também conhecido como gráfico de pizza, conforme a Figura 2. 101Organização de dados: tabelas e gráficos Bioestatistica_LIVRO.indb101 13/03/2018 09:16:40 Figura 2. Gráfico de setores (pizza). 47,5 52,5 Masculino Feminino Observe que em tabelas para dados de uma variável qualitativa nominal, devemos ordenar do mais frequente para o menos frequente. Já quando temos uma variável qualitativa ordinal, precisamos respeitar a ordem em que a variável é apresentada (Tabela 2). Satisfação F fr Muito satisfeito 12 13,3 Satisfeito 14 15,6 Indiferente 21 23,3 Insatisfeito 19 21,1 Muito insatisfeito 24 26,7 Total 90 100 Tabela 2. Exemplo de tabela com dados qualitativos ordinais sobre a satisfação com o atendimento recebido em uma Unidade de Pronto Atendimento (UPA) de Porto Alegre, RS. Para representarmos essa tabela, podemos fazer um gráfico de colunas, conforme a Figura 3. Organização de dados: tabelas e gráficos102 Bioestatistica_LIVRO.indb 102 13/03/2018 09:16:40 Figura 3. Exemplo de gráfico de colunas. 30,0 25,0 20,0 15,0 13,3 Muito satisfeito Muito insatisfeito Satisfeito InsatisfeitoIndiferente 15,6 23,3 26,7 21,1 10,0 5,0 0,0 Podemos também utilizar as tabelas para representar dados quantitativos. Nesse caso, podemos ter tabelas por ponto e tabelas por intervalos (também chamadas de tabelas por classes). Variáveis quantitativas discretas costumam gerar tabelas de distribuição de frequência por ponto (Tabela 3). Número de filhos F fr 0 12 15,0 1 11 13,8 2 23 28,8 3 19 23,8 4 9 11,3 5 6 7,5 Total 80 100 Tabela 3. Exemplo de tabela quantitativa sobre o número de filhos por família. 103Organização de dados: tabelas e gráficos Bioestatistica_LIVRO.indb 103 13/03/2018 09:16:40 Também podemos representar esses dados com um gráfico de colunas, conforme a Figura 4. Figura 4. Gráfico de colunas sobre o número de filhos por família. 30,0 35,0 25,0 20,0 15,0 15,0 13,8 28,8 23,8 11,3 7,5 543210 10,0 5,0 0,0 Já as variáveis quantitativas geram tabelas de distribuição de frequências por intervalos (Tabela 4). Faixa F Fr 15|---25 9 14,5 25|---35 12 19,4 35|---45 22 35,5 45|---55 11 17,7 55|---65 8 12,9 Total 62 100,0 Tabela 4. Exemplo de tabela com variáveis quantitativas sobre a faixa etária. Organização de dados: tabelas e gráficos104 Bioestatistica_LIVRO.indb 104 13/03/2018 09:16:40 Para representarmos essa tabela, precisamos nos dar conta de um fato: entre as faixas, não existe um intervalo numérico, pois chegamos ao limite de um número e na faixa seguinte já iniciamos com ele. Assim, não podemos representar nenhum espaço no eixo do gráfico quando temos um gráfico de colunas. Nesse caso, as colunas estão grudadas umas às outras, e chamamos esse gráfico de histograma (Figura 5). Figura 5. Exemplo de gráfico histograma. 30,0 35,0 25,0 20,0 15,0 14,5 15| ---25 25| ---35 35| ---45 45| ---55 55| ---65 19,4 35,5 17,7 12,9 10,0 5,0 0,0 Quando temos uma variável quantitativa discreta, pode ser que também precisemos fazer intervalos para melhor representar os dados. Caso existam mais de 10 opções de resposta, já podemos montar os intervalos para poder representar melhor esses dados. 105Organização de dados: tabelas e gráficos Bioestatistica_LIVRO.indb 105 13/03/2018 09:16:40 Podemos ainda acrescentar mais colunas a essas tabelas que representam dados quantitativos para utilizarmos para fins de análise (Tabela 5). As co- lunas que necessariamente precisam aparecer em uma tabela de distribuição de frequências, além da primeira coluna que representa as opções de resposta dos dados coletados, são: � f → frequência simples absoluta (resulta da contagem na amostra). � fr → frequência simples relativa (resulta da regra de três vista ante- riormente no capítulo). � F → frequência acumulada absoluta (resulta somando a coluna f). � Fr → frequência acumulada relativa (resulta somando a coluna fr). � x’ → ponto médio do intervalo, no caso da tabela de intervalos. Faixa f fr F Fr 15|---25 9 14,5 9 14,5 (15+25)/2=20 25|---35 12 19,4 9+12=21 33,9 (25+35)/2=30 35|---45 22 35,5 21+22=43 69,4 (35+45)/2=40 45|---55 11 17,7 43+11=54 87,1 (45+55)/2=50 55|---65 8 12,9 54+8=62 100,0 (55+65)/2=60 Total 62 100,0 - - - Tabela 5. Exemplo de tabela de faixa etária com demais colunas. Sobre a nomenclatura para a tabela de distribuição de frequências por intervalos, a barra na vertical (|) indica que o número ao seu lado está contido no intervalo. Quando temos o traço na horizontal, chegamos muito próximo ao número que está ao seu lado, mas não chegamos até ele. Por exemplo: 15|---25 → o número 15 está contido nesse intervalo, mas o número 25 não. 15---|25 → o número 15 não está contido nesse intervalo e o número 25 sim. 15---25 → o número 15 não está contido nesse intervalo e o número 25 também não. 15|---|25 → o número 15 está contido nesse intervalo e o número 25 também. Organização de dados: tabelas e gráficos106 Bioestatistica_LIVRO.indb 106 13/03/2018 09:16:41 Agora, qual gráfico escolher? Além dos gráficos apresentados aqui, temos uma grande quantidade de gráficos. Os mais básicos para a análise descritiva de dados são os de setores e os de barras ou colunas, mas não são somente esses que podemos utilizar. Quando tivermos uma variável qualitativa, tanto nominal quanto ordinal, podemos representar esses dados com um gráfico de setores, de colunas ou barras (Figura 6). Figura 6. Exemplo de dados representados em um gráfico de setores. Dois Irmãos 7% Campo Bom 10% São Leopoldo 15% Porto Alegre 32% Canoas 20% Novo Hamburgo 16% Para os mesmos dados, poderíamos representar em um gráfico de colunas e de barras (Figuras 7 e 8). 107Organização de dados: tabelas e gráficos Bioestatistica_LIVRO.indb 107 13/03/2018 09:16:41 Figura 7. Exemplo de gráfico de colunas utilizando os dados da Figura 6. 30,0 35,0 32,2 20,0 15,6 15,6 10,0 6,7 25,0 20,0 15,0 10,0 5,0 0,0 Dois Irmãos Campo Bom São Leopoldo Porto Alegre Canoas Novo Hamburgo Figura 8. Exemplo de gráfico de barras utilizando os dados da Figura 6. Porto Alegre Canoas Novo Hamburgo São Leopoldo Campo Bom Dois Irmãos 32,2 20,0 15,6 15,6 10,0 6,7 0,0 5,0 10,0 15,0 20,0 25,0 30,0 35,0 Agora, para as variáveis quantitativas para tabelas de distribuição de fre- quências simples ou por intervalos, podemos ter gráficos de colunas para representar as variáveis quantitativas discretas, conforme mostra a Figura 9. Organização de dados: tabelas e gráficos108 Bioestatistica_LIVRO.indb 108 13/03/2018 09:16:41 Para os dados de variáveis quantitativas representadas em tabelas de distri- buição de frequências por intervalos, representamos graficamente com um histograma, conforme mostra a Figura 10. Figura 9. Exemplo de gráfico de colunas com variáveis quantitativas discretas. 35,0 30,0 25,0 20,0 15,0 10,0 5,0 0,0 0 1 2 3 4 15,0 13,8 28,8 23,8 11,3 Figura 10. Exemplo de histograma. 30,0 25,0 20,0 15,0 10,0 5,0 0,0 0|---10 10|---20 20|---30 30|---40 40|---50 25,6 24,4 17,4 22,1 10,5 109Organização de dados: tabelas e gráficos Bioestatistica_LIVRO.indb 109 13/03/2018 09:16:41 Além desses gráficos, podemos citar ainda o gráfico de dispersão, que é utilizado em análise de correlação e regressão, quando temos duas variáveis e verificamos a relação entre elas. Imaginemos duas variáveis, peso e altura. Podemos, com o gráfico de dispersão (Figura 11), verificar a relação entre elas. Cada um dos pontos representa um par de valores (peso no eixo y e altura no eixo x). Figura 11. Exemplo de diagrama de dispersão. Pe so Altura 110 100 90 80 70 60 50 40 150 160 170 180 190 200 O gráfico de linhas é utilizado quando desejamos representar uma variável quantitativa ao longo do tempo (Figura 12). O eixo x sempre seráo tempo. Imaginemos acompanhar a evolução do número de nascidos vivos em uma pequena maternidade ao longo dos anos. Organização de dados: tabelas e gráficos110 Bioestatistica_LIVRO.indb 110 13/03/2018 09:16:41 Figura 12. Exemplo de gráfico de linhas. 1260 1250 1240 1230 1220 1210 1200 1190 1180 1170 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 Nestes endereços eletrônicos, você pode aprender a fazer gráficos utilizando o Excel: https://goo.gl/4mQZ0m https://goo.gl/Ek3Ydy 111Organização de dados: tabelas e gráficos Bioestatistica_LIVRO.indb 111 13/03/2018 09:16:41 Considere os dados referentes a uma pesquisa com 20 famílias de um bairro pequeno, onde foi perguntado quantas vezes o chefe da família procurou o médico no ano anterior. As respostas da coleta são as seguintes: 1 4 2 0 2 2 2 3 0 4 5 0 1 1 3 3 1 4 2 5 Para representarmos esses dados, o primeiro passo é a montagem da tabela de distribuição de frequências. Precisamos contar quantas vezes cada um dos números apareceu e então fazer os seus percentuais. nº de visitas f fr 0 3 15 1 4 20 2 5 25 3 3 15 4 3 15 5 2 10 total 20 100 A segunda maneira de representarmos esses dados seria por meio de um gráfico. 30,0 25,0 25,0 20,0 20,0 15,0 15,0 15,015,0 10,0 10,0 5,0 0,0 0 1 2 3 4 5 Concluímos então que o número mais frequente de visitas é igual a 2, representando 25%. Ou seja, mais da metade dos chefes de família foi, no máximo, até duas vezes a uma consulta com um médico no último ano. Organização de dados: tabelas e gráficos112 Bioestatistica_LIVRO.indb 112 13/03/2018 09:16:41 ARAUJO, A. Gráficos: modelos prontos. 04 fev. 2011. Disponível em: <http://geomor- fologiacesc.blogspot.com.br/2011/02/graficos-modelos-prontos.html>. Acesso em: 26 out. 2017. Leituras recomendadas CALLEGARI-JACQUES, S. M. Bioestatística: princípios e aplicações. Porto Alegre: Artmed, 2007. FREUND, J. E. Estatística aplicada economicamente. 11. ed. Porto Alegre: Bookman, 2007. Referência Organização de dados: tabelas e gráficos113 Bioestatistica_LIVRO.indb 114 13/03/2018 09:16:42 Encerra aqui o trecho do livro disponibilizado para esta Unidade de Aprendizagem. Na Biblioteca Virtual da Instituição, você encontra a obra na íntegra. 2a 2b
Compartilhar