Buscar

LIVRO - UNIDADE 02

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

ESTATÍSTICA
Juliane Silveira 
Freire da Silva
Fundamentos, tipos e 
aplicação de variáveis 
estatísticas
Objetivos de aprendizagem
Ao final deste texto, você deve apresentar os seguintes aprendizados:
 � Definir variável estatística.
 � Identificar os tipos de variáveis.
 � Utilizar os diferentes tipos de variáveis em situações aplicadas.
Introdução
Neste capítulo, você vai aprender o que significa uma variável em esta-
tística e irá verificar a importância delas para a estatística.
Você também estará apto a classificar os diferentes tipos de variáveis 
e quais as aplicações que cada tipo de variável pode ter.
Variáveis estatísticas
Uma variável em estatística é a observação de uma característica em uma amostra ou 
em uma população. É uma informação que pode variar de elemento para elemento. 
Essa observação pode ser um atributo, uma contagem, uma classificação ou uma 
medição. São essas características que definem os diferentes tipos de variáveis.
Essa é a primeira coisa a se observar quando estamos classificando os 
tipos de variáveis. Verificar se a resposta a essa variável é um atributo ou 
um número.
Quando fazemos um questionário para uma pesquisa, cada uma das per-
guntas realizadas do questionário será uma variável da pesquisa. Cada uma 
delas será uma característica diferente da amostra ou da população; cada 
uma delas pode variar para cada um dos elementos da minha amostra ou da 
minha população.
Não obtemos variáveis de um questionário formal obrigatoriamente, po-
demos ter bancos de dados de empresas, de acompanhamentos financeiros, 
dados que são levantados independentemente de questionários, como, por 
exemplo: valores mensais de entrada e saída, controle de estoque, valor de 
mercadorias, tipos de produtos em estoque, entre outros.
Para definir uma população não precisamos necessariamente de pessoas. 
Uma população pode ser composta por pessoas, seres ou objetos, desde que 
todos os elementos dela tenham pelo menos uma característica comum a todos 
os elementos dessa população, e como consequência, a amostra que também 
será composta por pessoas, por seres ou por objetos com a mesma característica 
comum da população da qual ela foi retirada.
Para fins de análise, precisamos organizar os dados das variáveis em bancos 
de dados. Esses bancos nos darão a oportunidade de realizar as estatísticas 
descritivas dos dados e, em alguns casos, as inferências estatísticas. Sempre 
que obtemos dados, sejam eles numéricos ou não, independentemente da clas-
sificação das variáveis, precisamos organizar esses dados para que possamos, 
posteriormente, fazer resumos numéricos que facilitem a compreensão dos 
resultados das variáveis estudadas.
Por exemplo, uma operadora de telefonia celular decide fazer uma pes-
quisa para investigar a satisfação dos consumidores desse tipo de serviço 
e analisar a sua concorrência. Para isso, foi realizada uma pesquisa para 
descobrir com que frequência as pessoas trocam de celular, qual é o tipo de 
plano de telefonia móvel mais frequente entre elas, qual é o valor médio gasto 
com esse tipo de serviço e a satisfação com a atual operadora de telefonia 
móvel. Veja o Quadro 1.
Fundamentos, tipos e aplicação de variáveis estatísticas2
Nome
Número de 
aparelhos 
adquiridos 
nos últimos 
5 anos
Tipo de 
conta
Valor 
gasto no 
último 
mês (em 
R$)
Ope-
radora 
atual
Satisfa-
ção com 
a ope-
radora 
atual
Mauro 1 Pré-pago 25,00 Cliente 
feliz
Satisfeito
Paula 3 Pós-pago 123,00 Telefonia 
ótima
Indiferente
Carlos 5 Pré-pago 15,00 Telefonia 
nova
Insatisfeito
Maicon 3 Pré-pago 10,00 Telefonia 
ótima
Indiferente
Juliana 2 Pré-pago 20,00 Cliente 
feliz
Muito 
satisfeito
Ricardo 4 Pós-pago 99,00 Cliente 
feliz
Satisfeito
Marluza 1 Pós-pago 42,00 Cliente 
feliz
Satisfeito
Caio 6 Pós-pago 199,00 Cliente 
feliz
Satisfeito
Patrícia 4 Pós-pago 149,00 Telefonia 
nova
Satisfeito
Renata 3 Pós-pago 153,00 Telefonia 
ótima
Satisfeito
Claudete 1 Pré-pago 40,00 Telefonia 
ótima
Indiferente
Vitória 5 Pós-pago 178,00 Cliente 
feliz
Muito 
satisfeito
Rui 4 Pós-pago 100,00 Telefonia 
nova
Satisfeito
Paulo 1 Pré-pago 60,00 Telefonia 
ótima
Indiferente
Raquel 1 Pré-pago 5,00 Telefonia 
ótima
Insatisfeito
Quadro 1. Banco de dados de uma pesquisa sobre uso do celular
(Continua)
3Fundamentos, tipos e aplicação de variáveis estatísticas
Quadro 1. Banco de dados de uma pesquisa sobre uso do celular
Nome
Número de 
aparelhos 
adquiridos 
nos últimos 
5 anos
Tipo de 
conta
Valor 
gasto no 
último 
mês (em 
R$)
Ope-
radora 
atual
Satisfa-
ção com 
a ope-
radora 
atual
Ana 2 Pré-pago 14,00 Telefonia 
ótima
Indiferente
Antônio 4 Pós-pago 120,00 Cliente 
feliz
Satisfeito
Marcos 3 Pós-pago 79,00 Cliente 
feliz
Satisfeito
Marcelo 5 Pós-pago 66,00 Telefonia 
nova
Satisfeito
Mirian 3 Pré-pago 30,00 Telefonia 
nova
Satisfeito
(Continuação)
Com esses dados no banco de dados não conseguimos tirar muitas conclu-
sões dos resultados dessa pesquisa. Imagine que, em vez de 20 entrevistados, 
tivéssemos 200. Não conseguiríamos ter ideia do perfil pesquisado. Com base 
nessas variáveis, podemos obter resultados das estatísticas descritivas. Cada 
uma dessas variáveis pode gerar tabelas e gráficos e também é possível calcular 
algumas medidas de posição ou de variabilidade nas que forem numéricas. 
No exemplo, temos seis variáveis: nome, quantidade de celulares adquiridos 
nos últimos 5 anos, tipo de conta, valor pago (em R$) no último mês, operadora 
atual e o nível de satisfação com ela.
A partir do banco de dados, podemos fazer a análise inicial estatística, a 
qual chamamos de estatística descritiva. Como o próprio nome sugere, esse 
tipo de estatística descreve os dados, resume as variáveis estudadas.
Poderíamos obter tabelas e gráficos para todas as variáveis do exemplo 
do banco de dados sobre telefonia celular, como, por exemplo, a tabela e o 
gráfico da variável “tipo de plano de telefonia”, demonstrados na Figura 1 e 
no Quadro 2.
Fundamentos, tipos e aplicação de variáveis estatísticas4
Figura 1. Tabela oriunda do banco de dados 
para a variável “tipo de plano de telefonia móvel”.
TIPO DE PLANO
pré-pago
45%
pós-pago
55%
Tipo de plano fi %
Pós-pago 11 55
Pré-pago 9 45
Total geral 20 100
Quadro 2. Quadro oriundo do bando de dados para a variável tipo de plano de telefonia 
móvel
Poderíamos, também, obter a média do valor gasto no último mês e a sua 
variabilidade. Para esses dados, o valor médio de gasto com telefonia móvel 
foi de R$ 76,35 com uma variabilidade em torno da média de R$ 60,55.
Então, para as variáveis numéricas, podemos fazer tanto gráficos e tabelas 
quanto calcular algumas estatísticas que sejam interessantes para a análise.
Segundo Doane e Seward (2015), um conjunto de dados pode ser constituído 
por muitas variáveis. As questões que podem ser exploradas e as técnicas 
analíticas usadas dependerão do tipo e do número de variáveis.
5Fundamentos, tipos e aplicação de variáveis estatísticas
Estatística descritiva — análise que resume as variáveis, por meio de resumos ta-
bulares, gráficos e numéricos. Esse tipo de estatística permite organizar tabelas de 
distribuição de frequências, elaborar gráficos e calcular algumas medidas numéricas 
como médias e desvios padrão.
Estatística inferencial — quando temos as variáveis provenientes de amostras 
representativas e, a partir dessa amostra, fazemos inferências para a população.
Tipos de variáveis
As variáveis se dividem em dois grandes grupos: as variáveis qualitativas 
(também chamadas de variáveis categóricas ou variáveis por atributos), que são 
atributos observados, e as variáveis quantitativas, que são valores numéricos.
Variáveis qualitativas
Dentro das variáveis qualitativas há mais uma divisão: nominais ou ordinais. 
As variáveis qualitativas têm como resposta à variável os atributos.
As variáveis qualitativas nominais são as de nível de mensuração mais 
simples. Elas são apenas um atributo associado a cada um dos resultadosda 
variável. Ou seja, a resposta dessa variável é apenas um nome associado. Nesse 
tipo de variável não existe nenhum tipo de ordenação.
São exemplos de variáveis qualitativas nominais: sexo, raça de cachorros, 
nomes de empresas, marcas de carros, entre outras.
Qual é seu sexo?
( ) Masculino ( ) Feminino
Qual é a raça de seu cachorro?
( ) Maltês ( ) Yorkshire ( ) Labrador 
( ) Buldogue ( ) Outra. Qual?
Qual é a montadora do seu veículo?
( ) Ford ( ) Chevrolet ( ) Fiat ( ) 
Volkswagen ( ) Outra. Qual? 
Fundamentos, tipos e aplicação de variáveis estatísticas6
Quando temos um banco de dados, podemos codificar essas palavras para 
facilitar a digitação dos dados obtidos. No nosso exemplo do Quadro 1, as 
variáveis qualitativas nominais, são “nome” e “tipo de conta”. Poderíamos 
codificar a variável do banco de dados: “tipo de conta”, por exemplo, colocando 
o “0” para pré-pago e “1” para pós-pago. Isso serve apenas para facilitar a 
digitação dos dados, na posterior análise é necessário que os números sejam 
substituídos pelas palavras correspondentes. 
Não é porque os dados foram codificados que podemos permitir que 
uma média seja calculada, por exemplo, não podemos calcular média de 
sexo, por mais que usemos “0” e “1” para os sexos masculino e feminino, 
respectivamente.
As variáveis qualitativas nominais, quando possuírem apenas duas opções 
de resposta, serão chamadas de variáveis qualitativas nominais dicotômicas, 
ou simplesmente dicotômicas ou binárias. São exemplos: sexo (masculino/
feminino); respostas a um questionamento (sim/não), entre tantas outras.
Qual é seu sexo?
( ) Masculino ( ) Feminino
Você votou nas últimas eleições?
( ) Sim ( ) Não
As variáveis qualitativas ordinais, como o próprio nome sugere, têm 
uma ordem nas respostas. Elas têm um atributo, assim como as qualitativas, 
mas esse atributo possui uma ordem associada. Por exemplo, se a variável 
estudada for porte de empresas (pequena, média ou grande), existe uma ordem 
de grandeza. O nível de escolaridade também possui uma ordem que vai do 
analfabeto ao pós-doutorado.
Qual é o porte da empresa em que você trabalha?
( ) Microempresa ( ) Pequena ( ) Média ( ) Grande
Qual é o seu nível de escolaridade?
( ) Analfabeto
( ) Ensino Fundamental incompleto
( ) Ensino Fundamental completo
( ) Ensino Médio incompleto
( ) Ensino Médio completo
( ) Ensino Superior incompleto
( ) Ensino Superior completo
7Fundamentos, tipos e aplicação de variáveis estatísticas
( ) Pós-graduação incompleta
( ) Pós-graduação completa
( ) Mestrado incompleto
( ) Mestrado completo
( ) Doutorado incompleto
( ) Doutorado completo
Nas variáveis qualitativas ordinais, enquadramos as escalas do tipo Likert. 
Esse tipo de variável precisa ter sempre uma quantidade ímpar de opções de 
resposta, pois sempre teremos o ponto neutro, o mesmo número de pontos 
favoráveis e desfavoráveis. Então podemos ter escalas Likert de 3, 5, 7, 9, 11 
pontos. Podemos ter escalas Likert de satisfação, de concordância, de avaliação, 
de frequência, de importância, entre outras. Veja alguns exemplos:
Escala de satisfação:
( ) Muito satisfeito
( ) Satisfeito
( ) Indiferente
( ) Insatisfeito
( ) Muito insatisfeito
Escala de concordância:
( ) Concordo plenamente
( ) Concordo
( ) Não concordo nem discordo
( ) Discordo
( ) Discordo plenamente
Escala de avaliação:
( ) Excelente
( ) Bom
( ) Regular
( ) Ruim
( ) Péssimo
Escala de frequência:
( ) Sempre
( ) Muitas vezes
( ) Às vezes
Fundamentos, tipos e aplicação de variáveis estatísticas8
( ) Raramente
( ) Nunca
Escala de importância:
( ) Muito importante
( ) Importante
( ) Indiferente
( ) Pouco importante
( ) Nada importante
Observe que também podemos codificar os dados para fins de tabulação. 
Porém, temos que tomar cuidado que, por mais que possamos calcular médias 
— isso é feito em larga escala em pesquisas —, não temos exatamente uma 
média, pois se perguntarmos ao entrevistado um nível de satisfação categó-
rico, como podemos analisá-lo como um número? Podemos, nesse caso, estar 
subestimando ou superestimando as respostas.
Se codificássemos a escala Likert dessa forma:
5 - Muito satisfeito
4 - Satisfeito
3 - Indiferente
2 - Insatisfeito
1 - Muito insatisfeito
Podemos calcular uma média com esses códigos, já que eles seguem uma 
escala ordinal; porém, na hora de analisar, precisamos ter bastante cuidado 
pois não estamos calculando uma média, uma variável em que coletamos 
dados numéricos. Houve, na verdade, uma “transformação” nos dados, então, 
na hora de mostrarmos essa resposta, precisamos encará-la como um índice 
médio. Supondo que a média de satisfação resultasse em 3,8; afirmaríamos 
que o índice médio de satisfação de 3,8 concentra os dados em média entre o 
“indiferente” e o “satisfeito”.
Nas variáveis qualitativas ordinais, também podemos classificar as variáveis 
intervalares. Por exemplo, se, em uma pesquisa, em vez de perguntarmos a 
idade perguntarmos a faixa etária, não saberemos quantas pessoas há cada 
uma das idades, mas saberemos o intervalo em que cada um dos entrevistados 
está. Assim sendo, não poderemos calcular a média de idade, nem o desvio 
padrão dessas variáveis, podemos apenas ter uma aproximação desses valores 
considerando o ponto médio de cada um dos intervalos.
9Fundamentos, tipos e aplicação de variáveis estatísticas
Qual é a sua faixa etária?
( ) 15|25
( ) 25|35
( ) 35|45
( ) 45|55
Qual é a sua faixa salarial?
( ) De R$ 0,00 a R$ 1.000,00
( ) De R$ 1.000,01 a R$ 2.000,00
( ) De R$ 2.000,01 a R$ 4.000,00
( ) De R$ 4.000,01 a R$ 5.000,00
( ) Mais de R$ 5.000,01
Sempre que pudermos investigar os valores de forma quantitativa devemos contar 
ou medir os valores correspondentes, pois perdemos muita informação quando 
perguntamos variáveis que seriam quantitativas de forma intervalar.
Variáveis quantitativas
As variáveis quantitativas, a exemplo das variáveis qualitativas, também se 
dividem em dois grupos: discretas ou contínuas. Ambas são representadas 
por números.
As variáveis quantitativas discretas são variáveis que resultam de uma 
contagem, portanto, podem assumir apenas valores inteiros. Segundo Doane 
e Seward (2015) uma variável que assume um número contável de possíveis 
valores que podem ser representados por um número inteiro é denominada 
discreta. 
Como exemplo, podemos usar a variável “número de aparelhos adquiridos 
nos últimos 5 anos” (apresentada no Quadro 1), ela tem valores numéricos que 
resultam em uma contagem de números inteiros. Para esse tipo de variável 
podemos fazer cálculos matemáticos.
Já as variáveis quantitativas contínuas são resultantes de medição ou de 
operações matemáticas. Nesse tipo de variável, podemos ter valores fracio-
Fundamentos, tipos e aplicação de variáveis estatísticas10
nados, a variável pode assumir qualquer valor em um intervalo numérico. O 
número de casas decimais dependerá no instrumento de medida utilizado para 
a mensuração da variável. Mesmo que os dados da variável sejam apresentados 
em forma de um número inteiro, precisamos analisar se a variável resultaria 
em uma medição, independentemente de o número ser apresentado inteiro, 
ele será considerado contínuo.
Segundo Doane e Seward (2015), em geral, tratamos dados financeiros 
(dólares, euros, pesos) como contínuos, ainda que os preços no varejo variem 
de 0,01 (por exemplo, vamos de US$1,25 para US$1,26).
Temos como exemplo, então, a variável “valor gasto no último mês (em 
R$)”. Outros exemplos de variáveis quantitativas contínuas são: tempo de 
abertura de uma empresa, velocidade de um veículo, peso de sacas de arroz, etc.
Utilização das variáveis
Todas as análises estatísticas partem das variáveis, elas são o instrumento 
necessário para toda análise, seja descritiva ou inferencial. Como existem 
diferentes tipos de variáveis, há também aplicações diferentes para cada tipo 
de variável.
As variáveis qualitativas nominais, muitas vezes, servem para as estatísticas 
descritivas. Com elas podemos montar tabelas de dados categóricos (tabelasde frequência), podemos aplicar esses dados em gráficos que tornam a visu-
alização mais rápida e prática e podemos utilizá-las como modo de separar 
outras variáveis por grupos.
Já com as variáveis qualitativas ordinais, podemos realizar alguns outros 
procedimentos estatísticos além de tabelas e gráficos. Nesse caso também 
existem análises numéricas, desde que observemos que não coletamos um 
número e que o valor dessas operações deve ser considerado como um índice. 
Para as variáveis ordinais também temos algumas técnicas inferenciais como 
os testes não paramétricos.
As variáveis quantitativas nos permitem um maior número de análises. 
Nas quantitativas discretas, podemos utilizar todas as técnicas descritivas, 
podemos calcular as medidas numéricas, montar tabelas e gráficos, também 
podemos utilizar da maioria das técnicas estatísticas inferenciais.
Nas quantitativas contínuas, nos utilizamos também de todas as análises 
de estatística descritiva, além de poder fazer uso de quase todas as técnicas 
de estatística inferencial disponíveis.
11Fundamentos, tipos e aplicação de variáveis estatísticas
Vamos, então, de um atributo a uma mensuração e a quantidade de informa-
ções e análises cresce conforme a complexidade de informação das variáveis 
cresce. Assim sendo, é nas variáveis que a magia da estatística acontece, são 
elas que nos fornecem os argumentos necessários para as análises.
Utilizamos as variáveis para levantamentos de pesquisas de marketing, por 
exemplo, quando elaboramos um questionário e investigamos um produto; ou 
quando levantamos os dados contábeis de uma empresa e analisamos a sua 
situação, além de podermos realizar correlações e análise de séries temporais. 
Utilizamos as variáveis quando fazemos observações qualitativas em campo 
ou quando coletamos dados ao longo do tempo. É com as variáveis que tudo 
acontece.
É de suma importância saber classificar cada um dos tipos de variáveis para 
que não sejam feitas análises estatísticas erradas. Muitas vezes, pesquisadores 
perdem coletas inteiras pois não conseguem definir os tipos de variáveis 
que sejam compatíveis com os objetivos de análises que eles desejam. Por 
exemplo, um pesquisador deseja investigar a correlação entre valor investido 
em previdência privada e o valor do salário. Essa correlação só será passível 
de solução, caso essas duas variáveis sejam coletadas de forma quantitativa. 
Como o objetivo é uma correlação, precisamos dos dados referentes a cada 
um dos elementos das amostras, precisamos do valor exato. Não podemos, 
em hipótese alguma, perguntar a renda e o valor investido em previdência em 
uma escala intervalar, pois dessa maneira não conseguiremos utilizar a análise 
de correlação e regressão que é feita com dados numéricos e não intervalares. 
Muitos pesquisadores cometem esse erro, dispendem tempo e dinheiro sem 
conseguir cumprir os objetivos delineados antes da coleta de dados.
Então, antes de iniciar qualquer levantamento ou amostra ,é preciso definir 
as variáveis a serem estudadas e a maneira com que elas serão medidas. Uma 
má escolha nesse momento pode arruinar todos os objetivos traçados.
Acesse o link ou o código a seguir para conhecer mais 
sobre os tipos de variáveis estatísticas.
https://goo.gl/FshvEK
Fundamentos, tipos e aplicação de variáveis estatísticas12
DOANE, D. P.; SEWARD, L. E. Estatística aplicada à administração e economia. 4. ed. Porto 
Alegre: AMGH, 2015.
Referência
13Fundamentos, tipos e aplicação de variáveis estatísticas
Conteúdo:
BIOESTATÍSTICA
Juliane Silveira 
Freire da Silva
Revisão técnica:
Rute Henrique da Silva Ferreira
Licenciada em Matemática 
Mestre em Educação Matemática 
Doutora em Sensoriamento Remoto 
Catalogação na publicação: Karin Lorien Menoncin CRB-10/2147
P228b Parenti, Tatiane.
Bioestatística / Tatiane Parenti, Juliane Silveira Freire da 
Silva, Jamur Silveira; [revisão técnica : Rute Henrique da Silva 
Ferreira ]. – Porto Alegre: SAGAH, 2018.
207 p. il. ; 22,5 cm
ISBN 978-85-9502-362-8
1. Bioestatística. I. Silva, Juliane Silveira Freire da. II. Silveira, 
Jamur. III.Título.
CDU 311
Bioestatistica_LIVRO.indb 2 13/03/2018 09:16:30
Organização de dados: 
tabelas e gráficos
Objetivos de aprendizagem
Ao final deste texto, você deve apresentar os seguintes aprendizados:
 � Reconhecer por que os dados devem ser organizados em estatística.
 � Identificar os principais tipos de tabelas e gráficos.
 � Selecionar o tipo de gráfico mais adequado para cada tipo de situação.
Introdução
Neste capítulo, vamos calcular e aplicar métodos estatísticos à análise 
de dados. A partir daí, construir e analisar tabelas e gráficos utilizando 
as normas científicas.
Por que organizamos os dados em estatística?
Quando estamos coletando os dados, essa coleta ocorre de forma aleatória 
e, durante esse processo, não temos a capacidade de organizá-los e também 
não temos condições de tomar alguma decisão com base na coleta, sem o 
tratamento desses dados.
Por esse motivo, precisamos começar a analisar os dados coletados e, de 
alguma forma, resumi-los para podermos visualizar os resultados de forma 
organizada, iniciando, assim, a análise descritiva dos dados. 
Primeiramente, resumimos em tabelas de distribuição de frequências e 
depois podemos fazer gráficos, o que visualmente é melhor para representar 
os dados (Figura 1). A análise descritiva dos dados ainda dispõe de outras 
técnicas além dessas, mas, neste capítulo, atentaremos para a análise de tabelas 
e gráficos.
Bioestatistica_LIVRO.indb 99 13/03/2018 09:16:40
Figura 1. Exemplo de diferentes tipos de gráficos.
Fonte: Araujo (2011).
Título do grá�co Título do grá�co
Título do grá�co
Título do grá�co
Série 1 (linha esquerda)
Série 1 Série 2
Série 3
18
16
14
12
10
45
10,00
9,00
8,00
7,00
6,00
5,00
4,00
3,00
2,00
1,00
0,00
40
35
30
25
20
15
10
5
7
6
5
4
3
2
1
0
8
6
4
2
Série 4
Série 1 Série 2
Série 3 Série 4
Série 2 (linha direita)
Categoria E, 1
Categoria A, 5
Categoria D, 2
Categoria C, 3
Categoria B, 4 Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov DezJan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Sobre a coleta de dados, é importante estarmos sempre atentos à forma como coleta-
mos os dados. Precisamos, antes de qualquer coleta, estabelecer a metodologia para 
a escolha das unidades amostrais. Muitas vezes, quando coletamos dados, estamos 
interessados em poder fazer inferência para o restante da população (extrapolar para 
toda a população). Somente quando temos uma amostra probabilística – ou seja, 
os elementos da população são escolhidos por sorteio aleatório – que poderemos 
realizar inferências. Caso a amostra não seja probabilística, poderemos apenas fazer 
uma análise descritiva dos dados e o resultado dessa análise dirá respeito somente à 
amostra pesquisada.
Organização de dados: tabelas e gráficos100
Bioestatistica_LIVRO.indb 100 13/03/2018 09:16:40
Tipos de tabelas e gráficos
Existem tabelas que são para dados qualitativos, que também chamamos 
de tabelas para dados categóricos (Tabela 1). São tabelas simples em que se 
anota a frequência que cada uma das opções de resposta aparece na amostra. 
Sexo F Fr
Masculino 63 52,5
Feminino 57 47,5
Total 120 100,0
Tabela 1. Exemplo de tabela com dados qualitativos.
Conforme verificado na Tabela 1, a coluna f (frequência simples absoluta) 
é resultado da contagem da frequência que cada uma das palavras apareceu na 
amostra. Ou seja, havia 63 pessoas do sexo masculino e 57 do sexo feminino 
na amostra.
Para calcularmos a coluna fr, precisamos ver quanto cada uma das fre-
quências tem de proporção no total da amostra. Podemos resolver isso por 
regra de três.
120
63
100%
x 120 ∙ x = 63 ∙ 100 x =
63∙100
120 = 52,5%
Podemos representar essa tabela com um gráfico de setores, também 
conhecido como gráfico de pizza, conforme a Figura 2.
101Organização de dados: tabelas e gráficos
Bioestatistica_LIVRO.indb101 13/03/2018 09:16:40
Figura 2. Gráfico de setores (pizza).
47,5
52,5
Masculino Feminino
Observe que em tabelas para dados de uma variável qualitativa nominal, 
devemos ordenar do mais frequente para o menos frequente. Já quando temos 
uma variável qualitativa ordinal, precisamos respeitar a ordem em que a 
variável é apresentada (Tabela 2).
Satisfação F fr
Muito satisfeito 12 13,3
Satisfeito 14 15,6
Indiferente 21 23,3
Insatisfeito 19 21,1
Muito insatisfeito 24 26,7
Total 90 100
Tabela 2. Exemplo de tabela com dados qualitativos ordinais sobre a satisfação com o 
atendimento recebido em uma Unidade de Pronto Atendimento (UPA) de Porto Alegre, 
RS.
Para representarmos essa tabela, podemos fazer um gráfico de colunas, 
conforme a Figura 3.
Organização de dados: tabelas e gráficos102
Bioestatistica_LIVRO.indb 102 13/03/2018 09:16:40
Figura 3. Exemplo de gráfico de colunas.
30,0
25,0
20,0
15,0 13,3
Muito
satisfeito
Muito
insatisfeito
Satisfeito InsatisfeitoIndiferente
15,6
23,3
26,7
21,1
10,0
5,0
0,0
Podemos também utilizar as tabelas para representar dados quantitativos. 
Nesse caso, podemos ter tabelas por ponto e tabelas por intervalos (também 
chamadas de tabelas por classes). Variáveis quantitativas discretas costumam 
gerar tabelas de distribuição de frequência por ponto (Tabela 3).
Número de filhos F fr
0 12 15,0
1 11 13,8
2 23 28,8
3 19 23,8
4 9 11,3
5 6 7,5
Total 80 100
Tabela 3. Exemplo de tabela quantitativa sobre o número de filhos por família.
103Organização de dados: tabelas e gráficos
Bioestatistica_LIVRO.indb 103 13/03/2018 09:16:40
Também podemos representar esses dados com um gráfico de colunas, 
conforme a Figura 4.
Figura 4. Gráfico de colunas sobre o número de filhos por família.
30,0
35,0
25,0
20,0
15,0
15,0 13,8
28,8
23,8
11,3
7,5
543210
10,0
5,0
0,0
Já as variáveis quantitativas geram tabelas de distribuição de frequências 
por intervalos (Tabela 4).
Faixa F Fr
15|---25 9 14,5
25|---35 12 19,4
35|---45 22 35,5
45|---55 11 17,7
55|---65 8 12,9
Total 62 100,0
Tabela 4. Exemplo de tabela com variáveis quantitativas sobre a faixa etária.
Organização de dados: tabelas e gráficos104
Bioestatistica_LIVRO.indb 104 13/03/2018 09:16:40
Para representarmos essa tabela, precisamos nos dar conta de um fato: 
entre as faixas, não existe um intervalo numérico, pois chegamos ao limite 
de um número e na faixa seguinte já iniciamos com ele. Assim, não podemos 
representar nenhum espaço no eixo do gráfico quando temos um gráfico de 
colunas. Nesse caso, as colunas estão grudadas umas às outras, e chamamos 
esse gráfico de histograma (Figura 5).
Figura 5. Exemplo de gráfico histograma. 
30,0
35,0
25,0
20,0
15,0
14,5
15| ---25 25| ---35 35| ---45 45| ---55 55| ---65
19,4
35,5
17,7
12,9
10,0
5,0
0,0
Quando temos uma variável quantitativa discreta, pode ser que também precisemos 
fazer intervalos para melhor representar os dados. Caso existam mais de 10 opções de 
resposta, já podemos montar os intervalos para poder representar melhor esses dados.
105Organização de dados: tabelas e gráficos
Bioestatistica_LIVRO.indb 105 13/03/2018 09:16:40
Podemos ainda acrescentar mais colunas a essas tabelas que representam 
dados quantitativos para utilizarmos para fins de análise (Tabela 5). As co-
lunas que necessariamente precisam aparecer em uma tabela de distribuição 
de frequências, além da primeira coluna que representa as opções de resposta 
dos dados coletados, são:
 � f → frequência simples absoluta (resulta da contagem na amostra).
 � fr → frequência simples relativa (resulta da regra de três vista ante-
riormente no capítulo).
 � F → frequência acumulada absoluta (resulta somando a coluna f).
 � Fr → frequência acumulada relativa (resulta somando a coluna fr).
 � x’ → ponto médio do intervalo, no caso da tabela de intervalos.
Faixa f fr F Fr
15|---25 9 14,5 9 14,5 (15+25)/2=20
25|---35 12 19,4 9+12=21 33,9 (25+35)/2=30
35|---45 22 35,5 21+22=43 69,4 (35+45)/2=40
45|---55 11 17,7 43+11=54 87,1 (45+55)/2=50
55|---65 8 12,9 54+8=62 100,0 (55+65)/2=60
Total 62 100,0 - - -
Tabela 5. Exemplo de tabela de faixa etária com demais colunas.
Sobre a nomenclatura para a tabela de distribuição de frequências por intervalos, a 
barra na vertical (|) indica que o número ao seu lado está contido no intervalo. Quando 
temos o traço na horizontal, chegamos muito próximo ao número que está ao seu 
lado, mas não chegamos até ele. Por exemplo:
15|---25 → o número 15 está contido nesse intervalo, mas o número 25 não.
15---|25 → o número 15 não está contido nesse intervalo e o número 25 sim.
15---25 → o número 15 não está contido nesse intervalo e o número 25 também não.
15|---|25 → o número 15 está contido nesse intervalo e o número 25 também.
Organização de dados: tabelas e gráficos106
Bioestatistica_LIVRO.indb 106 13/03/2018 09:16:41
Agora, qual gráfico escolher?
Além dos gráficos apresentados aqui, temos uma grande quantidade de gráficos. 
Os mais básicos para a análise descritiva de dados são os de setores e os de 
barras ou colunas, mas não são somente esses que podemos utilizar.
Quando tivermos uma variável qualitativa, tanto nominal quanto ordinal, 
podemos representar esses dados com um gráfico de setores, de colunas ou 
barras (Figura 6).
Figura 6. Exemplo de dados representados em um gráfico de setores.
Dois Irmãos
7%
Campo Bom
10%
São Leopoldo
15%
Porto Alegre
32%
Canoas
20%
Novo
Hamburgo
16%
Para os mesmos dados, poderíamos representar em um gráfico de colunas 
e de barras (Figuras 7 e 8).
107Organização de dados: tabelas e gráficos
Bioestatistica_LIVRO.indb 107 13/03/2018 09:16:41
Figura 7. Exemplo de gráfico de colunas utilizando os dados da Figura 6.
30,0
35,0 32,2
20,0
15,6 15,6
10,0
6,7
25,0
20,0
15,0
10,0
5,0
0,0
Dois
Irmãos
Campo 
Bom
São 
Leopoldo
Porto 
Alegre
Canoas Novo
Hamburgo
Figura 8. Exemplo de gráfico de barras utilizando os dados da Figura 6.
Porto Alegre
Canoas
Novo Hamburgo
São Leopoldo
Campo Bom
Dois Irmãos
32,2
20,0
15,6
15,6
10,0
6,7
0,0 5,0 10,0 15,0 20,0 25,0 30,0 35,0
Agora, para as variáveis quantitativas para tabelas de distribuição de fre-
quências simples ou por intervalos, podemos ter gráficos de colunas para 
representar as variáveis quantitativas discretas, conforme mostra a Figura 9. 
Organização de dados: tabelas e gráficos108
Bioestatistica_LIVRO.indb 108 13/03/2018 09:16:41
Para os dados de variáveis quantitativas representadas em tabelas de distri-
buição de frequências por intervalos, representamos graficamente com um 
histograma, conforme mostra a Figura 10.
Figura 9. Exemplo de gráfico de colunas com variáveis quantitativas discretas.
35,0
30,0
25,0
20,0
15,0
10,0
5,0
0,0
0 1 2 3 4
15,0 13,8
28,8
23,8
11,3
Figura 10. Exemplo de histograma.
30,0
25,0
20,0
15,0
10,0
5,0
0,0
0|---10 10|---20 20|---30 30|---40 40|---50
25,6
24,4
17,4
22,1
10,5
109Organização de dados: tabelas e gráficos
Bioestatistica_LIVRO.indb 109 13/03/2018 09:16:41
Além desses gráficos, podemos citar ainda o gráfico de dispersão, que é 
utilizado em análise de correlação e regressão, quando temos duas variáveis 
e verificamos a relação entre elas. Imaginemos duas variáveis, peso e altura. 
Podemos, com o gráfico de dispersão (Figura 11), verificar a relação entre 
elas. Cada um dos pontos representa um par de valores (peso no eixo y e 
altura no eixo x).
Figura 11. Exemplo de diagrama de dispersão.
Pe
so
Altura
110
100
90
80
70
60
50
40
150 160 170 180 190 200
O gráfico de linhas é utilizado quando desejamos representar uma variável 
quantitativa ao longo do tempo (Figura 12). O eixo x sempre seráo tempo. 
Imaginemos acompanhar a evolução do número de nascidos vivos em uma 
pequena maternidade ao longo dos anos.
Organização de dados: tabelas e gráficos110
Bioestatistica_LIVRO.indb 110 13/03/2018 09:16:41
Figura 12. Exemplo de gráfico de linhas.
1260
1250
1240
1230
1220
1210
1200
1190
1180
1170
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Nestes endereços eletrônicos, você pode aprender a fazer gráficos utilizando o Excel:
https://goo.gl/4mQZ0m
https://goo.gl/Ek3Ydy
111Organização de dados: tabelas e gráficos
Bioestatistica_LIVRO.indb 111 13/03/2018 09:16:41
Considere os dados referentes a uma pesquisa com 20 famílias de um bairro pequeno, 
onde foi perguntado quantas vezes o chefe da família procurou o médico no ano 
anterior. As respostas da coleta são as seguintes:
1 4 2 0 2
2 2 3 0 4
5 0 1 1 3
3 1 4 2 5
Para representarmos esses dados, o primeiro passo é a montagem da tabela de 
distribuição de frequências. Precisamos contar quantas vezes cada um dos números 
apareceu e então fazer os seus percentuais.
nº de visitas f fr
0 3 15
1 4 20
2 5 25
3 3 15
4 3 15
5 2 10
total 20 100
A segunda maneira de representarmos esses dados seria por meio de um gráfico.
30,0
25,0
25,0
20,0
20,0
15,0
15,0 15,015,0
10,0
10,0
5,0
0,0
0 1 2 3 4 5
Concluímos então que o número mais frequente de visitas é igual a 2, representando 
25%. Ou seja, mais da metade dos chefes de família foi, no máximo, até duas vezes a 
uma consulta com um médico no último ano.
Organização de dados: tabelas e gráficos112
Bioestatistica_LIVRO.indb 112 13/03/2018 09:16:41
ARAUJO, A. Gráficos: modelos prontos. 04 fev. 2011. Disponível em: <http://geomor-
fologiacesc.blogspot.com.br/2011/02/graficos-modelos-prontos.html>. Acesso em: 
26 out. 2017.
Leituras recomendadas
CALLEGARI-JACQUES, S. M. Bioestatística: princípios e aplicações. Porto Alegre: Artmed, 
2007.
FREUND, J. E. Estatística aplicada economicamente. 11. ed. Porto Alegre: Bookman, 2007.
Referência
Organização de dados: tabelas e gráficos113
Bioestatistica_LIVRO.indb 114 13/03/2018 09:16:42
Encerra aqui o trecho do livro disponibilizado para 
esta Unidade de Aprendizagem. Na Biblioteca Virtual 
da Instituição, você encontra a obra na íntegra.
	2a
	2b

Continue navegando