Buscar

APOSTILA ESTATÍSTICA- Unidade II

Prévia do material em texto

Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 20 
UNIDADE II – REPRESENTAÇÕES TABULAR E GRÁFICA 
2.1 TABELA: 
Tabelas são estruturas básicas para organização e apresentação de dados, muito utilizadas 
em textos científicos, pela imprensa, pelas empresas e pelos órgãos governamentais. O 
principal objetivo da organização de dados é viabilizar a produção de informações rápidas, 
de forma sintética, das variáveis em estudo, permitindo uma leitura simples e uma 
interpretação precisa. 
Uma tabela se apresenta da seguinte forma: 
Tabela 2.1 – Partos realizados pelo SUS, Brasil, 1996-2000 
 
 
 
 
 
 
 
 
 
Normas para apresentação de tabelas: 
Título: conjunto de informações sobre a tabela (O quê? Quando? Onde?) localizada no topo 
da tabela. 
Corpo: linhas e colunas que contém os valores das variáveis em estudo. 
✓ cabeçalho: parte superior que especifica o conteúdo das colunas. 
✓ coluna indicadora: coluna que indica o conteúdo das linhas. 
✓ casa ou célula: espaço destinado a uma só informação. 
Rodapé: elementos complementares da tabela. 
✓ Fonte: identifica o responsável (pessoa física ou jurídica) ou responsável pelos dados 
numéricos. 
CORPO 
RODAPÉ 
TÍTULO 
 CÉLULA 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 21 
✓ Notas: é o texto que irá esclarecer o conteúdo estudado, que poderá ser de caráter 
geral ou especifico de uma tabela. 
✓ Chamadas: símbolo remissivo atribuído a algum elemento de uma tabela que 
necessita de uma nota especifica. 
De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar : 
• um traço horizontal ( - ) quando o valor é zero; 
• três pontos ( ... ) quando não temos os dados; 
• zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade 
utilizada; 
• um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de 
determinado valor. 
• as tabelas não devem ser delimitadas à direita e à esquerda por traços verticais. 
• as tabelas devem ser numeradas com algarismos arábicos (1, 2, 3,....). 
• não se utiliza linhas horizontais no corpo da tabela. 
2.2 SÉRIES ESTATÍSTICAS: É qualquer tabela que apresenta a distribuição de um 
conjunto de dados estatísticos em função da época, do local ou da espécie. 
2.2.1 SÉRIE TEMPORAL: Identifica-se pelo caráter variável do fator cronológico. O 
local e a espécie (fenômeno) são elementos fixos. Esta série também é chamada de 
histórica ou evolutiva. 
 
Número de internações hospitalares, no município de Santana do Pará 2014 - 2017. 
PERÍODO Internações 
2014 300 
2015 400 
2016 452 
2017 480 
TOTAL 1632 
Fonte: DATASUS 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 22 
2.2.2 SÉRIE GEOGRÁFICA: Apresenta como elemento variável o fator geográfico. A 
época e o fato (espécie) são elementos fixos. Também é chamada de espacial, territorial ou 
de localização. 
 
Número de médicos por município de 2015. 
Município Nº de Médicos 
Redenção 620 
Santana do Pará 480 
Tucumã 340 
TOTAL 1440 
Fonte: DATASUS 
2.2.3 SÉRIE ESPECÍFICA OU CATEGÓRICA: O caráter variável é apenas o fato ou 
espécie. Também é chamada de série categórica. 
Vendas no 1º bimestre de 2015 
Laboratório UNIDADES VENDIDAS * 
Merck 1 8 
Medley 1 2 
TOTAL 3 0 
 Fonte: Elaborado pelo autor 
* Em mil unidades 
2.2.4 SÉRIE CONJUGADA OU MISTA: Também chamadas de tabelas de dupla entrada. 
São apropriadas à apresentação de duas ou mais séries de maneira conjugada, havendo duas 
ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série 
Categórica -Categórica. 
Compras de Materiais de Limpeza e Expediente Ano 2017 
Setor Unidades Compradas (R$) 
 Limpeza Expediente 
Gerência 700 900 
Estoque 635 750 
Vendas 552 457 
Rec. Humanos 488 322 
Laboratórios 395 300 
Total 2770 2729 
Fonte: Luz LTDA 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 23 
2.2.5 SÉRIE DISTRIBUIÇÃO DE FREQÜÊNCIA: Essa série descreve os valores de 
variáveis em determinado local e data distribuídos em classes numéricas (ou não) com as 
respectivas freqüências, essa série será abordada posteriormente. 
Idade de pacientes/2017 
Classe de idades Freqüência (fi) 
5 |— 7 7 
7 |— 9 5 
 9 |— 11 6 
11 |— 13 4 
13 |— 15 8 
15 |— 17 7 
17 |—| 19 3 
Total 40 
 Fonte: Hospital Samaritano 
2.3 GRÁFICO 
 É uma forma de apresentação dos dados estatísticos cujo objetivo é o de produzir 
uma impressão mais rápida e viva do fenômeno em estudo. Os gráficos não seguem somente 
um comportamento linear, isto depende das varáveis, grandezas e dados estudados. Serão 
descritos a seguir quatro tipos de gráficos muito utilizados em estatística. 
✓ Gráfico de barras ou colunas: são gráficos que utilizam barras horizontais ou 
verticais para representar os dados estatísticos. 
É adequado quando as variáveis forem qualitativas ou quantitativas discretas. 
 
 
 
 
 
 
 
 
 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 24 
 
 
✓ Gráfico de linhas: este tipo de gráfico usa uma linha poligonal para representar os 
dados estatísticos. 
 
✓ Gráfico de setores (pizza): este gráfico é construído com base em um círculo, e é 
empregado sempre que desejamos ressaltar a participação do dado no total. 
 
 
 
 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 25 
 
 
 
 
 
 
 
 
 
 
 
 
 
✓ PICTOGRAMA ou PICTÓRICO - é construído a partir de figuras representativas da 
intensidade do fenômeno. Este tipo de gráfico tem a vantagem de despertar a 
atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem 
ser auto-explicativos. A desvantagem dos pictogramas é que apenas mostram uma 
visão geral do fenômeno, e não de detalhes minuciosos. 
 
 
 
 
 
 
 
 
 
 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 26 
 
✓ CARTOGRAMA - é um mapa que mostra informação quantitativa mantendo um certo 
grau de precisão geográfica das unidades espaciais mapeadas 
 
 
 
 
 
 
 
 
 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 27 
EXERCÍCIOS PROPOSTOS 
1) A importância do desenvolvimento da atividade turística no Brasil relaciona-se 
especialmente com os possíveis efeitos na redução da pobreza e das desigualdades por 
meio da geração de novos postos de trabalho e da contribuição para o desenvolvimento 
sustentável regional. No gráfico são mostrados três cenários – pessimista, previsível, 
otimista – a respeito da geração de empregos pelo desenvolvimento de atividades 
turísticas. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
De acordo com o gráfico, em 2009, o número de empregos gerados pelo turismo será 
superior a: 
 
a) 602.900 no cenário previsível 
b) 660.000 no cenário otimista. 
c) 316.000 e inferior a 416.000 no cenário previsível 
d) 235.700 e inferior a 352.800 no cenário pessimista 
e) 516.000 e inferior a 616.000 no cenário otimista 
 
2) Foram publicados recentemente, trabalhos relatando o uso de fungos como controle 
biológico de mosquitos transmissores da malária. Observou-se o percentual de 
sobrevivência dos mosquitos Anopheles sp. após exposição ou não a superfícies cobertas 
com fungos sabidamente pesticidas, ao longo de duas semanas. Os dados obtidos estão 
presentes no gráfico abaixo: 
 
 
 
 
 
 
 
 
 
 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 28 
No grupo exposto aos fungos, o período em que houve 50% de sobrevivência ocorreu entre 
os dias: 
 
a) 2 e 4 
b) 4 e 6 
c) 6 e 8 
d) 8 e 10 
e) 10 e 12 
 
 
4) O psiquiatra Içami Tiba diz que amor em excesso não é bom na educação dos filhos. A 
revista Veja quis saber se os leitores concordam com essa afirmação. O resultado:Considerando que o diagrama representa os percentuais de respostas de 3700 pessoas, o 
número de pessoas que discordam do psiquiatra é: 
 
a) 3145 
b) 2960 
c) 2886 
d) 2775 
 
5) O gráfico abaixo mostra a produção diária de lixo orgânico de duas pessoas. O dia da 
semana que o gráfico mostra que as produções de lixo das duas pessoas foram iguais é: 
 
 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 29 
 
a) 2ª feira 
b) 4ª feira 
c) 6ª feira 
d) Sábado 
e) Domingo 
 
6) Análise o gráfico a seguir: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
a)Quais variáveis estão envolvidas nesse estudo? 
b) Em que período o número de transplantes ficou abaixo de 50? 
c) A partir de quando se pode afirmar que o número de transplantes aumenta de ano para 
ano? 
 
 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 30 
 
2.4 DISTRIBUIÇÃO DE FREQUÊNCIA 
 Uma distribuição de frequência (absoluta ou relativa) é um método de grupar 
dados por classes de ocorrência de modo a fornecer a quantidade de dados em cada classe. 
 Em outras palavras, este tipo de análise estatística permite verificar a frequência (o 
quanto se repete) de determinado dado em um determinado intervalo de estudo. Com isso 
podemos resumir e visualizar um conjunto de dados sem precisar levar em conta os valores 
individuais. Este tipo de distribuição pode ser representado em forma de tabelas e 
gráficos. 
2.4.1 TABELA PRIMITIVA E ROL 
Tabela Primitiva: É uma tabela ou relação de elementos que não foram numericamente 
organizados. É difícil formarmos uma idéia exata do comportamento do grupo como um 
todo, a partir de dados não ordenados. 
Exemplo: Considere os seguintes valores 
45, 41, 42, 41, 42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 
Rol: É a tabela obtida após a ordenação dos dados (crescente ou crescente). 
41, 41, 41, 42, 42 43, 44, 45, 46, 46,50, 50, 51, 52, 54, 57, 58, 58, 60, 60 
Distribuição de frequência com intervalos de classe: Quando o tamanho da amostra é 
elevado, é mais racional efetuar o agrupamento dos valores em vários intervalos de classe. 
Classes Frequências 
41 |------- 45 7 
45 |------- 49 3 
49 |------- 53 4 
53 |------- 57 1 
57 |------- 61 5 
Total 20 
 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 31 
2.4.2 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA COM INTERVALOS 
DE CLASSE 
Classes de Frequência: são os intervalos de variação de uma variável. As classes são 
representadas simbolicamente da por i , sendo 1,2,3, ,i k= , onde k é o número total de 
classes. O número total de valores é denotado por n . 
 Na tabela anterior, o intervalo 45 |------- 49 define a 2ª classe ( 2i = ), o intervalo 
53 |------- 57 define a 4ª classe ( 4i = ) e assim por diante. Como a distribuição tem cinco 
classes e vinte valores, logo 5k = e 20n = . 
Limites de Classe: são os extremos de cada classe. Para uma determinada classe i , o 
menor número é o limite inferior ( il ) e o maior número é o limite superior ( iL ). 
 No intervalo 49 |------- 53,... 3 49l = e 3 53L = . O símbolo |------- representa um 
intervalo fechado à esquerda e aberto à direita. O dado 53 do rol não pertence a classe 
3 e sim a classe 4 representada por 53 |------- 57. 
Amplitude do Intervalo de Classe: é o tamanho do intervalo que define a classe. A 
amplitude da classe i é simbolizada por ih e é obtida através da diferença entre o limite 
superior e inferior da classe, ou seja, por 
i i ih L l= − 
 No intervalo 49 |------- 53 temos que 3 53 49 4h = − = . 
Na distribuição de frequência com classe o ih será igual em todas as classes. 
 Amplitude Total (AT): é a diferença entre o limite superior da última classe ( kL ) e o 
limite inferior da primeira classe ( 1l ). Matematicamente, escrevemos isso como 
1kAT L l= − 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 32 
 Como no nosso exemplo temos cinco classes ( 5k = ) segue da tabela que 
5 1 61 41 20AT L l= − = − = . 
Amplitude Amostral: é a diferença entre o valor máximo e o valor mínimo da amostra, isto 
é, max minAA X X= − . 
 Em nosso exemplo, 60 41 19AA = − = . 
Em uma distribuição de frequência com classe, a amplitude (AT) deve ser ligeiramente 
maior que amplitude amostral (AA) para que a distribuição tenha intervalos para incluir 
todos os valores da amostra. 
Ponto Médio de Classe: é o ponto que divide o intervalo de classe em duas partes iguais. O 
ponto médio da classe i é simbolizado por ix e calculado efetuando a média entre os 
limites da classe: 
2
i i
i
l L
x
+
= 
 No intervalo 49 |------- 53, o ponto médio da terceira classe é 
3 3
3
53 49
51
2 2
l L
x
+ +
= = = . 
 
2.4.3 Método Prático para Construção de uma Distribuição de Frequências com classe 
 
1º - Organize os dados brutos em um rol. 
2º - Calcule a amplitude amostral AA. 
3º - Calcule o número de classes 
 Quando dispomos de uma tabela primitiva ou de um rol, precisamos estabelecer a 
quantidade e o intervalo das classes que vamos criar, de outro modo a distribuição de 
freqüência pode não ser útil para a nossa análise. 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 33 
Uma das maneiras de determinar o número de classes é usando uma regra que determina k 
em função de n : 
𝑘 = √𝑛 
lembrando que k é o número de classes e n o número de dados. 
 No nosso exemplo, usando a regra temos 20n = , logo 𝑘 = √20 = 4,48 ≅ 5, portanto 
utilizamos 5 classes. 
 Sabendo o número de classes, podemos calcular a amplitude do intervalo de classes 
através da amplitude total da amostra (AA) 
ℎ =
𝐴𝐴
𝐾
 
No nosso exemplo: ℎ =
19
5
= 3,8 ≅ 4 
4º - Temos então o menor número da amostra, o número de classes e a amplitude do 
intervalo. Podemos montar a tabela, com o cuidado para não aparecer classes com 
frequência iguais a zero. 
No nosso exemplo: o menor número da amostra é 41, logo a primeira classe será 
representada por 41 |------- 45, pois 41 45h+ = . As classes seguintes respeitarão o 
mesmo procedimento. 
 O primeiro elemento das classes seguintes sempre serão formadas pelo último 
elemento da classe anterior. 
2.4.4 TIPOS DE INTERVALOS DE CLASSE 
Os intervalos de classes são especialmente recomendados para variáveis quantitativas 
contínuas. Para variáveis discretas, os procedimentos variam de acordo com a amplitude 
amostral dos dados. 
Os intervalos mais comuns são os seguintes: 
Intervalo 0 —| 10: compreende todos os valores entre 0 e 10, inclusive o 10 e exclusive o 0. 
Intervalo 0 |— 10: compreende todos os valores entre 0 e 10, inclusive o 0 e exclusive o 10. 
Intervalo 0 |—| 10: compreende todos os valores entre 0 e 10, inclusive o 0 e inclusive o 10. 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 34 
2.4.5 TIPOS DE FREQÜÊNCIA 
Frequência Simples ou Absoluta ( if ): são os valores que diretamente representam o 
número de dados de cada classe. A soma de todas as freqüências simples é igual ao número 
total dos dados da distribuição. 
Frequência Relativa ( Rif ): são os valores das razões entre as frequências simples ( if ) e 
a frequência total da distribuição ( n ) 
i
Ri
f
f
n
= 
 Na quinta classe do exemplo a frequência relativa é 
5
0,25
20
= ou representado de 
outra forma, 25%. 
 
Frequência Acumulada ( iF ): é a soma das frequências simples de todas as classes com os 
valores inferiores ao limite superior do intervalo de uma determinada classe. 
 Assim, ainda no exemplo acima, a frequência acumulada correspondente à terceira 
classe é 3 1 2 3 7 3 4 14F f f f= + + = + + = 
 
Frequência Acumulada Relativa ( RiF ): é a frequência acumulada da classe dividida pela 
frequência total da distribuição: 
i
Ri
F
F
n
= 
 Logo, para a terceira classe, temos 3
3
14
0,7
20
R
F
F
n
= = = ou 70%.Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 35 
 
A tabela completa do nosso exemplo fica assim: 
 
...CLASSE ... if ... ... ix ... 
..... Rif
... 
..... iF
.... 
..... RiF
..... 
41 |-------- 45 7 43 0,35 7 0,35 
45 |-------- 49 3 47 0,15 10 0,50 
49 |-------- 53 4 51 0,20 14 0,70 
53 |-------- 57 1 55 0,05 15 0,75 
57 |-------- 61 5 59 0,25 20 1 
Total 20 1 
 
 
2.4.6 REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO 
 Em todos os gráficos utilizamos o primeiro quadrante do sistema de eixos 
coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os 
valores da variável e na linha vertical (eixo das ordenadas), as frequências. 
Histograma: é formado por um conjunto de retângulos justapostos, cujas bases se 
localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os 
pontos médios dos intervalos de classe. A área de um histograma é proporcional à soma das 
frequências simples ou absolutas. 
Exemplo: Em uma escola onde 500 alunos da classe A – 2000 participam da disciplina de 
Estatística Básica. Num teste de múltipla escolha contendo 100 questões que visava 
verificar a aprendizagem destes na referida disciplina, obteve-se a seguinte frequência de 
notas (correspondente à quantidade de acertos). 
 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 36 
Tabela: Classe A-2000 com 500 alunos participantes da disciplina Estatística Básica. 
 
Para construção do histograma, desenhe o eixo cartesiano (x, y), onde na abscissa serão 
representadas as classes, que neste caso tem uma amplitude h igual a 10, e na ordenada, a 
frequência dos dados. A área de cada retângulo do gráfico representa a frequência de cada 
nota. 
 
 
Polígono de frequência: é um gráfico em linha, sendo as freqüências marcadas sobre 
perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de 
classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura, 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 37 
ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da 
posterior à última, da distribuição. 
Exemplo: Represente em um polígono de frequência os dados da tabela abaixo referente ao 
tempo em minutos que uma amostra de 550 pessoas levou para realizar uma prova de 
estatística. 
Tabela: Tempo em minutos gasto por 550 pessoas para realizar uma prova de Estatística. 
 
Na construção de um polígono de frequências primeiramente podemos construir um 
histograma; depois marcamos no ‘telhado‘ de cada coluna o ponto central (ponto médio) e 
unimos sequencialmente estes pontos. Devem existir dois pontos na abscissa (eixo 
horizontal), um na lateral esquerda e outro na lateral direita, ligado aos pontos das barras 
das extremidades. 
 
 
 
Profª: Msc Nayane Caroline J.C.da Silva 
 e-mail: nayanecardoso@gmail.com 
 
 38 
EXERCÍCIOS PROPOSTOS 
 
1) Os dados abaixo são referentes aos níveis de glicose de 30 crianças: 
 
56 61 57 77 62 75 63 55 64 60 
60 57 61 57 67 62 69 67 68 59 
65 72 65 61 68 73 65 62 75 80 
 
a) Construa uma distribuição de frequência 
b) Construa o histograma e o polígono de frequência 
 
2) Os dados a seguir referem-se ao tempo, em horas, que 80 pacientes 
 hospitalizados dormiram durante a administração de certo anestésico: 
 
 
 
 
a) Construa uma distribuição de frequência. 
b) Dê a interpretação para a frequência relativa de 3a classe. 
c) Qual o percentual de pacientes que dormiram menos de 12 horas? 
 
 3) Considere a distribuição de frequência transcrita a seguir: 
 
 
 
 
a) 65% das observações têm peso não inferior a 4 kg e inferior a 10 kg. 
b) Mais de 65 % das observações têm peso maior ou igual a 4 kg. 
c) Menos de 20 observações têm peso igual ou superior a 4 kg. 
d) A soma dos pontos médios dos intervalos de classe é inferior ao tamanho da população. 
e) 8% das observações têm peso no intervalo de classe 8 |____10

Continue navegando