AS-_aula_2

•

UFRRJ

Lívia Ribeiro

24/03/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística I

57.085 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Universidade Federal Rural do Rio de Janeiro
Instituto de Cïı>½ncias Exatas
Departamento de Matem̈ı>½tica
NOTAS DE AULA II - EDA
Conteúdo
1 Introdução 4
1.1 O que é uma pesquisa estat́ıstica . . . . . . . . . . . . . . . . . . . . 4
1.2 Apresentação dos dados . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.1 Exemplos para Motivação . . . . . . . . . . . . . . . . . . . . 9
*
2
Lista de Tabelas
1.1 Dados da Turma de Economia . . . . . . . . . . . . . . . . . . . . . . 10
1.2 Sexo e Nº de alunos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3 Sexo e Nº de alunos por turma . . . . . . . . . . . . . . . . . . . . . 11
1.4 Sexo e Matéria Predileta . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.5 Tabela de frequências . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.6 Matéria Predileta e Turma . . . . . . . . . . . . . . . . . . . . . . . . 12
1.7 matŕıculas de professores e alunos . . . . . . . . . . . . . . . . . . . 12
1.8 Frota de véıculos no munićıpio de Niterói . . . . . . . . . . . . . . . . 16
1.9 Cálculo das áreas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.10 Evolução dos ı́ndices, INPC e IRSM . . . . . . . . . . . . . . . . . . . 18
1.11 Medidas da circunferência do tronco de pés de laranja . . . . . . . . . 22
1.12 Tabela da Esquerda . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1.13 Tabela da Esquerda . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3
Caṕıtulo 1
Introdução
1.1 O que é uma pesquisa estat́ıstica
”A pesquisa cient́ıfica é um processo de aprendizado dirigido. O objetivo dos mé-
todos estat́ısticos é tornar este processo o mais eficiente posśıvel”. BOX, G.E.P.,
HUNTER, W.G., HUNTER, J.S. Statistics for Experimenters. Canadá: John Wi-
ley, 1978
A palavra ”Estat́ıstica”vem de status, que significa em latim Estado. Com essa pa-
lavra faziam-se as descrições de dados relativos aos Estados, tornando a Estat́ıstica
um meio de administração para os governantes. Mais recentemente se passou a falar
em estat́ıstica em várias ciências de todas as áreas do conhecimento humano. Po-
demos então definir a estat́ıstica como sendo ”um conjunto de métodos e processos
quantitativos que servem para estudar e medir os fenômenos coletivos”.
Uma pesquisa estat́ıstica consiste em um trabalho de identificação, reunião, trata-
mento, análise e apresentação de informações (dados) para satisfazer certa necessi-
dade.
Quantos somos? Quem vai vencer a eleição para prefeito na cidade do Rio de Ja-
neiro? Qual é a maior torcida do Brasil? Quantas escolas municipais há no Brasil?
Respostas a essas perguntas, em geral, são obtidas a partir de uma pesquisa esta-
t́ıstica.
4
Freqüentemente nos deparamos com informações estat́ısticas nos jornais, televi-
são, empresas públicas ou privadas, etc. Por exemplo, quando a direção do Metrô do
Rio de Janeiro informa que transporta 500.000 passageiros por dia, estamos lidando
com uma estat́ıstica do número de passageiros do metrô. Tal estat́ıstica foi obtida
com base na análise do movimento diário ao longo de um determinado peŕıodo de
tempo e dessas análises resultou um número que pretende dar uma idéia do movi-
mento diário de passageiros. É claro que isso não significa que todos os dias circulam
exatamente 500.000 passageiros, mas tal número representa uma estimativa do nú-
mero de passageiros.
Um outro exemplo que presenciamos periodicamente no Brasil são os Censos Demo-
gráficos, que são levantamentos realizados pelos governos com o objetivo de conhecer
as caracteŕısticas de sua população, suas condições sócio-econômicas, suas caracteŕıs-
ticas culturais e religiosas, etc. Temos também os Censos Econômicos, com os quais
se pretende conhecer as caracteŕısticas da população formada pelos estabelecimentos
econômicos do páıs; assim podemos ter o Censo Industrial, o Censo Agropecuário,
etc.
Nas pesquisas censitárias, o objetivo é que todos os elementos da população tenham
os seus dados levantados. Nos censos demográficos, isso significa que todas as pes-
soas e domićılios têm que ser visitados; já no censo industrial, todas as empresas
que desenvolvam atividades industriais têm que ser pesquisadas.
Com esses exemplos, vê-se que o conceito de população de uma pesquisa estat́ıstica é
bem amplo, não se restringindo a seres humanos; ela é definida exatamente a partir
dos objetivos da pesquisa. Podemos então definir uma população como sendo o con-
junto de elementos para os quais se deseja estudar determinada(s) caracteŕıstica(s).
Os dados de uma pesquisa estat́ıstica podem ser obtidos por:
� observação: quando o pesquisador não pode controlar as caracteŕısticas de
5
interesse.
� experimentos: quando o pesquisador controla parcialmente as caracteŕısticas
de interesse.
Exemplo 1 Suponha que se deseja estudar a relação entre os gastos de consumo
e a renda de um determinado grupo de indiv́ıduos. Uma pesquisa pode constar da
escolha, por sorteio, de alguns indiv́ıduos do grupo e da coleta das informações sobre
as caracteŕısticas de interesse nestes indiv́ıduos.
Exemplo 2: Deseja-se comparar duas variedades de cana de açúcar, com respeito
a um tipo de adubação. São escolhidos dois ńıveis de adubo (“ausente”, “presente”,
por exemplo) e algumas mudas de cada uma das variedades são plantadas sob cada
um destes ńıveis.
No primeiro exemplo, o pesquisador apenas observa as caracteŕısticas de interesse
nos indiv́ıduos sorteados, e no segundo exemplo, ele controla uma das caracteŕısticas:
o ńıvel de adubo utilizado no experimento. Em ambos os casos, os dados estão
sujeitos a variações do “acaso”, ou seja, podem ser afetados por condições qua não
podem ser controladas ou observadas.
Por meio de uma análise de dados, busca-se uma forma de regularidade ou pa-
drão, ou modelo, presente nas observações.
Dados = modelo + reśıduos (D=M+R)
Os reśıduos (ou erros) são a diferença entre as observações e o modelo proposto.
A Análise Exploratória de Dados ( EDA ) é um conjunto de técnicas que busca
estabelecer a melhor relação D=M+R para um particular conjunto de dados.
Podemos identificar três grandes áreas da Estat́ıstica, que, no entanto, não for-
mam ramos isolados:
� Amostragem e Planejamento de Experimentos - processo de obtenção dos da-
6
dos;
� Estat́ıstica Descritiva - organização, apresentação e sintetização dos dados;
� Estat́ıstica Inferencial - conjunto de métodos para a tomada de decisão nas
situações onde existam incertezas e variações.
1.2 Apresentação dos dados
Iniciaremos este caṕıtulo com algmas definições importantes:
Definïı¿½̈ı¿½o 1.2.1 Variável
É uma caracteŕıstica qualquer do objeto em estudo e pode ser classificada como:
� variável qualitativa- quando apresenta como posśıveis realizações uma quali-
dade ou atributo do objeto em estudo;
� variável quantitativa - quando apresenta como posśıveis realizações, números
resultantes de uma contagem ou mensuração.
As variáveis qualitativas podem ainda ser divididas em:
� variáveis qualitativas nominais- se não existe nenhuma ordem em suas posśı-
veis realizações ou
� variáveis qualitativas ordinais- se existir uma ordem em suas posśıveis rea-
lizações.
As variáveis quantitativas podem ainda ser divididas em:
� variáveis quantitativas discretas-se seus posśıveis valores formam um conjunto
finito ou enumerável
� variáveis quantitativas cont́ınuas- se seus posśıveis valores formam um inter-
valo ou união de intervalos de números reais.
7
Esquematicamente, podemos representar a divisão das variáveis por
NOMINAL
QUALITATIVA ↗
↗ ↘ ORDINAL
VARIÁVEL
↘ DISCRETA
QUANTITATIVA ↗
↘ CONTÍNUA
Definïı¿½̈ı¿½o 1.2.2 População
É um conjunto de indiv́ıduos (ou objetos) tendo pelo menos uma variável comum
observávele que é alvo do estudo.
Definïı¿½̈ı¿½o 1.2.3 Amostra
É qualquer subconjunto da população.
Definïı¿½̈ı¿½o 1.2.4 Amostra Aleatória
É uma amostra representativa da população, é selecionada de tal forma que todos os
membros da população tenham a mesma chance (probabilidade) de serem seleciona-
dos para compor a amostra. A seleção da amostra pode ser feita de várias maneiras,
dependendo, entre outros fatores, do grau de conhecimento que temos da população,
da quantidade de recursos dispońıveis a assim por diante. Cabe ressaltar que este
item será apresentado mais para frente.
Definïı¿½̈ı¿½o 1.2.5 Censo
É um levantamento estat́ıstico (pesquisa) que abrange todos os elementos de uma
população.
Definïı¿½̈ı¿½o 1.2.6 Parâmetro
É uma medida numérica que descreve uma caracteŕıstica de uma população. São
valores fixos, geralmente desconhecidos e usualmente representados por caracteres
8
gregos. Por exemplo, µ (média populacional), ρ (proporção populacional), σ (desvio-
padrão populacional), σ2 (variância populacional).
Definïı¿½̈ı¿½o 1.2.7 Estat́ıstica
É uma medida numérica que descreve uma caracteŕıstica de uma amostra. Re-
presentada por caracteres latinos. Por exemplo, x̄ (média amostral), p (proporção
amostral), s (desvio-padrão amostral), s2 (variância amostral).
Ao estudar uma variável, o principal interesse do pesquisador é, em geral, co-
nhecer a distribuição desta variável através de seus valores. Podemos representar
a distribuição dos valores de uma variável utilizando uma tabela de frequências, ou
representando gráficamente seus valores.
1.2.1 Exemplos para Motivação
Exemplo 1 Considere os dados da Tabela 1.1 onde temos informações sobre a
turma, o sexo, a matéria predileta (Português, Matemática, História, Geografia ou
Ciências) no 2º grau e a nota (número de questões certas) em um teste de múltipla
escolha com 10 questões de matemática, ministrado no primeiro dia de aula dos ca-
louros do curso de Economia. As três primeiras variáveis são qualitativas, enquanto
nota é uma variável quantitativa discreta.
Como podemos resumir essas informações de uma forma mais clara e objetiva?
Afinal, o que nos interessa é saber quantas mulheres e quantos homens há em cada
turma, quantas pessoas tiraram nota 10, quantas pessoas escolheram, por exemplo,
o Português como materia predileta e assim por diante. Para isso, vamos construir
tabelas ou distribuições de freqüência para os dados apresentados
9
Turma Sexo Predileta Nota Turma Sexo Predileta Nota Turma Sexo Predileta Nota
A F H 5 A M M 2 B F G 6
A M M 8 A M G 4 B F M 4
A F P 8 A M G 9 B M M 6
A F H 6 A M M 7 B F P 5
A M C 5 A M M 1 B M G 3
A M H 6 A F P 8 B F M 5
A F M 8 A F G 5 B M P 3
A F P 4 A M G 9 B M M 4
A F H 2 A M P 5 B F C 8
A M C 6 A F M 8 B F H 3
A F P 8 A F G 6 B M G 4
A M H 3 A F P 9 B M P 5
A M M 5 A M M 8 B M P 4
A F P 5 B F H 6 B M H 6
A F G 5 B M M 3 B M M 6
A M C 7 B F P 4 B M G 6
A M H 4 B M H 8 B M H 6
A F M 7 B M G 10 B M H 6
A F P 7 B F M 5 B F M 8
A F M 6 B F P 7 B F M 8
A M G 6 B F P 5 B F G 5
A M H 9 B M M 6 B M C 5
A F M 8 B F M 5
A M P 5 B M G 5
A M G 6 B F H 8
A F M 7 B F G 5
A M P 5 B M G 6
A F M 5 B F M 5
A F M 5 B M G 2
Tabela 1.1: Dados da Turma de Economia
Por exemplo, a Tabela 1.2 mostra a distribuição de frequência dos alunos por
sexo.
Sexo Número de alunos
Masculino 41
Feminino 39
Total 80
Tabela 1.2: Sexo e Nº de alunos
10
A tabela 1.3 mostra a distribuição dos alunos por turma e sexo.
Sexo Nºde alunos
turma A turma B Total
Masculino 21 20 41
Feminino 21 18 39
Total 42 38 80
Tabela 1.3: Sexo e Nº de alunos por turma
Podemos construir ainda, uma tabela que mostra a distribuição dos alunos por
sexo e materia predileta, ver Tabela 1.4
Sexo Materia Predileta
História Matemática Português Geografia Ciências Total
Masculino 8 11 6 12 4 41
Feminino 6 15 11 6 1 39
Total 14 26 17 18 5 80
Tabela 1.4: Sexo e Matéria Predileta
Definïı¿½̈ı¿½o 1.2.8 Tabela de Frequências
É uma das formas mais simples de apresentação de dados. Podemos representar a
distribuição dos valores de uma variável utilizando uma tabela de frequências como
a que aparece no exemplo acima.
Regra geral, uma tabela de frequência pode ser representada da seguinte forma:
Tabela 1.5: Tabela de frequências
Variável Frequência Proporção Porcentagem Freq. acumulada
(ni) (fi) (%) (fa)
ńıvel 1 n1 f1 100× f1 n1
ńıvel 2 n2 f2 100× f2 n1 + n2
...
...
...
...
ńıvel k nk fk 100× fk n1 + n2 + . . .+ nk
Total n = n1 + n2 + . . .+ nk 1 = f1 + . . .+ fk 100 n
em que
11
� n é o número total de observações do conjunto;
� k é o número de ńıveis da variável em questão;
� i é o ı́ndice que indica o ńıvel da variável;
� ni é o núumero de observações para o ńıvel i da variável;
� fi = ni/n é a proporção de casos no ńıvel i da variável.
� (fa) = n1 + n2 + . . .+ nk é a soma de casos até o ńıvel k da variável.
A Tabela 1.6 mostra a importânciade se calcular uma proporção quando estamos
interessados em comparar dois conjuntos de dados de tamanhos diferentes. Propor-
cionalmente, temos mais alunos que preferiram História, na Turma B (fi = 18, 42)
do que na Turma A (fi = 16, 67), apesar das frequências serem as mesmas (ni = 7)
Matéria Frequência Proporção Frequência Proporção Frequência Proporção
Predileta Turma A (ni) Turma A (fi) Turma B (ni) Turma B (fi) Total Total
Português 10 23,81 7 18,42 17 21,25
Matemática 14 33,33 12 31,58 26 32,50
História 7 16,67 7 18,42 14 17,50
Geografia 8 19,05 10 26,32 18 22,50
Ciências 3 7,14 2 5,26 5 6,25
Total 42 100,00 38 100,00 80 100,00
Tabela 1.6: Matéria Predileta e Turma
Exemplo 2 A tabela 1.7 representa a distribuição de frequência dos dados referen-
tes as matŕıculas de professores e alunos em escolas do munićıpio de Niterói em
2009.
Escola de Ensino Fundamental Matŕıculas de professores Matŕıcula de alunos
Privada 1751 25280
Pública Estadual 1186 21328
Pública Municipal 947 18432
Pública Federal 29 280
Tabela 1.7: matŕıculas de professores e alunos
Uma outra forma de se apresentar os dados é por meio da utilização de gráficos.
Existem vários tipos de gráficos que podem ser utilizados para representar tanto as
12
variáveis qualitativas quanto as variáveis quantitativas. Para construir estes grá-
ficos, no caso de variáveis qualitativas, consideraremos as frequências com que os
ńıveis das variáveis aparecem em um conjunto de dados.
Podemos apresentar os dados do Exemplo 2 utilizando gráficos de Barras, como
mostram as Figuras 1.1 , 1.2 e 1.3:
privada estadual municipal federal
Distribuição dos professores
tipo de escola
nº
 d
e 
m
at
rí
cu
la
s
0
50
0
10
00
15
00
Figura 1.1: Distribuição das matŕıculas dos professores. Barra vertical.
Gráfico de Barras Vertical da Figura 2.1
prof<-c(1751,1186,947,29)
escola<-c(”privada”,”estadual”,”municipal”,”federal”)
barplot(prof, names.arg=escola)
names(prof)<-c(”privada”,”estadual”,”municipal”,”federal”)
barplot(prof, names.arg=escola, main=”Distribuição dos professores”,
col=c(2,3,4,5),xlab=”tipo de escola”,ylab=”nº de matŕıculas”)
13
federal
municipal
estadual
privada
Distribuição dos professores
tipo de escola
0 500 1000 1500
Figura 1.2: Distribuição das matŕıculas dos professores. Barra horizontal.
Gráfico de Barras Horizontal da Figura 2.2
555555558k7
14
alunos professores
Distribuição de professores e alunos
matrícula
n.
 d
e 
m
at
rí
cu
la
s
0
50
00
10
00
0
15
00
0
20
00
0
25
00
0
Figura 1.3: Distribuição das matŕıculas dos professores e alunos
Gráfico de Barras Horizontal (lado a lado) da Figura 2.3
alunosprof<- matrix(c(1751,1186,947,29,25280,21328,18432,280),
nrow=4, ncol=2, dimnames=list(c(”privada”, ”estadual”, ”municipal”, ”federal”),
c(”professores”, ”alunos”)))
barplot(alunosprof[,2:1],beside=TRUE,ylab=”n. de matŕıculas”,xlab=”matŕıcula”,
col=c(”blue”,”red”,”green”,”orange”),main=”Distribuição de professores e alunos”)
Definïı¿½̈ı¿½o 1.2.9 Gráfico de Barras:
É um dos gráficos mais utilizados para representar variáveis qualitativas. Algu-
mas observações devem ser feitas sobre este gráfico.
1. O gráfico tem apenas uma escala, a que representa a frequência ou porcentagem
em cada ńıvel da variável;
2. A largura da barra utilizada não tem nenhum significado especial além do apelo
visual;
15
3. Para facilitar a compreensão e análise, é prefeŕıvel que as barras sejam apre-
sentadas segundo uma ordem sistemática. O critério mais utilizado é ordená-
las por sua magnitude;
4. As barras devem ser colocadas, de preferência, no sentido horizontal pois desta
forma o nome dos ńıveis da variável podem ser melhor visualizados.
Exemplo 3 A Tabela 1.8 apresenta os dados sobre a frota de véıculos no munićıpio
de Niterói no ano de 2009.
Frota frequência Frota frequência Frota frequência
Automóveis 15188 Onibus 1969 Outros 1268
Motocicletas 11962 Motonetas 3201
Caminhonetes 8058 Caminhões 1895
Tabela 1.8: Frota de véıculos no munićıpio de Niterói
A variável aqui considerada, Frota, é também uma variável qualitativa. Esta
variável tanto pode ser representada por um gráfico de barras quanto por um gráfico
de setores. Mostraremos abaixo a representação por um gráfico de setores.
Gráfico de Setores
É também um gráfico bastante utilizado para representar variáveis qualitativas.
É muitas vezes chamado de Gráfico de Torta ou Gráfico de Pizza. Neste gráfico, um
ćırculo representa 100% das observações e cada ńıvel da variável é representado por
um setor de área proporcional à frequência observada. Algumas observações podem
ser feitas a respeito da construção deste gráfico:
� Não é um gráfico recomendado quando se quer representar subdivisões dos
ńıveis da variável;
� Não é recomendado quando o número de ńıveis da variável é muito grande.
Como se calcula da área para cada setor:
43541→ 360 x = 360×15188
42273
15188→ xauto x =125.5°
16
Frota área Frota área Frota área
Automóveis 125.5° Onibus 16.2° Outros 10.64°
Motocicletas 98.8° Motonetas 26.5°
Caminhonetes 66.7° Caminhões 15.7°
Tabela 1.9: Cálculo das áreas
automóveis(45.28%)
motocicletas(5.85%)
caminhonetes(24.02%)
motonetas(5.65%)
ônibus(9.54%)
caminhões(5.87%)
outros(3.78%)
Frota 2009 − Niterói_RJ
Figura 1.4: Gráfico de Setores para a frota de véıculos de Nitéroi
17
Gráfico de Setores da Figura 2.4
frota<-c(15188, 1962, 8058,1895, 3201, 1969,1268)
names(frota)<-c(”automóveis”,”motocicletas”,”caminhonetes”,”motonetas”,”̂onibus”,
”caminhões”, ”outros”)
title(”Frota 2009 - Niterói-RJ”)
porc<-round(frota*100/sum(frota),2)
rotulos<-paste(”(”,porc,”%)”,sep=)
pie(frota, main=”Frota 2009: Niterói-RJ”,labels=rotulos,
col=rainbow(7),pch=rep(20,6) )
Exemplo 4 A tabela 1.10 mostra a evolução dos ı́ndices ”́Indice Nacional de Preço
ao Consumidor (INPC)”e do ”́Indice de Reajuste do Salário Mı́nimo (IRSM)”, du-
rante o primeiro semestre de um ano fict́ıcio
Mes Jan Fev Mar Abr Mai Jun Jul
INPC 28.8 24.8 27.5 28.3 26.8 30.3 31.0
IRSM 27.9 25.8 26.8 28.2 28.4 30.5 29.2
Tabela 1.10: Evolução dos ı́ndices, INPC e IRSM
A variável aqui considerada, Índice, é uma variável quantitativa. Um gráfico que
pode ser utilizado para representá-las, é o gráfico de linhas. Ver Figura 1.5
Gráfico de Linhas da Figura 2.5
mes=c(01,02,03,04,05,06,07)
inpc=c(28.8 , 24.8,27.5,28.3,26.8,30.3,31.0)
irsm=c(27.9,25.8, 26.8 , 28.2 , 28.4, 30.5, 29.2)
plot(mes,inpc,type=”b”,xlab=”mes”,ylab=”Indice”,main=”Comportamento dos ı́ndi-
ces”,col=”blue”,ylim=c(24,35),lwd=2)
lines(mes,irsm, col=”red”, lwd=2,type=”b”)
legend(5,33,c(”inpc”,”irsm”),col =c(”blue”,”red”), pch=rep(20,2))
18
●
●
●
●
●
●
●
1 2 3 4 5 6 7
24
26
28
30
32
34
Comportamento dos índices
mes
In
di
ce
●
●
●
●
●
●
●
●
●
inpc
irsm
Figura 1.5: Gráfico de linhas
Definïı¿½̈ı¿½o 1.2.10 Gráfico de Linhas:
É o mais comum dos gráficos e um dos mais simples, representando os ńıveis das
variáveis em coordenadas retangulares. Observações sobre a construção do gráfico
de linhas:
� É um gráfico particularmente útil para representar séries de tempo. O tempo
é representado no eixo X e a série no eixo Y .
� É comum representar-se mais de uma série no mesmo gráfico.
Exemplo 5 A tabela a seguir mostra a produção de véıculos no peŕıodo de um ano.
Fonte:ANFAVEA (21/03/2018).
19
Ano Automóveis Caminhões Onibus
Jan 168.528 4.482 1.069
Fev 194.395 5.314 1.358
Mar 227.919 5.952 1.686
Abr 182.095 5.900 1.492
Mai 241.013 7.576 2.132
Jun 202.546 6.797 2.236
Jul 215.471 7.093 2.276
Ago 250.135 8.488 2.192
Set 228.733 7.599 1.687
Out 240.452 8.241 1.528
Nov 239.244 8.166 1.665
Dez 204.949 7.436 1.322
A representação desta variável é feita também por um gráfico de linhas. Ver
Figura 1.6
●
●
●
●
●
●
●
●
●
● ●
●
Produção de veículos
ano
P
ro
du
çã
o
●
●
● ●
●
● ●
●
●
● ●
●
● ●
● ●
● ● ● ●
● ● ● ●B
C
A
26
0
1 2 3 4 5 6 7 8 9 10 11 12
●
●
●
auto
cami
bus
Figura 1.6: Gráfico de linhas
20
Gráfico de Linhas da Figura 2.6
ano<-1:12
auto=c(168528,194395,227919,182095,241013,202546,215471,250135,
228733,240452,239244,204949)
auto1=auto/1000
cami1=cami/100
cami=c(4482, 5314, 5952, 5900, 7576, 6797, 7093, 8488, 7599,
8241,8166,7436)
bus=c(1069,1358 ,1686, 1492, 2132, 2236, 2276, 2192,
1687, 1528, 1665, 1322)
bus1=bus/100
plot(ano,auto1,type=”b”,lwd=2,axes=F,main=”Produção de véıculos”,
xlab=”ano”,ylab=”Produção”,col=”blue”,ylim=c(5,260))
lines(ano, cami1,col=”orange”,type=”b”,lwd=2)
lines(ano, bus1,col=”red”,type=”b”,lwd=2)
axis(2,c(10,45,170 ,260 ), c(”B”,”C”,”A”,260 ))
axis(1,1:12 )
legend(8,170,c(”auto”,”cami”,”bus”),col =c(”blue”,”orange”,”red”), pch=rep(20,2))
Definïı¿½̈ı¿½o 1.2.11 Gráfico de Colunas:
Uma alternativa ao Gráfico de Linha, é representar a variável por um gráfico
de Colunas. Neste gráfico, os ńıveis das variáveis são também representados por
barras, só que verticais. É, em geral, utilizado para representar séries de tempo.
Observações sobre a construção do gráfico:
1. As duas escalas estão presentes, no eixo X representamos o tempo e no eixo
Y os ńıveis da variável;
2. Pode ser utilizado para representar mais de uma série. Neste caso as colunas
aparecem juntas.
Vamos representar os dados da tabela 1.10 por um gráfico de colunas.
Exemplo 6 Os dados que iremos apresentar agora são medidas da circunferência,
em mm, do tronco de pés de laranjeiras e sua respectiva idade em dias. Suponha que
estamos interessados em observar se há relação entre o tamanho da circunferência
21
J F Mr A Ma Jn Jl
gráfico de colunas
0
20
40
60
80
10
0
Figura 1.7: Gráfico de Colunas
Idade Medidas da circnferencia
(em dias) Arvore 1 Arvore 2 Arvore 3 Arvore 4 Arvore 5
118 30 33 30 32 30
484 58 69 51 62 49
664 87 111 75 112 81
1004 115 156 108 167 125
1231 120 172 115 179 142
1372 142 203 139 209 174
1582 145 203 140 214 177
Tabela 1.11: Medidas da circunferência do tronco de pés de laranja
com a idade da árvore, para isto podemos representar os dados utilizando um gráfico
de dispersão.
As figuras abaixo mostram estas representações:
� A Figura 1.8 mostra a dispersão dos dados.
� A Figura 1.9 coloca no diagrama de dispersão, uma reta de regressão linear,
22
que mais tarde veremos é um recurso para estimar valores.
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
500 1000 1500
50
10
0
15
0
20
0
Dispersão entre idade e circunferência
idade em dias
ci
rc
un
fe
rê
nc
ia
 e
m
 m
m
Figura 1.8: Dispersão entre idade e circunferência
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●●
●
●
500 1000 1500
50
10
0
15
0
20
0
Dispersão entre idade e circunferência
idade em dias
ci
rc
un
fe
rê
nc
ia
 e
m
 m
m
Figura 1.9: Dispersão entre idade e circunferência, com reta de regressão
23
Gráfico de dispersão da Figura 2.8
data(Orange)
attach(Orange)
plot(age ,circumference,xlab=”idade em dias”,ylab=”circunferência em mm”,
main=”Dispersão entre idade e circunferência do tronco de pés de laranjeiras”)
Gráfico de dispersão da Figura 2.9
data(Orange)
attach(Orange)
plot(age ,circumference,xlab=”idade em dias”,ylab=”circunferência em mm”,
main=”Dispersão entre idade e circunferência do tronco de pés de laranjeiras”)
abline(lm(circumference age ),col=4,lwd=2)
Exemplo 7 A Tabela abaixo mostra o teor dos nutrientes; Potassio e Magnésio,
em folhas se soja, quando se varia a dose anual de adubo.
Teores de nutrientes
Dose anual de K2O(Kg/ha):X K, Y1 (g/Kg) Mg Y2(mg/Kg)
0 6 10,5
40 11 7,9
80 18 6,4
120 22 5,8
160 25 5,5
200 21 5,2
Fonte: PAB(1997) vol. 32(12) pg.1235-1249.
Na Figura 1.10, mostramos o diagrama de dispersão entre as variáveis X e Y1.
Observando a disposição dos pontos, verificamos que quando aumentamos a dose
anual do adubo parece haver uma tendência de aumento do teor do nutriente K nas
folhas de soja. No caso do Magnésio, ao contrário, quando aumentamos a dose de
adubo, a concentração do nutriente diminui.
24
●
●
●
●
●
●
0 50 100 200
10
15
20
25
 Pótassio
Óxido de Potássio
k
●
●
●
●
●
●
0 50 100 200
5
6
7
8
9
10
 Magnésio
Óxido de Potássio
m
g
Figura 1.10: Diagrama de dispersão: K2O versus Potássio
Gráfico de Dispersão. Figura 2.10
k2o=c(0,40,80,120,160,200) k=c(6,11,18,22,25,21) mg=c(10.5,7.9,6.4,5.8,5.5,5.2)
par(mfrow=c(1,2)) plot(k2o,k,main=”Pótassio”,col=”red”,lwd =3,xlab=”Óxido de
Potássio”) plot(k2o,mg,main=”Magnésio”,col=”red”,lwd =3,xlab=”Óxido de Potás-
sio”) cor(k2o,k) cor(k2o)
Definïı¿½̈ı¿½o 1.2.12 Diagrama de dispersão
Quando as variáveis envolvidas são ambas quantitativas (não agrupadas), um
procedimento bastante útil para se verificar a associação entre as variáveis é o grá-
fico de dispersão, que nada mais é do que a representação dos pares de valores em
um sistema cartesiano. Para desenhar este gráfico basta plotar em um eixo car-
tesiano o conjnto de valores das variáveis consideradas,se X = (x1, x2, · · · , xn) e
Y = (y1, y2, · · · , yn) então plotamos os pares (xi, yi).
25
Exemplo 8 O conjunto de dados abaixo mostra as informações sobre os alunos dfe
uma determinada turma, obtidas em um curso de Estat́ıstica Básica:
Vamos construir uma tabela de frequências para a vaŕıavel ”Peso”, neste caso,
vamos criar um artif́ıcio para representar esta variável em uma tabela de frequências.
Os ńıveis das variáveis serão representados por intervalos de classe em que,
� xi é o ponto médio do intervalo ( representa agora o valor da variável naquele
intervalo);
� ni é a frequência de cada classe.
Classe xi ni fi %
45 ` 55 50 10 0.23 23%
55 ` 60 57,5 7 0.16 16%
60 ` 70 65 11 0.25 25%
70 ` 80 75 9 0.20 20%
80 ` 90 85 7 0.16 16%
Total – 44 1 100%
Regras para encontrar o número de classes k para construir uma Tabela de
Frequências para variáveis quantitativas cont́ınuas:
Diversos autores indicam regras diferentes para a determinação do número de
classes para uma distribuição de frequências e, consequentemente, o histograma. Na
tabela abaixo, são apresentados as principais regras encontradas na literatura que
levem em conta apenas o tamanho da amostra n.
De maneira geral, é indicado ”bom senso”na determinação do número de classes
de uma tabela de frequências . O ”bom senso”deve levar em consideração as seguints
questões:
� O número de classes deve ser moderado.
� Como há um agrupamento de valores nas classes, há perda de informação.
� Se o número de classes for muito grande ocorre uma perda menor de informa-
ção, mas a eficiência do resumo fica prejudicada;
26
Aluno Sexo Idade Altura Peso Fumante? TV OpTV Ex.F. Ativ. Nº de irmãos
1 M 20 1,75 68,0 N 10 M 2 S 1
2 F 18 1,65 53,5 N 5 R 5 M 1
3 F 20 1,65 51,0 N 3 R 5 M 3
4 F 21 1,70 68,0 N 3 R 2 S 0
5 F 19 1,75 87,0 N 20 B 5 M 2
6 F 18 1,65 51,0 N 3 R 2 S 0
7 M 17 1,70 64,0 N 4 R 6 A 1
8 M 21 1,74 63,5 N 0 N 0 S 5
9 M 19 1,64 54,3 N 18 B 2 S 0
10 M 20 1,79 77,0 N 14 B 3 M 0
11 M 18 1,70 53,0 N 2 R 3 M 2
12 M 21 1,76 69,0 N 2 R 1 S 0
13 M 18 1,73 66,0 N 6 M 4 M 4
14 F 20 1,62 56,0 N 3 R 0 S 2
15 M 20 1,73 65,0 N 2 R 0 S 8
16 F 20 1,74 58,0 N 9 M 2 S 1
17 F 19 1,65 67,0 N 4 R 0 S 1
18 M 18 1,85 80,0 N 3 R 0 S 1
19 M 21 1,77 66,0 N 2 R 0 S 2
20 M 20 1,67 64,0 N 1 R 10 A 1
21 F 20 1,65 59,0 N 8 M 2 S 1
22 M 20 1,66 56,0 N 3 R 0 S 3
23 F 19 1,60 52,0 N 6 M 2 S 2
24 F 19 1,60 45,0 N 15 B 2 S 1
25 M 19 1,83 70,0 N - - 2 S 1
26 M 19 1,70 70,0 N 23 B 6 A 0
27 F 23 1,58 58,0 N 2 R 2,5 M 2
28 M 21 1,87 76,0 N 22 B 2 S 1
29 F 21 1,58 51,0 N 20 M 2 S 4
30 M 26 1,82 75,0 N 5 B 3 M 4
31 F 29 1,60 52,0 N 20 R 0 S 2
32 M 23 1,82 72,0 N 5 B 2 S 0
33 M 20 1,83 85,0 N 14 B 2 S 3
34 M 50 1,68 71,0 N 15 B 5 M 3
35 M 23 1,77 82,5 N 15 B 2 S 2
36 F 21 1,69 53,0 N 10 M 2 S 1
37 M 20 1,83 - N 6 N 2 S 1
38 M 20 1,76 74,0 N 0 N 6 A 4
39 M 23 1,81 85,0 N 1 R 0 S 1
40 F 20 1,63 57,5 N 2 B 0 S 2
41 M 32 1,85 87,5 S 15 R 2 S 1
42 M 20 1,70 60,0 S 3 B 3 M 3
43 F 19 1,70 78,0 N 14 R 4 M 0
44 M 20 1,82 80,0 N 1 R 1 S 2
45 M 19 1,82 55,0 N 20 B 0 S 2
27
� Um número muito pequeno de classes resume demais e ocorre perda excessiva
de informação.
Apresentaremos abaixo um conjunto de regras utilizadas para determinar o nú-
mero de classes de uma tabela de frequência.
Tabela : Regras para o número de classes de uma distribuição de frequências.
Regra Propriedade
Raiz quadrada de n Apropriado como valor inicial, fornece
valores baixos para n pequeno (n < 50).
k =
√
n Pode ser indicado para valores de n entre
80 e 120
Raiz quadrada de 2n Apropriado para valores baixos de n,
cresce muito rápido para valores
k =
√
2n moderados (n > 50).
Não é indicado paran > 80.
Regra do Logaritmo Muito parecido com o método de Sturges,
natural fornece valores ligeiramente maiores para n pequeno,
k = 3 + lnn porém a situação se inverte para n >.
Indicado para valores elevados de n
Sturges O método mais consagrado fornece valores
baixos para n pequeno, e cresce muito
k = 1 + 3.32x log1 0n devagar.
Indicado para valores elevados de n.
Vamos agora contruir um histograma para a variável peso.
Construção do Histograma para a variável Peso.Figura 2.11
peso=c(68.0, 53.5, 51.0, 68.0, 87.0, 51.0, 64.0, 63.5, 54.3, 77.0, 53.0, 69.0, 66.0,
56.0,65.0, 58.0, 67.0, 80.0, 66.0, 64.0, 59.0, 56.0, 52.0, 45.0, 70.0, 70.0 , 58.0,
76.0 , 51.0, 75.0 , 52.0, 72.0 , 85.0, 71.0 , 82.5 , 53.0, 74.0, 85.0 ,
57.5 , 87.5 , 60.0 , 78.0, 80.0 , 55.0 )
hist(peso,freq=F,col=”green”, breaks=c(45,55,60,70,80,90), main=”Histograma para
a variável Peso”,xlab=”Peso”,ylab=”densidade”)
28
Histograma para a variável Peso
Peso
de
ns
id
ad
e
50 60 70 80 90
0.
00
0
0.
00
5
0.
01
0
0.
01
5
0.
02
0
0.
02
5
0.
03
0
Figura 1.11: Histograma do Peso
Definïı¿½̈ı¿½o 1.2.13 Histograma:
O histograma é um gráfico que representa números pela área e não pela altura.
É utilizado, em geral, para representar distribuições de variáveis cont́ınuas quando
os dados estão agrupados em classes de frequência. Embora tenha a aparência de
um gráfico de colunas, não deve ser confundido com ele.
Podemos construir histogramas de frequências, de proporção ou de porcentagem.
A distribuição nas diversas classes é representada por blocos constrúıdos da seguinte
forma:
� a base do bloco é o comprimento do intervalo de classe;
� a altura do bloco é a densidade, de frequências, de proporção ou de porcentagem
na classe.
A densidade na classe i é definida por
di =
ni
4i
, no caso de frequências,
di =
fi4i
, no caso de proporção,
di =
100× fi
4i
, no caso de porcentagem,
29
em que 4i representa o comprimento do intervalo da i-ésima classe.
Observações:
� A área do bloco obtido é a quantidade representada naquela classe.
� A área total do histograma representa 100% das observações. Logo, a área total
de um histograma de frequências é igual a n, a de um histograma de proporção
é igual a 1 e a de um histograma de porcentagem é igual a 100%.
� A área entre dois valores quaisquer fornece uma aproximação para a frequência
(ou proporção ou porcentagem) no intervalo limitado por eles.
Definïı¿½̈ı¿½o 1.2.14 Poligono de Frequência:
O poĺıgono de frequências é constrúıdo de forma semelhante a do histograma.
Une-se o ponto médio das classes na altura determinada pela densidade. Para fe-
char o poĺıgono unimos os extremos da figura com o eixo das abcissas, nos quais
estariam os pontos médios de uma classe imediatamente anterior e outra imedia-
tamente posterior. Embora a área total abaixo do poĺıgono de frequências também
seja igual a 100% das observações, não podemos aproximar a frequência entre dois
pontos pela área delimitada por eles. Ver Figura 1.12
Histograma para a variável Peso
Peso
de
ns
id
ad
e
50 60 70 80 90
0.
00
0
0.
00
5
0.
01
0
0.
01
5
0.
02
0
0.
02
5
0.
03
0
●
●
●
●
●
Figura 1.12: Histograma com Poligno de frequência
30
Histograma com poligono de frequência. Figura 2.12
peso=c(68.0,53.5,51.0,68.0,87.0,51.0,64.0,63.5,54.3,
77.0,53.0,69.0,66.0,56.0,65.0,58.0,67.0,80.0,66.0,64.0,
59.0, 56.0, 52.0,45.0,70.0,70.0,58.0,76.0,51.0,75.0,52.0,72.0,85.0,71.0,
82.5,53.0,74.0,85.0,57.5,87.5,60.0,78.0,80.0,55.0)
hist(peso,freq=F,col=”green”,main=”Histograma para a variável Peso”,xlab=”Peso”,
ylab=”densidade”,breaks=c(45,55,60,70,80,90))
h=hist(peso,freq=F,xlab=”Peso”,col=”green”,ylab=”densidade”,
main= ”Histograma para a variável Peso”,breaks=c(45,55,60,70,80,90))
points(hmids, hdensity,”b”,col=”red”,lwd=3)
Definïı¿½̈ı¿½o 1.2.15 Histograma Alisado:
Se houvesse um número suficientemente grande de observações poder-se-ia ir di-
minuindo os intervalos de classe e o histograma iria ficando cada vez menos irregular
ate atingir um caso limite, com uma curva bem mais suave. Esta curva é chamada
de histograma alisado. Ver Figura 1.13
Histograma para a variável Peso
Peso
de
ns
id
ad
e
50 60 70 80 90
0.
00
0
0.
00
5
0.
01
0
0.
01
5
0.
02
0
0.
02
5
0.
03
0
Figura 1.13: Histograma Alisado
31
Histograma Alisado Figura 2.13
peso=c(68.0,53.5,51.0,68.0,87.0,51.0,64.0,63.5,54.3,
77.0,53.0,69.0,66.0,56.0,65.0,58.0,67.0,80.0,66.0,64.0,
59.0, 56.0, 52.0,45.0,70.0,70.0,58.0,76.0,51.0,75.0,52.0,72.0,85.0,71.0,
82.5,53.0,74.0,85.0,57.5,87.5,60.0,78.0,80.0,55.0)
hist(peso,freq=F,col=”green”,main=”Histograma para a variável Peso”,
xlab=”Peso”,ylab=”densidade”,breaks=c(45,55,60,70,80,90))
h1=density(peso)
lines(h1,col=”red”,lwd=3)
Definïı¿½̈ı¿½o 1.2.16 Ogiva:
É o gráfico representativo de uma distribuição acumulada de frequências e consta
de uma poligonal ascendente. No eixo horizontal colocam-se as extremidades de
classe e no eixo vertical, as frequências acumuladas (ou proporção acumulada, ou
porcentagem acumulada).
Definïı¿½̈ı¿½o 1.2.17 Ramo e folhas:
A forma de uma distribuição é uma caracteŕıstica importante de um conjunto
de dados. Um procedimento alternativo para resumir um conjunto de dados, com
o objetivo de se ter uma idéia da forma da distribuição é o ramo-e-folhas. Uma
vantagem do ramo-e-folhas sobre o histograma é que não perdemos informações sobre
os dados.
Observações sobre a construção de um ramo-e-folhas:
1. Não existe regra fixa para a construção de um ramo-e-folhas. A idéia básica é
dividir cada observação em duas partes: a 1ª, o ramo, é colocada à esquerda
de uma linha vertical; a 2ª, a folha, é colocada à direita desta linha.
2. Todos os ramos devem ter o mesmo comprimento.
3. Se ao fazer uma escolha de ramos obtivermos ramos muito carregados, podemos
fazer uma sub-divisão neles.
Exemplo 1
Os dados seguintes representam as pontuações obtidas por 48 estudantes, em um
32
determinado teste.
75 98 42 75 84 87 65 59 63 86 78 37
99 66 90 79 80 89 68 57 95 55 79 88
76 60 77 49 92 83 71 78 53 81 77 58
93 85 70 62 80 74 69 90 62 84 64 73
Como o menor e o maior dos dados anteriores são, respectivamente, 37 e 99,
vamos considerar para ramo o d́ıgito das dezenas:
33
3 7
4 2 9
5 3 5 7 8 9
6 0 2 2 3 4 5 6 8 9
7 0 1 2 4 5 5 6 7 7 8 8 9 9
8 0 0 1 3 4 4 5 6 7 8 9
9 0 0 2 3 5 8 9
cada dado deve ser lido da seguinte forma: 3|7 significa 37
Exemplo 2
Admitamos que as alturas, em cm, de um conjunto de plantas, duas semanas depois
de se ter lançado a semente à terra, eram:
7.5 9.8 4.2 7.5 8.4 8.7 6.5 5.9 6.3 8.6 7.8 3.7
9.9 6.6 9.0 7.9 8.0 8.9 6.8 5.7 9.5 5.5 7.9 8.8
7.6 6.0 7.7 4.9 9.2 8.3 7.1 7.8 5.3 8.1 7.7 5.8
9.3 8.5 7.0 6.2 8.0 7.4 6.9 9.0 6.2 8.4 6.4 7.3
Nota: estes dados são fict́ıcios e foram obtidos dos dados do Exemplo 1, dividindo-
se por 10 cada uma das pontuações.
A representação destes dados em um gráfico de ramo e folhas é precisamente igual
à dos dados das pontuações, mas com a indicação de como se deve fazer a leitura
não haverá ambiguidade:
neste caso, cada dado deve ser lido da seguinte forma: 3|7 significa 3,7 cm
3 7
4 2 9
5 3 5 7 8 9
6 0 2 2 3 4 5 6 8 9
7 0 1 2 4 5 5 6 7 7 8 8 9 9
8 0 0 1 3 4 4 5 6 7 8 9
9 0 0 2 3 5 8 9
Como aumentar o número de ramos?
Na representação anterior consideramos 7 ramos e o intervalo entre ramos su-
34
cessivos foi de 10 unidades. É como se tivessemos considerado as classes
[30, 40[, [40, 50[, [50, 60[, [60, 70[, [70, 80[, [80, 90[, [90, 100[, para agrupar os dados.
Suponhamos que em vez de considerar estas classes, de amplitude 10, estivésse-
mos interessados em considerar classes de amplitude 5, a saber
[30, 35[, [35, 40[, [40, 45[, [45, 50[, [50, 55[, [55, 60[, [60, 65[
[65, 70[, [70, 75[, [75, 80[, [80, 85[, [85, 90[, [90, 95[e[95, 100[
. Entâo a representação anterior teria o seguinte aspecto:
3 7
4 2
4 9
5 3
5 5 7 8 9
6 0 2 2 3 4
6 5 6 8 9
7 0 1 2 4
7 5 5 6 7 7 8 8 9 9
8 0 0 1 3 4 4
8 5 6 8 9
9 0 0 2 3
9 5 8 9
Um Exemplo.
Cosidere os dados da variável, peso ao nascer, de 45 crianças de uma certa lo-
calidade, durante os últimos 5 anos;
2 2 3 4 5 4 3 7 4 6 5 2 3 4 5 5 6 4 6 7 7 8 9 2 3 4 5
3 9 2 6 3 4 6 5
4 3 2 5 4 3
5 5 7 8 9
6 4 3 4
35
Apresentaremos abaixo duas tabelas de frequência que podeŕıamos fazer: Na pri-
meira tabela a primeira conterá as observações dentro do intervalo 2 ` 3 . Como
este é o ramo com maior número de observações, poderiamos está interessados em
descriminalas. Uma forma de fazer isto é quebrar esta intervalo em dois outros
intervlos, por exemplo, 2 ` 2, 5 e de 2, 5 ` 3.
Tabela 1.12: Tabela da Esquerda
Classe xi ni
2 ` 3 2,5 26
3 ` 4 3,5 7
4 ` 5 4,5 5
5 ` 6 5,5 4
6 ` 7 6,5 3
Total – 45
Tabela 1.13: Tabela da Esquerda
Classe xi ni
2 ` 2,5 2,25 12
2,5 ` 3 2,75 14
3 ` 4 3,5 7
4 ` 5 4,5 5
5 ` 6 5,5 4
6 ` 7 6,5 3
Total – 45
36