Buscar

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 41 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 41 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 41 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Continue navegando


Prévia do material em texto

Estat´ıstica Descritiva
Prof. Wesley Bertoli da Silva
Probabilidade e Estat´ıstica
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 1 / 41
Agenda
• Conceitos de Populac¸a˜o e Amostra;
• Varia´veis Qualitativas e Quantitativas;
• Tabulac¸a˜o e Descric¸a˜o de Dados;
• Tipos de Tabelas e Gra´ficos;
• Medidas de Tendeˆncia Central;
• Medidas de Dispersa˜o;
• Noc¸o˜es de Amostragem.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 2 / 41
Populac¸a˜o e Amostra
• Populac¸a˜o: Conjunto de N elementos (indiv´ıduos, objetos, etc.) que
apresentam pelo menos uma caracter´ıstica em comum;
− Finita: Tamanho populacional conhecido;
− Infinita: Tamanho populacional desconhecido;
• Amostra: Subconjunto de uma populac¸a˜o que, em geral, apresenta
tamanho n consideravelmente menor.
Exemplo de populac¸o˜es:
• Conjunto de alunos da UTFPR, de habitantes de Curitiba, etc;
• Conjunto dos nu´meros reais, de bacte´rias de determinada espe´cie que
circulam pelo ar, etc.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 3 / 41
Varia´veis Aleato´rias
• Varia´vel: Denota uma caracter´ıstica que sera´ observada em cada um
dos elementos de uma populac¸a˜o ou amostra;
− Qualitativas: Os poss´ıveis resultados sa˜o atributos (qualidades);
− Quantitativas: Os poss´ıveis resultados sa˜o de natureza nume´rica;
• Uma varia´vel qualitativa sera´ nominal se na˜o for poss´ıvel estabelecer
uma ordem natural entre seus poss´ıveis resultados. Caso contra´rio a
varia´vel e´ dita ordinal;
• Uma varia´vel quantitativa sera´ discreta se so´ puder assumir nu´meros
inteiros (naturais). Caso contra´rio a varia´vel e´ dita cont´ınua;
• Exemplos: Geˆnero, estado de uma doenc¸a, nu´mero de irma˜os, tempe-
ratura local, etc.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 4 / 41
Tabulac¸a˜o de Dados
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 5 / 41
Tabulac¸a˜o de Dados
Varia´veis observadas:
• V1 - Geˆnero;
• V2 - Grau de Escolaridade;
• V3 - Meio de Transporte;
• V4 - Altura;
• V5 - Nu´mero de Filhos;
• V6 - Idade.
− Note que V1, V2 e V3 sa˜o qualitativas, ao passo que V4, V5 e V6 sa˜o
quantitativas;
− Podemos resumir tais dados por meio de uma se´rie de ferramentas, tais
como tabelas, gra´ficos e medidas descritivas.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 6 / 41
Medidas de Frequeˆncia
• Frequeˆncia Absoluta (FA): Quantidade de vezes em que cada particular
poss´ıvel resultado i foi observado. Notac¸a˜o: Fi , i = 1, 2, . . . , p;
• Frequeˆncia Relativa (FR):
fi =
Fi
n
e fi (%) =
Fi
n
× 100;
• Frequeˆncia Acumulada (FAC):
Fac1 = F1 e Faci =
i−1∑
k=1
Fk ;
• Frequeˆncia Acumulada Relativa (FAR):
faci =
Faci
n
e faci (%) =
Faci
n
× 100.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 7 / 41
Tipos de Tabelas
Para varia´veis qualitativas:
• Tabela Simples: Resumo de uma u´nica varia´vel nominal/ordinal em
termo de suas frequeˆncias;
• Tabela de Dupla Entrada: Resumo de duas varia´veis nominais/ordinais
em termo de suas frequeˆncias cruzadas.
Para varia´veis quantitativas:
• Distribuic¸a˜o de Frequeˆncia Pontual: Resumo de uma u´nica varia´vel
discreta em termo de suas frequeˆncias;
• Distribuic¸a˜o de Frequeˆncia em Classes: Resumo de uma u´nica varia´vel
discreta/cont´ınua em termo de suas frequeˆncias agrupadas.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 8 / 41
Estrutura de Uma Tabela
Tabela X: Cabec¸alho/t´ıtulo da tabela.
Coluna Indicadora Caracter´ısticas Avaliadas
Atributos,
Valores ou Classes Distribuic¸a˜o Frequeˆncias
da Varia´vel
Total*
∗Chamada: o total e´ optativo.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 9 / 41
Exemplos
Tabela 1 : Geˆnero dos 25 in-
div´ıduos entrevistados.
Geˆnero Fi fi fi (%)
Feminino 8 0,32 32
Masculino 17 0,68 68
Total 25 1,00 100
Tabela 2 : Nu´mero de filhos dos 25 indiv´ıduos entrevis-
tados.
No Filhos Fi fi fi (%) Faci faci faci (%)
0 2 0,08 8 2 0,08 8
1 7 0,28 28 9 0,36 36
2 8 0,32 32 17 0,68 68
3 6 0,24 24 23 0,92 92
4 2 0,08 8 25 1,00 100
Total 25 1,00 100 - - -
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 10 / 41
Tabela de Dupla Entrada
Tabela X: Cabec¸alho/t´ıtulo da tabela.
Varia´vel 1
Varia´vel 2
Total Linhas
Atributos da Varia´vel 2
Atributos
da Frequeˆncias Cruzadas
Varia´vel 1
Total Colunas n
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 11 / 41
Exemplos
Tabela 3 : Geˆnero vs. meio de transporte utilizado pe-
los 25 indiv´ıduos entrevistados.
Geˆnero
Meio de Transporte
Total Linhas
C P
Feminino 3 5 8
Masculino 7 10 17
Total Colunas 10 15 25
Tabela 4 : Geˆnero vs. grau de escolaridade dos 25
indiv´ıduos entrevistados.
Geˆnero
Escolaridade
Total Linhas
PG SG TG
Feminino 1 4 3 8
Masculino 7 4 6 17
Total Colunas 8 8 9 25
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 12 / 41
Distribuic¸a˜o de Frequeˆncia em Classes
Agrupar uma varia´vel discreta/cont´ınua em classes pode ser uma al-
ternativa interessante quando muitos diferentes valores forem observados.
Para construir esse tipo de distribuic¸a˜o de frequeˆncia, devemos determinar:
• O nu´mero de classes (k):
− Me´todo emp´ırico: k = √n, se n ≤ 100 ou k = 5 log (n), se
n > 100 (observar o inteiro mais pro´ximo);
− Me´todo de Sturges: k = d1 + 3, 322 log10 (n)e ≈ d1 + log2 (n)e,
em geral para 30 ≤ n ≤ 40;
• A amplitude das classes (h):
h =
AT
k
=
x(max) − x(min)
k
.
A medida AT denota a amplitude total (medida de variabilidade).
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 13 / 41
Distribuic¸a˜o de Frequeˆncia em Classes
Devemos escolher uma configurac¸a˜o para as classes. Sejam os limites lj
(inferior) e Lj (superior) da j − e´sima classe, j = 1, 2, . . . , k , podemos:
• Incluir lj e na˜o incluir Lj =⇒ lj ` Lj ou [lj , Lj);
• Incluir Lj e na˜o incluir lj =⇒ lj a Lj ou (lj , Lj ];
• Incluir lj e Lj =⇒ lj `a Lj ou [lj , Lj ];
• Na˜o incluir lj e Lj =⇒ lj − Lj ou (lj , Lj).
Vale salientar que:
• Pode-se utilizar mais de uma configurac¸a˜o em uma mesma tabela;
• E´ poss´ıvel construir distribuic¸o˜es de frequeˆncias com classes de amplitu-
des distintas. Neste caso, a interpretac¸a˜o deve basear-se na˜o somente
nas frequeˆncias absolutas, mas tambe´m na densidade das classes.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 14 / 41
Exemplos
Para a varia´vel Altura, temos:
k =
√
25 = 5 e h =
1, 92− 1, 57
5
=
0, 35
5
= 0, 07.
Tabela 5 : Altura dos 25 indiv´ıduos entrevistados.
Altura Fj fj(%) Facj facj(%) PMj
1, 57 ` 1, 64 3 12 3 12 1,605
1, 64 ` 1, 71 7 28 10 40 1,675
1, 71 ` 1, 78 7 28 17 68 1,745
1, 78 ` 1, 85 6 24 23 92 1,815
1, 85 `a 1, 92 2 8 25 100 1,885
Total 25 100 - - -
∗PMj = 0, 5(lj + Lj ) representa o ponto me´dio da j − e´sima classe.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 15 / 41
Tipos de Gra´ficos
Um gra´fico basicamente traduz uma tabela por meio de uma figura. Em
relac¸a˜o a` varia´vel de interesse, por meio de um gra´fico devemos ser capazes
de detectar:
• As tendeˆncias e oscilac¸o˜es;
• As eventuais discrepeˆncias.
Os gra´ficos para varia´veis qualitativas sa˜o:
• Gra´fico de Barras/Colunas: Resumo de uma u´nica varia´vel nominal/or-
dinal em termo de suas frequeˆncias;
• Gra´fico Comparativo: Resumo de duas varia´veis nominais/ordinais em
termo de suas frequeˆncias cruzadas (gra´fico de barras/colunas);
• Gra´fico de Setores: Resumo de uma u´nica varia´vel nominal em termo
de suas frequeˆncias.
DAMAT -UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 16 / 41
Tipos de Gra´ficos
Os gra´ficos para varia´veis quantitativas sa˜o:
• Gra´fico de Basto˜es: Resumo de uma u´nica varia´vel discreta em termo
de suas frequeˆncias. Alguns autores convencionam utilizar o gra´fico de
barras/colunas nesse tipo de situac¸a˜o;
• Histograma: Resumo de uma u´nica varia´vel discreta/cont´ınua por meio
de suas frequeˆncias agrupadas;
• Gra´fico de Pontos: Apresentac¸a˜o dos valores de uma ou mais varia´veis
discretas/cont´ınuas por meio de uma linha ligando os pontos observa-
dos.
O gra´fico de linhas e´ amplamente utilizado para apresentar dados ob-
servados ao longo de um determinado per´ıodo de tempo (se´rie temporal).
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 17 / 41
Gra´fico de Barras
1º
 G
ra
u
2º
 G
ra
u
3º
 G
ra
u
Frequência Absoluta
0 5 10 15
Figura 1 : Grau de escolaridade dos 25 indiv´ıduos entrevistados.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 18 / 41
Gra´fico de Colunas
Feminino Masculino
Fr
eq
uê
nc
ia
 A
bs
ol
ut
a
0
5
10
15
20
Figura 2 : Geˆnero dos 25 indiv´ıduos entrevistados.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 19 / 41
Gra´fico Comparativo
1º Grau 2º Grau 3º Grau
Fr
eq
uê
nc
ia
 A
bs
ol
ut
a
0
2
4
6
8
10 Feminino
Masculino
Figura 3 : Geˆnero vs. grau de escolaridade dos 25 indiv´ıduos entrevistados.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 20 / 41
Gra´fico de Setores
Para construir um gra´fico
de setores, devemos, primei-
ramente, calcular os aˆngulos,
θi , i = 1, 2, . . . , p, associa-
dos aos poss´ıveis resultados da
varia´vel de interesse. Estes
aˆngulos podem ser obtidos a
partir da seguinte relac¸a˜o:
θi =
360oFi
n
.
No exemplo a seguir, te-
mos que θ1 = 144
o (MT Cole-
tivo) e θ2 = 360
o− θ1 = 216o
(MT Pro´prio).
Coletivo
Próprio
Figura 4 : Meio de transporte utilizado pe-
los 25 indiv´ıduos entrevistados.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 21 / 41
Gra´fico de Basto˜es (Colunas)
0 1 2 3 4
Fr
eq
uê
nc
ia
 A
bs
ol
ut
a
0
2
4
6
8
10
Figura 5 : Nu´mero de filhos dos 25 indiv´ıduos entrevistados.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 22 / 41
Histograma
Fr
eq
uê
nc
ia
 A
bs
ol
ut
a
1.5 1.6 1.7 1.8 1.9 2.0
0
1
2
3
4
5
6
7
Figura 6 : Distribuic¸a˜o da altura dos 25 indiv´ıduos entrevistados.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 23 / 41
Gra´fico de Pontos
Tabela 6 : Lucro de um banco
durante os anos de 2002 a 2013.
Ano Lucro (Por Milha˜o)
2002 40
2003 42
2004 42
2005 45
2006 48
2007 53
2008 51
2009 51
2010 56
2011 60
2012 55
2013 68
Total 611
40
45
50
55
60
65
70
Lu
cr
o
20
02
20
03
20
04
20
05
20
06
20
07
20
08
20
09
20
10
20
11
20
12
20
13
Figura 7 : Lucro de um banco durante os
anos de 2002 a 2013.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 24 / 41
Medidas Descritivas
Uma outra maneira de se resumir dados de natureza quantitativa, ale´m
de tabelas e gra´ficos, e´ apresenta´-los na forma de medidas descritivas.
• Para dados populacionais, essas medidas sa˜o denominadas paraˆmetros
e sa˜o usualmente denotadas por letras gregas (θ, µ, σ, etc.);
• Para dados amostrais, essas medidas sa˜o denominadas estat´ısticas ou
estimadores.
Podemos classificar as medidas descritivas da seguinte maneira:
• Medidas de posic¸a˜o (tendeˆncia central e separatrizes);
• Medidas de dispersa˜o (ou variabilidade);
• Medidas de assimetria e de curtose.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 25 / 41
Medidas de Tendeˆncia Central
As medidas de tendeˆncia central sa˜o assim denominadas por indicarem
um ponto em torno do qual os dados tendem a se concentrar. As principais
medidas que estudaremos sa˜o:
• Me´dia aritme´tica;
• Mediana;
• Moda.
Daqui em diante, vamos convencionar que:
• A varia´vel aleato´ria de interesse sera´ representada por X (maiu´sculo);
• Uma particular realizac¸a˜o da varia´vel aleato´ria X sera´ denotada por x,
ou seja, observou-se o evento (X = x);
• Um conjunto de observac¸o˜es da varia´vel aleato´ria X sera´ denotado pelo
vetor x = (x1, x2, . . . , xt), t = n ou N, n ≤ N.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 26 / 41
Me´dia Aritme´tica
Seja (x1, x2, . . . , xn) um conjunto de n observac¸o˜es provenientes de uma
varia´vel aleato´ria quantitativa X. A me´dia amostral aritme´tica desta varia´vel
e´ definida por:
x =
1
n
n∑
i=1
xi .
Se todos os elementos da populac¸a˜o (em relac¸a˜o a caracter´ıstica X)
forem observados, enta˜o:
µ =
1
N
N∑
i=1
xi ,
em que µ representa o paraˆmetro de me´dia aritme´tica populacional.
Obs. A me´dia aritme´tica e´ uma das medidas descritivas mais utilizadas
na pra´tica para o resumo de dados quantitativos.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 27 / 41
Me´dia Aritme´tica
Propriedades:
• A me´dia aritme´tica depende de todos os valores observados;
• A me´dia artime´tica e´ u´nica em um determinado conjunto de dados e
nem sempre existe;
• A me´dia aritme´tica e´ afetada por valores extremos.
Obs. Em conjuntos de dados com valores muito discrepantes, a me´dia
aritme´tica pode na˜o ser uma boa representante para o mesmo.
Exemplo: Suponha que um estudo foi realizado com servidores da
UTFPR. Seja X - nu´mero de filhos dos servidores da UTFPR. Considere
x = (3, 2, 0, 4, 1, 3, 2, 1) o nu´mero de filhos de n = 8 servidores aleatoria-
mente selecionados. Neste caso, temos:
x =
1
8
(3 + 2 + 0 + 4 + 1 + 3 + 2 + 1) =
1
8
16 = 2 filhos.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 28 / 41
Mediana
• O que ocorreria no exemplo anterior se inclu´ıssemos mais um servidor
na amostra com 11 filhos? Haveria uma inflac¸a˜o de 50% na me´dia!
• Neste cena´rio, faz-se necessa´rio utilizar medidas que na˜o sejam afetadas
por valores extremos na amostra (ou populac¸a˜o), como a mediana.
A mediana e´ o valor que ocupa a posic¸a˜o central do conjunto ordenado
de observac¸o˜es de uma varia´vel X, dividindo-o em duas partes iguais.
Exemplo: Considere novamente o exemplo anterior. Enta˜o:
Dados Observados
x1 x2 x3 x4 x5 x6 x7 x8
3 2 0 4 1 3 2 1
Dados Ordenados
x(1) x(2) x(3) x(4) x(5) x(6) x(7) x(8)
0 1 1 2 2 3 3 4
Neste caso:
Md =
x(4) + x(5)
2
=
2 + 2
2
= 2 filhos.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 29 / 41
Mediana
• Repetindo o exerc´ıcio de incluir, na amostra, o servidor com 11 filhos,
notaremos que a mediana na˜o se altera!
Genericamente, podemos obter a mediana de um determinado conjunto
de dados a partir do seguinte procedimento:
1) Ordenar o conjunto de dados;
2) Determinar a posic¸a˜o (q) que a mediana ocupa:
q = 0, 5(n + 1).
3) Obter a mediana (Md) da seguinte forma:
Md = x(α) + β[x(α+1) − x(α)],
em que α representa a parte inteira e β a parte decimal de q.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 30 / 41
Moda
A medida conhecida como moda representa o poss´ıvel resultado com
maior frequeˆncia (absoluta) dentre os valores observados de uma determi-
nada varia´vel X. Em relac¸a˜o a` moda, um conjunto de dados pode ser:
• Amodal: quando todos os valores observados apresentam a mesma
frequeˆncia absoluta;
• Unimodal: quando a maior frequeˆncia absoluta esta´ associada a um
u´nico valor observado;
• Plurimodal:quando a maior frequeˆncia absoluta esta´ associada a mais
de um valor observado.
Exemplo: Novamente para o exemplo do nu´mero de filhos de 8 ser-
vidores da UTFPR, temos que este conjunto e´ plurimodal (trimodal), uma
vez que os valores 1, 2 e 3 apresentam FA = 3. Note que a inclusa˜o do 9o
servidor, com 11 filhos, na˜o altera a moda do conjunto de dados.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 31 / 41
Medidas Separatrizes
As medidas separatrizes sa˜o aquelas que ocupam posic¸o˜es em um de-
terminado conjunto de dados ordenado.
• Quartis: Dividem o conjunto de dados em 4 partes iguais
(Qj , j = 1, 2, 3);
• Decis: Dividem o conjunto de dados em 10 partes iguais
(Dj , j = 1, 2, . . . , 9);
• Percentis: Dividem o conjunto de dados em 100 partes iguais
(Pj , j = 1, 2, . . . , 99).
Algumas observac¸o˜es importantes:
• As treˆs medidas apresentadas podem ser generalizadas em termos dos
percentis;
• A mediana tambe´m e´ uma medida separatriz (Md = Q2 = D5 = P50).
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 32 / 41
Medidas Separatrizes
Considerando a generalizac¸a˜o em termo dos percentis, podemos ob-
ter qualquer medida separatriz pelo mesmo procedimento utilizado para a
obtenc¸a˜o da mediana, ou seja:
1) Ordenar o conjunto de dados;
2) Determinar a posic¸a˜o (q) que a medida separatriz de interesse ocupa:
q =
j
100
(n + 1), j = 1, 2, . . . , 99.
3) Obter a medida separatriz de interesse (Pj) da seguinte forma:
Pj = x(α) + β[x(α+1) − x(α)],
em que α representa a parte inteira e β a parte decimal de q.
Exemplo: Novamente para o exemplo do nu´mero de filhos de n = 8
servidores da UTFPR, temos que Q1 = P25 = 1 filho e D7 = P70 = 3 filhos.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 33 / 41
Medidas de Dispersa˜o
As medidas de dispersa˜o sa˜o aquelas que visam fornecer o grau de
dispersa˜o (ou variabilidade) de um determinado conjunto de dados, sempre
utilizando como refereˆncia uma medida de tendeˆncia central.
As principais medidas de dispersa˜o que estudaremos sa˜o:
• Amplitude interquart´ılica;
• Desvio me´dio (desvio absoluto);
• Variaˆncia;
• Desvio padra˜o;
• Coeficiente de variac¸a˜o.
Obs. Com excec¸a˜o da primeira, as demais medidas que sera˜o apresen-
tadas sa˜o medidas de dispersa˜o em relac¸a˜o a` me´dia aritme´tica.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 34 / 41
Amplitude Interquart´ılica
A amplitude inter-
quart´ılica e´ uma medida de
dispersa˜o definida por:
AQ = Q3 − Q1.
A partir das quan-
tidades que definem a
AQ podemos construir um
gra´fico conhecido como
boxplot, muito u´til na
identificac¸a˜o de pontos
discrepantes (outliers).
Figura 8 : Exemplo de um boxplot.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 35 / 41
Desvio Me´dio
Seja x a me´dia aritme´tica amostral de um conjunto de observac¸o˜es
(x1, x2, . . . , xn) de uma varia´vel aleato´ria quantitativa X. Independente dos
valores observados e de x , teremos sempre que:
n∑
i=1
(xi − x) = 0.
• A ideia de desvio e´ fundamental para a definic¸a˜o da maioria das medidas
de dispersa˜o;
• Em virtude do citado acima, devemos pensar em alternativas para de-
finir medidas de dispersa˜o baseadas nos desvios.
Como alternativa, podemos definir a medida conhecida como desvio
me´dio (ou absoluto), dado por:
DM =
1
n
n∑
i=1
|xi − x |.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 36 / 41
Variaˆncia e Desvio Padra˜o
Como alternativa ao desvio me´dio, surge a medida de dispersa˜o conhe-
cida como variaˆncia que, para dados amostrais, e´ dada por:
S2 =
1
(n − 1)
n∑
i=1
(xi − x)2,
em que o termo (n − 1) e´ denominado grau de liberdade.
Se todos os elementos da populac¸a˜o (em relac¸a˜o a caracter´ıstica X)
forem observados, enta˜o:
σ2 =
1
N
N∑
i=1
(xi − µ)2,
em que σ2 representa o paraˆmetro de variaˆncia populacional.
• A variaˆncia e´ a medida que fornece o grau de dispersa˜o dos dados em
torno da me´dia, na unidade quadra´tica.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 37 / 41
Coeficiente de Variac¸a˜o
A medida conhecida como coeficiente de variac¸a˜o fornece a variac¸a˜o dos
dados em termos relativos. Para dados amostrais, esta medida e´ dada por:
CVA(%) =
S
x
× 100.
Para dados populacionais, temos:
CVP(%) =
σ
µ
× 100.
• O coeficiente de variac¸a˜o nos fornece uma medida a partir da qual
podemos classificar o conjunto de dados como homogeˆneo ou hete-
rogeˆneo;
• Quanto mais pro´ximo de zero estiver o coeficiente de variac¸a˜o, mais
agrupados esta˜o os dados;
• O crite´rio usual e´ o de classificar como homogeˆneo conjuntos com
CV < 50% e como heterogeˆneo caso contra´rio.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 38 / 41
Exemplo
Considere novamente os dados referentes ao nu´mero de filhos de n = 8
servidores da UTFPR. Sabemos que x = 2 filhos. Logo:
S2 =
1
7
8∑
i=1
(xi − 2)2
=
1
7
[(3− 2)2 + (2− 2)2 + . . .+ (1− 2)2]
=
1
7
12 = 1, 714286 filhos2.
Disto, temos que S =
√
1, 714286 = 1, 309307 filhos. Portanto:
CVA =
1, 309307
2
× 100 = 0, 6546537× 100 = 65, 46537%.
Adicionalmente, temos que DM = 18
8∑
i=1
|xi − 2| = 1 filho.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 39 / 41
Exemplo
Para a amostra com n = 9 servidores da UTFPR, temos que x = 3
filhos. Logo:
S2 =
1
8
9∑
i=1
(xi − 3)2
=
1
8
[(3− 3)2 + (2− 3)2 + . . .+ (11− 3)2]
=
1
8
84 = 10, 5 filhos2.
Disto, temos que S =
√
10, 5 = 3, 24037 filhos. Portanto:
CVA =
3, 24037
3
× 100 = 1, 080123× 100 = 108, 0123%.
Adicionalmente, temos que DM = 19
9∑
i=1
|xi − 2| = 2 filhos.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 40 / 41
Exemplo
A partir das medidas obtidas para a varia´vel nu´mero de filhos em ambas
as amostras de servidores da UTFPR, podemos construir boxplots.
0
2
4
6
8
10
12
N
úm
er
o 
de
 F
ilh
os
(a) n = 8
0
2
4
6
8
10
12
N
úm
er
o 
de
 F
ilh
os
(b) n = 9
Figura 9 : Nu´mero de filhos de servidores da UTFPR.
DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 41 / 41