apostila
139 pág.

apostila


DisciplinaProbabilidade e Estatística11.671 materiais111.961 seguidores
Pré-visualização19 páginas
a diferenc¸a entre as frequ¨e\u2c6ncias da classe modal e da imediatamente
posterior.
Por E trac¸a-se a reta FF \u2032, paralela ao eixo das classes, obtendo assim, os
segmentos EF e EF \u2032, que representam as alturas dos tria\u2c6ngulos ABE e CDE.
37
Figura 2.16: Esquema para obtenc¸a\u2dco da moda pelo me´todo de Czuber
Sendo Li o limite inferior da classe modal, Ls o limite superior e x a dista\u2c6ncia
entre Li e a moda (Mo), verificasse na figura 2.16 que:
Mo = Li+ x (2.19)
Sendo os tria\u2c6ngulos ABE e CDE semelhantes (pois possuem dois a\u2c6ngulos
iguais) tem-se que:
EF
EF \u2032
=
AB
CD
x
c\u2212 x =
\u22061
\u22062
x\u22062 = c\u22061 \u2212 x\u22061
x =
\u22061
\u22061 +\u22062
c (2.20)
Substituindo 2.20 em 2.19 tem-se:
Mo = Li +
\u22061
\u22061 +\u22062
c, (2.21)
em que:
Li e´ o limite inferior da classe modal;
38
\u22061 e´ a diferenc¸a entre a frequ¨e\u2c6ncia da classe modal e da imediatamente
anterior;
\u22062 e´ a diferenc¸a ente a frequ¨e\u2c6ncia da classe modal e da imediatamente
anterior;
c e´ a amplitude da classe modal.
Caracter´\u131sticas e Importa\u2c6ncia
i. Na\u2dco e´ afetada por valores extremos, a na\u2dco ser que estes constituam a classe modal;
ii. E´ uma medida bastante utilizada em Estat´\u131stica Econo\u2c6mica;
iii. Na\u2dco apresenta boas propriedades alge´bricas; d) Maximiza o nu´mero de desvios iguais
a zero.
Propriedades da Moda
i. Somando-se ou subtraindo uma constante a todos os dados, a moda fica somada ou
subtra´\u131da da mesma constante.
x\u2217 = x± k \u21d2Mo\u2217 = Mo± k
ii. Multiplicando-se todos os dados por uma constante k, a moda fica multiplicada por
esta constante.
x\u2217 = kx\u21d2Mo\u2217 = kMo
2.2.1.4 Separatrizes (Quantis)
Quartis
Os quartis separam um conjunto de dados ordenados (Rol) em quatro partes
iguais. Assim:
Q1 e´ o 1
o quartil, deixa 25% dos elementos abaixo dele;
39
Q2 = 2
o quartil, coincide com a mediana, deixa 50% dos elementos abaixo
dele;
Q3 = 3
o quartil, deixa 75% dos elementos abaixo dele.
Determinac¸a\u2dco de Q1
Q1 = LiQ1 +
[ n
4
\u2212 FaQ1
FQ1
]
c (2.22)
em que:
LiQ1 e´ o limite inferior da classe que conte´m Q1;
FaQ1 e´ a frequ¨e\u2c6ncia acumulada das classes anteriores a` classe que conte´m
Q1;
FQ1 e´ a frequ¨e\u2c6ncia da classe que conte´m Q1 e
c e´ a amplitude da classe que conte´m Q1.
Determinac¸a\u2dco de Q3
Q3 = LiQ3 +
[ 3n
4
\u2212 FaQ3
FQ3
]
c (2.23)
em que:
LiQ3 e´ o limite inferior da classe que conte´m Q3;
FaQ3 e´ a frequ¨e\u2c6ncia acumulada das classes anteriores a` classe que conte´m
Q3;
FQ3 e´ a frequ¨e\u2c6ncia da classe que conte´m Q3 e
c e´ a amplitude da classe que conte´m Q3.
Decis
Sa\u2dco valores que dividem uma se´rie de dados ordenados em dez partes iguais.
O i\u2212 e´simo decil, (i = 1, 2, . . . , 10), de um conjunto de observac¸o\u2dces organizadas na forma
de uma distribuic¸a\u2dco de frequ¨e\u2c6ncias pode ser obtido por:
Di = LiDi +
[ in
10
\u2212 FaDi
FDi
]
c (2.24)
em que:
40
LiDi e´ o limite inferior da classe que conte´m Di;
FaDi e´ a frequ¨e\u2c6ncia acumulada das classes anteriores a` classe que conte´m
Di;
FDi e´ a frequ¨e\u2c6ncia da classe que conte´m Di e
c e´ a amplitude da classe que conte´m Di.
Percentis
Sa\u2dco valores que dividem uma se´rie de dados ordenados em 100 partes iguais.
Dada uma distribuic¸a\u2dco de frequ¨e\u2c6ncias, o valor do i \u2212 e´simo percentil, (i = 1, 2, . . . , 10) e´
obtido por:
Pi = LiPi +
[ in
100
\u2212 FaPi
FPi
]
c (2.25)
em que:
LiPi e´ o limite inferior da classe que conte´m Pi;
FaPi e´ a frequ¨e\u2c6ncia acumulada das classes anteriores a` classe que conte´m Pi;
FPi e´ a frequ¨e\u2c6ncia da classe que conte´m Pi e
c e´ a amplitude da classe que conte´m Pi.
Relac¸o\u2dces emp´\u131ricas entre me´dia, mediana, moda e as distribuic¸o\u2dces de dados:
Distribuic¸a\u2dco Relac¸a\u2dco
Sime´trica x¯ = Md = Mo
Assime´trica a direita (assime´trica positiva) x¯ > Md > Mo
Assime´trica a esquerda (assime´trica negativa) x¯ < Md < Mo
2.2.2 Medidas de disperssa\u2dco
A utilizac¸a\u2dco de uma medida de posic¸a\u2dco para substituir um conjunto de dados
e´ insuficiente para sintetizar a informac¸a\u2dco nele contida, como pode ser observado a seguir:
A = 10, 10, 10, 10, 10, 10, 10
B = 1, 8,10, 10, 11, 12, 18
C = 1, 2, 10, 10, 10, 13, 24
41
Calculando a me´dia (eq 2.10), mediana (eq 2.16 e moda desses tre\u2c6s conjuntos
tem-se:
x¯A = x¯B = x¯c = 10 unidades
MdA = MdB = Mdc = 10 unidades
MoA = MoB = Moc = 10 unidades
Assim, verifica-se que os tre\u2c6s conjuntos (A,B,C) apresentam me´dias, me-
dianas e modas iguais a 10unidades, pore´m observando-os, percebe-se que eles sa\u2dco bem
diferentes entre si, pois enquanto no conjunto A os dados sa\u2dco todos iguais, os demais
apresentam uma certa variac¸a\u2dco, sendo que esta variac¸a\u2dco e´ maior no conjunto C. Deste
modo, para sintetizarmos eficientemente a informac¸a\u2dco de um conjunto de dados temos que
associar a` medida de posic¸a\u2dco utilizada, uma medida de dispersa\u2dco, que vai informar como
estes dados se comportam em torno da medida de posic¸a\u2dco em questa\u2dco.
2.2.2.1 Amplitude Total (A)
A amplitude total e´ a diferenc¸a entre o maior e o menor valor observado
A = MVO \u2212mvo, (2.26)
em que:
MVO e´ o maior valor observado, e
mvo e´ o menor valor observado.
Para os conjuntos A,B e C tem-se:
AA = 10\u2212 10 = 0 unidades
AB = 18\u2212 1 = 17 unidades e
AC = 24\u2212 1 = 23 unidades.
Nota-se, enta\u2dco, que a amplitude do conjunto C e´ bem maior que nos demais.
A amplitude e´ uma medida de dispersa\u2dco fa´cil de ser calculada e e´ certamente a maneira
mais natural e comumente utilizada para descrever a variabilidade de um conjunto de
42
dados. Pore´m sua interpretac¸a\u2dco depende do nu´mero de observac¸o\u2dces, mas, no seu ca´lculo
na\u2dco sa\u2dco consideradas todas as observac¸o\u2dces, pois so´ utiliza os valores extremos.
2.2.2.2 Varia\u2c6ncia e desvio padra\u2dco
Uma boa medida de dispersa\u2dco deve basear-se em todos os dados, ser facil-
mente calcula´vel e compreens´\u131vel, ale´m de prestar-se bem ao tratamento alge´brico. Uma
medida com todas estas caracter´\u131sticas e´ obtida considerando-se os desvios de cada ob-
servac¸a\u2dco em relac¸a\u2dco a me´dia (chamados erros) :
ei = xi \u2212 x¯ (2.27)
Para obter um u´nico nu´mero que represente a dispersa\u2dco dos dados, pensou-se inicialmente
em obter-se a me´dia destes desvios, mas deve-se lembrar que a soma dos desvios de um
conjunto de dados em relac¸a\u2dco a sua me´dia e´ nula. Enta\u2dco, optou-se por utilizar a soma
dos quadrados dos desvios, pois elevando-se cada desvio ao quadrado elimina-se o sinal
negativo, que estava trazendo complicac¸o\u2dces, e dividindo-se a soma dos quadrados dos
desvios pelo nu´mero de observac¸o\u2dces obte´m-se a varia\u2c6ncia populacional que e´ uma medida
quantitativa da dispersa\u2dco de um conjunto de dados entorno da sua me´dia, ale´m do fato,
de esta soma de quadrados de desvios ser m\u131´nima, como ja´ foi visto em propriedades da
me´dia.
V (x) = \u3c32 =
SQD
N
=
1
N
n\u2211
i=1
(xi \u2212 x¯)2 (2.28)
Para os exemplos anteriores tem-se:
\u3c32A =
(10\u2212 10)2 + (10\u2212 10)2 + · · ·+ (10\u2212 10)2
7
= 0 unidades2
\u3c32B =
(1\u2212 10)2 + (8\u2212 10)2 + · · ·+ (18\u2212 10)2
7
= 22 unidades2
\u3c32A =
(1\u2212 10)2 + (2\u2212 10)2 + · · ·+ (24\u2212 10)2
7
= 50 unidades2
Obs. Quando estiver trabalhando com amostras, a varia\u2c6ncia e´ dada pela
soma dos quadrados dos desvios dividida por n \u2212 1 (nu´mero de observac¸o\u2dces menos um)
43
que e´ denominado graus de liberdade. Assim:
s2 =
SQD
n\u2212 1 =
1
n\u2212 1
n\u2211
i=1
(xi \u2212 x¯)2 (2.29)
Formulas computacionais para o ca´lculo da varia\u2c6ncia
\u3c32 =
1
N
[
n\u2211
i=1
x2 \u2212 (
\u2211n
i=1 x)
2
N
]
(2.30)
s2 =
1
n\u2212 1
[
n\u2211
i=1
x2 \u2212 (
\u2211n
i=1 x)
2
n
]
(2.31)
prova:
SQD =
n\u2211
i=1
(xi \u2212 x¯)2
=
n\u2211
i=1
(x2i \u2212 2x¯xi + x¯2)
=
n\u2211
i=1
x2i \u2212 2x¯
n\u2211
i=1
xi + nx¯
2
=
n\u2211
i=1
x2i \u2212 2
\u2211n
i=1 xi
n
n\u2211
i=1
xi + n
[\u2211n