A maior rede de estudos do Brasil

Grátis
600 pág.
Hidrologia Estatística - Naghettini

Pré-visualização | Página 18 de 50

seria observado caso o coeficiente g determinasse um histograma com
assimetria negativa. Caso os desvios positivos e negativos se equivalessem, o
coeficiente g teria valor nulo (ou próximo de zero) e as 3 medidas de tendência
central tenderiam a se concentrar em um único valor de X. O coeficiente de
assimetria é um número limitado; de fato, a despeito de quão positivos ou negativos
sejam os desvios em relação à média, é válida a inequação 2�� Ng .
As séries hidrológicas referentes a eventos máximos, em geral, possuem
coeficientes de assimetria positivos. Essa constatação é particularmente verdadeira
para as séries de vazões máximas anuais. De fato, para tais séries, há uma grande
concentração de valores não muito inferiores, ou não muito superiores, à cheia
média anual, que, em geral, correspondem aos níveis d’água contidos pelo leito
menor da seção fluvial. Entretanto, a rara combinação de condições
hidrometeorológicas excepcionais e de elevado teor de umidade do solo pode
determinar a ocorrência de uma grande enchente, com vazão máxima muitas vezes
superior ao valor modal. Bastam apenas algumas ocorrências de tais grandes
enchentes para determinar a forma assimétrica do polígono de freqüências das
vazões máximas anuais e, conseqüentemente, valores positivos para o coeficiente
g. Do exposto, é certo concluir que a prescrição de modelos matemáticos
positivamente assimétricos para as funções densidade de probabilidade da
população explica-se pelo mecanismo de formação das enchentes de um rio.
Vale ressalvar, entretanto, que o coeficiente g, por não ser uma medida resistente
e, conseqüentemente, ser muito sensível à presença de extremos em amostras de
tamanho reduzido, não deve constituir um balizador único ou inequívoco para a
prescrição de modelos distributivos positivamente assimétricos.
� � � �
� �
3
1
3
21 s
xx
NN
N
g
N
i
i∑
�
�
��
�
HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
37
Coeficiente de Curtose
Uma medida de quão pontiagudo ou achatado é o histograma (ou o polígono de
freqüências) em torno da média amostral, pode ser calculada pelo coeficiente de
curtose. Esse número adimensional é formalmente definido por
 (2.14)
Por tratar-se de um coeficiente cuja base de cálculo é a soma das quartas potências
dos desvios em relação à média, a amostra deve ser de tamanho suficientemente
grande, digamos 200�N , para produzir estimativas confiáveis do grau de
achatamento da correspondente função de distribuição de freqüências. O
coeficiente de curtose possui maior relevância para distribuições aproximadamente
simétricas e também é um indicador do chamado peso relativo das caudas de
tais distribuições. Com efeito, como o valor do coeficiente k indica quão
aglomerados estão os pontos amostrais em torno da média, tem-se também a
noção da distribuição dos valores muito distantes daquele valor central e, por
conseguinte, das freqüências que se concentram nas caudas inferior e superior.
Às vezes, subtrai-se o valor 3 da equação 2.14 para estabelecer o coeficiente de
excesso de curtose ke, em relação a uma distribuição padrão perfeitamente
simétrica cujo valor de k é igual a 3. Nesse caso, se ke= 0, a distribuição é dita
mesocúrtica; se ke< 0, é leptocúrtica; e se ke> 0, é platicúrtica. A Figura 2.8
ilustra esquematicamente as situações mencionadas.
� � � � � �
� �
4
1
4
2
321 s
xx
NNN
N
k
N
i
i∑
�
�
���
�
Figura 2.8 – Categorização das distribuições de freqüências com respeito à curtose
HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
38
Em se tratando de séries hidrológicas, com amostras típicas de tamanho muito
limitado, as estatísticas descritivas mais freqüentemente usadas, e consideradas
representativas da forma do polígono de freqüências, são a média, o desvio padrão
e o coeficiente de assimetria. De fato, essas estatísticas oferecem um sumário
numérico conciso da informação contida em uma amostra. A título de exemplo,
apresenta-se na Tabela 2.4 o cálculo das principais estatísticas descritivas das
vazões médias anuais do Rio Paraopeba em Ponte Nova do Paraopeba, listadas
na Tabela 2.2. Os resultados da Tabela 2.4 mostram que a moda é inferior à
mediana, a qual, por sua vez, é menor do que a média, indicando, assim, uma
assimetria positiva. Tal fato é comprovado pelo exame da Figura 2.3 e pelo
coeficiente de assimetria amostral positivo de 0,808. Embora a amostra contenha
apenas 62 observações, o coeficiente de excesso de curtose sugere uma
distribuição platicúrtica, ou seja, relativamente menos pontiaguda em torno do
valor central.
2.3 – Métodos Exploratórios
Tukey (1977) cunhou a denominação ‘análise exploratória de dados’, tradução
livre da terminologia de língua inglesa ‘EDA - exploratory data analysis’, para
identificar uma coleção de técnicas quantitativas e gráficas de exame e interpretação
x
Tabela 2.4 – Estatísticas descritivas das vazões médias anuais do Rio Paraopeba
em Ponte Nova do Paraopeba – Período 1938-1999
Estatística Amostral Notação Valor
Média
Moda
Mediana
Média Harmônica
Média Geométrica
Amplitude
Primeiro Quartil
Terceiro Quartil
Ampl. Inter-Quartis
Desvio Abs. Médio
Variância
Desvio Padrão
Coef. de Variação
Coef. de Assimetria
Coef. de Curtose
Excesso de Curtose
xmo
xmd
A
Q1
Q3
AIQ
d
s2
s
CV
g
k
86,105
80
82,7
79,482
82,726
123,3
68,2
99,1
30,9
19,380
623,008
24,960
0,290
0,808
3,857
0,857
Unidades Cálculo
x m3/s
m3/s
m3/s
m3/s
m3/s
m3/s
m3/s
m3/s
m3/s
m3/s
(m3/s)2
m3/s
Adimensional
Adimensional
Adimensional
Adimensional
Equação 2.2
Polígono Freqüências
Equação 2.7
Equação 2.5
Equação 2.6
(Máximo-Mínimo)
Eq. 2.7 (1a metade da série)
Eq. 2.7 (2a metade da série)
(Q3-Q1)
Equação 2.8
Equação 2.10
Equação 2.11
Equação 2.13
Equação 2.14
(k-3)
xs
xh
ke
HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
39
de um conjunto de observações de uma variável aleatória, sem a preocupação
prévia de formular premissas ou modelos matemáticos. A abordagem EDA baseia-
se na idéia de que os dados revelam, por si mesmos, sua estrutura subjacente.
Entre as técnicas gráficas propostas pela abordagem EDA, destaca-se o diagrama
box plot, conhecido também pela denominação desenho esquemático, e o gráfico
ramo-e-folha, tradução livre de ‘stem-and-leaf’.
2.3.1 – O diagrama Box Plot
O diagrama box plot consiste em um retângulo definido pelo primeiro e pelo
terceiro quartis, contendo a mediana em seu interior, tal como ilustrado na Figura
2.9, relativa às vazões médias anuais do Rio Paraopeba em Ponte Nova do
Paraopeba. A partir do lado superior do retângulo, traça-se uma linha até o ponto
que não exceda (Q3+1,5AIQ), considerado limite superior para a identificação de
ouliers. De modo análogo, traça-se outra linha a partir do lado inferior do retângulo
até o limite dado por (Q1-1,5AIQ). As observações que estiverem acima ou abaixo
desses limites são identificadas no diagrama e consideradas outliers ou valores
atípicos. Para a construção dos diagramas do tipo box plot, existem outras
alternativas, tais como estender as linhas verticais até os pontos de máximo e
mínimo, os quais são assinalados no gráfico por barras horizontais; nesse caso, o
diagrama recebe a denominação de box & whisker.
Os diagramas do tipo box plot são muito úteis por permitirem uma visão geral do
valor central, da dispersão, da assimetria, das caudas e de eventuais pontos
amostrais discordantes. O valor central é dado pela mediana e a dispersão pela
amplitude inter-quartis. A simetria ou assimetria da distribuição pode ser visualizada
pelas posições relativas de Q1, Q2 e Q3. Pode-se ter