Buscar

17 - Hidrologia_Tucci (Cap17)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

658
12-U. S. Army. Corps of Enginners. 1976. Guidelines for f/(I/'" ,I,
reduction. Sacramento.
13-WATER RESOURCES COUNCIL, 1971. Regu/ation of flood ha
reduce f100d tosses. Washington. Não paginado.
Capítulo 17
HIDROLOGIA ESTATÍSTICA
Robin T. Clarke
11••11 de Hldrologia Estatística
1IIIIIIhlnde Hidrológica
iclo da água, tanto nos aspectos hidrol6gicos como nos da
as inferências estatísticas mais freqüentes sobre seqüências
Iradas, em intervalos discretos de tempo, são ilustradas a
liiJljl 1/.1 são apresentadas duas seqüências de cheias anuais (vazão
iltdll tio período de 1934-1984) para dois locais da bacia do rio
!lI" ('llllulna. Brasil). Estes dados são dos postos do rio Hercílio
1/114 1111111111 de 3314 km2) e no próprio Itajaí em Apiúna (9242 km2).
I IjllGuI,llu, um fato comum nas séries hidrol6gicas, interrompem a
I illlllllH (Ntlcll semelhante das duas séries é que as cheias extremas
11 1111111 dos dois anos de registro (1983 e 1984).
17.3 são apresentadas as vazões médias mensais para os
111111o p"ru os últimos 5 anos de registro da série, para um posto \
111 11Ihutl{l'io do rio Uruguai, rio Lavatudo em Fazenda Mineira
I11I ~ 1112). Enquanto existe alguma evidência de um ciclo anual, com
il1lld I,\wlolldn para ser menor nos meses de novembro a janeiro, existe
Iilltlllthull) do ano para ano. O abastecimento de água que utiliza
1111'1'"1'11111 considerar esta grande variabilidade, para evitar
1111 ulullltL'clmcnto.
Ir/ •• 1 .!'to upresen tadas seqüências de medições de radiação solar,
II li, 1lIlllpN'lllltrllS do bulbo úmido e seco e velocidade do vento e
I I 11111 1"\1 (I/dl) do 24 horas em novembro de 1990, registrado por uma
I1 11111'11. 11111' l'ldlldc de Manaus, Amazonas. A seqüência é parte de um
lillllllll d" tllllloH horltrios de vários unos. colctados com o objetivo de
j. IIIII~II dI' 11ll(l1~111 dentro du Al1lnzÔnin C como O clima é afetado pela
I 11. dndfl/i dt' t'lullllçl\o IIp rt..'s1.'11lU 111, (;111 pnrticulur, "mil clara
li,iill\ 11/11 ""I~ nrl tllIH 11m'lI II \1111I1 l'IllIldlldl"l.
660 Hidrologl
Tabela 17.1. Vazões máximas diárias anuais, em m3js, de Ibirama (ba
de 3314 km2) no rio Hercílio e Apiúna (bacia de 9242 km2) no rio Itajaí elll
S. Catarina, para o período de 1934 a 1984.
Anos Ibirama Apiuna Anos Ibirama Apiuna
1934 ,.. 1111 1960 487 1240
1935 1342 1914 1961 897 2160
1936 625 1507 1962 582 1550
1937 619 950 1963 510 1750
1938 797 1111 1964 ,.. 648
1939 1250 1742 1965 708 1460
1940 271 1033 1966 998 1930
1941 263 918 1967 477 727
1942 566 881 1968 298 562
1943 649 1960 1969 872 1730
1944 236 495 1970 483 1020
1945 474 566 1971 1040 2030
1946 763 1280 1972 1010 2210
1947 592 1100 1973 1240 2310
1948 981 2250 1974 697 951
1949 438 702 1975 1406 2760
1950 2!H 1680 1976 801 1575
1951 556 909 1977 741 1640
1952 393 1620 1978 1002 2156
1953 726 1890 1979 1090 1847
1954 897 ,.. 1980 ,.. 3086
1955 969 3090 1981 589 927
1956 566 1220 1982 490 1539
1957 1300 936 1983 2475 4327
1958 526 1984 2125 4314
1959 520
l lhlrologia Estatística 661
111110111 17.2. Vazão média mensal, em m3/s, para o rio Lavatudo em Fazenda
{hlcira (bacia de 1141 km2). Primeiros 5 anos de registro.
Mês Ano 1 Ano 2 Ano 3 Ano 4 Ano 5
Janeiro 1,83 13,90 0,95 32,17 9,87
Fevereiro 3,03 4,99 27,09 29,75 24,21
Março 3,15 8,21 4,57 16,06 10,16
Abril 2,16 3,15 2,58 7;20 2,78
Maio 12,28 1,70 1,60 8,18 21,26
Junho 33,36 16,55 3,55 78,18 19,51
Julho 34,38 11,87 5,73 50,46 20,22
Agosto 53,69 4,39 10,84 22,99 18,67
Setembro 43,52 6,83 22,12 9,02 40,38
Outubro 13,10 4,43 10,29 10,46 22,09
Novembro 7,44 9,91 3,90 . 3,51 10,31
Dezebro 4,83 1,27 4,14 6,07 24,41
111111 111 17.3. Vazão média mensal, em m3/s, para o rio Lavatudo em Fazenda
11111'1, II (bacia de 1147 km2). Últimos 5 anos de registro.
Mês I Ano 45 Ano 46 Ano 47 Ano 48 Ano 49
5,95 13,40 34,53 15,82 45,78, <,
'.0,60 9,57 37,85 15,68 31,56
26,<0 3,38 8,59 15,12 10,59
27,60 21,78 52,66 46,40 21,26
18,20 24,10 !18,90 48,2.5 34,77
25,60 18,10 37,01 35,18 7,10
16,90 16,80 39,88 17,84 23,00
24,50 17,90 50,32 5,57 49,68
23,60 26,00 32,05 45,21 90,77
26,30 30,70 69,30 17.76 26,46
24,00 63,00 I'J9,99 7,20 9,32
4,83 28,20 13,72 9,79 9,14
662 Hídrologia
Tabela 17.4. Registros de dados meteorol6gicos obtidos por estação automãtlou
em Manaus para um dia de novembro de 1990. Os dados são totais ou média
horárias, calculadas por medições com intervalo de 10 segundos. As horas
referem ao horário de Greenwich.
SolR NetR Wet Dry Wspeed Wdir
-2,0 -26,9 23,0 23,5 0,2 80,5
-1,7 -19,,1 23,2 23,7 0,4 64,9
-1,8 -2,1 23,1 23,4 0,2 58,5
-1,2 -13,6 23,2 23,5 0,0 57,6
-1,4 -13,6 23,1 23,2 0,0 51,7
-0,8 -9,6 23,3 23,4 0,0 181,4
-0,4 -7,6 23,4 23,6 0,1 135,8
-0,9 -10,2 23,2 23,4 0,1 129,5
-1,1 -11,3 23,1 23,2 0,0 65,7
4,5 -4,0 23,3 23,4 0,0 80,2
58,0 30,3 23,7 23,9 0,0 134,2
128,4 76,8 24,0 24,7 0,1 74,2
289,7 186,4 24,4 26,0 0,3 87,8
639,9 424,5 25,1 28,2 0,7 97,7
542,0 355,7 25,5 29,1 0,7 93,2
508,8 333,6 25,5 29,7 0,9 72,8
695,1 455,2 25,6 30,8 1,0 56,3
682,8 442,2 25,7 31,7 0,8 91,9
520,6 330,5 25,6 31,7 0,9 59,5
394,3 235,5 25,7 31,8 0,5 78,0
207,0 92,5 25,3 31,2 0,2 94,7
29,8 -24,4 24,8 29,5 0,0 87,1
-2,4 -42,7 24,4 28,5 0,3 88,8
-2,4 -42,2 24,4 28,0 0,3 97,2
SolR -radiação solar em Watts/m2; NetR- radiação
efetiva em Watts/m2; Wet - temperatura do bulbo
úmido em graus Celsius; Dry -temperatura do
bulbo seco em graus Celsius; Wspeed: velocidade
do vento em m/s; Wdir-direção do vento em graus.
d) a tabela 17.5 mostra valores de 8 variáveis medidas COl
1984 a outubro de 1987.
observações ostn
I rClIllllnr!cl"dc dI!
llklrologia Estatística 663
,111 cheia foi ordenada de forma decrescente. As outras variáveis seguem a
IIlllHma seqüência.
11(!lola 17.5. Valores de 8 variáveis medidas em cada uma das 30 diferentes
Iltluhontesocorridas no rio Booro-Borotou, Costa do Marfim, Africa do Oeste,
,lIlIlInlc o periodo de Junho de 1984 a Outubro de 1987. A área é de 1,36 km2.-.-11 1\ mês ano fv fp ft fs bf pv pt pi
I ago 1985 11,10 4150 148 1 20,50 82,7 304 80,4
I ago 1987 4,03 1260 566 1 2,06 55,0 20.5 80,2
I set 1987 2,60 1050 189 1 9,11 42,4 275 64,0
ago 1985 1,89 466 394 1 6,75 54,8 431 41,9
) ago 1985 1,78 315 349 1 13,50 45,6 182 47,2
I set 1984 1,73 183 492 2 4,40 57,0 254 35,1
.ago 1985 1,58 570 205 1 12,10 43,4 289 26,0
I jun 1984 1,56 682 201 1 0,19 56,4 200 95,7
\ set 1986 1,30 201 558 2 3,44 40,0 149 32,4, jul 1985 1,25 466 218 1 1,81 54,4 222 38,3
I ago 1987 1,20 115 859 2 7,98 31,2 300 21,7
set 1984 1,13 62 836 2 2,75 41,8 489 21,0
out 1985 1,09 71 884 2 7,08 28,3 * 11,4
I jul 1985 1,04 265 343 1 2,40 33,7 148 35,0
I ago 1987 1,00 66 1041 2 0,45 52,5 327 52,6
set 1985 0,92 119 550 2 20,50 35,6 331 *
~ set 1985 0,88 173 363 1 19,60 24,8 54 43,0
~ ligo 1985 0,85 119 420 2 13,80 32,1 331 31,4
I set 1987 0,84 201 328 1 20,80 19,9 50 28,1, out 1984 0,82 111 479 2 2,06 39,7 153 33,7
~ out 1987 0,79 61 160 2 10,20 22,5 215 19,3
/101 1987 0,79 64 963 2 10,70 20,4 179 25,4\
ou! 1984 0,76 131 445 2 3,13 34,8 279 47,7
oiu 1987 0,69 64 1009 2 11,90 18,9 161 *
) /101 1986 0,66 45 1281 2 2,00 29,4 172 46,6
/leI 1985 0,62 442 114 2 91,00 16,7 207 24,4
I Jun 1987 0,60 136 363 2 0,00 70,1 252 73,7, uno 1987 0,52 24 1273 2 2,32 24,2 256 25,6
Hot 1987 0,51 67 766 2 19,00 14,4 208 15,9
MOI 198G O,SO 18 1513 2 1,56 19,6 149 27,2_.-
• duração d•• chcla
de "use" Olll I!N;
11101'10 em 1lIi111110N:
17.1.2 Modelos Estatísticos
664 Hidrologiu
Todos os quatro exemplos mostram duas características: a) as observaçõ
são ordenadas no tempo; b) as observações, dentro de cada seqüência seguem
uma mesma tendência geral, com considerável flutuação na vizinhança da mesma
Diferente das seqüências matemáticas, onde os pontos caem sobre curva
suaves, as seqüências de observações hidrolégicas mostrampontos espalhado
numa larga amplitude. A seguir serão descritos como os métodos estatístlco
podem ajudar a descrever o comportamento das variáveis hidrolõgicas, como I
flutuação irregular que segue uma tendência.
Para várias aplicações hidrol6gicas é suficiente observar a tendõml
apresentada pela variável plotada (qi), que consiste na soma de ti 1111
componentes: a parte sistemática e a parte aleatória. A parte sistemãtlcn
cornurnente representada pela função f(t), dependente do tempo. Esta fllll\,1I1I
usualmente contém alguns valores fixos, que necessitam ser estimados COIII !til
nos dados disponíveis. Estes valores são denominados de parãmctrus
representado pela letra Grega 8 que pode ter vários componentes, III
8z, ..,8k. Desta forma a função é expressa de maneira mais completa por 1'(1,1)1
onde 8 é um vetar com k componentes.
A parte aleatória representa a flutuação com relação à COmpOIlL'III.
sistemática. usualmente representada pelo símbolo €I ou ar, onde o rlllll,'
indica que este componente também varia com o tempo. Desta forma Cjl, " :I
variável dc interesse, que pode ser cspressa por
qr = f(I;8) + Et (1'/ 1'I
Considerando as simplificações apropriadas sobre €I (discutidas dl'III""
equações como a 17.1 representam uma família de modelos estausticos, 1'1 1111101
família devido ao seguinte: a) a forma precisa da função f(.) ncccH"11I18ii
definida; e b) os valores numéricos do parâmetro a, juntamente COI\IIIIIIfl!
parârnctros que descrevem a variável aleatória €I, ncccssli 11111
especificados. Normalmente, os problemas encontrados na modclancru (~IIIIII("I
de séries hidrológicas incluem o seguinte:
aproprlndu 1111I11liltlI) determinação da forma explícita de f(t;8) rnai
modelo particular;
2) estimativa eficiente dos parâmctros dcsconh
parâmetros envolvidos na estimativa de Ct).
idos () (O 11111111
tipo expresso CIO (17.1) podem rcprescntur.
1111>1:111 17,1 purn () do I Il'I'd 11I \ l'lll 11111111111\
llidrologia Estatística 6CJ5
primeiro momento, por um modelo simples do tipo qr = ~ +€I, onde qt é a cheia
mual no ano t. A parte sistemática do modelo, ~' é um parârnctro,
udcpendente do tempo, o termo aleatório a, que pode ser positivo ou
negativo, representa a flutuação anual com relação ao valor fixo u.
lívtdentemente que se houver mudanças nas bacias ou outros fatores, como
onstrução de barragem que altera a tendência das cheias ao longo do registro
110 cheias, não é apropriado considerar que a parte sistemática é uma
uonstante; análises estatística indicarão se a não-estaciona/idade deste tipo
Importante.
No caso do registro de vazões médias mensais (qt) do o rio Lavatudo,
'prescntada nas tabelas 17.2 e 17.3, será razoável explorar um modelo do tipo
qt = o. + ~1 COS(21t1/12) + ~2 sen (21tt/12) +0 (17.2)
'\
A parte sistemática do modelo não é mais constante, mas depende de t e
uutcm três parâmetros 0., ~l e ~2. Da mesma forma que o anterior, se a
11~l\Ilenciadas médias mensais mudarem ao longo do período, a parte sistemática
11\111 que ser modificada para levar em conta esta nova tendência. Observe que o
uuulclo da equação 17.2 não tem estacionalidade, já que qr varia sazonalmente
111111 relação a um valor fixo 0.. As funções de coseno e seno traduzem uma
IldllÇi'lO cícliea sistemática, observada na sazonalidade do processo
I 1I111~tico.
Nos dados da tabela 17.4 para radiação solar total e efetiva, observa-se
1111 comportamento mais complicado para o componente sistemático. Dentro das
1llllllHcom claridade, a tendência é aproximadamente harmônica, enquanto que
Ihlllultc a noite o componente do tipo da equação 17.1 é mais apropriado.
,. ,.i Modelos estatísticos usando variáveis explicativas
011 exemplos discutidos anteriormente usando os dados das tabelas 17.1 a
t 'lI utlllzaram modelos estatísticos com um componente sistemático
, IIHlllllllldocom o tempo t (qr), Esses modelos descrevem o comportamento de
111\1I vnrlãvcl c não procuram estabelecer o relacionamento entre duas ou mais
,lIivl'ls hídrolégicas. Frcqücnternente é necessário definir este tipo de
I lilillwlluncnto, quando isto ocorre o componente sistemático do modelo incluem
11,lllvt'IRbldrolõgicas. Assim, para explorar o relacionamento entre vazão
1I,Idlll uiensul qt c prcclpltação mensal no mês t, H, ..., a forma geral da
'lfllllln" 1"/,1 éSmodlflcnda para
'11 1'1 f( PI,pl-I, •.. ;O) 'I (', ( 17.:\)
1\ III d
1("
\11111\ 11111'11\
IH, !lI I.", "nu 11
'111111hll 1111(\ 'I'
111111V,tlll ti1111 !l1111
666 Hidrologia
profundidades da precipitação efetiva durante os intervalos t, t-I, .... !oI(O
considerarmos que a bacia, quando saturada, funciona como um sistema linear
e, que qi contém um componente aleatório et, então o modelo relaciona ql c 1'1
da seguinte forma
qt= ho pt + hi pt-l + hz pt-2 + .... hk pt.k+l +et
A parte sistemática do modelo contém agora k parâmetros hí, i =O,l, ..k I
(ordenadas do hidrograma unitário, definido no capítulo 11). Pode
expressar de forma geral o modelo estatístico com variáveis explicativas du
seguinte forma
qr = f( [pr}; [Er}; {si};...; 8) +et
tendo .vários conjuntos de variáveis explicativas [pt ]= [pr, PI_I,
{Et}={Et,Et-l... }; {st} = {St,St-I,... } que, por exemplo, pode repreSl'I111I1
precipitação, evaporação potencial, estado de umidade do solo entre outru
Na fanu1ia de modelos estatísticos contendo variáveis explicativux, 1\
função linear é o tipo mais simples, como na equação 17.4. Seja qual fOI /I
forma da função f(.) as variáveis explicativas podem ser causativas ( 1111
sentido que precipitação e estado de umidade do solo determinam o eSCOUIIH'IIIH
superficial) ou elas podem ser simplesmente variáveis úteis para a estluuulv«
de qt sem, necessariamente, implicar uma relação causativa. Por C)«('llIplll
durante um longo período de recessão, a vazão qr pode ser uma boa indlctuhuu
do valor de qt+l, na falta da precipitação. Portanto, usando um modelo ilu
forma qt+l = e qr + et, qt não é uma variável causativa de ql+1.
17.1.4 O componente aleatório et
Até agora foi mencionado muito pouco sobre as propriedades do t'l, 11111111
considerado como aleatório, contudo o mesmo possui uma distriblll~'nll II
probabilidades. Considerando o seguinte:
a) que o seu valor médio (valor esperado ou Esperança, idcntiflcntlu 1"111
símbolo E) da variável aleatória et é zero, isto é E[el]=O;
b) para a maior parte deste texto consideramos que
independente; ou seja, que a distribuição de pr
P(EtI,et2,Et3,...), para cada conjunto de et fica
111111'111'
111111111
P(erl,et2,et.1, ..) ta P(ell).P(PI2).P(!!1
onde 1'("11) \ tlIRjllhul\'!t(! 1I111fHltml tllJ "11. ANNIIII,Il~'illdll I) 1111111,111 il
( 1 ri, li
(l7A)
(I',
llidrologia Estatística 667
= J.l + et para a vazão média de enchentes da tabela 17.1, a simplificação
de independência estatística implica que nenhuma informação será perdida
em alterar a seqüência no qual os valores de qt são escritos. A
simplificação de independência estatística é muito forte, e a
verificação disso corresponde a uma parte importante do processo de
selecionar um modelo estatístico apropriado, ajustá-Io (estimativa dos
seus parâmetros) e verificar se as simplificações do modelo são válidas
para um conjunto de dados em estudo;
c) ao considerar que {€I} tem a mesma distribução de probabilidade,
admite-se que as distribuições marginais P(etl), P(et2), ..tenham a mesma
forma matemática, com os mesmos parâmetros. No início do estudo de
modelagem é necessário adotar uma distribuição em particular. A análise
deve verificar se a escolha inicial da distribuição é apropriada para os
dados em estudo.
Em resumo, o modelo estatístico tem parâmetros de dois tipos: aqueles
illINltolndoscom a parte sistemática do modelo e aqueles associados com uma
,U.'dhuição de probabilidade em particular que usa um componente aleatório
;1 (
.1.,' Parclmônla na construção de um modelo estatístico
Temsido apresentado que cada modelo estatístico contém alguns
Ittll/1llllltros associados com o seu componente sistemático e outros associados
11111 11 componente aleat6rio. Se formos pródigos no uso de parâmetros, ou seja
""'"Ido um modelo com número de parâmetros igual ao número de dados, veremos
li" 11 modelo se ajusta exatamente aos dados: o componente sistemático passará
1'111 nulos os pontos dos dados. Na prática, contudo, esse modelo terá um
hi"~IIIIlMho muito ruim nas aplicações discutidas no item seguinte.
Um prlncípio cardinal na construção de modelos estatísticos, em
IIltlllIloUl1l como em outras ciências, é que devemos usar o menor número de
I"" IIllIl'h'O/l necessários para descrever adequadamente as características dos
I "li,. Hl'Iscl1ciulmcnte, o modelo é como um resumo de um documento técnico, se
1"'111111 tSum documento longo o mesmo não atinge a sua finalidade. De outro
111, 1111 1111\ modelo cstatísticc falha para descrever características dos dados
11'111 Itlod~ll\dos, O modelo não satisfaz, tanto quanto o resumo do relatório
IIh I' 111\0NlIllllfnz se Ó condensado de tal forma que omite as principais
li' lll'~o., Felizmente, li teoria cstatlstlcu fornece procedimentos
IH'IIIIIII\IIVlll'I(I"C pcunlto I'.lIfullllr, etn muitos cusoe, se Il inclusão de um
1,IlIlr1111 "dlulol)l\1 1\('HlliC'lllllu "I'H'olrtvel Illfmnult;no, j~ lncluídu dentro 11
1111111111jll'llltlllhu c1l' 1111111(1111,
II'II.,IUI~I\II\, 1111 lllllllllll;_1I de 11111 1110114.110 llUnlrllll'lI, 6 11pilllll(JlIII II
668 Hidroloaln
limitar os parâmetros a um número pequeno que adequadamente resuma
características dos dados.
17.1.6 Alguns usos hidrológicos de modelos estatísticos
Tem sido usado o termo construindo para descrever o processo ti
formulação de modelos estatísticos de dados hidro16gicos. Como colocm
tijolos, formulação de modelos é um processo iterativo: iniciando com um
modelo escolhido que, por inspeção gráfica dos dados ou de outra forma, pOlI
representar razoavelmente suas principais características. A sC~lIh I
determina-se onde o modelo falha nas suas intenções; isto é reall:l,11111I
plotando os valores ajustados pelo modelo e comparando com os vnlm
registrados. As discrepâncias entre os valores ajustados e os observados ,lIu
idéia como o modelo escolhido deve ser modificado. Alterando o modelo ti
melhor maneira é possivel continuar o processo iterativo até que nenluuu«
melhora seja encontrada.
Claramente o ajuste de modelos estatísticos aos dados hidrológicos O 11111
processo que exige constantes iterações entre o modelador e o seu cornpuuuhn
Esta iteração traz dois perigos:
- modelagem pode ser um objetivo em si só, o modelador perde o "t1111Id"
prático para o qual o modelo foi originalmente desenvolvido;
- o modelador pode acreditar que seu modelo é a realidade hiuroll'~II),
ao contrário de ser uma grande simplificação de algo multo IIldl
complicado. Em casos extremos, observações de campo do componnuuru
hidrol6gico que não se aproximam das predições do modelo p0(/I'III .11
desconsideradas; mas freqüenternente estas abcrrantes observações "111
realidade, indicando sérias limitações no modelo estatístico.
No restante deste item serão apresentados alguns exemplos
para os quais modelos estatísticos foram usados. Esta lista não
mas serve para introduzir aplicações que serão discutidas ao lon
capítulo.
I lldrologia Estatística 669
1llIl.lrgia.
Usando um modelo da forma qr = J.I. + Et com uma distribuição de
I'wbllbilídade apropriada P(Et) para o componente aleaiõrio Et = qt - J.I., pode-
,\ observar que J.I. é a média anual das enchentes, considerando que E[et]=O.
111111\estimativa Xo da cheia anual com período de retomo T anos pode ser
«híklu pelo seguinte procedimento: 1) estime por procedimentos eficientes os
IIIHRll1ctros da distribuição P(.); 2) determine se a distribuição ajustada
H'plc6cnta adequadamente a seqüência de cheia anuais, se isto não ocorrer,
IIhllllfique para tanto; 3) quando um modelo satisfat6rio for identificado,
",,"Iva a integral
00
J f (q; 9)dq = ltr
x,
(17.7)
IIdll f( ) a função probabilística de qt.
,I liuI pníscs desenvolvidos, registros de enchentes tão longos como os do rio
i10 1111110001 Ibirama e o rio ltajaí em Apiuna são exceções e não uma regra;
I11 411HIque os registros existam por muitos anos, existem falhas que destroem
1111Ihlllllnuldade. Um engenheiro ao projetar um vertedor de uma barragem, ou
I1I1 1111I\loJudorregional ao descobrir que tem uma série pequena de registros
11llilll(vols, necessita explorar se existem registros longos de cheias anuais
I1I outros locais em bacias vizinhas. Se existem registros longos de
11, lu HII)" na vizinhança é possível transferir informação para o local de
1 ou seja, usando estes registros para adicionar informações sobre
1t·IIIMIIOIIldas cheias extremas. Várias possibilidades existem para efetivarI' 1lIllIlIfl.lfOncia:um procedimento é o de usar uma distribuição bivariada
!~1111111U11\ para as enchentes nos dois locais e calcular a distribuição de
h41HIIIIlItllulccondicional para as cheias anuais no local de registro curto,
llll 111011\ Iill enchentes no local de registros longos.
mn que ó ainda mais crítico que o descrito no item b, ocorre onde
(e~!ISIIOSna vizinhança do local de interesse. Um procedimento
670 Hidrolo
registro. é possível estimar as características da cheia (capítulo 15).
d) Planejadores preocupados com o suprimento de água para uso doméstico, ti_li
agrícola. geração de energia ou indústria. necessitam assegurar que 11
suprimento é suficiente e confiável. Isto não significa que este suprimento
nunca deve falhar. mas que a freqüência de falhas é pequena. que a dUrll\,nll
das falhas. quando ocorrerem serão curtas e que a magnitude da falha nno
muito grande. Se a água é retirada do rio. um modelo estatístico ti ••
comportamento do escoamento através do ano fornece uma forma na qU1I111
planejador pode explorar. por simulação, a freqüência na qual as flllh
ocorrem para uma dada regra de retirada.
Com este problema o planejador pode construir um modelo estatístico 1111
tipo da equação 17.2 (provavelmente mais termos harmônicos Nl,.n••
necessários). Dependendo das circunstâncias será necessário o uso de Vlllnl
médias para períodos menores que um mês; e se existem várias altemativns I1
locais de retiradas em diferentes rios. será necessário desenvolver um O!()(ld ••
multivariado que leve em conta a variabilidade sazonal do escoamento CIII 1'1111
local de retirada e forneça alguma tendência para o escoamento aumcnnu
diminuir.
e) Os exemplos prévios analisaram modelos estatísticos do escoamento 1'111
regiões semi-ãridas, o escoamento é esparso e muitas vezes intermitente; 11111
avaliar o potencial de uma região quanto à disponibilidade de preciJlIIII\ftll
para agricultura. não existe. normalmente outra alternativa senão a do II~III'
precipitação diária que é mais facilmente disponível e com séries IOUHI!
Modelos estatísticos, para a ocorrência de precipitação diária e du ""1
total. quando a mesma existe. têm sido desenvolvidos para o cãloul« I1
probabilidades de seqüências de dias secos e úmidos; adotando sirnpllfk-n
razoáveis sobre a capacidade de umidade do solo e taxas de evaporação, III /"
provado que é possível estimar as probabilidades de disponibilidade do 111111
no solo. para um tempo normal de plantio. que garanta o crcscimoum I1
cultura em estudo. Modelos de precipitação deste tipo pertencem II 11I11
importante classe de Modelos Lineares Generalizados (GLMs).
l lhlrõlogia Estatística 671
"""tOS níveis de enchente; ou seja. intervalos que têm uma probabilidade
I'l'I.,{fica do nível da enchente estar contido. O cálculo desses intervalos é
Iillulutunente possível quando um modelo do tipo 17.1 foi ajustado com uma
11I1.ldcração válida sobre o componente aleatório. como especificado no item
I Ik Um intervalo de confiança baseado na verossimilhançapode ser
!\llllndo para O parâmetro do modelo e. e sua região de confiança pode. em
111111, ser usada para derivar os intervalos para a previsão de vazões
I!IlIItIlH,
I l'lldos os exemplos acima referem-se ao planejamento e operação de sistemas
u-oursos hídricos nos seus aspectos quantitativos. discutidos em termos da
uuululngcm do relacionamento entre variáveis hidrol6gicas como qt e tempo. ou
111111ql c variáveis explicativas. Quando à qualidade da água também deve ser
IlIlltll·rada. o número de variáveis resultantes da análise química e biológica
uuulc. Uma importante atividade preliminar é a preparação de um resumo
11'1'11111\(10ás características essenciais de cada variável. Enquanto os olhos
IUIIIII!II0Spodem absorver as características de 10 números, para 100 números é
111111111dlfrcil esta análise, muito menos para 1000. Neste capítulo são
1111111111118as técnicas apropriadas para resumir um grande conjunto de dados.
1111'1IIIudn suas principais características.
I I"'ngramas computacionais para ajuste rápido de modelos estatísticos
l'UH.:tdimentos gráficos é um componente importante no ajuste de modelos
1",U/hl"ll para dados hidrol6gicos. Seguindo o desenvolvimento moderno dos
1111. estausticos de cálculo como GUM. GENSTAT e MAlLAB para uso
t,lIlvlI com computadores pessoais, a análise gráfica tem resultado numa
111111 uíulto mais flexível para exame de dados. O uso de procedimentos
11[11.IlllIl lima participação central nos métodos descritos neste capítulo e
1"111111'"Nfio orientados para familiarizarem-se com os pacotes mencionados.
d~ distribuições estatísticas
~Iluhllo nulo
nsidcrado um modelo simples no qual a variável yt é
yl • Il .•.€I (17.7)
"11I11
li, til t I
IltlllllllOlllo 1I111I\[ólÍ() cl
1111'11'_1 !;() 1111111 qualquer t /I
IliSfllZ " condição
.} 101lIb,II(I" I1I1HI
que ()
r';
672 Hidrologill
simplificação importante, onde yt (e em conseqüência Et) são estatísticament
independentes, todos com a mesma distribuição de probabilidade. A ênfase do
capítulo é sobre a estimativa dos parâmetros do modelo para diferent
distribuições de yt em problemas onde os métodos estatísticos são usados pur
responder questões sobre a freqüência de eventos hidrol6gicos extremos. O
modelo simples (equação 17.7), que não inclui variável explicativa, ou
variáveis que explicam, num maior ou menor grau, como yt varia, é chamado (\
modelo nulo. No modelo nulo, ·cada dado de yt tem o mesmo valor esperado I'
Quando a variável explicativa está incluída, o valor esperado de cadu yl
será diferente, dependendo dos valores das variáveis explicativas xr,
Nos pr6ximos capítulos são apresentados modelos mais complexos ond
componente sistemática ~ do lado direito da equação (17.7) é substituída \1111
formas envolvendo variáveis explicativas. Mais tarde neste capítul
considerado o caso onde ~ é substituído por uma combinação linear ,I
variáveis explicativas. Modelos com as simplificações mencionada
(independência estatística de yr, onde todos os yt têm a mesma' distribulçãu
de probabilidades) são apropriados para um grande número de problcm
hidrol6gicos, particularmente para aqueles em que yt são o maior e o rnCII 11I
valor de um ano hidrol6gico. Assim, neste capítulo, serão descritos mO(\l'11I
estatísticos para vazão máxima anual, vazão mínima anual, precipitação LI1111I1I
e para a precipitação máxima anual de duração de 30 minutos. Observa-se 'I"
vazão total anual pode ser ou não considerada, com scgurnnç
estatísticamente independente de ano para ano. Numa bacia pequena, ti
primeira ordem, com resposta rápida, a vazão total anual segue um rtl"htl
anual e a consideração de independência anual é justificada. Contudo, VlI'f ntl
média anual para uma grande bacia com grande capacidade de armazenamon to 1'111
água subterrânea provavelmente apresentará correlações de ano para IjIlO. I I
modelos apresentados neste capítulo não serão apropriados.
17.2.2 A função de verossimilhança
Para fixar idéias, suponha que yi, y2, ...yN são vazões máxhnuH (1'111
cheias anuais) observadas numa seqüência de anos. Os dados do rio 111\/111 1111
Apiuna (tabela 17.1) são dados típicos desta função. A simplificurnl1 I1
independência é válida, e não existe necessidade para u scqnOnl1111 11,11
contínua, ou seja a ordem das observações não é importante. Se, 00111111111, "
necessário em alguma fase do estudo verificar se a resposta da bucln 111111111
mudar ao longo do registro, talvez como conseqüência do uso dll te 11I1I I'Il1nll
ordem na qual as observações ocorreram será crltlcn pnrn 1\ 1111di
estatística.
Considere que 8 dlstrlbuição de probnbilidU(I ...•
f(y;O), onde O cS um vetor O(llltClltlO
nonuahncntc l!olfl nu 11~N.1\ (1IIIIIllhll'll
l lhlrologia Estatística 673
que por definição o valor esperado do operador E[.] : fica
00
E[ytl = J f(y;9)dy = ~ (17.8)
-00
111111" u integral será função dos parâmetros 9. Como yt é estatísticamente
111IIt'pondente, a probabilidade de obter as observações yt é
f(Y1;9).f(Y2;9) .... f(YN;9)dY1.dY2 .... dYN (17.9)
1I1IIIndo que yr, y2, ... yN é uma amostra aleat6ria de uma população
11111111111. Conhecida as observações yr, a função de verossimilhança
III,yl, ...yN) é definida por
N
L(9;Y1 ,...YN) = n f(Yt;9)
t=1
(17.10)
111, u função de verossimilhança é proporcional a probabilidade de obter
111\(1115 observações, considerada como uma função dos parâmetros
I",'"uhcoidos e. A função de verossimilhança é particularmente importante
luqW\, quando o modelo estatístico é correto, a função L(9) contém todas as
!lI" fllllIlÇOOS dos dados. Contudo, modelos diferentes resultarão em funções de
Illuhllllhnnça diferentes e uma das tarefas necessárias é a de encontrar o
11111"1111 mais apropriado para representar as características dos dados
Ihllllulví.lls. Algumas situações ocorrerão, nas quais não será possível
1111'11111'(lUO um modelo é mais apropriado que outro (ou outros). Neste caso,
,!tI IIlodelo, igualmente aceitável, terá sua pr6pria função de
mlllumça.
1""1110 definida a função de verossimilhança é apresentada a estimativa
11 IlIlInllll'lros O. Para tanto é considerada a superfície definida por L(9)
illlh, 1111111 simplificar 8 notação. o termo yt da expressão de verossimilhança
lIlRldorndo) i\ medida que e varia. Evidentemente que para diferente
do O. resultam diferentes valores para L(e). De todos os valor
j.W il VI I. Ile O pode-se lntul tlvnmcntc esperar que o valor do O 111111
I'1 '1'1 b.IIIIlN'I( nquolc que tllllxlOli1.11n probabllldado dos vulorcs obscrvudea li
111.1' 11\, 'I"U 1I1llKIt})lzll u flltl~n() de vcrosslrnltltnnçn L(O). FOIIHIIIIllOlllO, plll"
hlll\,nll do Vtll<tHsllllllhllllÇIi 1.(0) de lIlll" f'IIH~ltO de k pll1·nIllO\tIU(l,
A A
IIllIhlllll.lll Ü dt, () ~ 110111111111 ("01110 II vullll' cio (~ 1"111
ti j 'I. til 1'011I()}, )1111'11 Inllll II 0, Nu I'tl'
674 Hidroloal
L(e) é um produto de termos como f(Yt;e). Utilizando logarítmicos de L(O)
N
I(e) = [log f(Yt;e)
t=I
(17.11)
Os valores de e que maximizam I(e) também maximizam L(9). Os valores 11
1\
e que maximizam L(e) e I(e) podem ser obtidos derivando e resolvendo
equações
ai alog L 1 aL
-= =---=0
eo se L sa
Estas equações em geral não têm solução explícita para e (a solução 111111
pode ser encontrada na forma q igual a wna expressão contendo somente II
valores observados de yt). Como conseqüência será necessário resolver
equações iterativamente; alguns exemplos são apresentados a seguir. QUIIIlIlu 11
vetor de parâmetros e têmapenas dois ou três elementos, é recomendãvol 1111,'111
as superficies L(e) ou I(e) por métodos que são demonstrados abaixo.
Ajuste da log-normal de dois e três parAmetros pela máxima verosslmllh
Log-normal com dois parâmetros- A distribuição log-normal de dois purRm.,ll"
de yt é
f(y;~,a2) = _1_ exp [ __ 1 (log Y - Jl )2] (O ~ y <(0) (1/ 1\1
yo~2n/ 202
o logaritmo da funçãode verossimilhança, 1{J.1,(2) na qual II~ 11111
parâmetros anteriormente definidos por 9=[91.92] são agora dcnoll1huIII"
el=Jl e 92=a2• fica
1 . [ '11IÚL,(2) = - N 10g. (J - (1/2) log (27t) - L 10g Yt - - L 10/1 YL .)1 <
202 ,
t
do qual
(17.1J1
IlIdrologia Estatística
81 1
- = O resulta em - L (log Yt - Jl)2 = O
all 02
8/ N 1 \"- = O resulta em - - + -:- L (log Yt - 11)2 = O
o (J 03
Estas duas equações têm a solução explícita
fi
" '" 1: (log Yt)/N
1\ 2: 2
li' := 1: (log Yt - ~ ) /N .
I, ,11,11 ,11)'" - cxp r ...:..(108 [r-a1 - ~)2l(u • v o,,,) (I '1.1ti
2()'2. ,
itlllldlll 'i"11 11 lllUn',WIIII 1_ 6 IIxudo r \III/llttulclll, 1111111111111111I1" 1"" 11"
675
676 Hidrolog
Usando a variável yt"' = yt - ao o cálculo das estimativas de (k e éo é obtldu
1\ *
J..Lo = 1: (log Yt )/N
1\2 * 1\'2
0"0 = 1: (log Yt -~) /N
o valor correspondente do logaritmo de verossimilhança /<p..>. ao, •..1
para este valor de ao é
1(~.ao2.ao)= -Nlog éo - Nlog(27t)f2 -1:10g yt - _1_ LClogyt - Ao)2 (I'/.I~I2ao2
Fazendo variar o valor de a. ai.az •...an é possível construir uma (11111:1111
de verossimilhança co-idicional, mostrando como /(jlol10~ao) varia com 1111
valor de ao para o qual a verossimilhança condicional tem sua máxima dc/1u
estimativa de verossimilhança de J..l e 0". Ilustrando com a seqüência de VIIII ••
de cheias anuais do rio Hercílio em Ibirama, foram testados valores .11
variando de O a 200. de 50 em 50. Na tabela 17.6 pode-se obscrvm 11
resultados. onde o máximo obtido foi a = O. Este valor pode ser vcrHklul ••
pesquisando-se na vizinhança de a=I), já que o intervalo de 50. utilizad« 1'"1
a pode ser grande. Observa-se que a estimativa de ao deve ser menor elo 11"11 Ii
valor mínimo y(l) da amostra, para que yt não seja negativo.
9,0
iI,iJ
6,0, o. .
o
""o.J
7.0
&,0 I--- ,--..
------ I -,
-:!,O -1,0 0,0 I,
OOIVIO do dl~' I'IhuiQ/'Io nO! moi
I
',IJ. 3,0
Piüurn 17.1. J)llllllb\llcRo (III/i VII'/, (ltj Apilll\l\,
llhlrologia Estatística 677
,',.bela 17.6. Ajuste da distribuição log-normal de três parâmetros para uma
Illlencia de vazões máximas anuais (vazões máximas diárias anuais) para o rio
lloreílio em Ibirama: 51 anos de registro, faltando 3 valores. Os logaritmos
111\ verossimilhança calculados para a série de valores do pârametro a, que
'/DUnC o limite inferior da distribuição.
a 10gL
O 8,594
a 10gL
50,00 4,437
a 10gL
100.0 -0,4701
a logL
150,0 -6,628
a 10gL
200.0 -15,56
1',,1\(\0 a estimativa dos parâmetros do modelo log-normal, é possível
\~ cheias anuais com período de retomo de T anos pelo cálculo de yo
1'1\911. a equação seguinte
YoJ y-l exp f _1 [log y - ~]2]dy = 1 - 11
7t 2é2-00
(17.16)
678 Hidrol()
Portanto, (log Y0- A)/tt = 2,32, log Y0=2,32 X 0,5+ 7).7, e o valor de
exp(2,32 x 0,5 + 7).7)= 4582,5 m3/s
17.2.3 Métodos dos Momentos
o método dos momentos vinha sendo mais utilizado pelos hidr61llM'"
porque é computacionalmente mais simples de ser calculado, antes do ndVI'IIIt'
de programas estatísticos generalizados, mesmo sabendo que a estimativa IMI
este método é inferior que a da máxima verossimilhança. Com as facllJelJll1
computacionais atuais, o método dos momentos pode ser justificado apou". PI
casos muito especiais; a simplicidade do cálculo não é mais uma justlfllHlIl
aceitável.
Isso não quer dizer que o método dos momentos não possa ser utillzmlu '"
estágios intermediários de estimativas. Normalmente o métod« II
verossimilhança requer a solução de equações por métodos iteratlv\l~ 'IIi
exigem estimativas iniciais dos parâmetros, seguido de processos IU.llllllvtl
da máxima verossimilhança; o método do momentos é útil para inlo\lu
estimativas.
Os textos de hidrologia anteriores punham considerável cor"
estimativa pelo método dos momentos. Neste capítulo, contudo, a Onf'li~n II
estimativas é no método da máxima verossimilhança. O método dos 1I10lJII'1I1t
consiste em igualar os momentos dos dados com os momentos da distr\hlll~I"" II
probabilidades adotada. Assim, se y, s2 são a média e a variança da 8011111\111,1
de dados yr, yz, .. yn, estimativas 91 e 92 de uma distribuição (I
parâmetros f(y; Bt , 92) são estimadas, usando o métodos dos momcntn
" "solução das duas equações seguintes para 91 e 92:
<XI
Y = L<XI y f(y;91,92)dy
= 11. digamos, que será função de el e 92; e
s2 = f <XI(y- 11)2 f(y; 01,62) dy
-<XI
= 02, digamos, que também será função do ()1 e 02: anel
probabilidades tem três parâmctros, o terceiro nlOO1DOto
(g:E(YrY)3/N), podo Sl.:r IgUlillldo UO terceiro HHHlI~mtq
I dl""III"
ulorrlnrlu .111
Irologia Estatística 679
<XIJ (y - 11)3 f(y; 91; 92; 93)dy
oCO
ponto essencial é que uma equação é obtida igualando os momentos da
IIII1~trneom os momentos da distribuição para cada parâmetro a ser estimado.
111 uusos particulares, a estimativa pelos momentos e pela verossimilhança são
1llIlvnlcntes. Como estas estimativas não são geralmente iguais é demonstrado
111,hlestimativa de ~ e (J para a distribuição log-normal, As estimativas dadas
1111"método de momentos (veja equações 17.17 e 17.18) são obtidas pela
1111II.l"0das equações
y = exp (~ + 02/2)
s2 = exp (2~ + (J2).[exp «(J2) -1]
1111\~no é
"2 2 -2(J = ln (I +s /y )
~ = (1/2) ln [i/ (l+s2/i) ]
"'llIlIIlltlvas são diferentes das obtidas pela máxima verossimilhança.
dístrtbutções Gamma de dois e três parãmetros
dllttrlbuiçílo Gama de dois e três parâmetros tem sido largamente
1111.•11111 1.1111 hldrologia com a finalidade de modelar as freqüências de cheias
11111,111I r••mdo os símbolos ~ e 1C (substituindo 91 e e2), a distribuição de
t\_ ,III.'ftlili.ltrO& podo ser escrita como
(K/~)t': y'IC-l cxp (-lCY/Il]/ f{'IC) O~y<oo (17.19)
1/'lr-/1
UlOlll
; ~1/1C • VflrlJlnoln ( O cocflclonte d
(por exemplo de chcíns nnunls) qtl
" r llinO (lu vor()H~lmllhlI09" podo /ler
680 Hidroloa
1(J,l.,K) = N K log(K/J,l.)+ (K-l)!:log Yt -(K/J,l.)!:Yt- Nlog r(K) (17.211)
As equações 8 1/8J,l.=O , 81/8K=O, podem ser resolvidas numericameut
obtendo-se as estimativas de J,l.e K, ou seja
1\ _
J,l.=y (17,",
8 10g T'(x) _
log K - = 10g y - 10g Y
8K (17,H'
A quantidade a log r(K)/8K é a função digama, que pode ser facIJIlIClIII
programada. Observamos que a equação (17.22) somente envolve K; POdOlll1l
resolvê-Ia pelo uso iterativo da equação:
K.. 1 = K. [ln K. - a ln r(K)/8K ] / (ln Y - ln y).
1+ 1 1 K=Ki
No caso da distribuição Oama com três parâmetros,
K x-If(y;J,l.,K)= (K/J,l.) (y-a) exp [-K(y-a)/J,l.] / r(K) a es y < IX)
A estimativa dos parâmetros é um pouco mais difícil. Temos várias (lI
para calcular as estimativas; uma delas é o uso do método de verossimlJl/lllfl
condicional já empregado com a distribuição log-normal com três parnlHrlltl
Isto é, usamos uma seqüência de valores fixos do parâmetro a, d11l11l1lt
ao,al,a2, ....an, e para cada valor ai (i=L, .•n) nessa seqüência, 081011111I1111
estimativas dos parâmetros u, K pela resolução das equações (I'I,) I)
(17.22). Substitui mos estas estimativas na expressão (17.20) rIU
conseguirmos 1(J,l.,K; ai). Assim conseguimos a relação entre 1(J,.l,K;11
graficamente, ou pelo cálculo, podemos definir o valor a na Hl'lltll\llI'!
ai(i=l, ...n) que maximiza I. Esta é a estimativa da máxima vcrosslrnlthmn« II
parâmetro a; usando este valor de a, calculamos as estimntlvn
correspondentes. Como no caso com a distribuição log-normal com 3 plll/llll
observamos que a estimativa do parâmetro a não pode ser menor do '1tiQ 1/
mínimo dos dados yl,y2,_ ...
17.2.5 Escolha entre distribuições log-normal c gammu
De forma geral as distribuíçõc
forma da assirnctria, com uma longn OI\lI(/1I
que permito as dislrlbulçl'lt-s J'oprCRolltlll'Olll 11
ltldrologia Estatística 681
uhlrolõgicos, onde a assimetria esta invariavelmente presente. A pergunta que
11111uialmente aparece é qual distribuição é maisapropriada? Atkínson (1984)
111cscntou um método para esta avaliação, que é o seguinte:
a) ajuste o modelo log-normal aos dados (com base numa amostra N
statisticarnente independente);
b) usando o modelo log-normal ajustado gere 100 amostras de tamanho N;
) para cada amostra gerada calcule o máximo da função de log-
verossimilhança considerando: l)modelo log-normal (LN); 2) considerando
o modelo Gamma (O);
li) plote LN contra O, mostrando no gráfico os valores de LN e O para a
qüência de dados hist6ricos;
) repita as seqüências a até d ajustando a distribuição Oamma no lugar
du log-normal.
Pura explicar a interpretação destes pontos, considere primeiro que os
1'111I1lJ_(LN,O), derivados de N valores observados caem dentro da nuvem de
1'111111'.gerados (100 amostras de N valores). Neste caso não é possível
1I1t1I1Kulr entre a log-normal e a gamma. Suponha, no entanto, que quando as
11"IIIIIIOStrasda distribuição Log-normal foram geradas, os valores maximizados
1111 11l~·vcrossimílhança da distribuição gamma para os valores observados são
lutn. com relação à LN, fazendo com que os valores observados caiam longe
I., IIItVOIll de pontos gerados. Isso indica que o modelo gamma é mais apropriado.
I 1lIlIlmonle, suponha que, quando as 100 amostras simuladas foram geradas pela
11111IlIullll'lo gamma, os valores maximizados do log-verossimilhança de LN são
IIl1ldn" 0001 relação ao da máxima verossimilhança do logaritmo O, fazendo com
li' 1111pontos observados caiam fora da nuvem dos 100 pontos. Isso indica que
ItU 1111Imal é 1\ distribuição mais apropriada.
1I I)IHh'lbulçlio Gumbel
cllNtdbulçtio é definida por
Hv: /X,u)-cx cxp] -a(y-u) - exp] -a(y-u)}] (17.23)-IX) <y <00
I llllltllllotros IX c u; sua média c variância são u+y/C1. o 7t'-f6a2
11'1 tlVI'lllilllte, anuo li constante de Euler é aproxímadumonre 0,:577. Como 1\
111111111 U LI dl~tribui9no 0110111, 10m uma assírnotrln posltlvn, »1\<1" IlIUII
111'111111 YI' y""YN' I' (ul1çnO do vcroselmühunça é dndu por
1(II,cO" •N lou ( (rl'U) • ).!cx.pr·u(Yrll) I j'I,.'4 )
682 Hidrclojl
das derivadas 81/8u=O e 81/8CJ;:::0 obtém-se
kexp[-a(Yt-u)] = N (17.
e
N/a - 1:(Yt-u) + 1:(Yt-u)exp [-a(Yt-u)] = O
Pode-se escrever estas equações numa forma mais simples
l/a =y - 1: Yt exp (-a Yt) IE exp( -a YV (17.21)
e
expi-u u) = L exp (-c Yt) / N (17.2M'
Estas equações não têm solução explícita, mas podem ser resolvidas JlIIII
método de Newton-Raphson, utilizando a solução dos métodos dos momentos 01111111
primeira estimativa. Nota-se que a primeira equação não envolve o parAlIll'Il1I
A .
a. Obtida a solução de a por esta equação, podemos substituí-Ia em (''I
para obter a estimativa de u.
Alternativamente, pode-se resolver as duas equações diretamente 1",1
método de Newton-Raphson. Considerando as estimativas de u.e obtidna 1141111
método de momentos como Uo e «o, estes valores podem-se alterar para "ti I A
«O+da, onde dU e .1a são soluções das duas equações lineares seguintes:
alldu + al2'~a = bl
a21du + a22da = b2
onde alI = -a2 Z; al2 = a21 = N - Z + a W; a22 = -N/a2 - V; bl = -N~ I I
b2 = -N/a + 1:(Yt-u) - W; Z = keXP [-a (Yt-u)]; W = 1:(Yt-u)exp [.~I
V = 1:(Yt-u)2exp[ -a(Yt-u)];
( 1'I
I, '"
/11)1
Exemplo 17.1. Ajuste a distribuição Gumbel aos dados de vazão mãxlmu 1I1I111Ii'
de Ibirama no rio Itajaí-Açu,
Solução: Utilizando os dados de Ibirama (tabela 17.1), OS vnloJ'oll 11111-11.1
obtidos pelo método dos momentos são uo = 585 c ao .,. 0,00;7,') 11)
estimativas iniciais, obtidas pelo método de momentos, resultam 1111'1 ti 11
de:
\
783,7 • u .•0,577/0.
I !'>:lOóO ri rc2 1((. (X2)
(l7.
Hldrologia Estatística 683
undc 783,7 e 193060 são a média e a variância da amostra. Ap6s cinco
ternções o cálculo converge para a estimativa de máxima verossimilhança que
\I c:: 602,98 e a = 0,00341848.
A função acumulada de distribuição é
F(y;u,a) = exp [-a(y-u)]
1111110a cheia de tempo de retomo de T anos é relacionado com F e y por
F(y; u, a ) = 1 . lrr
yT = u - (l/a) ln [ -ln (l-1m]
Pode-se verificar a bondade do ajuste visualmente pela plotagem ordenada
dli nmostra, ou seja yt versus os padrões da distribuição de probabilidades
I uncapondentes à probabilidade (t-l/2)!N para t=L, ..N. Se os dados de cheia
1111/11para o rio Hercílio em Ibirama estão bem ajustados pela distribuição de
IIIIlHhel, os pontos se distribuirão segundo uma linha reta. A figura 17.2
1II1I_lmque, aproximadamende, isso ocorre. Apenas os pontos correspondentes às
dllM maiores enchentes de 1983 e 1984 caem fora da tendência.
Também é importante a plotagem da máxima verossimilhança na vizinhança
,111sou máximo, por razões que serão discutidas a seguir. Na figura 17.3 é
I'ld.cntndo o contorno da função na vizinhança do máximo, mostrando que a
1I1""no é clíptica.
.7 Dlstrlbulçâo Welbull
A distribuição Weibull pertence a mesma fanu1ia da distribuição Gumbel
,1.1 hUIJI anterior. Esta distribuição é também chamada de extremos tipo m.
1IIIIIIIItll 6 denominada também de distribuição de extremo tipo 1. Esta
lI'ttlltlllçlto 6 útil para representar a distribuição de vazões mínimas anuais.
flllll'~() do distribuição é a seguinte
kF(y) :: 1 - exp [-(y/a)] (ye-O) (17.31)
IlIIll'h!) densidade de probabilidade
k-I k,
f(y) • (k/a) (y/a) cxp] -(y/a) J (17.32)
684 Hidrologl
2400
.e 800
c
o
:::l
O
'".g 1600
o
>
"".,
'".<:o
o a 000
00000
000
000
o 0000
o
°1 I I I 1 I I
2000 2400
Figura 17.2. Ajuste da Distribuição Gumbel aos dados do posto Ibirarnn,
400 600 1200 f600
Quantis calculados
.....---1.00,-
0.83
0.67
J.l 0.50
0.33
..>. "
O j I I
').17 0.3'3 0.00
a:.
I)
FI~lIrlll7.3. Fun de VOI'O'rthllllhilll",,,.
Illdrclogia Estatística 685
"u Ãk + a12 Aa = b1
a21 Ãk + a22 Aa = b2 (17.33)
Ilude
2 2 k
ali = -N/k - r [ln(Yt/a)] ·(ytfa)
k ka12 = -N/a + (l/a) L<ytfa) + (k/a) L [ln (Yt/a)](Yt/a)
2 2 k
a22 = Nk/o; - k(k+1)/a . L<Yt/a)
b1 = -N/k - L [ln(Yt/a)].[I-(Ytfa)~
b2 = (k/a)I [1 - (Yt/a)~ (17.34)
1111110 yt são os valores observados. O cálculo dos valores iniciais necessitam
111\ um pouco mais de cálculo que no caso do Gumbel. Para a distribuição de
Ihull, a média, variância e coeficiente de variação são dados por
E[Y] = a r(1+1/k); var(Y) = fi [r(1+2/k) -r2(1+1/k)]
v = r(1+2/k);r2(l+I/k) - 1.
A última equação pode ser resolvida para k e na primeira equação,
HIt"iltuindo k, obtém-se a.
1111'110 17.2. Ajuste a distribuição de Weibull às vazões mínimas do posto
1I111111ll" no rio Itajaí-Açu.
11111~'l\O: Utilizando vazões mínimas anuais do rio Hercílío, dados apresentados
1111 IIIholl1 17.5, a média, variância e o coeficiente de variação obtidos são,
flll\ll'otlvumente 7.791; 25,790562 e 0,405915.
Rosolvendo a equação
2/k);r2(1+1/k) ::: 1,405915
Vlllor,
nl",141" (I
686 Hidrologia
resultados, onde se observa um valor estranho para o ano de 1983. que foi de
31,8 m3/s.
Como foi mencionado anteriormente, é uma boa prática plotar a função de
" 1\verossimilhança na vizinhança do seu máximo k= 1,72591 e a = 8.99319. Na
figura 17.5 são apresentadas as curvas nessa vizinhança, observando-se também
uma função elíptica.
17.2.8 Precisão das estimativas de máxima verossimilhança
Um dos aspectos do procedimento da máxima verossimilhança descrito acima
foi a plotagem da sua superfície na vizinhança do seu máximo. A curvatura dn
superfície neste ponto está diretamente relacionada com a precisão da
estimativas de máxima verossimilhança; intuitivamente, se a superfície d
verossimilhança é plana nesta região, com pequenas curvaturas e gradiente
pequenos, o ponto de máximo será determinado com pouca segurança e 11
estimativa por verossimilhança terá pouca precisão. De outro lado, se u
curvatura é pronunciada e os gradientes grandes a estimativa da superfí
de máxima verossimilhança será claramente definida com grande precisão,Assim, a curvatura da superfície de verossimilhança proporciona uma medida tllI
precisão; além disso, a curvatura da superfície de verossimilhança
relacionada com a taxa de mudança do gradiente na vizinhança do máximo.
A teoria estatística mostra que a precisão da estimativa da mãxhn
verossimilhança é dada pelo inverso da matriz das segundas derivad
_a21/ae2, calculada no máximo da verossimilhança. Mais especificamente, se tt
é um vetor de estimativas de máxima verossimilhança do parâmetro e. a muuI,
1\
vare da variâncias e covariâncias é dada por qualquer das três rólaon
.equivalentes:
E [-a21/ae2]e=ô; [-a21/ae2]e=ôE [-a2I/ae2];
A teoria estatística também mostra que, quando os dados são COíllllh\h I
1\
(quando N é grande), as estimativas de e são aproximadamente dlstrlbuhl
segundo a normal, o que significa que a distribuição normal de dimclllIRl1 I'
produz os valores verdadeiros do parâmetro e c a matriz. de vllIlRII
covariância é
1\ 2 2-1var e = . E [ -B J/as ) (I'/I~\~)
e, quanto maior for o valor de N, m
normnl, I1l1orcvo-60 vrrtlllt/(1/rlJ euIr IIlndolll
llldrologia Estatística 687
24
o o
IS
16.
o
00
00
8 00
000
00
00
I Io 1 I I I I 36.
12. 18 24.
QUQnt is calcu lados
30.'0 6.
Plgura 17.4.Ajuste da distribuição as vazões mínimas de Ibirama.
K
~\lU' 17,5.PIIII",\~I' \1., \/('I".1I111I1hllllOIl do plohlolllll 1'/,,..
688 Hidrologia
usados para descrever as características de, por exemplo, cheias anuais, nã
são mais do que aproximações; estaremos-nos iludindo se acreditarmos qu
cheias na natureza necessariamente seguem a distribuição log-normal, gamma,
gumbel, ou qualquer outra distribuição.
Com a ajuda de análises estatísticas cuidadosas, contudo, tem-
condições de rejeitar aqueles modelos estatísticos que não são consistent
com os dados e concluir que um, ou vários modelos remanescentes servem
igualmente bem. Se vários modelos são bons, a decisão da escolha entre ele
deve ser realizada com base em outros elementos além da estatística. Para
qualquer modelo adotado será desejável obter os limites de confiança parll
seus parâmetros. Os limites de confiança aproximados podem ser obtidos usando
os termos da diagonal dado pelo lado direito da relação (17.35). Usando 11
1\
fato de que cada componente do vetar e é distribuído aproximadamente seguJ11111
a normal, o intervalo de confiança aproximado de 95% para o componente 01 til
'1\ 1\ 1\
e são dados por €lI ± 1,96 vvar €lI, var €lI sendo dado pelo primeiro elcmenln
1\
na diagonal principal da matriz vare. Limites de confiança para 99% e 99,ljl.~,
são calculados usando os desvios da normal 2,58 e 3,29 em substituição li.
1,96.
Limites de confiança aproximados assim calculados são apropriados qUIIIlII ••
um parâmetro é considerado individualmente; se os limites de confiança .R ••
calculados para todos os p parâmetros do vetar €lI, as p condições 11
confiança não serão simultaneamente verdadeiras. Quando as condições 1I
confiança são necessárias para todos os parâmetros simultaneamcnt
necessário usar a região de confiança conjunta que. com N gmn(I!"
apresentada pela teoria estatística como sendo
1\ 2
2 J(e;x) -2 J(O;x) s X
p,CX1
onde lOO(l-a)% é a probabilidade de confiança; X2 é o valor tabclndn tip,a
distribuição X2 para p graus de liberdade tendo uma probabilidade CX )HI 1"11
limite superior; e p é o número de elementos no vetor 9. Bsscnclulmeum,
relação (17.36) define aqueles 9 valores que são suficientemente pr6xlllllll ,111
1\
valor e onde o Iog-verossimilhança têm seu máximo,
17.2.9 Intervalos de Confiança para a cheia de T anos
689IlIdrologia Estatística
presentado o problema de definir as condições de confiança dos quantis
1\ 1\
.Irdvados da distribuição ajustada f(x;e). onde e é obtido pela máxima
vlIrossimilhança.O símbolo usado anteriormente neste texto para representar o
IjllllJ1tilera Xo onde Xo é a solução da equação
Xo 1\
O = J f(x;e) dx - P = O (17.37)
-00
unrlc, para uma cheia de T anos, P= ltr.
Um método direto de calcular o limite de confiança aproximado de 95%
1"11'11 Xo é pelo uso da aproximação da distribuição normal Xo ± 2 v(varXo),
111\l1~ varXo pode ser calculada com a ajuda da variância e convariância da
"1j11l1~t\0 var e = [-E(a21/d9ia9j>rl. Considerando que Xo é função de Bi,
111" •• pode-se escrever. quando N é grande, que
2 1\ 2 1\
varXo= (80/891) varüj + (80/892) var a2 +
1\ 1\ 1\ 1\
I 2(aO/ael) (aO/a92) COv(al,e2»)/ [f(Xo·el.92) )
(17.38)
Ollílr os termos adicionais devem ser incluídos quando existirem os parâmetros
n" OL., As variâncias e covariâncias são obtidas diretamente da expressão
1\
III1 Illlltt'iz var a; ao/ael, por exemplo é
Xo
ao/a91 = J af/801 dx-IX) (17.39)
() 1116todoacima não é algebricamente elegante, mas é direto do ponto de
11111 \lOl1lputacional,contudo considera que Xo é aproximadamente distribuído
111111, 1\ distríbução normal. e desconhecido em condições em que esta
11I' 111~l'lIçno é válida. Outra alternativa é retomar a superfície de máxima
mllhança, como segue.
I '11I1l'ddcrundoque a região definida pela inequalidade (17.36) dá uma
" do eonflança de lOO(l-a)% para o parârnetro e do modelo, para cada
O 11\10 cf\i nesta região ou dentro de seus limites pode-se calcular um
" IIl1lmdo n equi\çno (17.37): escolhendo vários pontos a podemos gerar
ti". VIIl\ltbR de X<I, o 1111110r c o menor destes valores define o Intervalo
111111 If)'nl 11" ro~ll\o do o<mllll1\çn puru o qunntll Xe, Pode ser demonstrado que
ilu IIJlC"I'/ll'IIII)"lw 'X" purn nH vulorca do () que caem dontro d
l'll IJlll\thlll~1I1\11 ."lilno IIl'Ill\ldll Il(J( (t·/.1CI). NII tuhclu \'1:1
111111111. 11M Iltlllll·.~ Ilf\ 111111 111I\Io'i\ 1\(1 I)~ %, '1110 íurum ~I\Il~\Ih\illl' I
690 Hidroloal
procedimento para as séries de vazões da bacia do rio Itajaí-Açu,
considerando a distribuição de Gumbel; intervalos de confiança calculado
usando a superfície de verossimilhança têm uma maior precisão do quo CI
intervalos calculados usando a aproximação da distribuição normal.
Tabela 17.7. Distribuição Gumbel: estimativas de cheia de 100 anos Xo em 01111
uma das 18 bacias, juntamente com o intervalo de confiança de 95% (XL.X,,)
Rio XL: Xo: Xu:
Taio 470,4 512,0 679,9
Pouso Redondo 96.1 113,3 165,7
Trombudo 211,4 245,5 783,0
Adago 506,5 636,9 1308,5
Itajaí, Barracão 597.0 700.3 1997,4
Itajaí, Jararaca 590,4 661.8 1909.9
Itajaí-Açu, rio do Sul 1697,2 1863,9 9161.3
Hercílio, Ibirama 2022.6 2192.2 4289.0
Neisse Central 169,4 207.8 340.3
Itajaí-Açu, Apiuna 3924.6 4279.1 7074.7
Benedito. Benedito Novo 373.7 397,8 1237,6
Benedito, Timbo 990,3 1070,5 3978,3
Itajaí-Açu, Indaial 5588,6 6062,3 14781,0
Testo, rio do Testo 48,4 57,6 72,0
Itajaí-Açu, ltoupava Seca 3139,5 3703,5 10096,0
Garcia.Garcia 130,2 154,4 239,1
Luis Alves, Luis Alves 115,1 125,4 472,8
Itajaí-Mirim, Brusque 599,1 651,4 1737,2
17.3 Relações lineares com variáveis expUcativas
17.3.1 Princípios de análise de regressão
A análise de regressão busca estabelecer um relacionamento onhu 1111I
variável y e p outras variáveis Xl' x2' ..., xp que explicam aOI.\() vI,d.\
Numa regressão linear, as variáveis explicativas se combinam (l1\(1I jl(UIIlIII 11111
componente sistemático que é linear com parâmetros dcsconheold09(13), ,111 (111"1
~O+PlXI+P2X2+·..f3pxp, Qualquer observação da variável y, digul1Ios yl, Ilnllvl
se do componente sistemático do modelo por uma qunntlu dcnouilmulu 1'11I 1'" .1
modo que a equação do modelo podo ser cscrl til nn f\lrlllll /lOJ{lIhIlO:
1II,Ifologia Estatística 691
Yt = Po + Plxlt + P2X2t + ...+ Pp"Xpt+ ft (17.40)
,"ulo xit' X2t' ... , "Xpt são as observações das variáveis XI' x2' ..., "Xp
Illlu~pondentes à t-ésima observação de y, a saber Yt. A equação (17.40) pode
I Ullorita Yt = ~ TP + ft, onde ~ é o vetor [X1t,x2t''''"Xpt]T e P é o vetor
1111 pnrâmetros [~O,Pl,P2, ...pplT.Dadas as observações YI' Y2' ..·Yt. "·YN.
\,.111",1108 estender esta notação, escrevendo as N relações da f6rmula (17.40 )
111110
Y = X~ + e (17.41)
IlIlu Y é agora um vetor Nx1 das observações [Yt] sobre y. P é um vetor
'I' I I}I( tdc parâmetros, e é um vetor Nxl de desvios, e X é uma matriz Nx(p+ 1)
IW I~HI uns na sua primeira coluna, e as observações sobre as variáveis Xl'
Xp na segunda, terceira, ...p-ésima colunas. Se os ~ são variáveis
1.111111,\l1~ com valor esperado zero, podemos escrever
E[y] = Xp
tlvo onde for indicado de outra forma, pressupõe-se que os desvios ft
1""1 oStLltlstieamente independentes, normalmente distribuídos, e com
IlnllOIl\ desconhecida ut O parâmetro Po representa uma ínterceptação sobre
11 110 longo do qual é medido y; é, às vezes, conveniente incluir uma
!HIVI;\ nrttficial xo' multiplicando Pc, que têm um valor identicamente
l!til 1\ 111I1. Se o componente sistemático do modelo contiver apenas uma outra
1111"I I •.(tio modo que, com uma pequena mudança na notação, este componente
I IIUtllllC1 possa ser escrito Po + ~lx), o modelo estatístico será uma
llncur simples: se o componente sistemático contiver mais de uma
J( pl lcatlvu, será uma regressão múltipla (linear). Nas aplicações
111 díscutídas abaixo, às vezes mudaremos ainda mais a notação,
11111111 \I nlu\bolo q, em lugar de v, quando a variável que estiver sendo
111 ,h hlllu Ibr dcrlvadu de um regisl.'" de fluxo.
" HI1~II",t.I de rCHrcs8l'io Ilncar busca resolver problemas eSLatísticos dos
(lS ecgulntea: estlmntlva cl1clcnto dos parãmetroa Il
de y" ,. eerrospondondo li nOVII~ OhIlCI'VI\I,ll"lU/\ "IH
~ I' •••XII• lI\ulutllVl, o utUl'ulo do 1'\I~lvllln8 (10 pl'(.\dl
1\ lI'"IIUllo ,111 11, hll'hlNlvo 1\ d(llllllllhll\~l,o !lu qUII
692 Hidrolo
variáveis explicativas para predizer y: combinação das estimativas de P e \Ir
dadas por diferentes conjuntos de dados.
17.3.2 Aplicações hidrol6gicas de regressão linear
o objetivo deste capítulo não é relatar a teoria estatística aproprlud
para a solução dos problemas acima apresentados. pois já existem toxl ••
excelentes destinados a esta finalidade, N6s nos preocupamos antes, com
apresentação de um relato de algumas das muitas aplicações de anãlise 11
regressão linear nas ciências hídricas.
A seguir são apresentados alguns exemplos, ilustrando a amplitude II
aplicação da análise de regressão linear nas ciências hídricas.
a) O modelo Thomas-Fiering é um procedimento para derivar seqüõuul«
artificiais' de descarga média mensal (fluxo). com caracrcrísth
semelhantes, sob aspectos importantes. àquelas do registro de fluxo 1IIIIIIUl
observado numa estação fluviométrica de um rio. As seqüências arllJldlll
geradas pelo modelo Thomas-Fiering são usadas; por exemplo, para 51mllllll
comportamento de um sistema de recursos hídricos que abstrai ãgua <lu 1111
pr6ximo ao local de medição. O modelo, conforme comumente formulado, 0011.1"
em doze regressões lineares simples, nas quais o fluxo de fevereiro (y)
correlacionado com o fluxo de janeiro (variável explicativa x); o fluxlI II
março é correlacionado com o fluxo de fevereiro (variável explicutlvn 1\)
As doze regressões qfev = «rev + Pfev qjan + €fev; qmar = «mar + BIII~I II,
+ ~ar;'" são usadas para gerar as seqüências de fluxo flltlllllllll
escolhendo o €fev' ~ar"" a partir de componentes normais com vllllRlld
apropriadas. e acrescentando a esses componentes aleatórios os comJlOUI'''1
sistemáticos <Xrev+ Pfev qjan' Ornar + Pmar Qmar.··· . Claramente, 0111111
possibilidade de incluir, além de variáveis explicativas, o fluxo dCI
meses precedentes; usar distribuições outras do que a normal, a flu: d
os componentes aleat6rios e. e assim por diante.
b) Yevjevich (1972) discutiu um ex r 'I) no qual uma curva-chave plu'l\lIl1Ill/I
Po ~ PIH + P2H
2 é ajustada a '~.:l~ -ncdidas Q c níveis H, 1181)11110 I \ 11M'
de observações (Q.H). Como os 1 1,C~'OS l3e, 131, P2 ocorrem IhwIIIJ.III'1
equação para a curva-chave, o componente .Isrcmãtioo do modclu lilllulhll
para Q têm a forma de regressão rnúltipl a,
c) A concentração de; sedimento em suepen
dCROl\rr,n Iluvlnl (vm:no) (I rM 11I1111 tl(IIII\~'n"/lu 1'011I111 I
IlId.ologia Estatística 693
Illl'Nontarn diferenças com relação à expressão no lado direito dessa equação,
11. desvios forem aleatórios pode-se dar a forma
•• a q~ + e
() componente sistemático do modelo será claramente não-linear nos
11I1I/llIIllll'OSa e P, Contudo, pode-se obter uma relação linear entre os
IUlldlll)OSde c e q na forma
111 C = a* + ~* (ln q) + e
!. nuulo que o modelo estatístico agora é expresso sob a forma de regressão
1111I-111
xcmplos das tabelas 17.1 a 17.4 deram um conjunto de valores contendo
de observação. Denominando y como uma seqüência de, digamos. cheias
-1I1111~, 1111I um local de medição com registro irncompleto, e por Xl' x2' ...xp
I llllll'~ nnuais em postos de medição próximos, com registros nos quais não
,1111111 vntorcs, a regressão múltipla pode ser usada para estimar valores que
1/11111 1111 seqüência y. Contudo. será necessário aplicar a análise de
1I1I00.IU1\0 com especial cuidado para assegurar que sejam satisfeitas
básicas.
I IJllIlIUlo IlS características de cheia devem ser estimadas para um local sem
1'111"1 tló vazão, é comum usar registros de cheia de outros postos dentro
11, u fim de relacionar (por exemplo) a cheia anual média q e
I1.llllll~ da bacia (área A. declividade de canal S. percentagem P de
IIr Imolll que é lago ou reservatório ...). como variáveis explicativas.
" 11111111 ~ comum utilizar-se de modelos de regressão múltipla na forma
111 '11' ~ ~I (1n A) + ~2(1n S) + ~3(1n P) + ... + e (17.42)
111111' tllIMO, também deve haver cuidado, porque os registros serão de
ilt'dllliJlIllU diferentes, de modo que as cheias anuais médias q necessitarão
"1111\1111'11 ptl!lOR nu anãliec, Quando o relacionamento entre o escoamento de
lIil11111111j'1\ U 11 chuvu ofctiv» P1, p
'
_}' P'-2' ",' estiver na forma
1I1 II h()p, .•. hl» •.• '" h2PI.2 + ... + hkPt.)( + e (17.43)
111111( IIlu 1111111 nl~I'CI4Nnl)llncnr,
11111111' til! 1111111I111'1111111 1I1I11Itllll. 11 11•• ··"
udo os plu'RIllO\.t'()S 11o• hl, •.•hk 11,
dI' ~\1ltlil(lnl'Hll~('h,l no IlhlNlo til)
694 Hidrologl
modelo para assegurar que as ordenadas sejam fisicamente significativaq
alguns procedimentos ajustam o modelo utilizando restrições para
ordenadas.
17.3.3 Os fundamentos da regressão linear
Pressupomos o modelo
T
Yt = xt 13+ Et (17.44 )
com as suposições E[Et)=O; E[fi2)=cr/; e E[fies)=O para qualquer s=t. Tamhérn
pressupomos que os erros ou reslduos Et sejam normalmente distribuídos. 1'111.
calcular as estimativas de 13 dos parâmetros 13 calcula-se o valor 13 11\1
minimizaa soma dos erros quadráticos, le, onde eé o vetor Nxl com elcmcnm
típico fi; isto é, as estimativas de 13minimizam
TR(j3) = (y-Xj3) (y-Xj3). (17.4'1
As estimativas 13,portanto, satisfazem
dando
T •
X (y - X 13)= O
XTX P = XTy
P = (XTX)-l XTy•
, (I".,
ou
Substituindo para 13na expressão (17.48), obtemos o valor mínimo <111 HIIIII
dos quadrados
A • T • T T _I T
R(P) = (y - X 13) (y - X ~) :: y (I - X (X X) X) y.
Usaremos esta relação 1.e .jcmcntc, junto com a s<.lgulnto 111I111
alternativa:
• T AT T
RW) :; y y - p (X y). ( 1'1'1
A relação (17.49) é li bnse pnrn u nnáll
Il sorn» to til 1 dos Clul.ld~ud(lI4 1'111'11 11
de vi\,lnnC'l1l
I1htll" VII'.'/'i(
1'/,1
llldrolo gia Estatística 695
,2 2 T é di idid d . ~TXT difVI "Y2 +"·+YN =y Y - IVI 1 a em 01S componentes, '"' y e a irerença.
1((1l), Textos estatísticos (veja, por exemplo, Draper e Smith, 1966) mostram:
a) que, se o vetor 13têm p elementos, e o vetor y têm N componentes, os
T • T •
graus de liberdade, associados com os componentes Y y,pX Y e R(p) são
N. p e N-p, respectivamente.
b) que dadas as suposições acima concementes ao Et,as quantidades
~XTy/p e R(~)/(N-p) são ambas distribuídas como X2 com p e (N-p) graus
de liberdade, quando à hipótese nula que 13=0 é verdadeira .
) em qual caso. a relação dessas duas quantidades, [PXTy/p] dividida
por [R(j3)/(N-p»), é distribuída como uma razão de variãnctas, ou
tatística F, com p e N-p graus de liberdade. Existem tabelas para essa
tatística, porém os seus quantis podem ser facilmente calculados por
ENST AT, ou por outros pacotes computacionais,
NlI prática, estamos interessados em obter o modelo mais adequado para
I'lIilllf como varia a variável YI testando uma série de modelos de regressão
11111'lU I envolvendo um número cada vez maior de variáveis explicativas. Assim,
1I1I1'-'~'lIndocom o modelo mais simples
YI = ~o + Et
I •.•uma constante ~o desconsiderando o termo aleat6rio; acrescentando
1lillU vII,lrtvcl cxplicativa xl' resulta no modelo
YI = Po + ~l xl + Et.
II"IIIIIN.tulvcz, urna segunda variável explicativa x2' de modo que o modelo
11111 11(\ III
YI • ~o + Pl XI + P2 x2 + e.
IIIVt
IUI["
1II 1'111 111111\10. UIItIlHl() 11 0(1111\91'{0(17.49), cadn m
111111' dQ H(~) qUll Ml' 1001IJlut uteuor 1\ 0/1<11'novo plll·nllllJlW
IrrHIIt'IIHI'j Itlll~11I1 N 1'11Inlilnllll~. H(O> lIt'dn t,l1l'CI. Jrt (l\ll) IIPI'IIII. 1011111
696 Hidrolo
III
N valores de dados Yt para ajustar N parâmetros ~o. ~I' "'~N-I' Se chamarmo
a seqüência de valores de R(~) correspondentes aos modelos de númeru
crescentes de variáveis explicatívas, por R(Po); R(PO'P1); R(Po,PI'~1)
então podemos resumir o processo todo, conforme apresentado na Tabela J 7.H,
na qual consideramos que k variáveis explicativas é o número máximo 11"
desejaríamos incluir.
Deve ser observado que a expressão ,,~TXTy", que ocorre em divcrs«
lugares na tabela 17.8, é diferente de uma linha para outra, dependendo Ilu
número de parâmetros ajustados. Assim, onde apenas é ajustado ~o' a matrb,
consiste em uma única coluna de uns, sendo de dimensão Nxl: onde ~o e ~I _nu
ajustados, a matriz X é da dimensão Nx2, tendo uns na sua primeira coluna
os valores de N da variável explicativa Xl na sua seguna coluna, e assim li'"
diante.
Em particular, o valor de pTXTy corresponde ao ajuste de ~o é, pOlllllllt1
apenas Ni, e é conveniente subtrair essa quantia, juntamente com seu gl'IIU II
liberdade correspondente, da última linha na tabela 17.8. Maior simpllflcu; n••
pode ser obtida se rearranjarmos a tabela para dar as diferenças R(P) qun I' II
resultado de ajustes sucessivos com parâmetros adicionais. A tabela 1101111
obtida é a 17.9.
Devem ser mencionados dois aspectos das tabelas 17.8 e 17.9. PI'IIlI
conforme mostrado na tabela 17.9, cada parâmetro novo (e SUII vlld,lvl·1
explicativa associada), que é incluído. no modelo, resulta em redução dn ~IIIII'
Residual dos Quadrados R(~) que, conforme já foi observado, dCSUJ11I11'I'1
totalmente se fôssemos ajustar N parâmetros. Freqüenternente, as rccluçl'lt,. 1I
Soma Residual de Quadrados, associados com os primeiros parârnotros,
substanciais, as reduções tornando-se sucessivamente menores com I"ul
parâmetro adicional incluído. É um dos objetivos do ajuste do 1lI111ldll
determinar em que ponto a redução da soma residual de quadrados 1011111
pequena demais para justificar a inclusão de parâmetros adicionais no 11111I11'111
Em segundo lugar, a apresentação nas Tabelas 17.8 e 17.9 pressupôs q\lU "1"11
um parâmetro adicional seja acrescentado em cada passo, de modo que (I~.,.""
de liberdade para a soma residual de quadrados é reduzida de um" \ll\ld,1I1
cada passo. Às vezes, contudo, precisaremos acrescentar grupos de pUl,nllH' 11"
em lugar de acrescentá-Ias um por vez. A Tabela 17.9 pode fnoll UltlllI1
modificada para incluir este caso. Por exemplo. se ajustásscmos J1(l~ Nl~1I11111
do grupo ~1'~2""~p seguido mais uma vez pelo gruJJo PJ1III~l)'21 .••lIplil'
a Tabela 17.9 seria modificada pura 11 forrnn mOlllrlld" 111.1tuhclu 1'1.10
I )\!tull\ 17.9. Análise de tabela de variância (ANOVA), derivada diferenciando a
11\111111\ l7.8. A tabela mostra a redução na função de soma de quadrados R(~)
1111It~sulta do ajuste de parâmetros adicionais.
IGraus de liberdade l'Soma dos Quadrados
llldrologia Estatística
"llbela 17.8. Resumo do procedimento para o ajuste de modelos lineares com
11I11\\crocrescente de parâmetros ~o; PI; ~2; ..·po; P1; .•.!3x., correspondentes
n. 1.2 •... k variáveis explicativas Xl' X2' ...xk
Parârnetros Ajustados Graus de liberdade Soma dos quadrados
~o 1
~TXTy
N-! R(Po)
~o' Pl 2
pTXTy
N-2 R(~O'~l)
Po, Pl' P2 3
pTXTy
N-3 R(Po,P I '~2)
... ." ..,
.., ... ..,
~o' ...!3x. k+l pTXTy
N-k+l R(~o''''~lc)
N yTy
697
1
1
R(PO)-R(PO.Pl)
R(Po,P 1)-R(~O,Pl '~2)
Ajuste de P1
Ajuste de P2 em
11I6mde p\
AJustc de P3 em
1\I~m de DI '~2
1 R(Po,P I,P2)-R(Po,~ I.P2'~)
R(PO.p\ •..·Pk.l)-R(PO.PI ,...Plt)
N k IR(PO, .. ·~k)
N.\ IY1'y , Nyl
17.3.4 Caso especial: regressão linear simples
698 Hidrolog]
~
Tabela 17.10. Particionamento (distribuição, divisão) de somas de quadrado
graus de liberdade '
Graus de liberdade Soma dos Quadrados
Ajuste de ~l '~2""~p P R(~o)-R(~O'~l ,...~~
Ajuste de ~P+l''''~p+q q R(~O'~l ,...~~- R(~O'~l ,....~p+q)
após ajustar ~l""~p
Erro N-p-q R(Po,P1, ...Pp+q)
Total N-l yTy _ Ny2
No caso de uma variável explicativa, digamos x, a análise de varlRllI'l
ANOVA acima toma-se a tabela 17.11 (onde acrescentamos uma coluna adlolUWl1
à tabela, Quadrados Médios; estes valores são as Somas dos Quadrmlll.,
divididas pelos graus de liberdade correspondentes).
- 2 - - - 2 T -2Sxx=L<x(x) , Sxy=D"t-x)(Yt"Y) e Syy=L<Y(Y) =Y y-Ny
Tabela 17.11. ANOVA
df SQ QM ,
Regressão sobre x 1 Sx/ISxx SxllSxx
(i.e. ajuste de ~l) (i.e. R(Po)-R(~o,J31)}
Erro N-2 Syy-Sxy2/Sxx (Syy-Sxy2/Sxx)/ON-2)
[i.e. R(130'~I) I
Total N-l Syy
Se a hipótese nula, onde P1 = O, for correta. de modo que 11 VIIIII\VIII
não tenha valor para explicar como y varia, uS dU1I1
entitulada QM são arnbas disrribuídns como X2 com I C N-
respectivamente; c n ~lI" rclncão é en1~O dlstrlhufdll (J(')Il11
l lhlrologia Estatística 699
I I) N-2 graus de liberdade. Como teste da verificação de incluir x como uma
vllllável explicativa do modelo de Yt' comparamos o valor numérico do F
I nlculado a partir dos dados com o valor tabulado para 1 e N-2 graus de
llhcrdade,
Embora a álgebra apresentada pareça assustadora à primeira vista,
uunselha-se o leitor a passar algum tempo dominando os princípios que a ela
nnduzem, embora as f6nnulas em si não sejam importantes para a pessoa que
1II\Iilllha com isso. Os cálculos são facilmente realizados por qualquer bom
1'Illllrama estatístico.
1r.!(OInplo17.3. Estabeleça a regressão linear das vazões anuais de cheia de
lhlmma (y) com as vazões de cheias de Apiuna (x) (tabela 17.1).
1I1\l~l'io: Como existem menos falhas na seqüência do rio Hercílio em Apiuna do
11"1\ para o rio Itajaí-Açu em Apiuna, pode-se explorar se as cheias anuais em
pluna (x) podem ser usadas para preencher os valores que faltam para as
1111\1115 anuais (y) em Ibirama. Assim considerando a regressão linear de y com
•I plotando inicialmente os pontos para ter uma idéia de como x e y variam
IllIljllntamente. Na figura 17.6 as duas cheias extremas para os anos de 1983 e
IIJH4 se destacam claramente, e ambas têm um efeito substancial sobre a
IItHIIIO conforme será visto mais adiante.
Na tabela 17.12, o sumário de análise mostra a soma total de quadrados
I'y N;,'2,= 9025393 dividida em dois componentes: um (Regression) para o ajuste
1111 Il" com valor 7265785, e o outro (Residual) para R (~O,Pl)' com valor
1/~IJcI08. A tabela mostra os quadrados médios (soma dos quadrados divididos
Ilou "'(lIUB de liberdades) e, mais abaixo, a relação de variância (chamada de
111110 183,8l.
I'nrn testar se a variável Apiuna é útil para predizer valores da
Ilnvl.lI lbirama (ou, mais formalmente,testar a hip6tese nula 131=0)
IIIIItII'IU'llrnosa razão de variância com os valores tabulados da estatística da
lI~hl\,n()de varíância com 1 e 45 graus de liberdade. O quantil de 95% da
Ilh11Ih\lI<;1'(0 de razão de variância é F=4,057. Os quantis de 99% e 99,9% são
unntrados como sendo, respectivamente, 7,234 e 12.39; como a relação de
.nlnuoll\ calculada de 185.81 está bem acima da parte superior da cauda da
dlUllhulçrto que seria apropriada se fosse verdadeira a hipótese nula,
II I"ltlllll<l&OSSI.l hlpõtcsc, concluindo (conforme é 6bvio do traçado na Figura
11 fi) 1(110 I' scqüêncln de 011011111 do Apiuna é extremamente útil para predizer
dllllh~ IIIUI/IIR (1110 fllllllUl 011I lhlrllllln. No rabcla 17012. Percentagem ele
I'" m,,,./,/ v.\p//c{I(lo é pmu(vol ohservnr que 11 rCllrcss~o llncnr slmpl
11\ I' 1'11 q1lx 11111111(((n()'~I) 111\1111 1_ (IQO-RO.t) 11 IC).C)% <111 N(1111U (01111 dt
111I111I1.ulo" II)(I'>(~I, II'l 11111110 '11111 1\ InUlo_Mllll foi 11'HIHllllutvl}1 PC!( IIUII\ JlIIIII
700
dn regressão UIjI
l
(l,?!)
t ",h
701Hidrolo l lhlrologia Estatística
(1111, cheia anual estimada em Ibirama = 12,5 + 0.4775 * cheia anual observada
11I Apiuna). Também são apresentados os erros padrão do Po e PI' a partir dos
III\HI~, caso necessário, podem ser calculados intervalos de confiança para Po
11" como 12.5 ± t x 63,8 e 0,4775 1: t x 0,035, onde t é o valor do t
IIllrNtico com 45 graus de liberdade, lido a partir de tabelas. Para uma
I'ltlhllbilidade de 0,05 nas duas caudas da sua distribuição o valor de t é
,Ol~; onde os limites de confiança de !i5% para Po e P1 são 12.5 ± 2,014 x
fI \ t~ e 0.4775 ± 2,014 x 0,035, ou (-116,0; 141,0) e (0,407; 0,548),
1O'_)lI'otlvamente. Observamos que os limites de confiança para Po incluem o
1111' zero, que é pelo menos consistente com a realidade.
considerável da variação em y.
Para testar se a variável Apiuna é útil para predizer valores cI
variável lbirama (ou, mais formalmente, testar a hipótese nula PI ••tI)
comparamos a razão de variância com os valores tabulados da estatística ti
relação de variâncía com 1 e 45 graus de liberdade. O quantil de 95% 11
distribuição de razão de variância é F=4,057. Os quantis de 99% e 99,9% .ali
encontrados como sendo, respectivamente, 7,234 e 12,39; como a relação Ii
variância calculada de 185,81 está bem acima da parte superior da cauda li
distribuição que seria apropriada se fosse verdadeira a hip6tese nul.,
rejeitamos essa hip6tese, concluindo (conforme é 6bvio do traçado na FIM'II
17.6) que a seqüência de cheias de Apiuna é extremamente útil para prolll1
cheias anuais que faltam em Ibirama. Na tabela 17.12, Percentagem ,li
variãncia explicada é possível observar que a regressão linear sllllpl
E[y]=(30+Plx tinha R(PO,PI) igual a (100-80,1) = 19.9% da soma tollll I1
Quadrados 196204, de modo que a regressão foi responsável por umu pllll
considerável da variação em y.
1.11111111 17.12. Regressão linear entre vazões máximas de Ibirama(y) e
Apiuna(x).
l\l\lise de Regressão ***
II\Hwd dependente: Ibirama
1'[111111" njustados: constante, Apiuna
2400
00
17
O
-2,73
2.31
urno da Análise ***
d.f.
1
45
46
s.s .
7265785.
1759608.
9025393.
m.s.
7265785.
39102.
196204.
•.
<,... 1600e
<::E«
11:
m
eoo
o •
o o 111 da variança explicada: 80,1%
111: As seguintes unidades têm grandes resíduos:
• o • o ••
o
I • . . ,--
3200 'IOCII seguintes unidades tem alta leverage:o 800 1600 2400
APIUNA m'/s ()
1
0.250
0.248Figura 17.6. Vazões máximas anuais de Ibirama vcrSIIS as do Âplllll
Mais abaixo, na tabela. na parte cntítulada E~'ti;nrlllv,,~' <I,
de regressão, coluna eruitulada estimativo, lUl ostiUlutlvl\H numér
t,,\,H
(l,()'110~l são 12 1 IhJ Y •• 12,~ ,I' I)0,4775, dundo um" cqullolln de fOII.l"
702
Deve-se lembrar que a finalidade de ajustar o modelo estatístico
estimar as cheias anuais que faltam em Ibirama, usando o registro 11I
completo em Apiuna. As cheias anuais em Apiuna, para as quais faltam
cheias de lbírama, são 1111, 648 e 3086 m3s-1. Utilizando a regressão 0\11
se as cheias de Ibirama que faltam, ou seja 543, 322 e 1486 111
respectivamente. Usando os valores da estatística t calculada anteriormenl
podemos, caso necessário, calcular limites para as estimativas.
REFERÊNCIAS
1 _ ATKINSON, A.C., 1984. Plots, transformations and regression.
Inglaterra. Clarendon Press.
2 - DRAPER, N e SMITH, H., 1966. Applied regression
. John Wiley & Sons
3 _ YEVJEVICH, V., 1972. Probability and statistics in hydrology. WIII
Resources Publications, Fort Collins, Co.
Capítulo 18
11:(~ULARIZAÇÃO DE VAZÕES EM RESERVATÓRIOS
Antonio Eduardo Lanna
ntrodução
variabilidade temporal das vazões fluviais tem como resultado visível
nela de excessos hídricos nos períodos úmidos e a carência nos
",tlIIM ilOCOS. Nada mais natural que seja preconizada a formação de reservas
1\111 ti período úmido para serem utilizadas nacomplernentação das demandas
"'\ n(~seca. Como a ocorrência das vazões é aleat6ria, ou seja, não há
Ildlltll\~c de previsão de ocorrências a longoprazo, não é também possível
I.n com precisão o tamanho da reserva de água necessária para
I ilIIII'Il10das demandas de períodos de seca no futuro. Isto leva o planejador
11\11~()S hídricos a duas situações ineficientes : superdimensionar as
I 11.~" custas de investimentos demasiados no reservat6rio de acumulação,
1I111111\1cnsionaras reservar às custas de racionamento durante o período
,,11'c essas duas dimensões estaria aquela ótima.
Ill! cn tun to , a situação é mais complexa do que o acima exposto,
11111111\11.1 por que as vazões são aleatõrias, Assim, existirão períodos nos
1!l1, dlJll'11l1lnada dimensão de reservat6rio será suficiente e outros em que
ceção ocorre nos casos extremos em que seja implantado um
11'110excessivamente grande, que permita atender sempre a demanda, ou
VlIllU.lI1tc pequeno, que nunca o faça. A dimensão ótima para um
1111\110devera ser considerada em função deum compromisso entre o custo
thncnto na sua implantação e o custo da escassez de água durante os
. O primeiro custo é diretamente proporcional e o segundo é
proporcional à dimensão do reservat6rio. Quanto menor for a
\1111 do acumulação de água, ou seja aquela que pode ser
,I 111 lU,) 1 \lb utlllzada, mais provável é a ocorrência de racionamento.
111111111,1\IHlnIlS na situação de extrema aversão ao racionamento seria ótima a
11Ilr eonsrruir-sc um reservatório que semprepudesse acumular água para
dOlllllndll,
11m rlsoo de que o mclooínlo previamente elaborado leve à errônea
II 1I11t.'lpllrtl o ntcndlrncnto 1\ qualquer demanda hídrica seja suficiente a
II di: 11111!'~\~I.lIvll\(~d() com 011111101411\(\0\1111suflcícutcmento grande de
1,"'ill\~n'l IftlUi pmquc, ohvhuucutc, 11 ollplluldu(lc ,'til de lIounlulJlçllo do um
I' 111I,d'l "l,dtllll Ill'l I'rllllV 11lI11'1I1C' 1I1111t.l\llu110 houver durnnto ,11/111111

Outros materiais