Baixe o app para aproveitar ainda mais
Prévia do material em texto
658 12-U. S. Army. Corps of Enginners. 1976. Guidelines for f/(I/'" ,I, reduction. Sacramento. 13-WATER RESOURCES COUNCIL, 1971. Regu/ation of flood ha reduce f100d tosses. Washington. Não paginado. Capítulo 17 HIDROLOGIA ESTATÍSTICA Robin T. Clarke 11••11 de Hldrologia Estatística 1IIIIIIhlnde Hidrológica iclo da água, tanto nos aspectos hidrol6gicos como nos da as inferências estatísticas mais freqüentes sobre seqüências Iradas, em intervalos discretos de tempo, são ilustradas a liiJljl 1/.1 são apresentadas duas seqüências de cheias anuais (vazão iltdll tio período de 1934-1984) para dois locais da bacia do rio !lI" ('llllulna. Brasil). Estes dados são dos postos do rio Hercílio 1/114 1111111111 de 3314 km2) e no próprio Itajaí em Apiúna (9242 km2). I IjllGuI,llu, um fato comum nas séries hidrol6gicas, interrompem a I illlllllH (Ntlcll semelhante das duas séries é que as cheias extremas 11 1111111 dos dois anos de registro (1983 e 1984). 17.3 são apresentadas as vazões médias mensais para os 111111o p"ru os últimos 5 anos de registro da série, para um posto \ 111 11Ihutl{l'io do rio Uruguai, rio Lavatudo em Fazenda Mineira I11I ~ 1112). Enquanto existe alguma evidência de um ciclo anual, com il1lld I,\wlolldn para ser menor nos meses de novembro a janeiro, existe Iilltlllthull) do ano para ano. O abastecimento de água que utiliza 1111'1'"1'11111 considerar esta grande variabilidade, para evitar 1111 ulullltL'clmcnto. Ir/ •• 1 .!'to upresen tadas seqüências de medições de radiação solar, II li, 1lIlllpN'lllltrllS do bulbo úmido e seco e velocidade do vento e I I 11111 1"\1 (I/dl) do 24 horas em novembro de 1990, registrado por uma I1 11111'11. 11111' l'ldlldc de Manaus, Amazonas. A seqüência é parte de um lillllllll d" tllllloH horltrios de vários unos. colctados com o objetivo de j. IIIII~II dI' 11ll(l1~111 dentro du Al1lnzÔnin C como O clima é afetado pela I 11. dndfl/i dt' t'lullllçl\o IIp rt..'s1.'11lU 111, (;111 pnrticulur, "mil clara li,iill\ 11/11 ""I~ nrl tllIH 11m'lI II \1111I1 l'IllIldlldl"l. 660 Hidrologl Tabela 17.1. Vazões máximas diárias anuais, em m3js, de Ibirama (ba de 3314 km2) no rio Hercílio e Apiúna (bacia de 9242 km2) no rio Itajaí elll S. Catarina, para o período de 1934 a 1984. Anos Ibirama Apiuna Anos Ibirama Apiuna 1934 ,.. 1111 1960 487 1240 1935 1342 1914 1961 897 2160 1936 625 1507 1962 582 1550 1937 619 950 1963 510 1750 1938 797 1111 1964 ,.. 648 1939 1250 1742 1965 708 1460 1940 271 1033 1966 998 1930 1941 263 918 1967 477 727 1942 566 881 1968 298 562 1943 649 1960 1969 872 1730 1944 236 495 1970 483 1020 1945 474 566 1971 1040 2030 1946 763 1280 1972 1010 2210 1947 592 1100 1973 1240 2310 1948 981 2250 1974 697 951 1949 438 702 1975 1406 2760 1950 2!H 1680 1976 801 1575 1951 556 909 1977 741 1640 1952 393 1620 1978 1002 2156 1953 726 1890 1979 1090 1847 1954 897 ,.. 1980 ,.. 3086 1955 969 3090 1981 589 927 1956 566 1220 1982 490 1539 1957 1300 936 1983 2475 4327 1958 526 1984 2125 4314 1959 520 l lhlrologia Estatística 661 111110111 17.2. Vazão média mensal, em m3/s, para o rio Lavatudo em Fazenda {hlcira (bacia de 1141 km2). Primeiros 5 anos de registro. Mês Ano 1 Ano 2 Ano 3 Ano 4 Ano 5 Janeiro 1,83 13,90 0,95 32,17 9,87 Fevereiro 3,03 4,99 27,09 29,75 24,21 Março 3,15 8,21 4,57 16,06 10,16 Abril 2,16 3,15 2,58 7;20 2,78 Maio 12,28 1,70 1,60 8,18 21,26 Junho 33,36 16,55 3,55 78,18 19,51 Julho 34,38 11,87 5,73 50,46 20,22 Agosto 53,69 4,39 10,84 22,99 18,67 Setembro 43,52 6,83 22,12 9,02 40,38 Outubro 13,10 4,43 10,29 10,46 22,09 Novembro 7,44 9,91 3,90 . 3,51 10,31 Dezebro 4,83 1,27 4,14 6,07 24,41 111111 111 17.3. Vazão média mensal, em m3/s, para o rio Lavatudo em Fazenda 11111'1, II (bacia de 1147 km2). Últimos 5 anos de registro. Mês I Ano 45 Ano 46 Ano 47 Ano 48 Ano 49 5,95 13,40 34,53 15,82 45,78, <, '.0,60 9,57 37,85 15,68 31,56 26,<0 3,38 8,59 15,12 10,59 27,60 21,78 52,66 46,40 21,26 18,20 24,10 !18,90 48,2.5 34,77 25,60 18,10 37,01 35,18 7,10 16,90 16,80 39,88 17,84 23,00 24,50 17,90 50,32 5,57 49,68 23,60 26,00 32,05 45,21 90,77 26,30 30,70 69,30 17.76 26,46 24,00 63,00 I'J9,99 7,20 9,32 4,83 28,20 13,72 9,79 9,14 662 Hídrologia Tabela 17.4. Registros de dados meteorol6gicos obtidos por estação automãtlou em Manaus para um dia de novembro de 1990. Os dados são totais ou média horárias, calculadas por medições com intervalo de 10 segundos. As horas referem ao horário de Greenwich. SolR NetR Wet Dry Wspeed Wdir -2,0 -26,9 23,0 23,5 0,2 80,5 -1,7 -19,,1 23,2 23,7 0,4 64,9 -1,8 -2,1 23,1 23,4 0,2 58,5 -1,2 -13,6 23,2 23,5 0,0 57,6 -1,4 -13,6 23,1 23,2 0,0 51,7 -0,8 -9,6 23,3 23,4 0,0 181,4 -0,4 -7,6 23,4 23,6 0,1 135,8 -0,9 -10,2 23,2 23,4 0,1 129,5 -1,1 -11,3 23,1 23,2 0,0 65,7 4,5 -4,0 23,3 23,4 0,0 80,2 58,0 30,3 23,7 23,9 0,0 134,2 128,4 76,8 24,0 24,7 0,1 74,2 289,7 186,4 24,4 26,0 0,3 87,8 639,9 424,5 25,1 28,2 0,7 97,7 542,0 355,7 25,5 29,1 0,7 93,2 508,8 333,6 25,5 29,7 0,9 72,8 695,1 455,2 25,6 30,8 1,0 56,3 682,8 442,2 25,7 31,7 0,8 91,9 520,6 330,5 25,6 31,7 0,9 59,5 394,3 235,5 25,7 31,8 0,5 78,0 207,0 92,5 25,3 31,2 0,2 94,7 29,8 -24,4 24,8 29,5 0,0 87,1 -2,4 -42,7 24,4 28,5 0,3 88,8 -2,4 -42,2 24,4 28,0 0,3 97,2 SolR -radiação solar em Watts/m2; NetR- radiação efetiva em Watts/m2; Wet - temperatura do bulbo úmido em graus Celsius; Dry -temperatura do bulbo seco em graus Celsius; Wspeed: velocidade do vento em m/s; Wdir-direção do vento em graus. d) a tabela 17.5 mostra valores de 8 variáveis medidas COl 1984 a outubro de 1987. observações ostn I rClIllllnr!cl"dc dI! llklrologia Estatística 663 ,111 cheia foi ordenada de forma decrescente. As outras variáveis seguem a IIlllHma seqüência. 11(!lola 17.5. Valores de 8 variáveis medidas em cada uma das 30 diferentes Iltluhontesocorridas no rio Booro-Borotou, Costa do Marfim, Africa do Oeste, ,lIlIlInlc o periodo de Junho de 1984 a Outubro de 1987. A área é de 1,36 km2.-.-11 1\ mês ano fv fp ft fs bf pv pt pi I ago 1985 11,10 4150 148 1 20,50 82,7 304 80,4 I ago 1987 4,03 1260 566 1 2,06 55,0 20.5 80,2 I set 1987 2,60 1050 189 1 9,11 42,4 275 64,0 ago 1985 1,89 466 394 1 6,75 54,8 431 41,9 ) ago 1985 1,78 315 349 1 13,50 45,6 182 47,2 I set 1984 1,73 183 492 2 4,40 57,0 254 35,1 .ago 1985 1,58 570 205 1 12,10 43,4 289 26,0 I jun 1984 1,56 682 201 1 0,19 56,4 200 95,7 \ set 1986 1,30 201 558 2 3,44 40,0 149 32,4, jul 1985 1,25 466 218 1 1,81 54,4 222 38,3 I ago 1987 1,20 115 859 2 7,98 31,2 300 21,7 set 1984 1,13 62 836 2 2,75 41,8 489 21,0 out 1985 1,09 71 884 2 7,08 28,3 * 11,4 I jul 1985 1,04 265 343 1 2,40 33,7 148 35,0 I ago 1987 1,00 66 1041 2 0,45 52,5 327 52,6 set 1985 0,92 119 550 2 20,50 35,6 331 * ~ set 1985 0,88 173 363 1 19,60 24,8 54 43,0 ~ ligo 1985 0,85 119 420 2 13,80 32,1 331 31,4 I set 1987 0,84 201 328 1 20,80 19,9 50 28,1, out 1984 0,82 111 479 2 2,06 39,7 153 33,7 ~ out 1987 0,79 61 160 2 10,20 22,5 215 19,3 /101 1987 0,79 64 963 2 10,70 20,4 179 25,4\ ou! 1984 0,76 131 445 2 3,13 34,8 279 47,7 oiu 1987 0,69 64 1009 2 11,90 18,9 161 * ) /101 1986 0,66 45 1281 2 2,00 29,4 172 46,6 /leI 1985 0,62 442 114 2 91,00 16,7 207 24,4 I Jun 1987 0,60 136 363 2 0,00 70,1 252 73,7, uno 1987 0,52 24 1273 2 2,32 24,2 256 25,6 Hot 1987 0,51 67 766 2 19,00 14,4 208 15,9 MOI 198G O,SO 18 1513 2 1,56 19,6 149 27,2_.- • duração d•• chcla de "use" Olll I!N; 11101'10 em 1lIi111110N: 17.1.2 Modelos Estatísticos 664 Hidrologiu Todos os quatro exemplos mostram duas características: a) as observaçõ são ordenadas no tempo; b) as observações, dentro de cada seqüência seguem uma mesma tendência geral, com considerável flutuação na vizinhança da mesma Diferente das seqüências matemáticas, onde os pontos caem sobre curva suaves, as seqüências de observações hidrolégicas mostrampontos espalhado numa larga amplitude. A seguir serão descritos como os métodos estatístlco podem ajudar a descrever o comportamento das variáveis hidrolõgicas, como I flutuação irregular que segue uma tendência. Para várias aplicações hidrol6gicas é suficiente observar a tendõml apresentada pela variável plotada (qi), que consiste na soma de ti 1111 componentes: a parte sistemática e a parte aleatória. A parte sistemãtlcn cornurnente representada pela função f(t), dependente do tempo. Esta fllll\,1I1I usualmente contém alguns valores fixos, que necessitam ser estimados COIII !til nos dados disponíveis. Estes valores são denominados de parãmctrus representado pela letra Grega 8 que pode ter vários componentes, III 8z, ..,8k. Desta forma a função é expressa de maneira mais completa por 1'(1,1)1 onde 8 é um vetar com k componentes. A parte aleatória representa a flutuação com relação à COmpOIlL'III. sistemática. usualmente representada pelo símbolo €I ou ar, onde o rlllll,' indica que este componente também varia com o tempo. Desta forma Cjl, " :I variável dc interesse, que pode ser cspressa por qr = f(I;8) + Et (1'/ 1'I Considerando as simplificações apropriadas sobre €I (discutidas dl'III"" equações como a 17.1 representam uma família de modelos estausticos, 1'1 1111101 família devido ao seguinte: a) a forma precisa da função f(.) ncccH"11I18ii definida; e b) os valores numéricos do parâmetro a, juntamente COI\IIIIIIfl! parârnctros que descrevem a variável aleatória €I, ncccssli 11111 especificados. Normalmente, os problemas encontrados na modclancru (~IIIIII("I de séries hidrológicas incluem o seguinte: aproprlndu 1111I11liltlI) determinação da forma explícita de f(t;8) rnai modelo particular; 2) estimativa eficiente dos parâmctros dcsconh parâmetros envolvidos na estimativa de Ct). idos () (O 11111111 tipo expresso CIO (17.1) podem rcprescntur. 1111>1:111 17,1 purn () do I Il'I'd 11I \ l'lll 11111111111\ llidrologia Estatística 6CJ5 primeiro momento, por um modelo simples do tipo qr = ~ +€I, onde qt é a cheia mual no ano t. A parte sistemática do modelo, ~' é um parârnctro, udcpendente do tempo, o termo aleatório a, que pode ser positivo ou negativo, representa a flutuação anual com relação ao valor fixo u. lívtdentemente que se houver mudanças nas bacias ou outros fatores, como onstrução de barragem que altera a tendência das cheias ao longo do registro 110 cheias, não é apropriado considerar que a parte sistemática é uma uonstante; análises estatística indicarão se a não-estaciona/idade deste tipo Importante. No caso do registro de vazões médias mensais (qt) do o rio Lavatudo, 'prescntada nas tabelas 17.2 e 17.3, será razoável explorar um modelo do tipo qt = o. + ~1 COS(21t1/12) + ~2 sen (21tt/12) +0 (17.2) '\ A parte sistemática do modelo não é mais constante, mas depende de t e uutcm três parâmetros 0., ~l e ~2. Da mesma forma que o anterior, se a 11~l\Ilenciadas médias mensais mudarem ao longo do período, a parte sistemática 11\111 que ser modificada para levar em conta esta nova tendência. Observe que o uuulclo da equação 17.2 não tem estacionalidade, já que qr varia sazonalmente 111111 relação a um valor fixo 0.. As funções de coseno e seno traduzem uma IldllÇi'lO cícliea sistemática, observada na sazonalidade do processo I 1I111~tico. Nos dados da tabela 17.4 para radiação solar total e efetiva, observa-se 1111 comportamento mais complicado para o componente sistemático. Dentro das 1llllllHcom claridade, a tendência é aproximadamente harmônica, enquanto que Ihlllultc a noite o componente do tipo da equação 17.1 é mais apropriado. ,. ,.i Modelos estatísticos usando variáveis explicativas 011 exemplos discutidos anteriormente usando os dados das tabelas 17.1 a t 'lI utlllzaram modelos estatísticos com um componente sistemático , IIHlllllllldocom o tempo t (qr), Esses modelos descrevem o comportamento de 111\1I vnrlãvcl c não procuram estabelecer o relacionamento entre duas ou mais ,lIivl'ls hídrolégicas. Frcqücnternente é necessário definir este tipo de I lilillwlluncnto, quando isto ocorre o componente sistemático do modelo incluem 11,lllvt'IRbldrolõgicas. Assim, para explorar o relacionamento entre vazão 1I,Idlll uiensul qt c prcclpltação mensal no mês t, H, ..., a forma geral da 'lfllllln" 1"/,1 éSmodlflcnda para '11 1'1 f( PI,pl-I, •.. ;O) 'I (', ( 17.:\) 1\ III d 1(" \11111\ 11111'11\ IH, !lI I.", "nu 11 '111111hll 1111(\ 'I' 111111V,tlll ti1111 !l1111 666 Hidrologia profundidades da precipitação efetiva durante os intervalos t, t-I, .... !oI(O considerarmos que a bacia, quando saturada, funciona como um sistema linear e, que qi contém um componente aleatório et, então o modelo relaciona ql c 1'1 da seguinte forma qt= ho pt + hi pt-l + hz pt-2 + .... hk pt.k+l +et A parte sistemática do modelo contém agora k parâmetros hí, i =O,l, ..k I (ordenadas do hidrograma unitário, definido no capítulo 11). Pode expressar de forma geral o modelo estatístico com variáveis explicativas du seguinte forma qr = f( [pr}; [Er}; {si};...; 8) +et tendo .vários conjuntos de variáveis explicativas [pt ]= [pr, PI_I, {Et}={Et,Et-l... }; {st} = {St,St-I,... } que, por exemplo, pode repreSl'I111I1 precipitação, evaporação potencial, estado de umidade do solo entre outru Na fanu1ia de modelos estatísticos contendo variáveis explicativux, 1\ função linear é o tipo mais simples, como na equação 17.4. Seja qual fOI /I forma da função f(.) as variáveis explicativas podem ser causativas ( 1111 sentido que precipitação e estado de umidade do solo determinam o eSCOUIIH'IIIH superficial) ou elas podem ser simplesmente variáveis úteis para a estluuulv« de qt sem, necessariamente, implicar uma relação causativa. Por C)«('llIplll durante um longo período de recessão, a vazão qr pode ser uma boa indlctuhuu do valor de qt+l, na falta da precipitação. Portanto, usando um modelo ilu forma qt+l = e qr + et, qt não é uma variável causativa de ql+1. 17.1.4 O componente aleatório et Até agora foi mencionado muito pouco sobre as propriedades do t'l, 11111111 considerado como aleatório, contudo o mesmo possui uma distriblll~'nll II probabilidades. Considerando o seguinte: a) que o seu valor médio (valor esperado ou Esperança, idcntiflcntlu 1"111 símbolo E) da variável aleatória et é zero, isto é E[el]=O; b) para a maior parte deste texto consideramos que independente; ou seja, que a distribuição de pr P(EtI,et2,Et3,...), para cada conjunto de et fica 111111'111' 111111111 P(erl,et2,et.1, ..) ta P(ell).P(PI2).P(!!1 onde 1'("11) \ tlIRjllhul\'!t(! 1I111fHltml tllJ "11. ANNIIII,Il~'illdll I) 1111111,111 il ( 1 ri, li (l7A) (I', llidrologia Estatística 667 = J.l + et para a vazão média de enchentes da tabela 17.1, a simplificação de independência estatística implica que nenhuma informação será perdida em alterar a seqüência no qual os valores de qt são escritos. A simplificação de independência estatística é muito forte, e a verificação disso corresponde a uma parte importante do processo de selecionar um modelo estatístico apropriado, ajustá-Io (estimativa dos seus parâmetros) e verificar se as simplificações do modelo são válidas para um conjunto de dados em estudo; c) ao considerar que {€I} tem a mesma distribução de probabilidade, admite-se que as distribuições marginais P(etl), P(et2), ..tenham a mesma forma matemática, com os mesmos parâmetros. No início do estudo de modelagem é necessário adotar uma distribuição em particular. A análise deve verificar se a escolha inicial da distribuição é apropriada para os dados em estudo. Em resumo, o modelo estatístico tem parâmetros de dois tipos: aqueles illINltolndoscom a parte sistemática do modelo e aqueles associados com uma ,U.'dhuição de probabilidade em particular que usa um componente aleatório ;1 ( .1.,' Parclmônla na construção de um modelo estatístico Temsido apresentado que cada modelo estatístico contém alguns Ittll/1llllltros associados com o seu componente sistemático e outros associados 11111 11 componente aleat6rio. Se formos pródigos no uso de parâmetros, ou seja ""'"Ido um modelo com número de parâmetros igual ao número de dados, veremos li" 11 modelo se ajusta exatamente aos dados: o componente sistemático passará 1'111 nulos os pontos dos dados. Na prática, contudo, esse modelo terá um hi"~IIIIlMho muito ruim nas aplicações discutidas no item seguinte. Um prlncípio cardinal na construção de modelos estatísticos, em IIltlllIloUl1l como em outras ciências, é que devemos usar o menor número de I"" IIllIl'h'O/l necessários para descrever adequadamente as características dos I "li,. Hl'Iscl1ciulmcnte, o modelo é como um resumo de um documento técnico, se 1"'111111 tSum documento longo o mesmo não atinge a sua finalidade. De outro 111, 1111 1111\ modelo cstatísticc falha para descrever características dos dados 11'111 Itlod~ll\dos, O modelo não satisfaz, tanto quanto o resumo do relatório IIh I' 111\0NlIllllfnz se Ó condensado de tal forma que omite as principais li' lll'~o., Felizmente, li teoria cstatlstlcu fornece procedimentos IH'IIIIIII\IIVlll'I(I"C pcunlto I'.lIfullllr, etn muitos cusoe, se Il inclusão de um 1,IlIlr1111 "dlulol)l\1 1\('HlliC'lllllu "I'H'olrtvel Illfmnult;no, j~ lncluídu dentro 11 1111111111jll'llltlllhu c1l' 1111111(1111, II'II.,IUI~I\II\, 1111 lllllllllll;_1I de 11111 1110114.110 llUnlrllll'lI, 6 11pilllll(JlIII II 668 Hidroloaln limitar os parâmetros a um número pequeno que adequadamente resuma características dos dados. 17.1.6 Alguns usos hidrológicos de modelos estatísticos Tem sido usado o termo construindo para descrever o processo ti formulação de modelos estatísticos de dados hidro16gicos. Como colocm tijolos, formulação de modelos é um processo iterativo: iniciando com um modelo escolhido que, por inspeção gráfica dos dados ou de outra forma, pOlI representar razoavelmente suas principais características. A sC~lIh I determina-se onde o modelo falha nas suas intenções; isto é reall:l,11111I plotando os valores ajustados pelo modelo e comparando com os vnlm registrados. As discrepâncias entre os valores ajustados e os observados ,lIu idéia como o modelo escolhido deve ser modificado. Alterando o modelo ti melhor maneira é possivel continuar o processo iterativo até que nenluuu« melhora seja encontrada. Claramente o ajuste de modelos estatísticos aos dados hidrológicos O 11111 processo que exige constantes iterações entre o modelador e o seu cornpuuuhn Esta iteração traz dois perigos: - modelagem pode ser um objetivo em si só, o modelador perde o "t1111Id" prático para o qual o modelo foi originalmente desenvolvido; - o modelador pode acreditar que seu modelo é a realidade hiuroll'~II), ao contrário de ser uma grande simplificação de algo multo IIldl complicado. Em casos extremos, observações de campo do componnuuru hidrol6gico que não se aproximam das predições do modelo p0(/I'III .11 desconsideradas; mas freqüenternente estas abcrrantes observações "111 realidade, indicando sérias limitações no modelo estatístico. No restante deste item serão apresentados alguns exemplos para os quais modelos estatísticos foram usados. Esta lista não mas serve para introduzir aplicações que serão discutidas ao lon capítulo. I lldrologia Estatística 669 1llIl.lrgia. Usando um modelo da forma qr = J.I. + Et com uma distribuição de I'wbllbilídade apropriada P(Et) para o componente aleaiõrio Et = qt - J.I., pode- ,\ observar que J.I. é a média anual das enchentes, considerando que E[et]=O. 111111\estimativa Xo da cheia anual com período de retomo T anos pode ser «híklu pelo seguinte procedimento: 1) estime por procedimentos eficientes os IIIHRll1ctros da distribuição P(.); 2) determine se a distribuição ajustada H'plc6cnta adequadamente a seqüência de cheia anuais, se isto não ocorrer, IIhllllfique para tanto; 3) quando um modelo satisfat6rio for identificado, ",,"Iva a integral 00 J f (q; 9)dq = ltr x, (17.7) IIdll f( ) a função probabilística de qt. ,I liuI pníscs desenvolvidos, registros de enchentes tão longos como os do rio i10 1111110001 Ibirama e o rio ltajaí em Apiuna são exceções e não uma regra; I11 411HIque os registros existam por muitos anos, existem falhas que destroem 1111Ihlllllnuldade. Um engenheiro ao projetar um vertedor de uma barragem, ou I1I1 1111I\loJudorregional ao descobrir que tem uma série pequena de registros 11llilll(vols, necessita explorar se existem registros longos de cheias anuais I1I outros locais em bacias vizinhas. Se existem registros longos de 11, lu HII)" na vizinhança é possível transferir informação para o local de 1 ou seja, usando estes registros para adicionar informações sobre 1t·IIIMIIOIIldas cheias extremas. Várias possibilidades existem para efetivarI' 1lIllIlIfl.lfOncia:um procedimento é o de usar uma distribuição bivariada !~1111111U11\ para as enchentes nos dois locais e calcular a distribuição de h41HIIIIlItllulccondicional para as cheias anuais no local de registro curto, llll 111011\ Iill enchentes no local de registros longos. mn que ó ainda mais crítico que o descrito no item b, ocorre onde (e~!ISIIOSna vizinhança do local de interesse. Um procedimento 670 Hidrolo registro. é possível estimar as características da cheia (capítulo 15). d) Planejadores preocupados com o suprimento de água para uso doméstico, ti_li agrícola. geração de energia ou indústria. necessitam assegurar que 11 suprimento é suficiente e confiável. Isto não significa que este suprimento nunca deve falhar. mas que a freqüência de falhas é pequena. que a dUrll\,nll das falhas. quando ocorrerem serão curtas e que a magnitude da falha nno muito grande. Se a água é retirada do rio. um modelo estatístico ti •• comportamento do escoamento através do ano fornece uma forma na qU1I111 planejador pode explorar. por simulação, a freqüência na qual as flllh ocorrem para uma dada regra de retirada. Com este problema o planejador pode construir um modelo estatístico 1111 tipo da equação 17.2 (provavelmente mais termos harmônicos Nl,.n•• necessários). Dependendo das circunstâncias será necessário o uso de Vlllnl médias para períodos menores que um mês; e se existem várias altemativns I1 locais de retiradas em diferentes rios. será necessário desenvolver um O!()(ld •• multivariado que leve em conta a variabilidade sazonal do escoamento CIII 1'1111 local de retirada e forneça alguma tendência para o escoamento aumcnnu diminuir. e) Os exemplos prévios analisaram modelos estatísticos do escoamento 1'111 regiões semi-ãridas, o escoamento é esparso e muitas vezes intermitente; 11111 avaliar o potencial de uma região quanto à disponibilidade de preciJlIIII\ftll para agricultura. não existe. normalmente outra alternativa senão a do II~III' precipitação diária que é mais facilmente disponível e com séries IOUHI! Modelos estatísticos, para a ocorrência de precipitação diária e du ""1 total. quando a mesma existe. têm sido desenvolvidos para o cãloul« I1 probabilidades de seqüências de dias secos e úmidos; adotando sirnpllfk-n razoáveis sobre a capacidade de umidade do solo e taxas de evaporação, III /" provado que é possível estimar as probabilidades de disponibilidade do 111111 no solo. para um tempo normal de plantio. que garanta o crcscimoum I1 cultura em estudo. Modelos de precipitação deste tipo pertencem II 11I11 importante classe de Modelos Lineares Generalizados (GLMs). l lhlrõlogia Estatística 671 """tOS níveis de enchente; ou seja. intervalos que têm uma probabilidade I'l'I.,{fica do nível da enchente estar contido. O cálculo desses intervalos é Iillulutunente possível quando um modelo do tipo 17.1 foi ajustado com uma 11I1.ldcração válida sobre o componente aleatório. como especificado no item I Ik Um intervalo de confiança baseado na verossimilhançapode ser !\llllndo para O parâmetro do modelo e. e sua região de confiança pode. em 111111, ser usada para derivar os intervalos para a previsão de vazões I!IlIItIlH, I l'lldos os exemplos acima referem-se ao planejamento e operação de sistemas u-oursos hídricos nos seus aspectos quantitativos. discutidos em termos da uuululngcm do relacionamento entre variáveis hidrol6gicas como qt e tempo. ou 111111ql c variáveis explicativas. Quando à qualidade da água também deve ser IlIlltll·rada. o número de variáveis resultantes da análise química e biológica uuulc. Uma importante atividade preliminar é a preparação de um resumo 11'1'11111\(10ás características essenciais de cada variável. Enquanto os olhos IUIIIII!II0Spodem absorver as características de 10 números, para 100 números é 111111111dlfrcil esta análise, muito menos para 1000. Neste capítulo são 1111111111118as técnicas apropriadas para resumir um grande conjunto de dados. 1111'1IIIudn suas principais características. I I"'ngramas computacionais para ajuste rápido de modelos estatísticos l'UH.:tdimentos gráficos é um componente importante no ajuste de modelos 1",U/hl"ll para dados hidrol6gicos. Seguindo o desenvolvimento moderno dos 1111. estausticos de cálculo como GUM. GENSTAT e MAlLAB para uso t,lIlvlI com computadores pessoais, a análise gráfica tem resultado numa 111111 uíulto mais flexível para exame de dados. O uso de procedimentos 11[11.IlllIl lima participação central nos métodos descritos neste capítulo e 1"111111'"Nfio orientados para familiarizarem-se com os pacotes mencionados. d~ distribuições estatísticas ~Iluhllo nulo nsidcrado um modelo simples no qual a variável yt é yl • Il .•.€I (17.7) "11I11 li, til t I IltlllllllOlllo 1I111I\[ólÍ() cl 1111'11'_1 !;() 1111111 qualquer t /I IliSfllZ " condição .} 101lIb,II(I" I1I1HI que () r'; 672 Hidrologill simplificação importante, onde yt (e em conseqüência Et) são estatísticament independentes, todos com a mesma distribuição de probabilidade. A ênfase do capítulo é sobre a estimativa dos parâmetros do modelo para diferent distribuições de yt em problemas onde os métodos estatísticos são usados pur responder questões sobre a freqüência de eventos hidrol6gicos extremos. O modelo simples (equação 17.7), que não inclui variável explicativa, ou variáveis que explicam, num maior ou menor grau, como yt varia, é chamado (\ modelo nulo. No modelo nulo, ·cada dado de yt tem o mesmo valor esperado I' Quando a variável explicativa está incluída, o valor esperado de cadu yl será diferente, dependendo dos valores das variáveis explicativas xr, Nos pr6ximos capítulos são apresentados modelos mais complexos ond componente sistemática ~ do lado direito da equação (17.7) é substituída \1111 formas envolvendo variáveis explicativas. Mais tarde neste capítul considerado o caso onde ~ é substituído por uma combinação linear ,I variáveis explicativas. Modelos com as simplificações mencionada (independência estatística de yr, onde todos os yt têm a mesma' distribulçãu de probabilidades) são apropriados para um grande número de problcm hidrol6gicos, particularmente para aqueles em que yt são o maior e o rnCII 11I valor de um ano hidrol6gico. Assim, neste capítulo, serão descritos mO(\l'11I estatísticos para vazão máxima anual, vazão mínima anual, precipitação LI1111I1I e para a precipitação máxima anual de duração de 30 minutos. Observa-se 'I" vazão total anual pode ser ou não considerada, com scgurnnç estatísticamente independente de ano para ano. Numa bacia pequena, ti primeira ordem, com resposta rápida, a vazão total anual segue um rtl"htl anual e a consideração de independência anual é justificada. Contudo, VlI'f ntl média anual para uma grande bacia com grande capacidade de armazenamon to 1'111 água subterrânea provavelmente apresentará correlações de ano para IjIlO. I I modelos apresentados neste capítulo não serão apropriados. 17.2.2 A função de verossimilhança Para fixar idéias, suponha que yi, y2, ...yN são vazões máxhnuH (1'111 cheias anuais) observadas numa seqüência de anos. Os dados do rio 111\/111 1111 Apiuna (tabela 17.1) são dados típicos desta função. A simplificurnl1 I1 independência é válida, e não existe necessidade para u scqnOnl1111 11,11 contínua, ou seja a ordem das observações não é importante. Se, 00111111111, " necessário em alguma fase do estudo verificar se a resposta da bucln 111111111 mudar ao longo do registro, talvez como conseqüência do uso dll te 11I1I I'Il1nll ordem na qual as observações ocorreram será crltlcn pnrn 1\ 1111di estatística. Considere que 8 dlstrlbuição de probnbilidU(I ...• f(y;O), onde O cS um vetor O(llltClltlO nonuahncntc l!olfl nu 11~N.1\ (1IIIIIllhll'll l lhlrologia Estatística 673 que por definição o valor esperado do operador E[.] : fica 00 E[ytl = J f(y;9)dy = ~ (17.8) -00 111111" u integral será função dos parâmetros 9. Como yt é estatísticamente 111IIt'pondente, a probabilidade de obter as observações yt é f(Y1;9).f(Y2;9) .... f(YN;9)dY1.dY2 .... dYN (17.9) 1I1IIIndo que yr, y2, ... yN é uma amostra aleat6ria de uma população 11111111111. Conhecida as observações yr, a função de verossimilhança III,yl, ...yN) é definida por N L(9;Y1 ,...YN) = n f(Yt;9) t=1 (17.10) 111, u função de verossimilhança é proporcional a probabilidade de obter 111\(1115 observações, considerada como uma função dos parâmetros I",'"uhcoidos e. A função de verossimilhança é particularmente importante luqW\, quando o modelo estatístico é correto, a função L(9) contém todas as !lI" fllllIlÇOOS dos dados. Contudo, modelos diferentes resultarão em funções de Illuhllllhnnça diferentes e uma das tarefas necessárias é a de encontrar o 11111"1111 mais apropriado para representar as características dos dados Ihllllulví.lls. Algumas situações ocorrerão, nas quais não será possível 1111'11111'(lUO um modelo é mais apropriado que outro (ou outros). Neste caso, ,!tI IIlodelo, igualmente aceitável, terá sua pr6pria função de mlllumça. 1""1110 definida a função de verossimilhança é apresentada a estimativa 11 IlIlInllll'lros O. Para tanto é considerada a superfície definida por L(9) illlh, 1111111 simplificar 8 notação. o termo yt da expressão de verossimilhança lIlRldorndo) i\ medida que e varia. Evidentemente que para diferente do O. resultam diferentes valores para L(e). De todos os valor j.W il VI I. Ile O pode-se lntul tlvnmcntc esperar que o valor do O 111111 I'1 '1'1 b.IIIIlN'I( nquolc que tllllxlOli1.11n probabllldado dos vulorcs obscrvudea li 111.1' 11\, 'I"U 1I1llKIt})lzll u flltl~n() de vcrosslrnltltnnçn L(O). FOIIHIIIIllOlllO, plll" hlll\,nll do Vtll<tHsllllllhllllÇIi 1.(0) de lIlll" f'IIH~ltO de k pll1·nIllO\tIU(l, A A IIllIhlllll.lll Ü dt, () ~ 110111111111 ("01110 II vullll' cio (~ 1"111 ti j 'I. til 1'011I()}, )1111'11 Inllll II 0, Nu I'tl' 674 Hidroloal L(e) é um produto de termos como f(Yt;e). Utilizando logarítmicos de L(O) N I(e) = [log f(Yt;e) t=I (17.11) Os valores de e que maximizam I(e) também maximizam L(9). Os valores 11 1\ e que maximizam L(e) e I(e) podem ser obtidos derivando e resolvendo equações ai alog L 1 aL -= =---=0 eo se L sa Estas equações em geral não têm solução explícita para e (a solução 111111 pode ser encontrada na forma q igual a wna expressão contendo somente II valores observados de yt). Como conseqüência será necessário resolver equações iterativamente; alguns exemplos são apresentados a seguir. QUIIIlIlu 11 vetor de parâmetros e têmapenas dois ou três elementos, é recomendãvol 1111,'111 as superficies L(e) ou I(e) por métodos que são demonstrados abaixo. Ajuste da log-normal de dois e três parAmetros pela máxima verosslmllh Log-normal com dois parâmetros- A distribuição log-normal de dois purRm.,ll" de yt é f(y;~,a2) = _1_ exp [ __ 1 (log Y - Jl )2] (O ~ y <(0) (1/ 1\1 yo~2n/ 202 o logaritmo da funçãode verossimilhança, 1{J.1,(2) na qual II~ 11111 parâmetros anteriormente definidos por 9=[91.92] são agora dcnoll1huIII" el=Jl e 92=a2• fica 1 . [ '11IÚL,(2) = - N 10g. (J - (1/2) log (27t) - L 10g Yt - - L 10/1 YL .)1 < 202 , t do qual (17.1J1 IlIdrologia Estatística 81 1 - = O resulta em - L (log Yt - Jl)2 = O all 02 8/ N 1 \"- = O resulta em - - + -:- L (log Yt - 11)2 = O o (J 03 Estas duas equações têm a solução explícita fi " '" 1: (log Yt)/N 1\ 2: 2 li' := 1: (log Yt - ~ ) /N . I, ,11,11 ,11)'" - cxp r ...:..(108 [r-a1 - ~)2l(u • v o,,,) (I '1.1ti 2()'2. , itlllldlll 'i"11 11 lllUn',WIIII 1_ 6 IIxudo r \III/llttulclll, 1111111111111111I1" 1"" 11" 675 676 Hidrolog Usando a variável yt"' = yt - ao o cálculo das estimativas de (k e éo é obtldu 1\ * J..Lo = 1: (log Yt )/N 1\2 * 1\'2 0"0 = 1: (log Yt -~) /N o valor correspondente do logaritmo de verossimilhança /<p..>. ao, •..1 para este valor de ao é 1(~.ao2.ao)= -Nlog éo - Nlog(27t)f2 -1:10g yt - _1_ LClogyt - Ao)2 (I'/.I~I2ao2 Fazendo variar o valor de a. ai.az •...an é possível construir uma (11111:1111 de verossimilhança co-idicional, mostrando como /(jlol10~ao) varia com 1111 valor de ao para o qual a verossimilhança condicional tem sua máxima dc/1u estimativa de verossimilhança de J..l e 0". Ilustrando com a seqüência de VIIII •• de cheias anuais do rio Hercílio em Ibirama, foram testados valores .11 variando de O a 200. de 50 em 50. Na tabela 17.6 pode-se obscrvm 11 resultados. onde o máximo obtido foi a = O. Este valor pode ser vcrHklul •• pesquisando-se na vizinhança de a=I), já que o intervalo de 50. utilizad« 1'"1 a pode ser grande. Observa-se que a estimativa de ao deve ser menor elo 11"11 Ii valor mínimo y(l) da amostra, para que yt não seja negativo. 9,0 iI,iJ 6,0, o. . o ""o.J 7.0 &,0 I--- ,--.. ------ I -, -:!,O -1,0 0,0 I, OOIVIO do dl~' I'IhuiQ/'Io nO! moi I ',IJ. 3,0 Piüurn 17.1. J)llllllb\llcRo (III/i VII'/, (ltj Apilll\l\, llhlrologia Estatística 677 ,',.bela 17.6. Ajuste da distribuição log-normal de três parâmetros para uma Illlencia de vazões máximas anuais (vazões máximas diárias anuais) para o rio lloreílio em Ibirama: 51 anos de registro, faltando 3 valores. Os logaritmos 111\ verossimilhança calculados para a série de valores do pârametro a, que '/DUnC o limite inferior da distribuição. a 10gL O 8,594 a 10gL 50,00 4,437 a 10gL 100.0 -0,4701 a logL 150,0 -6,628 a 10gL 200.0 -15,56 1',,1\(\0 a estimativa dos parâmetros do modelo log-normal, é possível \~ cheias anuais com período de retomo de T anos pelo cálculo de yo 1'1\911. a equação seguinte YoJ y-l exp f _1 [log y - ~]2]dy = 1 - 11 7t 2é2-00 (17.16) 678 Hidrol() Portanto, (log Y0- A)/tt = 2,32, log Y0=2,32 X 0,5+ 7).7, e o valor de exp(2,32 x 0,5 + 7).7)= 4582,5 m3/s 17.2.3 Métodos dos Momentos o método dos momentos vinha sendo mais utilizado pelos hidr61llM'" porque é computacionalmente mais simples de ser calculado, antes do ndVI'IIIt' de programas estatísticos generalizados, mesmo sabendo que a estimativa IMI este método é inferior que a da máxima verossimilhança. Com as facllJelJll1 computacionais atuais, o método dos momentos pode ser justificado apou". PI casos muito especiais; a simplicidade do cálculo não é mais uma justlfllHlIl aceitável. Isso não quer dizer que o método dos momentos não possa ser utillzmlu '" estágios intermediários de estimativas. Normalmente o métod« II verossimilhança requer a solução de equações por métodos iteratlv\l~ 'IIi exigem estimativas iniciais dos parâmetros, seguido de processos IU.llllllvtl da máxima verossimilhança; o método do momentos é útil para inlo\lu estimativas. Os textos de hidrologia anteriores punham considerável cor" estimativa pelo método dos momentos. Neste capítulo, contudo, a Onf'li~n II estimativas é no método da máxima verossimilhança. O método dos 1I10lJII'1I1t consiste em igualar os momentos dos dados com os momentos da distr\hlll~I"" II probabilidades adotada. Assim, se y, s2 são a média e a variança da 8011111\111,1 de dados yr, yz, .. yn, estimativas 91 e 92 de uma distribuição (I parâmetros f(y; Bt , 92) são estimadas, usando o métodos dos momcntn " "solução das duas equações seguintes para 91 e 92: <XI Y = L<XI y f(y;91,92)dy = 11. digamos, que será função de el e 92; e s2 = f <XI(y- 11)2 f(y; 01,62) dy -<XI = 02, digamos, que também será função do ()1 e 02: anel probabilidades tem três parâmctros, o terceiro nlOO1DOto (g:E(YrY)3/N), podo Sl.:r IgUlillldo UO terceiro HHHlI~mtq I dl""III" ulorrlnrlu .111 Irologia Estatística 679 <XIJ (y - 11)3 f(y; 91; 92; 93)dy oCO ponto essencial é que uma equação é obtida igualando os momentos da IIII1~trneom os momentos da distribuição para cada parâmetro a ser estimado. 111 uusos particulares, a estimativa pelos momentos e pela verossimilhança são 1llIlvnlcntes. Como estas estimativas não são geralmente iguais é demonstrado 111,hlestimativa de ~ e (J para a distribuição log-normal, As estimativas dadas 1111"método de momentos (veja equações 17.17 e 17.18) são obtidas pela 1111II.l"0das equações y = exp (~ + 02/2) s2 = exp (2~ + (J2).[exp «(J2) -1] 1111\~no é "2 2 -2(J = ln (I +s /y ) ~ = (1/2) ln [i/ (l+s2/i) ] "'llIlIIlltlvas são diferentes das obtidas pela máxima verossimilhança. dístrtbutções Gamma de dois e três parãmetros dllttrlbuiçílo Gama de dois e três parâmetros tem sido largamente 1111.•11111 1.1111 hldrologia com a finalidade de modelar as freqüências de cheias 11111,111I r••mdo os símbolos ~ e 1C (substituindo 91 e e2), a distribuição de t\_ ,III.'ftlili.ltrO& podo ser escrita como (K/~)t': y'IC-l cxp (-lCY/Il]/ f{'IC) O~y<oo (17.19) 1/'lr-/1 UlOlll ; ~1/1C • VflrlJlnoln ( O cocflclonte d (por exemplo de chcíns nnunls) qtl " r llinO (lu vor()H~lmllhlI09" podo /ler 680 Hidroloa 1(J,l.,K) = N K log(K/J,l.)+ (K-l)!:log Yt -(K/J,l.)!:Yt- Nlog r(K) (17.211) As equações 8 1/8J,l.=O , 81/8K=O, podem ser resolvidas numericameut obtendo-se as estimativas de J,l.e K, ou seja 1\ _ J,l.=y (17,", 8 10g T'(x) _ log K - = 10g y - 10g Y 8K (17,H' A quantidade a log r(K)/8K é a função digama, que pode ser facIJIlIClIII programada. Observamos que a equação (17.22) somente envolve K; POdOlll1l resolvê-Ia pelo uso iterativo da equação: K.. 1 = K. [ln K. - a ln r(K)/8K ] / (ln Y - ln y). 1+ 1 1 K=Ki No caso da distribuição Oama com três parâmetros, K x-If(y;J,l.,K)= (K/J,l.) (y-a) exp [-K(y-a)/J,l.] / r(K) a es y < IX) A estimativa dos parâmetros é um pouco mais difícil. Temos várias (lI para calcular as estimativas; uma delas é o uso do método de verossimlJl/lllfl condicional já empregado com a distribuição log-normal com três parnlHrlltl Isto é, usamos uma seqüência de valores fixos do parâmetro a, d11l11l1lt ao,al,a2, ....an, e para cada valor ai (i=L, .•n) nessa seqüência, 081011111I1111 estimativas dos parâmetros u, K pela resolução das equações (I'I,) I) (17.22). Substitui mos estas estimativas na expressão (17.20) rIU conseguirmos 1(J,l.,K; ai). Assim conseguimos a relação entre 1(J,.l,K;11 graficamente, ou pelo cálculo, podemos definir o valor a na Hl'lltll\llI'! ai(i=l, ...n) que maximiza I. Esta é a estimativa da máxima vcrosslrnlthmn« II parâmetro a; usando este valor de a, calculamos as estimntlvn correspondentes. Como no caso com a distribuição log-normal com 3 plll/llll observamos que a estimativa do parâmetro a não pode ser menor do '1tiQ 1/ mínimo dos dados yl,y2,_ ... 17.2.5 Escolha entre distribuições log-normal c gammu De forma geral as distribuíçõc forma da assirnctria, com uma longn OI\lI(/1I que permito as dislrlbulçl'lt-s J'oprCRolltlll'Olll 11 ltldrologia Estatística 681 uhlrolõgicos, onde a assimetria esta invariavelmente presente. A pergunta que 11111uialmente aparece é qual distribuição é maisapropriada? Atkínson (1984) 111cscntou um método para esta avaliação, que é o seguinte: a) ajuste o modelo log-normal aos dados (com base numa amostra N statisticarnente independente); b) usando o modelo log-normal ajustado gere 100 amostras de tamanho N; ) para cada amostra gerada calcule o máximo da função de log- verossimilhança considerando: l)modelo log-normal (LN); 2) considerando o modelo Gamma (O); li) plote LN contra O, mostrando no gráfico os valores de LN e O para a qüência de dados hist6ricos; ) repita as seqüências a até d ajustando a distribuição Oamma no lugar du log-normal. Pura explicar a interpretação destes pontos, considere primeiro que os 1'111I1lJ_(LN,O), derivados de N valores observados caem dentro da nuvem de 1'111111'.gerados (100 amostras de N valores). Neste caso não é possível 1I1t1I1Kulr entre a log-normal e a gamma. Suponha, no entanto, que quando as 11"IIIIIIOStrasda distribuição Log-normal foram geradas, os valores maximizados 1111 11l~·vcrossimílhança da distribuição gamma para os valores observados são lutn. com relação à LN, fazendo com que os valores observados caiam longe I., IIItVOIll de pontos gerados. Isso indica que o modelo gamma é mais apropriado. I 1lIlIlmonle, suponha que, quando as 100 amostras simuladas foram geradas pela 11111IlIullll'lo gamma, os valores maximizados do log-verossimilhança de LN são IIl1ldn" 0001 relação ao da máxima verossimilhança do logaritmo O, fazendo com li' 1111pontos observados caiam fora da nuvem dos 100 pontos. Isso indica que ItU 1111Imal é 1\ distribuição mais apropriada. 1I I)IHh'lbulçlio Gumbel cllNtdbulçtio é definida por Hv: /X,u)-cx cxp] -a(y-u) - exp] -a(y-u)}] (17.23)-IX) <y <00 I llllltllllotros IX c u; sua média c variância são u+y/C1. o 7t'-f6a2 11'1 tlVI'lllilllte, anuo li constante de Euler é aproxímadumonre 0,:577. Como 1\ 111111111 U LI dl~tribui9no 0110111, 10m uma assírnotrln posltlvn, »1\<1" IlIUII 111'111111 YI' y""YN' I' (ul1çnO do vcroselmühunça é dndu por 1(II,cO" •N lou ( (rl'U) • ).!cx.pr·u(Yrll) I j'I,.'4 ) 682 Hidrclojl das derivadas 81/8u=O e 81/8CJ;:::0 obtém-se kexp[-a(Yt-u)] = N (17. e N/a - 1:(Yt-u) + 1:(Yt-u)exp [-a(Yt-u)] = O Pode-se escrever estas equações numa forma mais simples l/a =y - 1: Yt exp (-a Yt) IE exp( -a YV (17.21) e expi-u u) = L exp (-c Yt) / N (17.2M' Estas equações não têm solução explícita, mas podem ser resolvidas JlIIII método de Newton-Raphson, utilizando a solução dos métodos dos momentos 01111111 primeira estimativa. Nota-se que a primeira equação não envolve o parAlIll'Il1I A . a. Obtida a solução de a por esta equação, podemos substituí-Ia em (''I para obter a estimativa de u. Alternativamente, pode-se resolver as duas equações diretamente 1",1 método de Newton-Raphson. Considerando as estimativas de u.e obtidna 1141111 método de momentos como Uo e «o, estes valores podem-se alterar para "ti I A «O+da, onde dU e .1a são soluções das duas equações lineares seguintes: alldu + al2'~a = bl a21du + a22da = b2 onde alI = -a2 Z; al2 = a21 = N - Z + a W; a22 = -N/a2 - V; bl = -N~ I I b2 = -N/a + 1:(Yt-u) - W; Z = keXP [-a (Yt-u)]; W = 1:(Yt-u)exp [.~I V = 1:(Yt-u)2exp[ -a(Yt-u)]; ( 1'I I, '" /11)1 Exemplo 17.1. Ajuste a distribuição Gumbel aos dados de vazão mãxlmu 1I1I111Ii' de Ibirama no rio Itajaí-Açu, Solução: Utilizando os dados de Ibirama (tabela 17.1), OS vnloJ'oll 11111-11.1 obtidos pelo método dos momentos são uo = 585 c ao .,. 0,00;7,') 11) estimativas iniciais, obtidas pelo método de momentos, resultam 1111'1 ti 11 de: \ 783,7 • u .•0,577/0. I !'>:lOóO ri rc2 1((. (X2) (l7. Hldrologia Estatística 683 undc 783,7 e 193060 são a média e a variância da amostra. Ap6s cinco ternções o cálculo converge para a estimativa de máxima verossimilhança que \I c:: 602,98 e a = 0,00341848. A função acumulada de distribuição é F(y;u,a) = exp [-a(y-u)] 1111110a cheia de tempo de retomo de T anos é relacionado com F e y por F(y; u, a ) = 1 . lrr yT = u - (l/a) ln [ -ln (l-1m] Pode-se verificar a bondade do ajuste visualmente pela plotagem ordenada dli nmostra, ou seja yt versus os padrões da distribuição de probabilidades I uncapondentes à probabilidade (t-l/2)!N para t=L, ..N. Se os dados de cheia 1111/11para o rio Hercílio em Ibirama estão bem ajustados pela distribuição de IIIIlHhel, os pontos se distribuirão segundo uma linha reta. A figura 17.2 1II1I_lmque, aproximadamende, isso ocorre. Apenas os pontos correspondentes às dllM maiores enchentes de 1983 e 1984 caem fora da tendência. Também é importante a plotagem da máxima verossimilhança na vizinhança ,111sou máximo, por razões que serão discutidas a seguir. Na figura 17.3 é I'ld.cntndo o contorno da função na vizinhança do máximo, mostrando que a 1I1""no é clíptica. .7 Dlstrlbulçâo Welbull A distribuição Weibull pertence a mesma fanu1ia da distribuição Gumbel ,1.1 hUIJI anterior. Esta distribuição é também chamada de extremos tipo m. 1IIIIIIIItll 6 denominada também de distribuição de extremo tipo 1. Esta lI'ttlltlllçlto 6 útil para representar a distribuição de vazões mínimas anuais. flllll'~() do distribuição é a seguinte kF(y) :: 1 - exp [-(y/a)] (ye-O) (17.31) IlIIll'h!) densidade de probabilidade k-I k, f(y) • (k/a) (y/a) cxp] -(y/a) J (17.32) 684 Hidrologl 2400 .e 800 c o :::l O '".g 1600 o > ""., '".<:o o a 000 00000 000 000 o 0000 o °1 I I I 1 I I 2000 2400 Figura 17.2. Ajuste da Distribuição Gumbel aos dados do posto Ibirarnn, 400 600 1200 f600 Quantis calculados .....---1.00,- 0.83 0.67 J.l 0.50 0.33 ..>. " O j I I ').17 0.3'3 0.00 a:. I) FI~lIrlll7.3. Fun de VOI'O'rthllllhilll",,,. Illdrclogia Estatística 685 "u Ãk + a12 Aa = b1 a21 Ãk + a22 Aa = b2 (17.33) Ilude 2 2 k ali = -N/k - r [ln(Yt/a)] ·(ytfa) k ka12 = -N/a + (l/a) L<ytfa) + (k/a) L [ln (Yt/a)](Yt/a) 2 2 k a22 = Nk/o; - k(k+1)/a . L<Yt/a) b1 = -N/k - L [ln(Yt/a)].[I-(Ytfa)~ b2 = (k/a)I [1 - (Yt/a)~ (17.34) 1111110 yt são os valores observados. O cálculo dos valores iniciais necessitam 111\ um pouco mais de cálculo que no caso do Gumbel. Para a distribuição de Ihull, a média, variância e coeficiente de variação são dados por E[Y] = a r(1+1/k); var(Y) = fi [r(1+2/k) -r2(1+1/k)] v = r(1+2/k);r2(l+I/k) - 1. A última equação pode ser resolvida para k e na primeira equação, HIt"iltuindo k, obtém-se a. 1111'110 17.2. Ajuste a distribuição de Weibull às vazões mínimas do posto 1I111111ll" no rio Itajaí-Açu. 11111~'l\O: Utilizando vazões mínimas anuais do rio Hercílío, dados apresentados 1111 IIIholl1 17.5, a média, variância e o coeficiente de variação obtidos são, flll\ll'otlvumente 7.791; 25,790562 e 0,405915. Rosolvendo a equação 2/k);r2(1+1/k) ::: 1,405915 Vlllor, nl",141" (I 686 Hidrologia resultados, onde se observa um valor estranho para o ano de 1983. que foi de 31,8 m3/s. Como foi mencionado anteriormente, é uma boa prática plotar a função de " 1\verossimilhança na vizinhança do seu máximo k= 1,72591 e a = 8.99319. Na figura 17.5 são apresentadas as curvas nessa vizinhança, observando-se também uma função elíptica. 17.2.8 Precisão das estimativas de máxima verossimilhança Um dos aspectos do procedimento da máxima verossimilhança descrito acima foi a plotagem da sua superfície na vizinhança do seu máximo. A curvatura dn superfície neste ponto está diretamente relacionada com a precisão da estimativas de máxima verossimilhança; intuitivamente, se a superfície d verossimilhança é plana nesta região, com pequenas curvaturas e gradiente pequenos, o ponto de máximo será determinado com pouca segurança e 11 estimativa por verossimilhança terá pouca precisão. De outro lado, se u curvatura é pronunciada e os gradientes grandes a estimativa da superfí de máxima verossimilhança será claramente definida com grande precisão,Assim, a curvatura da superfície de verossimilhança proporciona uma medida tllI precisão; além disso, a curvatura da superfície de verossimilhança relacionada com a taxa de mudança do gradiente na vizinhança do máximo. A teoria estatística mostra que a precisão da estimativa da mãxhn verossimilhança é dada pelo inverso da matriz das segundas derivad _a21/ae2, calculada no máximo da verossimilhança. Mais especificamente, se tt é um vetor de estimativas de máxima verossimilhança do parâmetro e. a muuI, 1\ vare da variâncias e covariâncias é dada por qualquer das três rólaon .equivalentes: E [-a21/ae2]e=ô; [-a21/ae2]e=ôE [-a2I/ae2]; A teoria estatística também mostra que, quando os dados são COíllllh\h I 1\ (quando N é grande), as estimativas de e são aproximadamente dlstrlbuhl segundo a normal, o que significa que a distribuição normal de dimclllIRl1 I' produz os valores verdadeiros do parâmetro e c a matriz. de vllIlRII covariância é 1\ 2 2-1var e = . E [ -B J/as ) (I'/I~\~) e, quanto maior for o valor de N, m normnl, I1l1orcvo-60 vrrtlllt/(1/rlJ euIr IIlndolll llldrologia Estatística 687 24 o o IS 16. o 00 00 8 00 000 00 00 I Io 1 I I I I 36. 12. 18 24. QUQnt is calcu lados 30.'0 6. Plgura 17.4.Ajuste da distribuição as vazões mínimas de Ibirama. K ~\lU' 17,5.PIIII",\~I' \1., \/('I".1I111I1hllllOIl do plohlolllll 1'/,,.. 688 Hidrologia usados para descrever as características de, por exemplo, cheias anuais, nã são mais do que aproximações; estaremos-nos iludindo se acreditarmos qu cheias na natureza necessariamente seguem a distribuição log-normal, gamma, gumbel, ou qualquer outra distribuição. Com a ajuda de análises estatísticas cuidadosas, contudo, tem- condições de rejeitar aqueles modelos estatísticos que não são consistent com os dados e concluir que um, ou vários modelos remanescentes servem igualmente bem. Se vários modelos são bons, a decisão da escolha entre ele deve ser realizada com base em outros elementos além da estatística. Para qualquer modelo adotado será desejável obter os limites de confiança parll seus parâmetros. Os limites de confiança aproximados podem ser obtidos usando os termos da diagonal dado pelo lado direito da relação (17.35). Usando 11 1\ fato de que cada componente do vetar e é distribuído aproximadamente seguJ11111 a normal, o intervalo de confiança aproximado de 95% para o componente 01 til '1\ 1\ 1\ e são dados por €lI ± 1,96 vvar €lI, var €lI sendo dado pelo primeiro elcmenln 1\ na diagonal principal da matriz vare. Limites de confiança para 99% e 99,ljl.~, são calculados usando os desvios da normal 2,58 e 3,29 em substituição li. 1,96. Limites de confiança aproximados assim calculados são apropriados qUIIIlII •• um parâmetro é considerado individualmente; se os limites de confiança .R •• calculados para todos os p parâmetros do vetar €lI, as p condições 11 confiança não serão simultaneamente verdadeiras. Quando as condições 1I confiança são necessárias para todos os parâmetros simultaneamcnt necessário usar a região de confiança conjunta que. com N gmn(I!" apresentada pela teoria estatística como sendo 1\ 2 2 J(e;x) -2 J(O;x) s X p,CX1 onde lOO(l-a)% é a probabilidade de confiança; X2 é o valor tabclndn tip,a distribuição X2 para p graus de liberdade tendo uma probabilidade CX )HI 1"11 limite superior; e p é o número de elementos no vetor 9. Bsscnclulmeum, relação (17.36) define aqueles 9 valores que são suficientemente pr6xlllllll ,111 1\ valor e onde o Iog-verossimilhança têm seu máximo, 17.2.9 Intervalos de Confiança para a cheia de T anos 689IlIdrologia Estatística presentado o problema de definir as condições de confiança dos quantis 1\ 1\ .Irdvados da distribuição ajustada f(x;e). onde e é obtido pela máxima vlIrossimilhança.O símbolo usado anteriormente neste texto para representar o IjllllJ1tilera Xo onde Xo é a solução da equação Xo 1\ O = J f(x;e) dx - P = O (17.37) -00 unrlc, para uma cheia de T anos, P= ltr. Um método direto de calcular o limite de confiança aproximado de 95% 1"11'11 Xo é pelo uso da aproximação da distribuição normal Xo ± 2 v(varXo), 111\l1~ varXo pode ser calculada com a ajuda da variância e convariância da "1j11l1~t\0 var e = [-E(a21/d9ia9j>rl. Considerando que Xo é função de Bi, 111" •• pode-se escrever. quando N é grande, que 2 1\ 2 1\ varXo= (80/891) varüj + (80/892) var a2 + 1\ 1\ 1\ 1\ I 2(aO/ael) (aO/a92) COv(al,e2»)/ [f(Xo·el.92) ) (17.38) Ollílr os termos adicionais devem ser incluídos quando existirem os parâmetros n" OL., As variâncias e covariâncias são obtidas diretamente da expressão 1\ III1 Illlltt'iz var a; ao/ael, por exemplo é Xo ao/a91 = J af/801 dx-IX) (17.39) () 1116todoacima não é algebricamente elegante, mas é direto do ponto de 11111 \lOl1lputacional,contudo considera que Xo é aproximadamente distribuído 111111, 1\ distríbução normal. e desconhecido em condições em que esta 11I' 111~l'lIçno é válida. Outra alternativa é retomar a superfície de máxima mllhança, como segue. I '11I1l'ddcrundoque a região definida pela inequalidade (17.36) dá uma " do eonflança de lOO(l-a)% para o parârnetro e do modelo, para cada O 11\10 cf\i nesta região ou dentro de seus limites pode-se calcular um " IIl1lmdo n equi\çno (17.37): escolhendo vários pontos a podemos gerar ti". VIIl\ltbR de X<I, o 1111110r c o menor destes valores define o Intervalo 111111 If)'nl 11" ro~ll\o do o<mllll1\çn puru o qunntll Xe, Pode ser demonstrado que ilu IIJlC"I'/ll'IIII)"lw 'X" purn nH vulorca do () que caem dontro d l'll IJlll\thlll~1I1\11 ."lilno IIl'Ill\ldll Il(J( (t·/.1CI). NII tuhclu \'1:1 111111111. 11M Iltlllll·.~ Ilf\ 111111 111I\Io'i\ 1\(1 I)~ %, '1110 íurum ~I\Il~\Ih\illl' I 690 Hidroloal procedimento para as séries de vazões da bacia do rio Itajaí-Açu, considerando a distribuição de Gumbel; intervalos de confiança calculado usando a superfície de verossimilhança têm uma maior precisão do quo CI intervalos calculados usando a aproximação da distribuição normal. Tabela 17.7. Distribuição Gumbel: estimativas de cheia de 100 anos Xo em 01111 uma das 18 bacias, juntamente com o intervalo de confiança de 95% (XL.X,,) Rio XL: Xo: Xu: Taio 470,4 512,0 679,9 Pouso Redondo 96.1 113,3 165,7 Trombudo 211,4 245,5 783,0 Adago 506,5 636,9 1308,5 Itajaí, Barracão 597.0 700.3 1997,4 Itajaí, Jararaca 590,4 661.8 1909.9 Itajaí-Açu, rio do Sul 1697,2 1863,9 9161.3 Hercílio, Ibirama 2022.6 2192.2 4289.0 Neisse Central 169,4 207.8 340.3 Itajaí-Açu, Apiuna 3924.6 4279.1 7074.7 Benedito. Benedito Novo 373.7 397,8 1237,6 Benedito, Timbo 990,3 1070,5 3978,3 Itajaí-Açu, Indaial 5588,6 6062,3 14781,0 Testo, rio do Testo 48,4 57,6 72,0 Itajaí-Açu, ltoupava Seca 3139,5 3703,5 10096,0 Garcia.Garcia 130,2 154,4 239,1 Luis Alves, Luis Alves 115,1 125,4 472,8 Itajaí-Mirim, Brusque 599,1 651,4 1737,2 17.3 Relações lineares com variáveis expUcativas 17.3.1 Princípios de análise de regressão A análise de regressão busca estabelecer um relacionamento onhu 1111I variável y e p outras variáveis Xl' x2' ..., xp que explicam aOI.\() vI,d.\ Numa regressão linear, as variáveis explicativas se combinam (l1\(1I jl(UIIlIII 11111 componente sistemático que é linear com parâmetros dcsconheold09(13), ,111 (111"1 ~O+PlXI+P2X2+·..f3pxp, Qualquer observação da variável y, digul1Ios yl, Ilnllvl se do componente sistemático do modelo por uma qunntlu dcnouilmulu 1'11I 1'" .1 modo que a equação do modelo podo ser cscrl til nn f\lrlllll /lOJ{lIhIlO: 1II,Ifologia Estatística 691 Yt = Po + Plxlt + P2X2t + ...+ Pp"Xpt+ ft (17.40) ,"ulo xit' X2t' ... , "Xpt são as observações das variáveis XI' x2' ..., "Xp Illlu~pondentes à t-ésima observação de y, a saber Yt. A equação (17.40) pode I Ullorita Yt = ~ TP + ft, onde ~ é o vetor [X1t,x2t''''"Xpt]T e P é o vetor 1111 pnrâmetros [~O,Pl,P2, ...pplT.Dadas as observações YI' Y2' ..·Yt. "·YN. \,.111",1108 estender esta notação, escrevendo as N relações da f6rmula (17.40 ) 111110 Y = X~ + e (17.41) IlIlu Y é agora um vetor Nx1 das observações [Yt] sobre y. P é um vetor 'I' I I}I( tdc parâmetros, e é um vetor Nxl de desvios, e X é uma matriz Nx(p+ 1) IW I~HI uns na sua primeira coluna, e as observações sobre as variáveis Xl' Xp na segunda, terceira, ...p-ésima colunas. Se os ~ são variáveis 1.111111,\l1~ com valor esperado zero, podemos escrever E[y] = Xp tlvo onde for indicado de outra forma, pressupõe-se que os desvios ft 1""1 oStLltlstieamente independentes, normalmente distribuídos, e com IlnllOIl\ desconhecida ut O parâmetro Po representa uma ínterceptação sobre 11 110 longo do qual é medido y; é, às vezes, conveniente incluir uma !HIVI;\ nrttficial xo' multiplicando Pc, que têm um valor identicamente l!til 1\ 111I1. Se o componente sistemático do modelo contiver apenas uma outra 1111"I I •.(tio modo que, com uma pequena mudança na notação, este componente I IIUtllllC1 possa ser escrito Po + ~lx), o modelo estatístico será uma llncur simples: se o componente sistemático contiver mais de uma J( pl lcatlvu, será uma regressão múltipla (linear). Nas aplicações 111 díscutídas abaixo, às vezes mudaremos ainda mais a notação, 11111111 \I nlu\bolo q, em lugar de v, quando a variável que estiver sendo 111 ,h hlllu Ibr dcrlvadu de um regisl.'" de fluxo. " HI1~II",t.I de rCHrcs8l'io Ilncar busca resolver problemas eSLatísticos dos (lS ecgulntea: estlmntlva cl1clcnto dos parãmetroa Il de y" ,. eerrospondondo li nOVII~ OhIlCI'VI\I,ll"lU/\ "IH ~ I' •••XII• lI\ulutllVl, o utUl'ulo do 1'\I~lvllln8 (10 pl'(.\dl 1\ lI'"IIUllo ,111 11, hll'hlNlvo 1\ d(llllllllhll\~l,o !lu qUII 692 Hidrolo variáveis explicativas para predizer y: combinação das estimativas de P e \Ir dadas por diferentes conjuntos de dados. 17.3.2 Aplicações hidrol6gicas de regressão linear o objetivo deste capítulo não é relatar a teoria estatística aproprlud para a solução dos problemas acima apresentados. pois já existem toxl •• excelentes destinados a esta finalidade, N6s nos preocupamos antes, com apresentação de um relato de algumas das muitas aplicações de anãlise 11 regressão linear nas ciências hídricas. A seguir são apresentados alguns exemplos, ilustrando a amplitude II aplicação da análise de regressão linear nas ciências hídricas. a) O modelo Thomas-Fiering é um procedimento para derivar seqüõuul« artificiais' de descarga média mensal (fluxo). com caracrcrísth semelhantes, sob aspectos importantes. àquelas do registro de fluxo 1IIIIIIUl observado numa estação fluviométrica de um rio. As seqüências arllJldlll geradas pelo modelo Thomas-Fiering são usadas; por exemplo, para 51mllllll comportamento de um sistema de recursos hídricos que abstrai ãgua <lu 1111 pr6ximo ao local de medição. O modelo, conforme comumente formulado, 0011.1" em doze regressões lineares simples, nas quais o fluxo de fevereiro (y) correlacionado com o fluxo de janeiro (variável explicativa x); o fluxlI II março é correlacionado com o fluxo de fevereiro (variável explicutlvn 1\) As doze regressões qfev = «rev + Pfev qjan + €fev; qmar = «mar + BIII~I II, + ~ar;'" são usadas para gerar as seqüências de fluxo flltlllllllll escolhendo o €fev' ~ar"" a partir de componentes normais com vllllRlld apropriadas. e acrescentando a esses componentes aleatórios os comJlOUI'''1 sistemáticos <Xrev+ Pfev qjan' Ornar + Pmar Qmar.··· . Claramente, 0111111 possibilidade de incluir, além de variáveis explicativas, o fluxo dCI meses precedentes; usar distribuições outras do que a normal, a flu: d os componentes aleat6rios e. e assim por diante. b) Yevjevich (1972) discutiu um ex r 'I) no qual uma curva-chave plu'l\lIl1Ill/I Po ~ PIH + P2H 2 é ajustada a '~.:l~ -ncdidas Q c níveis H, 1181)11110 I \ 11M' de observações (Q.H). Como os 1 1,C~'OS l3e, 131, P2 ocorrem IhwIIIJ.III'1 equação para a curva-chave, o componente .Isrcmãtioo do modclu lilllulhll para Q têm a forma de regressão rnúltipl a, c) A concentração de; sedimento em suepen dCROl\rr,n Iluvlnl (vm:no) (I rM 11I1111 tl(IIII\~'n"/lu 1'011I111 I IlId.ologia Estatística 693 Illl'Nontarn diferenças com relação à expressão no lado direito dessa equação, 11. desvios forem aleatórios pode-se dar a forma •• a q~ + e () componente sistemático do modelo será claramente não-linear nos 11I1I/llIIllll'OSa e P, Contudo, pode-se obter uma relação linear entre os IUlldlll)OSde c e q na forma 111 C = a* + ~* (ln q) + e !. nuulo que o modelo estatístico agora é expresso sob a forma de regressão 1111I-111 xcmplos das tabelas 17.1 a 17.4 deram um conjunto de valores contendo de observação. Denominando y como uma seqüência de, digamos. cheias -1I1111~, 1111I um local de medição com registro irncompleto, e por Xl' x2' ...xp I llllll'~ nnuais em postos de medição próximos, com registros nos quais não ,1111111 vntorcs, a regressão múltipla pode ser usada para estimar valores que 1/11111 1111 seqüência y. Contudo. será necessário aplicar a análise de 1I1I00.IU1\0 com especial cuidado para assegurar que sejam satisfeitas básicas. I IJllIlIUlo IlS características de cheia devem ser estimadas para um local sem 1'111"1 tló vazão, é comum usar registros de cheia de outros postos dentro 11, u fim de relacionar (por exemplo) a cheia anual média q e I1.llllll~ da bacia (área A. declividade de canal S. percentagem P de IIr Imolll que é lago ou reservatório ...). como variáveis explicativas. " 11111111 ~ comum utilizar-se de modelos de regressão múltipla na forma 111 '11' ~ ~I (1n A) + ~2(1n S) + ~3(1n P) + ... + e (17.42) 111111' tllIMO, também deve haver cuidado, porque os registros serão de ilt'dllliJlIllU diferentes, de modo que as cheias anuais médias q necessitarão "1111\1111'11 ptl!lOR nu anãliec, Quando o relacionamento entre o escoamento de lIil11111111j'1\ U 11 chuvu ofctiv» P1, p ' _}' P'-2' ",' estiver na forma 1I1 II h()p, .•. hl» •.• '" h2PI.2 + ... + hkPt.)( + e (17.43) 111111( IIlu 1111111 nl~I'CI4Nnl)llncnr, 11111111' til! 1111111I111'1111111 1I1I11Itllll. 11 11•• ··" udo os plu'RIllO\.t'()S 11o• hl, •.•hk 11, dI' ~\1ltlil(lnl'Hll~('h,l no IlhlNlo til) 694 Hidrologl modelo para assegurar que as ordenadas sejam fisicamente significativaq alguns procedimentos ajustam o modelo utilizando restrições para ordenadas. 17.3.3 Os fundamentos da regressão linear Pressupomos o modelo T Yt = xt 13+ Et (17.44 ) com as suposições E[Et)=O; E[fi2)=cr/; e E[fies)=O para qualquer s=t. Tamhérn pressupomos que os erros ou reslduos Et sejam normalmente distribuídos. 1'111. calcular as estimativas de 13 dos parâmetros 13 calcula-se o valor 13 11\1 minimizaa soma dos erros quadráticos, le, onde eé o vetor Nxl com elcmcnm típico fi; isto é, as estimativas de 13minimizam TR(j3) = (y-Xj3) (y-Xj3). (17.4'1 As estimativas 13,portanto, satisfazem dando T • X (y - X 13)= O XTX P = XTy P = (XTX)-l XTy• , (I"., ou Substituindo para 13na expressão (17.48), obtemos o valor mínimo <111 HIIIII dos quadrados A • T • T T _I T R(P) = (y - X 13) (y - X ~) :: y (I - X (X X) X) y. Usaremos esta relação 1.e .jcmcntc, junto com a s<.lgulnto 111I111 alternativa: • T AT T RW) :; y y - p (X y). ( 1'1'1 A relação (17.49) é li bnse pnrn u nnáll Il sorn» to til 1 dos Clul.ld~ud(lI4 1'111'11 11 de vi\,lnnC'l1l I1htll" VII'.'/'i( 1'/,1 llldrolo gia Estatística 695 ,2 2 T é di idid d . ~TXT difVI "Y2 +"·+YN =y Y - IVI 1 a em 01S componentes, '"' y e a irerença. 1((1l), Textos estatísticos (veja, por exemplo, Draper e Smith, 1966) mostram: a) que, se o vetor 13têm p elementos, e o vetor y têm N componentes, os T • T • graus de liberdade, associados com os componentes Y y,pX Y e R(p) são N. p e N-p, respectivamente. b) que dadas as suposições acima concementes ao Et,as quantidades ~XTy/p e R(~)/(N-p) são ambas distribuídas como X2 com p e (N-p) graus de liberdade, quando à hipótese nula que 13=0 é verdadeira . ) em qual caso. a relação dessas duas quantidades, [PXTy/p] dividida por [R(j3)/(N-p»), é distribuída como uma razão de variãnctas, ou tatística F, com p e N-p graus de liberdade. Existem tabelas para essa tatística, porém os seus quantis podem ser facilmente calculados por ENST AT, ou por outros pacotes computacionais, NlI prática, estamos interessados em obter o modelo mais adequado para I'lIilllf como varia a variável YI testando uma série de modelos de regressão 11111'lU I envolvendo um número cada vez maior de variáveis explicativas. Assim, 1I1I1'-'~'lIndocom o modelo mais simples YI = ~o + Et I •.•uma constante ~o desconsiderando o termo aleat6rio; acrescentando 1lillU vII,lrtvcl cxplicativa xl' resulta no modelo YI = Po + ~l xl + Et. II"IIIIIN.tulvcz, urna segunda variável explicativa x2' de modo que o modelo 11111 11(\ III YI • ~o + Pl XI + P2 x2 + e. IIIVt IUI[" 1II 1'111 111111\10. UIItIlHl() 11 0(1111\91'{0(17.49), cadn m 111111' dQ H(~) qUll Ml' 1001IJlut uteuor 1\ 0/1<11'novo plll·nllllJlW IrrHIIt'IIHI'j Itlll~11I1 N 1'11Inlilnllll~. H(O> lIt'dn t,l1l'CI. Jrt (l\ll) IIPI'IIII. 1011111 696 Hidrolo III N valores de dados Yt para ajustar N parâmetros ~o. ~I' "'~N-I' Se chamarmo a seqüência de valores de R(~) correspondentes aos modelos de númeru crescentes de variáveis explicatívas, por R(Po); R(PO'P1); R(Po,PI'~1) então podemos resumir o processo todo, conforme apresentado na Tabela J 7.H, na qual consideramos que k variáveis explicativas é o número máximo 11" desejaríamos incluir. Deve ser observado que a expressão ,,~TXTy", que ocorre em divcrs« lugares na tabela 17.8, é diferente de uma linha para outra, dependendo Ilu número de parâmetros ajustados. Assim, onde apenas é ajustado ~o' a matrb, consiste em uma única coluna de uns, sendo de dimensão Nxl: onde ~o e ~I _nu ajustados, a matriz X é da dimensão Nx2, tendo uns na sua primeira coluna os valores de N da variável explicativa Xl na sua seguna coluna, e assim li'" diante. Em particular, o valor de pTXTy corresponde ao ajuste de ~o é, pOlllllllt1 apenas Ni, e é conveniente subtrair essa quantia, juntamente com seu gl'IIU II liberdade correspondente, da última linha na tabela 17.8. Maior simpllflcu; n•• pode ser obtida se rearranjarmos a tabela para dar as diferenças R(P) qun I' II resultado de ajustes sucessivos com parâmetros adicionais. A tabela 1101111 obtida é a 17.9. Devem ser mencionados dois aspectos das tabelas 17.8 e 17.9. PI'IIlI conforme mostrado na tabela 17.9, cada parâmetro novo (e SUII vlld,lvl·1 explicativa associada), que é incluído. no modelo, resulta em redução dn ~IIIII' Residual dos Quadrados R(~) que, conforme já foi observado, dCSUJ11I11'I'1 totalmente se fôssemos ajustar N parâmetros. Freqüenternente, as rccluçl'lt,. 1I Soma Residual de Quadrados, associados com os primeiros parârnotros, substanciais, as reduções tornando-se sucessivamente menores com I"ul parâmetro adicional incluído. É um dos objetivos do ajuste do 1lI111ldll determinar em que ponto a redução da soma residual de quadrados 1011111 pequena demais para justificar a inclusão de parâmetros adicionais no 11111I11'111 Em segundo lugar, a apresentação nas Tabelas 17.8 e 17.9 pressupôs q\lU "1"11 um parâmetro adicional seja acrescentado em cada passo, de modo que (I~.,."" de liberdade para a soma residual de quadrados é reduzida de um" \ll\ld,1I1 cada passo. Às vezes, contudo, precisaremos acrescentar grupos de pUl,nllH' 11" em lugar de acrescentá-Ias um por vez. A Tabela 17.9 pode fnoll UltlllI1 modificada para incluir este caso. Por exemplo. se ajustásscmos J1(l~ Nl~1I11111 do grupo ~1'~2""~p seguido mais uma vez pelo gruJJo PJ1III~l)'21 .••lIplil' a Tabela 17.9 seria modificada pura 11 forrnn mOlllrlld" 111.1tuhclu 1'1.10 I )\!tull\ 17.9. Análise de tabela de variância (ANOVA), derivada diferenciando a 11\111111\ l7.8. A tabela mostra a redução na função de soma de quadrados R(~) 1111It~sulta do ajuste de parâmetros adicionais. IGraus de liberdade l'Soma dos Quadrados llldrologia Estatística "llbela 17.8. Resumo do procedimento para o ajuste de modelos lineares com 11I11\\crocrescente de parâmetros ~o; PI; ~2; ..·po; P1; .•.!3x., correspondentes n. 1.2 •... k variáveis explicativas Xl' X2' ...xk Parârnetros Ajustados Graus de liberdade Soma dos quadrados ~o 1 ~TXTy N-! R(Po) ~o' Pl 2 pTXTy N-2 R(~O'~l) Po, Pl' P2 3 pTXTy N-3 R(Po,P I '~2) ... ." .., .., ... .., ~o' ...!3x. k+l pTXTy N-k+l R(~o''''~lc) N yTy 697 1 1 R(PO)-R(PO.Pl) R(Po,P 1)-R(~O,Pl '~2) Ajuste de P1 Ajuste de P2 em 11I6mde p\ AJustc de P3 em 1\I~m de DI '~2 1 R(Po,P I,P2)-R(Po,~ I.P2'~) R(PO.p\ •..·Pk.l)-R(PO.PI ,...Plt) N k IR(PO, .. ·~k) N.\ IY1'y , Nyl 17.3.4 Caso especial: regressão linear simples 698 Hidrolog] ~ Tabela 17.10. Particionamento (distribuição, divisão) de somas de quadrado graus de liberdade ' Graus de liberdade Soma dos Quadrados Ajuste de ~l '~2""~p P R(~o)-R(~O'~l ,...~~ Ajuste de ~P+l''''~p+q q R(~O'~l ,...~~- R(~O'~l ,....~p+q) após ajustar ~l""~p Erro N-p-q R(Po,P1, ...Pp+q) Total N-l yTy _ Ny2 No caso de uma variável explicativa, digamos x, a análise de varlRllI'l ANOVA acima toma-se a tabela 17.11 (onde acrescentamos uma coluna adlolUWl1 à tabela, Quadrados Médios; estes valores são as Somas dos Quadrmlll., divididas pelos graus de liberdade correspondentes). - 2 - - - 2 T -2Sxx=L<x(x) , Sxy=D"t-x)(Yt"Y) e Syy=L<Y(Y) =Y y-Ny Tabela 17.11. ANOVA df SQ QM , Regressão sobre x 1 Sx/ISxx SxllSxx (i.e. ajuste de ~l) (i.e. R(Po)-R(~o,J31)} Erro N-2 Syy-Sxy2/Sxx (Syy-Sxy2/Sxx)/ON-2) [i.e. R(130'~I) I Total N-l Syy Se a hipótese nula, onde P1 = O, for correta. de modo que 11 VIIIII\VIII não tenha valor para explicar como y varia, uS dU1I1 entitulada QM são arnbas disrribuídns como X2 com I C N- respectivamente; c n ~lI" rclncão é en1~O dlstrlhufdll (J(')Il11 l lhlrologia Estatística 699 I I) N-2 graus de liberdade. Como teste da verificação de incluir x como uma vllllável explicativa do modelo de Yt' comparamos o valor numérico do F I nlculado a partir dos dados com o valor tabulado para 1 e N-2 graus de llhcrdade, Embora a álgebra apresentada pareça assustadora à primeira vista, uunselha-se o leitor a passar algum tempo dominando os princípios que a ela nnduzem, embora as f6nnulas em si não sejam importantes para a pessoa que 1II\Iilllha com isso. Os cálculos são facilmente realizados por qualquer bom 1'Illllrama estatístico. 1r.!(OInplo17.3. Estabeleça a regressão linear das vazões anuais de cheia de lhlmma (y) com as vazões de cheias de Apiuna (x) (tabela 17.1). 1I1\l~l'io: Como existem menos falhas na seqüência do rio Hercílio em Apiuna do 11"1\ para o rio Itajaí-Açu em Apiuna, pode-se explorar se as cheias anuais em pluna (x) podem ser usadas para preencher os valores que faltam para as 1111\1115 anuais (y) em Ibirama. Assim considerando a regressão linear de y com •I plotando inicialmente os pontos para ter uma idéia de como x e y variam IllIljllntamente. Na figura 17.6 as duas cheias extremas para os anos de 1983 e IIJH4 se destacam claramente, e ambas têm um efeito substancial sobre a IItHIIIO conforme será visto mais adiante. Na tabela 17.12, o sumário de análise mostra a soma total de quadrados I'y N;,'2,= 9025393 dividida em dois componentes: um (Regression) para o ajuste 1111 Il" com valor 7265785, e o outro (Residual) para R (~O,Pl)' com valor 1/~IJcI08. A tabela mostra os quadrados médios (soma dos quadrados divididos Ilou "'(lIUB de liberdades) e, mais abaixo, a relação de variância (chamada de 111110 183,8l. I'nrn testar se a variável Apiuna é útil para predizer valores da Ilnvl.lI lbirama (ou, mais formalmente,testar a hip6tese nula 131=0) IIIIItII'IU'llrnosa razão de variância com os valores tabulados da estatística da lI~hl\,n()de varíância com 1 e 45 graus de liberdade. O quantil de 95% da Ilh11Ih\lI<;1'(0 de razão de variância é F=4,057. Os quantis de 99% e 99,9% são unntrados como sendo, respectivamente, 7,234 e 12.39; como a relação de .nlnuoll\ calculada de 185.81 está bem acima da parte superior da cauda da dlUllhulçrto que seria apropriada se fosse verdadeira a hipótese nula, II I"ltlllll<l&OSSI.l hlpõtcsc, concluindo (conforme é 6bvio do traçado na Figura 11 fi) 1(110 I' scqüêncln de 011011111 do Apiuna é extremamente útil para predizer dllllh~ IIIUI/IIR (1110 fllllllUl 011I lhlrllllln. No rabcla 17012. Percentagem ele I'" m,,,./,/ v.\p//c{I(lo é pmu(vol ohservnr que 11 rCllrcss~o llncnr slmpl 11\ I' 1'11 q1lx 11111111(((n()'~I) 111\1111 1_ (IQO-RO.t) 11 IC).C)% <111 N(1111U (01111 dt 111I111I1.ulo" II)(I'>(~I, II'l 11111110 '11111 1\ InUlo_Mllll foi 11'HIHllllutvl}1 PC!( IIUII\ JlIIIII 700 dn regressão UIjI l (l,?!) t ",h 701Hidrolo l lhlrologia Estatística (1111, cheia anual estimada em Ibirama = 12,5 + 0.4775 * cheia anual observada 11I Apiuna). Também são apresentados os erros padrão do Po e PI' a partir dos III\HI~, caso necessário, podem ser calculados intervalos de confiança para Po 11" como 12.5 ± t x 63,8 e 0,4775 1: t x 0,035, onde t é o valor do t IIllrNtico com 45 graus de liberdade, lido a partir de tabelas. Para uma I'ltlhllbilidade de 0,05 nas duas caudas da sua distribuição o valor de t é ,Ol~; onde os limites de confiança de !i5% para Po e P1 são 12.5 ± 2,014 x fI \ t~ e 0.4775 ± 2,014 x 0,035, ou (-116,0; 141,0) e (0,407; 0,548), 1O'_)lI'otlvamente. Observamos que os limites de confiança para Po incluem o 1111' zero, que é pelo menos consistente com a realidade. considerável da variação em y. Para testar se a variável Apiuna é útil para predizer valores cI variável lbirama (ou, mais formalmente, testar a hipótese nula PI ••tI) comparamos a razão de variância com os valores tabulados da estatística ti relação de variâncía com 1 e 45 graus de liberdade. O quantil de 95% 11 distribuição de razão de variância é F=4,057. Os quantis de 99% e 99,9% .ali encontrados como sendo, respectivamente, 7,234 e 12,39; como a relação Ii variância calculada de 185,81 está bem acima da parte superior da cauda li distribuição que seria apropriada se fosse verdadeira a hip6tese nul., rejeitamos essa hip6tese, concluindo (conforme é 6bvio do traçado na FIM'II 17.6) que a seqüência de cheias de Apiuna é extremamente útil para prolll1 cheias anuais que faltam em Ibirama. Na tabela 17.12, Percentagem ,li variãncia explicada é possível observar que a regressão linear sllllpl E[y]=(30+Plx tinha R(PO,PI) igual a (100-80,1) = 19.9% da soma tollll I1 Quadrados 196204, de modo que a regressão foi responsável por umu pllll considerável da variação em y. 1.11111111 17.12. Regressão linear entre vazões máximas de Ibirama(y) e Apiuna(x). l\l\lise de Regressão *** II\Hwd dependente: Ibirama 1'[111111" njustados: constante, Apiuna 2400 00 17 O -2,73 2.31 urno da Análise *** d.f. 1 45 46 s.s . 7265785. 1759608. 9025393. m.s. 7265785. 39102. 196204. •. <,... 1600e <::E« 11: m eoo o • o o 111 da variança explicada: 80,1% 111: As seguintes unidades têm grandes resíduos: • o • o •• o I • . . ,-- 3200 'IOCII seguintes unidades tem alta leverage:o 800 1600 2400 APIUNA m'/s () 1 0.250 0.248Figura 17.6. Vazões máximas anuais de Ibirama vcrSIIS as do Âplllll Mais abaixo, na tabela. na parte cntítulada E~'ti;nrlllv,,~' <I, de regressão, coluna eruitulada estimativo, lUl ostiUlutlvl\H numér t,,\,H (l,()'110~l são 12 1 IhJ Y •• 12,~ ,I' I)0,4775, dundo um" cqullolln de fOII.l" 702 Deve-se lembrar que a finalidade de ajustar o modelo estatístico estimar as cheias anuais que faltam em Ibirama, usando o registro 11I completo em Apiuna. As cheias anuais em Apiuna, para as quais faltam cheias de lbírama, são 1111, 648 e 3086 m3s-1. Utilizando a regressão 0\11 se as cheias de Ibirama que faltam, ou seja 543, 322 e 1486 111 respectivamente. Usando os valores da estatística t calculada anteriormenl podemos, caso necessário, calcular limites para as estimativas. REFERÊNCIAS 1 _ ATKINSON, A.C., 1984. Plots, transformations and regression. Inglaterra. Clarendon Press. 2 - DRAPER, N e SMITH, H., 1966. Applied regression . John Wiley & Sons 3 _ YEVJEVICH, V., 1972. Probability and statistics in hydrology. WIII Resources Publications, Fort Collins, Co. Capítulo 18 11:(~ULARIZAÇÃO DE VAZÕES EM RESERVATÓRIOS Antonio Eduardo Lanna ntrodução variabilidade temporal das vazões fluviais tem como resultado visível nela de excessos hídricos nos períodos úmidos e a carência nos ",tlIIM ilOCOS. Nada mais natural que seja preconizada a formação de reservas 1\111 ti período úmido para serem utilizadas nacomplernentação das demandas "'\ n(~seca. Como a ocorrência das vazões é aleat6ria, ou seja, não há Ildlltll\~c de previsão de ocorrências a longoprazo, não é também possível I.n com precisão o tamanho da reserva de água necessária para I ilIIII'Il10das demandas de períodos de seca no futuro. Isto leva o planejador 11\11~()S hídricos a duas situações ineficientes : superdimensionar as I 11.~" custas de investimentos demasiados no reservat6rio de acumulação, 1I111111\1cnsionaras reservar às custas de racionamento durante o período ,,11'c essas duas dimensões estaria aquela ótima. Ill! cn tun to , a situação é mais complexa do que o acima exposto, 11111111\11.1 por que as vazões são aleatõrias, Assim, existirão períodos nos 1!l1, dlJll'11l1lnada dimensão de reservat6rio será suficiente e outros em que ceção ocorre nos casos extremos em que seja implantado um 11'110excessivamente grande, que permita atender sempre a demanda, ou VlIllU.lI1tc pequeno, que nunca o faça. A dimensão ótima para um 1111\110devera ser considerada em função deum compromisso entre o custo thncnto na sua implantação e o custo da escassez de água durante os . O primeiro custo é diretamente proporcional e o segundo é proporcional à dimensão do reservat6rio. Quanto menor for a \1111 do acumulação de água, ou seja aquela que pode ser ,I 111 lU,) 1 \lb utlllzada, mais provável é a ocorrência de racionamento. 111111111,1\IHlnIlS na situação de extrema aversão ao racionamento seria ótima a 11Ilr eonsrruir-sc um reservatório que semprepudesse acumular água para dOlllllndll, 11m rlsoo de que o mclooínlo previamente elaborado leve à errônea II 1I11t.'lpllrtl o ntcndlrncnto 1\ qualquer demanda hídrica seja suficiente a II di: 11111!'~\~I.lIvll\(~d() com 011111101411\(\0\1111suflcícutcmento grande de 1,"'ill\~n'l IftlUi pmquc, ohvhuucutc, 11 ollplluldu(lc ,'til de lIounlulJlçllo do um I' 111I,d'l "l,dtllll Ill'l I'rllllV 11lI11'1I1C' 1I1111t.l\llu110 houver durnnto ,11/111111
Compartilhar