Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE FEDERAL DE ALFENAS CARLOS JOSE´ DOS REIS ASPECTOS TEO´RICOS E PRA´TICOS DA DISTRIBUIC¸A˜O GUMBEL: UMA APLICAC¸A˜O AOS DADOS DE PRECIPITAC¸A˜O MA´XIMA DE PIRACICABA (SP) Alfenas 2013 UNIVERSIDADE FEDERAL DE ALFENAS-MG UNIFAL-MG Carlos Jose´ dos Reis Aspectos teo´ricos e pra´ticos da distribuic¸a˜o Gumbel: uma aplicac¸a˜o aos dados de precipitac¸a˜o ma´xima de Piracicaba (SP) LICENCIATURA EM MATEMA´TICA Trabalho de Conclusa˜o de Curso apresentado a` Universidade Federal de Alfenas, como parte dos requisitos para obtenc¸a˜o do t´ıtulo de Licenciado em Matema´tica ALFENAS-MG 2013 FICHA CATALOGRA´FICA. Reis, Carlos Jose´ dos. Aspectos teo´ricos e pra´ticos da distribuic¸a˜o Gumbel: uma aplicac¸a˜o aos dados de precipitac¸a˜o ma´xima de Piracicaba (SP)/Carlos Jose´ dos Reis. - Alfenas, 2013. 65f. - Orientador: Luiz Alberto Beijo. Trabalho de Conclusa˜o de Curso (Graduac¸a˜o em Matema´tica) - Universidade Federal de Alfenas, Alfenas, MG, 2013. Bibliografia. 1. Teoria dos valores extremos. 2. Estimativa de parametro. 3. Estatistica. I. Beijo, Luiz Alberto. II. T´ıtulo CDD 519.5 Carlos Jose´ dos Reis Aspectos teo´ricos e pra´ticos da distribuic¸a˜o Gumbel: uma aplicac¸a˜o aos dados de precipitac¸a˜o ma´xima de Piracicaba (SP) A banca examinadora abaixo-assinada, aprova o Trabalho de Conclusa˜o de Curso apresentado como parte dos requisitos para obtenc¸a˜o do Certificado de Conclusa˜o do Curso de Licenciatura em Matema´tica pela Universidade Federal de Alfenas. Aprovado em: de de 2013. Prof. Dr. Luiz Alberto Beijo Orientador Prof. Dr. Fabricio Goecking Avelar Universidade Federal de Alfenas Prof. Gilberto Rodrigues Liska Universidade Federal de Lavras Prof. Dr. Denismar Alves Nogueira (Suplente) Universidade Federal de Alfenas Dedico ao Senhor pela oportunidade concedida. AGRADECIMENTOS As palavras transcritas abaixo de um grande hero´i nacional nas pistas, Ayrton Senna da Silva, sintetizam em esseˆncia a forma intensa como vivi esses mais de quatro anos dedicados a graduac¸a˜o e o amor com que tratei a oportunidade de realizar esse Trabalho de Conclusa˜o de Curso. “...seja quem voceˆ for, seja qualquer posic¸a˜o que voceˆ tenha na vida, um n´ıvel alt´ıssimo ou mais baixo social, tenha sempre como meta, muita forc¸a, muita deter- minac¸a˜o e sempre fac¸a tudo com muito amor e com muita fe´ em Deus, que um dia voceˆ chega la´, de al- guma maneira voceˆ chega la´.” Ayrton Senna da Silva A vito´ria vem quando trabalha-se arduamente, objetivando-se um propo´sito. Nesse momento de grande alegria e´ importante parar e dizer a algumas pessoas especiais que essa vito´ria na˜o foi conquistada somente pelo meu esforc¸o pessoal, mas tambe´m por que essas pessoas especiais foram instrumentos de benc¸a˜o na construc¸a˜o dessa vito´ria em minha vida. De forma geral, muito obrigado a todos que estiveram ao meu lado e, torceram para que esse sonhe ganhasse forma e se concretizasse em minha vida. Primeiramente, toda a honra, glo´ria e louvor seja dada ao Senhor pela realizac¸a˜o desse trabalho. Acredito muito que mesmo que eu fosse perfeitamente habilitado e capacitado para realizar esse trabalho, se eu na˜o tivesse a oportunidade que me foi dada por Deus, nada seria concretizado. Nesses dez anos que em busca desse sonho, o amor, o carinho e o perda˜o do Senhor, por meio de seu filho amado Jesus, foram os elementos essenciais que me trouxeram ate´ aqui. Na˜o me esquec¸o das inu´meras vezes que a Palavra do Senhor me forneceu o aˆnimo necessa´rio para continuar e persistir. Que essa conquista em minha vida seja para o louvor e glo´ria do Senhor, pela sua eterna bondade e miserico´rdia. Agradec¸o aos meus pais e ao meu irma˜o pelo apoio nesses anos. Em especial aos meus pais, Jose´ e Selma, pelo exemplo de conduta e pelo valioso legado de princ´ıpios e valores humanos que carregarei comigo aonde quer que eu esteja. O exemplo de honestidade e de trabalho duro deles tem me encorajado a batalhar pelos sonhos ainda na˜o conquistados. Agradec¸o tambe´m a Dais, minha namo, por seu amor e pelo carinho que me tem dedicado. Nesse nosso tempo de conv´ıvio tenho aprendido e crescido muito com voceˆ. Obrigado por estar ao meu lado e por suas boas palavras em meus momentos de maior dificuldade no curso. Voceˆ tornou-se parte importante de minha vida. Agradec¸o ao meu orientador, professor Luiz Alberto Beijo, por todos os ensinamentos nesses anos que temos trabalhado juntos. Assim como no dia 5 de junho de 2007 na apresentac¸a˜o do Bic-Ju´nior, torno a dizer: na˜o o vejo somente como meu orientador, mas tambe´m como um amigo. Voceˆ e´ uma pessoa especial em minha vida, pois a sua orientac¸a˜o iniciou-se quando perguntou-me sobre qual curso eu pretendia fazer. Hoje, afirmo que sou feliz pela escolha que foi tomada, que contou com seus conselhos. Ademais, vejo na sua conduta profissional um exemplo a ser seguido, dada a seriedade com que trata o meio aonde trabalha. Desejo que Deus o abenc¸oe pelo que fez e tem feito por mim. Agradec¸o com todo carinho a todos os meus professores dos ensinos fundamental e me´dio, pelos conhecimentos ba´sicos que me deram a base para realizar esse trabalho. Essa conquista em minha vida somente foi poss´ıvel porque o amor com que voceˆs lecionavam me encheram do entusiasmo necessa´rio para estudar. Esse amor pela profissa˜o que voceˆs escolheram tambe´m provocou dentro de mim um ardente interesse para ser professor. Obrigado meus mestres! Aos meus professores do ensino superior agradec¸o pelo respeito, pelos conselhos em conversas informais e pela dedicac¸a˜o com que tratam esse curso. Pec¸o desculpas por algo que na˜o tenha sido bom, por alguma palavra ou atitude que na˜o tenha sido boa. De minha graduac¸a˜o levarei na˜o somente o conhecimento matema´tico, mas tambe´m o modelo de profissionais que tratam de forma se´ria e com compromisso a educac¸a˜o de nosso pa´ıs, no engajamento da formac¸a˜o de bons profissionais para a licenciatura em matema´tica. Agradecimentos nesse momento tambe´m sa˜o devidos a banca examinadora, cons- titu´ıda pelos professores Fabricio Goecking Avelar e Gilberto Rodrigues Liska, que con- tribu´ıram de forma valiosa com suas sugesto˜es e comenta´rios para que se chegasse ao documento final desse trabalho. Agradec¸o aos meus amigos do Curso de Matema´tica pelos momentos felizes que passa- mos juntos e principalmente pela unia˜o de nossa turma. Em especial, gostaria de agradecer aos meus amigos Roger e Nalva, que foram pessoas importantes durante todo o curso. A UNIFAL sou grato pelas oportunidades concedidas em minha formac¸a˜o e pelas amizades que pude fazer com as mais diversas pessoas que compo˜em o seu quadro de funciona´rios. Complementarmente, agradecimentos sa˜o extensivos a` ageˆncia de fomento FAPEMIG, pelas bolsas que me deram as condic¸o˜es necessa´rias para que eu pudesse dedicar-me ao curso e as iniciac¸o˜es cient´ıficas. Desejo retribuir a sociedade todo o inves- timento que essas duas instituic¸o˜es dedicaram a minha formac¸a˜o. Desde ja´ agradec¸o a todos aqueles que dedicarem um pouco de seu tempo para a leitura e para o estudo desse trabalho. Desejo e espero que esse trabalho possa contribuir de alguma maneira para aqueles que se interessarem pelo tema proposto. “Parece que os rios conhecem a teoria [Teoria de Va- lores Extremos]. Resta convencer os engenheiros da validade das ana´lises.” Emil Julius Gumbel RESUMO A distribuic¸a˜o Gumbel e´ uma importante distribuic¸a˜o de probabilidade que se origina da Teoria de Valores Extremos. Nessa teoria, demonstra-se que a distribuic¸a˜o assinto´tica de valores extremos pode convergir para treˆs formas assinto´ticas,sendo a de Gumbel ou do Tipo I largamente utilizada em algumas a´reas. Va´rias aplicac¸o˜es da distribuic¸a˜o Gumbel teˆm sido implementadas com sucesso em muitas a´reas da cieˆncia, tais como: engenharias naval e estrutural, hidrologia, climatologia, economia e financ¸as. Dessa forma, o pre- sente trabalho teve como objetivos realizar uma revisa˜o sobre alguns aspectos teo´ricos da distribuic¸a˜o Gumbel, e exemplificar o uso dessa distribuic¸a˜o com uma aplicac¸a˜o aos dados de precipitac¸a˜o ma´xima anual do munic´ıpio de Piracicaba-SP. A se´rie histo´rica de precipitac¸o˜es ma´ximas anuais foi obtida junto a estac¸a˜o convencional do posto agromete- orolo´gico da ESALQ/USP. Os dados utilizados compreendem o per´ıodo de 1917 a 2012. O teste de Ljung-Box e o Runs test foram usados respectivamente para verificar a inde- pendeˆncia e a aleatoriedade dos dados. A qualidade do ajuste da distribuic¸a˜o Gumbel foi verificada pelo gra´fico Quantil-Quantil e pelo teste de Kolmogorov-Smirnov. O n´ıvel de significaˆncia de 5% foi adotado em todos os testes. Verificou-se que as observac¸o˜es de precipitac¸a˜o ma´xima anual sa˜o independentes e aleato´rias (valor p>0,05). A distri- buic¸a˜o Gumbel mostrou-se adequada para modelar os dados, conforme a ana´lise gra´fica e os resultados do teste de Kolmogorov-Smirnov (valor p=0,4455). As probabilidades de ocorreˆncia de precipitac¸o˜es ma´ximas anuais superiores a 100, 120 e 140mm em Piracicaba- SP foram respectivamente iguais a` 7,66%, 2,00% e 0,51%. Por u´ltimo, apresentou-se as precipitac¸o˜es ma´ximas anuais esperadas em Piracicaba-SP, para os tempos de retorno de 2, 5, 10, 30, 50 e 100 anos. Palavras chave: valor extremo, distribuic¸a˜o GEV, me´todos de estimac¸a˜o, tempos de re- torno. ABSTRACT The Gumbel distribution is an important probability distribution that originates from Extreme Value Theory. In this theory, it is demonstrated that the asymptotic distribu- tion of extreme values can converge to asymptotic three forms, with the Gumbel or type I widely used in some areas. Several applications of the Gumbel distribution have been implemented successfully in many areas of science, such as shipbuilding, structural engi- neering, hydrology, climatology, economics and finance. Thus, the present study aimed to conduct a review of some theoretical aspects of the Gumbel distribution, and exem- plify the use of this distribution with an application to annual maximum rainfall data from Piracicaba-SP. The time series of annual maximum rainfall were obtained from the Post Conventional Agrometeorological Station of College of Agriculture “Luiz de Quei- roz”(ESALQ/USP). The data used cover the period 1917-2012. The Ljung-Box test and Runs test were respectively used to verify the independence and randomness of the data. The quality of fit of the Gumbel distribution was verified by chart Quantile-Quantile and the Kolmogorov-Smirnov test. The significance level of 5% was adopted for all tests. It was found that the maximum annual rainfall observations are independent and random (p value<0.05). The Gumbel distribution was appropriate to model the data as a graphical analysis and the results of the Kolmogorov-Smirnov test (value p=0.4455). The probabi- lity of precipitation annual maximum above 100, 120 and 140mm in Piracicaba-SP were respectively equal to 7.66%, 2.00% and 0.51%. Finally, presented the annual maximum rainfall expected in Piracicaba-SP, for return times of 2, 5, 10, 30, 50 and 100 years. Keywords: extreme value, GEV distribution, estimation methods, return times. LISTA DE FIGURAS 1 Emil Julius Gumbel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2 Representac¸a˜o das definic¸o˜es de valor extremo. . . . . . . . . . . . . . . . . 21 3 Comportamento de caudas superiores de func¸o˜es densidade de probabilidade. 25 4 Func¸a˜o densidade de probabilidade da distribuic¸a˜o Generalizada de Valores Extremos para ξ = −0, 4 (Weibull), ξ = 0, 4 (Fre´chet) e ξ → 0 (Gumbel), com σ = 10 e µ = 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 5 Chuvas intensas em Santa Catarina (2008), com destaque a um temporal em Camboriu´ e um deslizamento de uma encosta em Blumenau. . . . . . . 49 6 Localizac¸a˜o da a´rea de estudo, com destaque ao munic´ıpio de Piracicaba-SP. 50 7 Metodologia estat´ıstica para coleta, ana´lise e obtenc¸a˜o dos n´ıveis extremos de precipitac¸a˜o. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 8 Gra´fico de caixa (box plot) dos dados de precipitac¸o˜es ma´ximas anual (mm) de Piracicaba-SP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 9 Gra´fico QQ-plot para verificac¸a˜o do ajuste da distribuic¸a˜o Gumbel a se´rie de precipitac¸o˜es ma´ximas anuais (mm) de Piracicaba-SP. . . . . . . . . . . 57 10 Precipitac¸o˜es ma´ximas anuais esperadas em Piracicaba-SP, para os tempos de retorno de 2, 5, 10, 30, 50 e 100 anos. . . . . . . . . . . . . . . . . . . . 58 LISTA DE TABELAS 1 Precipitac¸o˜es ma´ximas anuais (PMA) observadas em Piracicaba-SP, no per´ıodo de 1917 a 2012. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 2 Estat´ısticas descritivas dos dados de precipitac¸a˜o ma´xima anual (mm) de Piracicaba-SP, no per´ıodo de 1917 a 2012. . . . . . . . . . . . . . . . . . . 54 3 Resultados dos testes de independeˆncia e de aleatoriedade da se´rie de pre- cipitac¸o˜es ma´ximas anuais de Piracicaba-SP. . . . . . . . . . . . . . . . . . 55 4 Estimativas dos paraˆmetros da distribuic¸a˜o Gumbel obtidas pelo me´todo da ma´xima verossimilhanc¸a e, respectivas variaˆncias e covariaˆncia estimadas. 56 5 Intervalo de 95% confianc¸a para os paraˆmetros posic¸a˜o (µ) e escala (σ) da distribuic¸a˜o Gumbel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 6 Probabilidade de ocorreˆncia de precipitac¸o˜es ma´ximas anuais superiores a 40, 60, 80, 100, 120 e 140mm em Piracicaba-SP. . . . . . . . . . . . . . . . 58 LISTA DE ABREVIATURAS CV coeficiente de variac¸a˜o ESALQ Escola Superior de Agricultura Luiz de Queiroz et al. entre outros autores e colaboradores fd func¸a˜o distribuic¸a˜o fdp func¸a˜o densidade de probabilidade fgm func¸a˜o geradora de momentos GEV Generalized Extreme Value IBGE Instituto Brasileiro de Geografia e Estat´ıstica iid independente e identicamente distribu´ıda INPE Instituto Nacional de Pesquisas Espaciais KS Kolmogorov-Smirnov mm mil´ımetro PMA precipitac¸o˜es ma´ximas anuais POT Peaks Over Threshold QQ-plot gra´fico Quantil-Quantil TVE Teoria de Valores Extremos LISTA DE SI´MBOLOS F (.) Func¸a˜o distribuic¸a˜o exp(.) Exponencial ξ Paraˆmetro forma µ Paraˆmetro posic¸a˜o σ Paraˆmetro escala f (.) Func¸a˜o densidade de probabilidade F (.)GEV Func¸a˜o distribuic¸a˜o GEV Md Mediana H0 Hipo´tese nula α Nı´vel de significaˆncia E(.) Esperanc¸a matema´tica V ar(.) Variaˆncia H1 Hipo´tese alternativa χ2 Distribuic¸a˜o Qui-Quadrado MX(.) Func¸a˜o geradora de momentos da varia´vel aleato´ria X Γ(.) Func¸a˜o Gama X ∼ Gu (µ, σ) X segue uma distribuic¸a˜o Gumbel Ψ(.) Func¸a˜o Digama γ Constante de Euler Mk K -e´simo momento ordina´rio amostral µk K -e´simo momento ordina´rio populacional θ Vetor de paraˆmetros Theta pi Nu´mero Pi L(.) Func¸a˜o de verossimilhanc¸a f(.)Gumbel Func¸a˜o densidade de probabilidade da distribuic¸a˜o Gumbel L(.)Gumbel Func¸a˜o de verossimilhanc¸a da distribuic¸a˜o Gumbel l(.) Func¸a˜o suporte I Limite inferior S Limite superior I(.) Matriz de informac¸a˜o de Fischer I(.)−1 Matriz de variaˆncias e covariaˆncia δ Coeficiente de confianc¸a cov(.) Covariaˆncia P (.) Probabilidade T Tempo de retorno E Evento xp Quantil p oC Graus Ce´lsius IC95% Intervalo de 95% de confianc¸a SUMA´RIO 1 Introduc¸a˜o16 2 Aspectos teo´ricos da distribuic¸a˜o Gumbel 18 2.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.2 A vida e a obra de Emil Julius Gumbel (1891-1966) . . . . . . . . . . . . . 19 2.3 Teoria de Valores Extremos . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.4 O desenvolvimento da Teoria de Valores Extremos . . . . . . . . . . . . . . 21 2.5 Distribuic¸a˜o Gumbel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.6 Estimac¸a˜o dos paraˆmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.6.1 Estimac¸a˜o por ponto . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.6.1.1 Func¸a˜o geradora de momentos . . . . . . . . . . . . . . . . 30 2.6.1.2 Me´todo dos momentos . . . . . . . . . . . . . . . . . . . . 34 2.6.1.3 Me´todo da ma´xima verossimilhanc¸a . . . . . . . . . . . . . 35 2.6.2 Estimac¸a˜o por intervalo . . . . . . . . . . . . . . . . . . . . . . . . 39 2.7 Probabilidade de ocorreˆncia de eventos extremos ma´ximos . . . . . . . . . 40 2.8 Tempo de retorno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 2.9 Estimativa dos n´ıveis de retorno da distribuic¸a˜o Gumbel . . . . . . . . . . 41 2.10 Intervalos de confianc¸a para os quantis xp da distribuic¸a˜o Gumbel . . . . . 42 2.11 Ajuste da distribuic¸a˜o Gumbel . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.11.1 Teste de Kolmogorov-Smirnov . . . . . . . . . . . . . . . . . . . . . 43 2.12 Testes de aleatoriedade e independeˆncia . . . . . . . . . . . . . . . . . . . . 44 2.12.1 Teste de Ljung-Box . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.12.2 Runs test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3 Aplicac¸a˜o aos dados de precipitac¸a˜o ma´xima anual de Piracicaba-SP 47 3.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 3.2 Eventos clima´ticos extremos recentes no Brasil . . . . . . . . . . . . . . . . 48 3.3 Material . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 3.4 Me´todos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 3.4.1 Composic¸a˜o da se´rie histo´rica de precipitac¸o˜es ma´ximas anuais . . . 51 3.4.2 Ana´lise descritiva dos dados . . . . . . . . . . . . . . . . . . . . . . 52 3.4.3 Pressuposic¸o˜es de ana´lise dos dados . . . . . . . . . . . . . . . . . . 52 3.5 Recursos computacionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 3.6 Resultados e discussa˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 4 Considerac¸o˜es finais e concluso˜es 59 Refereˆncias 61 16 CAPI´TULO 1 INTRODUC¸A˜O Os eventos extremos ocorrem em ambientes naturais, tecnolo´gicos e sociais. Esses eventos podem se originar de causas naturais, pela ac¸a˜o antropogeˆnica ou meramente pelo “acaso”. Em muitas situac¸o˜es, a ocorreˆncia dos eventos extremos pode ocasionar perdas de vidas humanas e animais, e causar preju´ızos econoˆmicos. As informac¸o˜es acerca dos eventos extremos e´ limitada, o que dificulta a compreensa˜o de como eles se desenvolvem, e de quando e onde eles podem ocorrer (ALBEVERIO; JENTSCH; KANTZ, 2006). Os eventos extremos sa˜o caracterizados pelos valores extremos, que apresentam baixa frequeˆncia relativa. Os valores extremos (ma´ximos ou mı´nimos) sa˜o geralmente associados a fenoˆmenos raros, com resultados frequentemente catastro´ficos. Os fenoˆmenos com essas caracter´ısticas podem ser estudados atualmente utilizando-se a Teoria de Valores Extre- mos (TVE), um ramo ativo e importante da estat´ıstica matema´tica, de grande utilidade pra´tica em diversas a´reas. Uma distribuic¸a˜o oriunda da TVE largamente utilizada na mo- delagem de eventos extremos, em a´reas como a economia e a engenharia, e´ a distribuic¸a˜o Gumbel de probabilidade. Nesse sentido, o presente trabalho teˆm como objetivos gerais: • realizar uma revisa˜o sobre alguns aspectos teo´ricos da distribuic¸a˜o Gumbel; • exemplificar o uso dessa distribuic¸a˜o com uma aplicac¸a˜o aos dados de precipitac¸a˜o ma´xima de Piracicaba-SP. Dessa forma, ale´m dessa breve introduc¸a˜o, o presente trabalho e´ composto dos cap´ıtulos 2, 3 e 4, que sa˜o detalhados a seguir. O cap´ıtulo 2 inicia-se com uma breve biografia 17 de Emil Julius Gumbel, a qual se justifica dada a` importaˆncia das contribuic¸o˜es desse cientista para a ana´lise de valores extremos. As sec¸o˜es seguintes sa˜o dedicadas aos fun- damentos da TVE, com prioridade a`s distribuic¸o˜es oriundas dessa teoria, principalmente a distribuic¸a˜o Gumbel. Nessas sec¸o˜es sa˜o discutidas as origens da TVE, a relac¸a˜o en- tre as distribuic¸o˜es Gumbel e Generalizada de Valores Extremos (GEV), os me´todos de estimac¸a˜o dos paraˆmetros da distribuic¸a˜o Gumbel e os me´todos para obtenc¸a˜o de proba- bilidades e n´ıveis de retorno utilizando essa distribuic¸a˜o. O ajuste da distribuic¸a˜o Gumbel e os testes de independeˆncia e de aleatoriedade sa˜o tratados no final do cap´ıtulo. O cap´ıtulo 3 e´ dedicado a aplicac¸a˜o da distribuic¸a˜o Gumbel na ana´lise das preci- pitac¸o˜es ma´ximas anuais de Piracicaba-SP. Inicialmente, e´ feita uma breve abordagem da ocorreˆncia de eventos clima´ticos extremos recentes no Brasil, que apresentaram con- sequeˆncias tra´gicas e calamitosas. A seguir e´ apresentada a metodologia utilizada para o estudo da se´rie de dados do munic´ıpio, tais como a sua origem, a forma como a se´rie foi constitu´ıda, a ana´lise estat´ıstica e os recursos computacionais que foram necessa´rios. A u´ltima sec¸a˜o desse cap´ıtulo e´ reservada aos resultados e a` discussa˜o. No cap´ıtulo 4 sa˜o apresentadas as considerac¸o˜es finais e as concluso˜es do trabalho. 18 CAPI´TULO 2 ASPECTOS TEO´RICOS DA DISTRIBUIC¸A˜O GUMBEL 2.1 Introduc¸a˜o A distribuic¸a˜o Gumbel de probabilidade e´ tambe´m denominada distribuic¸a˜o do Tipo I, distribuic¸a˜o tipo I Fisher-Tippet ou ainda, distribuic¸a˜o dupla exponencial. O potencial de aplicabilidade da distribuic¸a˜o Gumbel deve-se ao fato dessa distribuic¸a˜o modelar tanto a distribuic¸a˜o do ma´ximo quanto a distribuic¸a˜o do mı´nimo de uma varia´vel aleato´ria, embora a forma assinto´tica limite dessas distribuic¸o˜es sejam diferentes. Essa distribuic¸a˜o tem sido muito utilizada na modelagem da frequeˆncia de varia´veis hidrolo´gicas, possuindo vasta aplicac¸a˜o em estudos de precipitac¸o˜es intensas e vazo˜es de enchentes. Na engenharia, a distribuic¸a˜o Gumbel tem servido de subs´ıdio para a construc¸a˜o de estruturas como barragens, plataformas, diques, torres de alta tensa˜o, quebra-mar, edif´ıcios, onde essas obras sa˜o projetadas para suportar o limite ma´ximo (ou mı´nimo) esperado dos eventos hidrometeorolo´gicos que poderiam impactar sobre elas. Devido a importaˆncia da distribuic¸a˜o Gumbel, esse cap´ıtulo tem como objetivos es- pec´ıficos: • Demonstrar que a distribuic¸a˜o Gumbel e´ um caso particular da distribuic¸a˜o GEV; • determinar a func¸a˜o geradora de momentos (fgm) da distribuic¸a˜o Gumbel; 19 • obter os estimadores de momentos e de ma´xima verossimilhanc¸a dos seus paraˆmetros; • determinar a sua func¸a˜o de quantis. 2.2 A vida e a obra de Emil Julius Gumbel (1891- 1966) Figura 1: Emil Julius Gumbel. Emil Julius Gumbel (1891-1966) esteve dire- tamente envolvido nos acontecimentos pol´ıticos de seu tempo, principalmente pelo seu posicionamento contra´rio ao nazismo. Gumbel tambe´m se destacou por seus trabalhos acadeˆmicos, notoriamente por suas contribuic¸o˜es para o desenvolvimento da teoria es- tat´ıstica de valores extremos. Muito de sua vida e de sua carreira pol´ıtica pode ser encontrado em The Emil J. Gumbel collection do Instituto Leo Baeck, NovaYork, colec¸a˜o que conte´m diversos artigos, manuscri- tos e rascunhos de sua autoria, que expressam a ima- gem de um dos pol´ıticos antinazistas mais expressivos na Alemanha nos anos de 1920 a 1940 (BRENNER, 1990). Nascido em 18 de julho de 1891 em Munique, Emil Julius Gumbel era o primeiro de treˆs filhos de um pro´spero casal judeu de Wurttemberg, Herman e Flora Gumbel. Durante sua formac¸a˜o inicial, Gumbel recebeu uma educac¸a˜o human´ıstica completa. Em 1913, na universidade de Munique, Gumbel obteve seu diploma em matema´tica e cieˆncias atuariais. Um ano depois, um pouco antes do desabrochar da Primeira Guerra Mundial, Gumbel receberia o t´ıtulo de doutor em economia pol´ıtica. As marcas dessa grande guerra deixariam tambe´m profundos sinais em sua vida. Apo´s poucas semanas do in´ıcio do conflito, seu primo seria morto e seu irma˜o cac¸ula viria a sucumbir no vera˜o de 1915. O conflito gerado por essa guerra talvez tenha contribu´ıdo para que Emil se tornasse um pacifista e escritor. Em 1916, Gumbel se mudou para Berlim, onde apo´s a morte de um amigo passou a investigar diversos assassinatos. Utilizando registros do tribunal, contas de jornais e relato´rios fornecidos a ele por amigos no governo, Gumbel expoˆs indiv´ıduos e grupos que realizaram diversos assassinatos pol´ıticos na Alemanha, publicando suas descobertas em 1922 e 1924. Em 1923, Gumbel tornou-se professor de estat´ıstica na Universidade de 20 Heidelberg. Devido ao seu posicionamento pol´ıtico, Gumbel enfrentou dura hostilidade de colegas e de grupos de estudantes nazistas em Heidelberg. Ao receber a promoc¸a˜o de professor assistente em 1930 pelo ministro da educac¸a˜o, muitos estudantes da universidade se manifestaram em oposic¸a˜o a sua nomeac¸a˜o, exigindo a sua demissa˜o por considera´-lo um “traidor”e “caluniador da memo´ria nacional”. Apo´s uma falsa citac¸a˜o em que teria supostamente ofendido soldados mortos em guerra, Gumbel foi demitido de Heidelberg em agosto de 1932. Ironicamente, essa demissa˜o em 1932 provavelmente conservou a sua vida. Em 1933, com a ascensa˜o dos nazistas ao poder, exilou-se na Franc¸a, onde, posteri- ormente naturalizou-se franceˆs (1939). Devido aos desdobramentos da Segunda Guerra Mundial, enquanto morava em Marseille, com a invasa˜o alema˜ a Franc¸a, Gumbel e sua famı´lia fugiram para Portugal, de onde emigraram para os Estados Unidos em 1940. Com certa idade e em raza˜o de seu passado pol´ıtico, Gumbel passou dificuldades profissionais e financeiras nos Estados Unidos, conseguindo se estabilizar somente em 1953, ao lecionar como professor adjunto na Universidade de Columbia (1953-1966). Segundo Brenner (1990), apesar da dificuldade de conseguir um emprego esta´vel nos Estados Unidos, Gumbel era um cientista produtivo e bem sucedido. Ele recebeu muitas concesso˜es e contratos de ageˆncias governamentais, e dezenas de artigos foram publicados sobre a teoria estat´ıstica de valores extremos e sua aplicac¸a˜o a` problemas de engenharia. Entre outras aplicac¸o˜es, Gumbel estabeleceu os me´todos para calcular a pior inundac¸a˜o poss´ıvel para um determinado corpo de a´gua e os me´todos para identificar o mais fraco elo de uma cadeia, relativo a` resisteˆncia de materiais. Sua teoria de probabilidade sobre inundac¸a˜o foi utilizada por engenheiros civis para construc¸a˜o de barragens e em outros projetos em va´rios estados, sendo seu trabalho utilizado principalmente em cieˆncias apli- cadas e engenharias. Seus livros e os seus artigos sa˜o citados com frequeˆncia ainda hoje, mais de cinquenta anos apo´s a publicac¸a˜o de sua obra-prima, Statistics of Extremes (1958). Gumbel veio a falecer no dia 10 de setembro de 1966 aos 75 anos de idade, em raza˜o de um caˆncer. O conceito de valor extremo esteve em seus pensamentos nos u´ltimos 33 anos de sua vida, e a sua obra sobre esse tema lhe garantiu fama duradoura. Gumbel, por suas habilidades interdisciplinares, seu conhecimento de outras l´ınguas, e o seu talento como matema´tico aplicado, foi capaz de explorar o campo teo´rico da TVE e demonstrar o seu uso pra´tico atrave´s da aplicac¸a˜o de seus resultados em algumas a´reas. 21 2.3 Teoria de Valores Extremos A TVE e´ um importante ramo da estat´ıstica matema´tica que possibilita a ana´lise de eventos que apresentam baixa frequeˆncia relativa e elevado impacto. Segundo Silva R. N. C. (2008), os valores extremos podem ser compreendidos como eventos raros que ocorrem nas caudas das distribuic¸o˜es, distantes do aglomerado (centro) da distribuic¸a˜o dos dados. Entretanto, o mesmo autor ressalta que na˜o ha´ uma definic¸a˜o que possa ser considerada como universal para os valores extremos. Mendes (2004), e Morita, Bueno e Pires (2008), definem o termo valor extremo como sendo o valor ma´ximo (ou mı´nimo) de uma se´rie de dados num determinado bloco ou aquele(s) valor(es) que excede(m) um limiar suficientemente alto. Na Figura 2 sa˜o ilustradas essas duas definic¸o˜es de valor extremo. B1 B2 B3 B4 l l l l (a) Ma´ximos nos blocos B1, B2, B3 e B4. u l l l l l l (b) Ma´ximos acima de um limiar u. Figura 2: Representac¸a˜o das definic¸o˜es de valor extremo. 2.4 O desenvolvimento da Teoria de Valores Extre- mos Os fundadores do ca´lculo das probabilidades se interessavam mais com o comporta- mento do aglomerado das observac¸o˜es do que com as observac¸o˜es extremas. No entanto, em 1709 Nicolas Bernoulli ja´ se deparava com um problema atuarial relativo a valores extremos, ao tratar da me´dia da distaˆncia ma´xima a` origem, de pontos aleatoriamente 22 posicionados em uma linha reta de tamanho fixo. As primeiras pesquisas referentes a` TVE iniciaram-se a partir da distribuic¸a˜o Normal, que se mostrou razoa´vel para essa finalidade, devido a sua importaˆncia pra´tica (GUMBEL, 1958). A origem da TVE esta´ associada a` problemas astronoˆmicos, onde existia a presenc¸a de dados at´ıpicos em relac¸a˜o ao conjunto de dados. Segundo Gumbel (1958), havia por parte dos astroˆnomos o interesse em estabelecer crite´rios para a aceitac¸a˜o ou rejeic¸a˜o de um valor perife´rico. Um crite´rio adotado era descartar aquelas observac¸o˜es muito discordantes (outliers). Em 1852, Pierce estabeleceu um me´todo elaborado para a identificac¸a˜o de outliers, baseado na teoria de probabilidade. Os primeiros artigos sobre a TVE datam das primeiras de´cadas do se´culo passado, podendo citar os trabalhos de Bortkiewicz (1922), Dodd (1923), Finetti (1932), Mises (1936). Alguns autores afirmam que Bortkiewicz foi o primeiro cientista a estudar os valores extremos (GUMBEL, 1958; MENDES, 2004). A importaˆncia do artigo de Bortkiewicz deve-se ao fato de que o conceito de distribuic¸a˜o de valor extremo foi claramente introduzida pela primeira vez nesse trabalho (KOTZ; NADARAJAH, 2000). Em seu artigo de 1927, Fre´chet introduziu a distribuic¸a˜o assinto´tica do ma´ximo de uma amostra aleato´ria (MENDES, 2004). Nesse trabalho, Fre´chet mostrou que os maiores valores tirados de diferentes distribuic¸o˜es iniciais compartilham de uma mesma proprie- dade, podendo ter uma distribuic¸a˜o assinto´tica comum. Devido a sua importaˆncia, Gum- bel (1958) salienta que o artigo de Fre´chet nunca obteve o reconhecimento que merecia. O marco da TVE foi o artigo de Fisher e Tippett (1928). Estudando o mesmo problema que Fre´chet, os autores verificaram que a distribuic¸a˜o dos ma´ximos convergia para uma de treˆs formas assinto´ticas de valores extremos, conhecidas atualmente como Gumbel ou Tipo I, Fre´chet ou Tipo II e Weibull ou Tipo III (BAUTISTA, 2002). Gnedenko (1943) forneceu importantes contribuic¸o˜es para o desenvolvimento da TVE. Em seu trabalho, Gnedenko introduziu a distribuic¸a˜o GEV (do ingleˆs “GeneralizedEx- treme Value”). Ale´m disso, Gnedenko apresentou uma rigorosa fundamentac¸a˜o teo´rica necessa´ria e suficiente para a convergeˆncia em distribuic¸a˜o do ma´ximo para uma das treˆs formas assinto´ticas de valores extremos (BAUTISTA, 2002; MENDES, 2004). O teorema de Fisher-Tippett, proposto pelos mesmos autores e demonstrado rigorosamente por Gne- denko em 1943, e´ um resultado acerca da distribuic¸a˜o assinto´tica dos valores extremos. Basicamente, o teorema estabelece que o ma´ximo amostral convenientemente normalizado converge para uma de treˆs distribuic¸o˜es poss´ıveis. O teorema dos tipos extremais desem- penha um papel semelhante ao teorema central do limite, que segundo Memo´ria (2004) assegura que “qualquer soma ou me´dia de varia´veis aleato´rias tem, para um grande nu´mero 23 de termos, uma distribuic¸a˜o aproximadamente Normal”. Jenkinson (1955) propoˆs que as treˆs formas assinto´ticas de valores extremos estabele- cidas por Fisher e Tippett (1928) poderiam ser representadas pela distribuic¸a˜o GEV. De acordo com Coles (2001), a parametrizac¸a˜o da distribuic¸a˜o GEV foi realizada de forma independente por Mises (1954) e Jenkinson (1955). Todavia, Gumbel foi pioneiro na aplicac¸a˜o da TVE, principalmente na modelagem de varia´veis clima´ticas e hidrolo´gicas. Em seu artigo, Gumbel (1941) utilizou a distribuic¸a˜o Gumbel para estimar os n´ıveis de retorno para os dados de vaza˜o ma´xima anual dos rios Mississ´ıpi (Estados Unidos) e Rhoˆne (Franc¸a). Gumbel (1958) destacou-se principalmente pela publicac¸a˜o de sua obra- prima, Statistics of Extremes, pela Universidade de Columbia. Coles (2001) afirma que “Statistics of Extremes foi fundamental na promoc¸a˜o da TVE como uma ferramenta para a modelagem do comportamento extremal de processos f´ısicos observados”. Esse livro e´ ainda hoje considerado como uma das principais refereˆncias em aplicac¸o˜es da TVE em assuntos de engenharia. Durante a de´cada seguinte na˜o houve alterac¸o˜es significativas no desenvolvimento da TVE pela falta de interesse entre os probabilistas e os estat´ısticos, o que culminou com um nu´mero muito limitado de trabalhos relevantes. Pore´m, na de´cada de 1970, a tese de doutoramento de Laurens de Haan, On Regular Variation and its Applications to the Weak Convergence of Sample Extremes, foi representativa do ponto de vista teo´rico para a TVE. Pela primeira vez, as propriedades probabil´ısticas e estoca´sticas de amostras de valores extremos foram desenvolvidas em uma teoria atraente, compara´vel a` teoria das somas de varia´veis aleato´rias (BEIRLANT et al., 2004). A crescente preocupac¸a˜o com a ocorreˆncia de eventos extremos severos, que ocasionam grandes impactos sociais e econoˆmicos, tem chamado a atenc¸a˜o nas u´ltimas de´cadas pela gravidade das consequentes perdas. Aliado a evoluc¸a˜o dos computadores, essas motivac¸o˜es talvez tenham conduzido a uma crescente publicac¸a˜o das refereˆncias sobre a TVE nos u´ltimos trinta anos. Esses fatores provocaram o ra´pido amadurecimento dessa teoria, tornando-a muito atraente em diversas a´reas da cieˆncia. Atualmente, as te´cnicas de valores extremos tem sido amplamente utilizadas em a´reas tais como climatologia, meteorologia, hidrologia, engenharias, economia, financ¸as, astronomia, biologia, entre outras. 24 2.5 Distribuic¸a˜o Gumbel Fisher e Tippett (1928) definiram que a distribuic¸a˜o dos ma´ximos de uma amostra aleato´ria converge ou para uma distribuic¸a˜o degenerada ou para um dos treˆs tipos de distribuic¸o˜es assinto´ticas de valores extremos. Posteriormente, em 1943 Gnedenko apre- sentou, com o devido rigor matema´tico, as condic¸o˜es necessa´rias para se conhecer para qual das treˆs formas assinto´ticas a distribuic¸a˜o dos valores extremos iria convergir, caso na˜o convergisse a uma distribuic¸a˜o degenerada. Gnedenko determinou que o comportamento da cauda dessas distribuic¸o˜es, na direc¸a˜o dos extremos (ma´ximos ou mı´nimos), poderia ser modelado por algumas distribuic¸o˜es cont´ınuas. No caso de ma´ximos, a convergeˆncia das caudas sera´ para a distribuic¸a˜o i) do Tipo I, quando for por exemplo, a distribuic¸a˜o Gumbel, Exponencial, Gama, Normal ou a Log-Normal; ii) do Tipo II, quando corres- ponder a distribuic¸a˜o Fre´chet, a distribuic¸a˜o Log-Gama ou a distribuic¸a˜o t de Student; iii) do Tipo III se seguir a distribuic¸a˜o Weibull, Uniforme ou a Beta (BAUTISTA, 2002; NAGHETTINI; PINTO, 2007). As treˆs formas assinto´ticas que surgem apresentam diferenc¸as quanto ao compor- tamento de suas caudas. Tomando o caso dos ma´ximos, a distribuic¸a˜o Gumbel decai exponencialmente, apresentando uma queda menos suave na direc¸a˜o do extremo em foco quando comparada a distribuic¸a˜o Fre´chet. Essa u´ltima distribuic¸a˜o tem decaimento po- linomial na cauda de sua distribuic¸a˜o, apresentando taxas de decaimento relativamente diferentes aos da distribuic¸a˜o Gumbel. Por sua vez, a distribuic¸a˜o Weibull possui cauda su- perior finita. Essas considerac¸o˜es resultam em diferentes aplicac¸o˜es das treˆs distribuic¸o˜es de valores extremos, pelos seus comportamentos diferenciados na direc¸a˜o dos extremos (COLES, 2001). 25 10 20 30 40 50 60 70 80 0.00 0.01 0.02 0.03 0.04 x f(x ) Caudas superiores de funções densidade Exponencial Limitada Polinomial Figura 3: Comportamento de caudas superiores de func¸o˜es densidade de probabilidade. Fonte: Adaptado de Naghettini e Pinto (2007). Segundo Coles (2001), uma das dificuldades iniciais para a aplicac¸a˜o das treˆs formas assinto´ticas de valores extremos era escolher qual das treˆs distribuic¸o˜es era mais ade- quada para um determinado conjunto de dados. Uma alternativa para esse problema e´ a utilizac¸a˜o da forma generalizada dessas distribuic¸o˜es, a distribuic¸a˜o GEV, fundamentada por Jenkinson (1955). A unificac¸a˜o das treˆs formas assinto´ticas de valores extremos em uma u´nica distribuic¸a˜o apresenta como vantagem o fato de que apenas uma infereˆncia e´ realizada, o que elimina uma discriminac¸a˜o a priori para selecionar a distribuic¸a˜o mais adequada, dentre as treˆs distribuic¸o˜es iniciais. Conforme Jenkinson (1955), a distribuic¸a˜o GEV possui func¸a˜o distribuic¸a˜o (fd) que pode ser expressa por: F (x| ξ, µ, σ) = exp { − [ 1 + ξ ( x− µ σ )]− 1 ξ } , (2.1) definida em {x : 1 + ξ (x− µ)/σ > 0}, em que ξ, µ e σ denotam respectivamente os paraˆmetros forma, posic¸a˜o e escala, com −∞ < ξ < ∞, −∞ < µ < ∞ e σ > 0. As distribuic¸o˜es de valores extremos de Fre´chet e de Weibull correspondem respectivamente aos casos em que ξ > 0 e ξ < 0 na parametrizac¸a˜o. Derivando-se (2.1) em relac¸a˜o a x, obte´m-se a func¸a˜o densidade de probabilidade (fdp) 26 da distribuic¸a˜o GEV, cuja representac¸a˜o matema´tica pode ser dada por: f (x| ξ, µ, σ) = 1 σ [ 1 + ξ ( x− µ σ )]−( 1+ξξ ) exp { − [ 1 + ξ ( x− µ σ )− 1 ξ ]} , (2.2) definida em −∞ < x < µ− σ/ξ para ξ < 0 e µ− σ/ξ < x < +∞ para ξ > 0. Uma variedade de te´cnicas tem sido propostas na literatura para a infereˆncia dos paraˆmetros da distribuic¸a˜o GEV. Entre elas pode-se citar te´cnicas gra´ficas, me´todo da ma´xima verossimilhanc¸a, me´todo dos momentos, me´todo da regressa˜o, me´todo dos L- momentos, me´todo dos momentos de probabilidade ponderada, me´todos Bayesianos, entre outros (BAUTISTA, 2002; MENDES, 2004; SILVA R. N. C., 2008). Coles (2001) ressalta que cada te´cnica possui em sua metodologia pro´s e contras quanto a sua utilizac¸a˜o, pore´m destaca que o me´todo da ma´xima verossimilhanc¸a e´ uma te´cnica particularmente atraente, principalmente pela sua capacidade de adaptar-se a` distribuic¸o˜es com construc¸o˜es mais complexas. Smith (1985) tambe´m destaca que aprefereˆncia pelos estimadores obtidos pelo me´todo da ma´xima verossimilhanc¸a deve-se ao fato de sua metodologia ser bem compreendida. O mesmo autor fornece em seu trabalho detalhes teo´ricos sobre a regularidade dos es- timadores de ma´xima verossimilhanc¸a da distribuic¸a˜o GEV, apresentando os seguintes resultados: i) quando ξ > −0, 5 os estimadores de ma´xima verossimilhanc¸a sa˜o comple- tamente regulares; ii) quando −1 < ξ < −0, 5 os estimadores de ma´xima verossimilhanc¸a existem, mas na˜o sa˜o regulares; iii) quando ξ < −1 os estimadores de ma´xima verossimi- lhanc¸a na˜o existem. Na Figura 4 sa˜o apresentados os treˆs casos da distribuic¸a˜o GEV, com destaque ao caso em que ξ → 0 (Gumbel). Nessa figura pode-se observar que o comportamento das caudas e´ influenciado pelo paraˆmetro ξ. 27 −20 0 20 40 60 80 0.00 0.01 0.02 0.03 0.04 x D en si da de s Gumbel Weibull Fréchet Figura 4: Func¸a˜o densidade de probabilidade da distribuic¸a˜o Generalizada de Valores Extremos para ξ = −0, 4 (Weibull), ξ = 0, 4 (Fre´chet) e ξ → 0 (Gumbel), com σ = 10 e µ = 2. Em particular, quando lim ξ→0 F (x)GEV obteˆm-se a fd de Gumbel. lim ξ→0 F (x| ξ, µ, σ) = lim ξ→0 exp { − [ 1 + ξ ( x− µ σ )]− 1 ξ } = exp { − { lim ξ→0 [ 1 + ξ ( x− µ σ )]− 1 ξ }} . (2.3) Em (2.3) surge uma forma indeterminada do limite do tipo 0−∞. Esse caso de inde- terminac¸a˜o do limite em (2.3) pode ser resolvido tomando-se a exponencial do logaritmo natural da expressa˜o interna do limite. Assim, 28 lim ξ→0 [ 1 + ξ ( x− µ σ )]− 1 ξ = lim ξ→0 exp { ln [ 1 + ξ ( x− µ σ )]− 1 ξ } = lim ξ→0 exp { − ln [ 1 + ξ ( x−µ σ )] ξ } = exp lim ξ→0 { − ln [ 1 + ξ ( x−µ σ )] ξ } = exp lim ξ→0 { − ( x−µ σ )/[ 1 + ξ ( x−µ σ )] 1 } = exp lim ξ→0 { − ( x−µ σ ) 1 + ξ ( x−µ σ )} = exp [ − ( x− µ σ )] . (2.4) Substituindo (2.4) em (2.3) obteˆm-se a fd de Gumbel: F (x|µ, σ) = exp { − exp [ − ( x− µ σ )]} , (2.5) em que x e´ a varia´vel aleato´ria associada a valores ma´ximos do per´ıodo, µ e´ denominado paraˆmetro de posic¸a˜o e σ e´ o paraˆmetro de escala, sendo definida em −∞ < x < +∞, −∞ < µ < +∞ e σ > 0. A fdp da distribuic¸a˜o Gumbel e´ obtida derivando-se (2.5) em relac¸a˜o a x. Seja y =( x−µ σ ) e dessa forma: dF (x|µ, σ) dx = d dx {exp [− exp (−y)]} = exp [− exp (−y)] d dx [− exp (−y)] = exp [− exp (−y)] [− exp (−y)] d dx [−y] = exp [− exp (−y)] [− exp (−y)] ( − 1 σ ) = exp [− exp (−y)] [exp (−y)] ( 1 σ ) = exp [− exp(−y)− y] ( 1 σ ) . (2.6) Reorganizando e substituindo y em (2.6) teˆm-se que a fdp da distribuic¸a˜o Gumbel e´ 29 dada por: f (x|µ, σ) = 1 σ exp [ −x− µ σ − exp ( −x− µ σ )] , (2.7) definida em −∞ < x <∞, −∞ < µ <∞ e σ > 0. A distribuic¸a˜o Gumbel e´ utilizada frequentemente em algumas a´reas da cieˆncia. Por modelar tanto valores mı´nimos como ma´ximos, a distribuic¸a˜o Gumbel tem corroborado na soluc¸a˜o de importantes problemas em a´reas como a engenharia. Entre os va´rios campos de pesquisa de aplicac¸a˜o da distribuic¸a˜o Gumbel, destaca-se a sua utilizac¸a˜o em pesquisas ligadas a fenoˆmenos hidrometeorolo´gicos, principalmente nos casos em que a varia´vel envolvida no estudo refere-se a` precipitac¸a˜o pluviome´trica ma´xima (BEIJO, 2002). Nos estudos envolvendo fenoˆmenos hidrometeorolo´gicos, a distribuic¸a˜o Gumbel e´ uti- lizada principalmente no planejamento de atividades que possam sofrer preju´ızos humanos e econoˆmicos, onde considera-se um risco admiss´ıvel da ac¸a˜o dos eventos extremos. Nesse sentido, a distribuic¸a˜o Gumbel tem sido empregada na ana´lise de varia´veis como preci- pitac¸a˜o pluviome´trica ma´xima, temperatura ma´xima ou mı´nima e velocidade ma´xima de vento. Como exemplo dessas aplicac¸o˜es, pode-se citar os trabalhos de Camargo et al. (1993), Bautista (2002), Beijo et al. (2003), Astolpho, Camargo e Bardin (2004), Sansi- golo (2008), Queiroz et al. (2010), Hartmann, Moala e Mendonc¸a (2011), e Blain e Lulu (2011). 2.6 Estimac¸a˜o dos paraˆmetros Ao estudar-se uma determinada varia´vel aleato´ria, um dos interesses reside em de- terminar uma distribuic¸a˜o teo´rica que a descreva. Mas para isso torna-se necessa´rio determinar os valores dos paraˆmetros que definem tal distribuic¸a˜o. Como na˜o e´ poss´ıvel contar com todas as informac¸o˜es da populac¸a˜o, tem-se que os verdadeiros valores dos seus paraˆmetros na˜o podem ser obtidos, ao menos no tocante a varia´veis clima´ticas. O recurso a ser adotado e´ utilizar uma amostra que seja representativa em relac¸a˜o a` populac¸a˜o da varia´vel em estudo. Atrave´s de uma amostra representativa busca-se obter estimativas dos paraˆmetros, sendo este processo conhecido por estimac¸a˜o. O processo de estimac¸a˜o dos paraˆmetros pode ser realizado basicamente de duas maneiras: atrave´s da estimac¸a˜o por ponto (ou pontual) ou pela estimac¸a˜o por intervalo (intervalar). Na estimac¸a˜o pontual determinam- se os estimadores, que sa˜o func¸o˜es que fornecera˜o as estimativas dos paraˆmetros. Dois 30 me´todos de estimac¸a˜o pontual amplamente utilizados sa˜o o me´todo dos momentos e o me´todo da ma´xima verossimilhanc¸a. No presente trabalho sera˜o apresentados os estimadores de momentos e de ma´xima ve- rossimilhanc¸a para os paraˆmetros da distribuic¸a˜o Gumbel. Todavia, para a obtenc¸a˜o das estimativas dos paraˆmetros dessa distribuic¸a˜o sera˜o utilizados somente os estimadores de ma´xima verossimilhanc¸a, conforme recomendac¸a˜o de Smith (1985). Em relac¸a˜o ao me´todo dos momentos, como a distribuic¸a˜o Gumbel e´ biparame´trica, temos dois paraˆmetros a es- timar. Portanto, torna-se necessa´rio a determinac¸a˜o da me´dia e da variaˆncia de uma varia´vel aleato´ria com distribuic¸a˜o Gumbel, que sera˜o especificadas empregando os mo- mentos. Por sua vez, os momentos sera˜o obtidos utilizando-se a fgm da distribuic¸a˜o Gumbel. 2.6.1 Estimac¸a˜o por ponto 2.6.1.1 Func¸a˜o geradora de momentos O comportamento de uma varia´vel aleato´ria X e´ especificada por sua func¸a˜o den- sidade, a qual pode ter a sua forma caracterizada por um certo nu´mero de momentos. Cada momento e´ obtido pela aplicac¸a˜o da esperanc¸a matema´tica. Pore´m, em algumas situac¸o˜es essa aplicac¸a˜o pode na˜o ser ta˜o simples e uma forma alternativa para se obter cada momento de uma varia´vel aleato´ria e´ utilizando-se a fgm. De acordo com Naghettini e Pinto (2007), a fgm de uma distribuic¸a˜o de probabilidades e´ uma func¸a˜o M que permite o ca´lculo alternativo de seus momentos em relac¸a˜o a` origem. Para uma varia´vel aleato´ria cont´ınua X, a func¸a˜o M e´ definida por: MX (t) = E[e tX ] = ∞∫ −∞ etxf (x) dx, (2.8) em que f(.) e´ a func¸a˜o densidade de probabilidade da varia´vel aleato´ria X. A fgm recebe esse nome porque cada momento e´ obtido pela sua i-e´sima derivada em relac¸a˜o a t, calculada em t = 0, fornecendo o momento da distribuic¸a˜o em questa˜o. Primeiramente, determinemos a fgm da distribuic¸a˜o Gumbel padra˜o (µ = 0, σ = 1), que tem fdp dada por: f (z|µ, σ) = exp [−z − exp (−z)] . (2.9) 31 Assim, aplicando-se (2.8) em (2.9) segue que: MZ (t) = E[e tZ ] = ∞∫ −∞ etzf (z) dz = ∞∫ −∞ exp (tz) exp [−z − exp (−z)] dz = ∞∫ −∞ exp (tz) exp (−z) exp [− exp (−z)] dz = ∞∫ −∞ exp [(−z) (−t)] exp [− exp (−z)] exp (−z) dz. (2.10) Seja y = exp(-z )⇒ −dy = exp(-z )dz. Examinando-se os limites de integrac¸a˜o, tem-se que, quando z →∞, y → 0, e quando z → −∞, y →∞. Logo, substituindo y em (2.10) e alterando os limitesde integrac¸a˜o, tem-se que a fgm da distribuic¸a˜o Gumbel padra˜o e´ expressa por: MZ (t) = E[e tZ ] = − 0∫ ∞ y−t exp (−y) dy = ∞∫ 0 y−t exp (−y) dy = ∞∫ 0 y(1−t)−1 exp (−y) dy = Γ (1− t) , (2.11) sendo Γ (.) a func¸a˜o Gama. Uma varia´vel aleato´ria X com distribuic¸a˜o Gumbel com paraˆmetros µ e σ (X ∼ Gu (µ, σ)), pode ser expressa como uma transformac¸a˜o linear de uma varia´vel aleato´ria Z com distribuic¸a˜o Gumbel padra˜o. Como Z = (X − µ)/σ, tem-se que X = µ + σZ. Assim, a fgm da distribuic¸a˜o Gumbel e´ dada por: 32 MX(t) = Mµ+σZ (t) = E [ e(µ+σZ)t ] = E [ eµteσtZ ] = eµtE [ e(σt)Z ] = eµtΓ (1− σt) = exp (µt) Γ (1− σt) . (2.12) Dessa forma, a me´dia e a variaˆncia podem ser determinadas pelos dois momentos ordina´rios, obtidos a partir de (2.12). Assim, o primeiro momento ordina´rio e´ dado por E (X) = dMX(t) dt ∣∣∣ t=0 . Logo, dMX (t) dt = d [exp (µt) Γ (1− σt)] dt = exp (µt) d [µt] dt Γ (1− σt) + exp (µt) d [Γ (1− σt)] dt = µ exp (µt) Γ (1− σt) + exp (µt) Ψ (1− σt) Γ (1− σt) d [1− σt] dt = µ exp (µt) Γ (1− σt)− σ exp (µt) Ψ (1− σt) Γ (1− σt) , (2.13) em que, conforme Lawless (1982), dΓ(.) dt = Ψ (.) Γ (.), sendo Ψ (.) a func¸a˜o Digama. Das propriedades das func¸o˜es Gama e Digama tem-se que Γ (1) = 1 e Ψ (1) = −γ = −0, 577215..., sendo que γ e´ chamada constante de Euler. Dessa forma, o primeiro mo- mento ordina´rio da varia´vel aleato´ria X ∼ Gu (µ, σ) e´: E (X) = dMX (t) dt ∣∣∣∣ t=0 = µ exp (µt) Γ (1− σt)− σ exp (µt) Ψ (1− σt) Γ (1− σt)|t=0 = µ exp (0) Γ (1)− σ exp (0) Ψ (1) Γ (1) = µ+ σγ = µ+ 0, 5772σ. (2.14) A me´dia de X ∼ Gu (µ, σ) corresponde ao primeiro momento ordina´rio. O segundo momento ordina´rio e´ obtido pela segunda derivada de (2.12), quando t = 0, ou seja, 33 E (X2) = d 2MX(t) dt2 ∣∣∣ t=0 . Dessa forma, E ( X2 ) = d2MX (t) dt2 ∣∣∣∣ t=0 = d [µ exp (µt) Γ (1− σt)− σ exp (µt) Ψ (1− σt) Γ (1− σt)] dt ∣∣∣∣ t=0 = µ2 exp (µt) Γ (1− σt)− 2µσ exp (µt) Ψ (1− σt) Γ (1− σt)+ + σ2 exp (µt) Ψ ′ (1− σt) Γ (1− σt) + σ2 exp (µt) Ψ2 (1− σt) Γ (1− σt) |t=0 = µ2Γ (1)− 2µσΨ (1) Γ (1) + σ2Ψ′ (1) Γ (1) + σ2Ψ2 (1) Γ (1) = µ2 + 2µσγ + σ2Ψ ′ (1) + σ2γ2, (2.15) em que Ψ ′ (1) = pi 2 6 (LAWLESS, 1982). Assim, o segundo momento ordina´rio e´: E ( X2 ) = µ2 + 2µσγ + σ2 pi2 6 + σ2γ2. (2.16) Com os dois primeiros momentos ordina´rios determinados e´ poss´ıvel obter a variaˆncia de X ∼ Gu (µ, σ). De forma geral, a variaˆncia de uma varia´vel aleato´ria qualquer e´ dada por: V (X) = E ( X2 )− [E (X)]2 . (2.17) Logo, substituindo 2.14 e 2.16 em 2.17 tem-se que: V (X) = E ( X2 )− [E (X)]2 = µ2 + 2µσγ + σ2 pi2 6 + σ2γ2 − (µ+ σγ)2 = µ2 + 2µσγ + σ2 pi2 6 + σ2γ2 − µ2 − 2µσγ − σ2γ2 = σ2 pi2 6 . (2.18) Com a me´dia, a variaˆncia e os dois primeiros momentos ordina´rios especificados e´ poss´ıvel determinar os estimadores de momentos dos paraˆmetros da distribuic¸a˜o Gumbel. 34 2.6.1.2 Me´todo dos momentos O me´todo dos momentos para obtenc¸a˜o de estimativas dos paraˆmetros e´ uma das te´cnicas de estimac¸a˜o mais simples e antigas. A metodologia para aplicac¸a˜o desse me´todo consiste em igualar os momentos ordina´rios amostrais aos momentos ordina´rios populaci- onais (BOLFARINE; SANDOVAL, 2001). Seja {x1, x2, . . . , xn} uma amostra aleato´ria simples de uma populac¸a˜o de uma varia´vel aleato´ria X distribu´ıda de acordo com f (x| θ1, θ2, ..., θk), com k paraˆmetros. O k -e´simo momento ordina´rio amostral (Mk), associado a uma amostra de tamanho n, e´ definido como: Mk = 1 n n∑ i=1 x ki . (2.19) O k-e´simo momento ordina´rio populacional (µk) de uma varia´vel aleato´ria X e´ definido como: µk = E(X k). (2.20) O me´todo dos momentos consiste na obtenc¸a˜o de estimadores para θ = (θ1, θ2, ..., θk) de f (x| θ), resolvendo-se as equac¸o˜es: M1 = µˆ1 M2 = µˆ2 ... Mk = µˆk (2.21) Os estimadores do me´todo dos momentos para os paraˆmetros da distribuic¸a˜o Gumbel sa˜o obtidos pela resoluc¸a˜o do seguinte sistema de equac¸o˜es. M1 = µˆ+ σˆγ (2.22) M2 = µˆ 2 + 2µˆσˆγ + σˆ2 pi2 6 + σˆ2γ2. (2.23) De (2.17) e (2.21) segue que: 35 M2 = E ( X2 ) = V (X) + [E (X)]2 . (2.24) Substituindo (2.14) em (2.24) e trocando V (X) por seu respectivo estimador amostral S2, temos que: M2 = S 2 + [µˆ+ σˆγ]2 = S2 + µˆ2 + 2µˆσˆγ + σˆ2γ2. (2.25) Substituindo (2.25) em (2.23) e cancelando os termos iguais nos dois membros da igualdade, tem-se que o estimador de momentos de σ e´ aproximadamente: σˆ2 pi2 6 = S2 ⇒ σˆ2 = 6S 2 pi2 ⇒ σˆ = √ 6S pi ⇒ σˆ ∼= 0, 7796S. (2.26) De forma ana´loga, o estimador de momentos de µ e´ obtido resolvendo-se (2.22), pela substituic¸a˜o de M1 = E(X) por X¯. Portanto, µˆ+ σˆγ = M1 ⇒ µˆ+ 0, 5772σˆ = X¯ ⇒ µˆ = X¯ − 0, 5772σˆ. (2.27) 2.6.1.3 Me´todo da ma´xima verossimilhanc¸a Seja X1, X2, ..., Xn uma se´rie de n varia´veis aleato´rias independente e identicamente distribu´ıda (iid), com distribuic¸a˜o Gumbel e {x1, x2, . . . , xn} um conjunto de n observac¸o˜es amostrais. Assegurada a pressuposic¸a˜o de independeˆncia entre as n observac¸o˜es, tem-se que a func¸a˜o de verossimilhanc¸a da distribuic¸a˜o Gumbel pode ser expressa por: L (µ, σ|x) = n∏ i=1 f(xi) = 1 σn n∏ i=1 exp { − ( xi − µ σ ) − exp [ − ( xi − µ σ )]} . (2.28) 36 De posse do conhecimento da func¸a˜o de verossimilhanc¸a, deseja-se determinar os va- lores do vetor de paraˆmetros da f(.)Gumbel que maximizam a func¸a˜o de verossimilhanc¸a, ou seja, que maximizam a probabilidade da amostra ter ocorrido. O processo de maxi- mizac¸a˜o do vetor de paraˆmetros e´ feito atrave´s de derivadas parciais em relac¸a˜o a cada um de seus paraˆmetros, igualando as derivadas parciais a zero. Por simplicidade alge´brica, muitas vezes e´ mais interessante trabalhar com somas ao inve´s de produtos. O ca´lculo de func¸o˜es complicadas envolvendo produtos pode muitas vezes ser simplificado tomando-se o logaritmo dessas func¸o˜es. Portando, para obter- se o ma´ximo da L(µ, σ|x)Gumbel e´ mais conveniente aplicar o logaritmo natural a` essa func¸a˜o, pela mudanc¸a de produto em somas. Logo, o logaritmo natural da func¸a˜o de verossimilhanc¸a da distribuic¸a˜o Gumbel e´ dado por: l (µ, σ|x) = ln [L (µ, σ|x)] = −n lnσ + n∑ i=1 [ − ( xi − µ σ )] − n∑ i=1 exp [ − ( xi − µ σ )] . (2.29) Os estimadores de ma´xima verossimilhanc¸a de µ e σ sa˜o obtidos pela resoluc¸a˜o do sistema de equac¸o˜es constitu´ıdo pelas derivadas parciais em relac¸a˜o a cada um dos paraˆmetros da func¸a˜o (2.29), igualadas a zero. Dessa forma, tem-se que: n σˆ − 1 σˆ n∑ i=1 exp ( −xi − µˆ σˆ ) = 0 (2.30) − n σˆ + 1 σˆ2 n∑ i=1 (xi − µˆ)− 1 σˆ2 n∑ i=1 (xi − µˆ) exp ( −xi − µˆ σˆ ) = 0. (2.31) Rao e Hamed (2000) sugerem o procedimento, descrito a seguir, para a soluc¸a˜o do sistema de equac¸o˜es acima. O estimador de µ e´ obtido resolvendo-se (2.30). Assim, temos que: 37 n σˆ − 1 σˆ n∑ i=1 exp ( −xi − µˆ σˆ ) = 0⇒ n− exp ( µˆ σˆ ) n∑ i=1 exp [ − (xi σˆ )] = 0 ⇒ − exp ( µˆ σˆ ) n∑ i=1 exp [ − (xi σˆ )] = −n ⇒ exp ( µˆ σˆ ) = n n∑ i=1 exp [− (xi σˆ )] ⇒ µˆ σˆ = ln nn∑ i=1 exp [− (xi σˆ )] ⇒ µˆ = σˆ ln nn∑ i=1 exp [− (xi σˆ )] . (2.32) Simplificando os somato´rios da equac¸a˜o (2.31), temos em relac¸a˜o ao paraˆmetro σ que: −n σˆ + 1 σˆ2 n∑ i=1 (xi − µˆ)− 1 σˆ2 n∑ i=1 (xi − µˆ) exp ( −xi − µˆ σˆ ) = 0 ⇒ −σˆn+ n∑ i=1 (xi− µˆ)− n∑ i=1 (xi − µˆ) exp ( −xi − µˆ σˆ ) = 0 ⇒ −σˆn+ n∑ i=1 xi − n∑ i=1 µˆ− n∑ i=1 xi exp ( −xi σˆ ) exp ( µˆ σˆ ) + n∑ i=1 µˆ exp ( −xi σˆ ) exp ( µˆ σˆ ) = 0. (2.33) Substituindo (2.32) em exp ( µˆ σˆ ) tem-se que: 38 exp ( µˆ σˆ ) = exp σˆ ln n n∑ i=1 exp(−xiσˆ ) σˆ = exp ln nn∑ i=1 exp (−xi σˆ ) = n n∑ i=1 exp (−xi σˆ ) . (2.34) Substituindo (2.34) em (2.33): −σˆn+ n∑ i=1 xi − nµˆ− n n∑ i=1 xi exp (−xi σˆ ) n∑ i=1 exp (−xi σˆ ) + nµˆ n∑ i=1 exp (−xi σˆ ) n∑ i=1 exp (−xi σˆ ) = 0 ⇒ −σˆn+ n∑ i=1 xi − nµˆ− n n∑ i=1 xi exp (−xi σˆ ) n∑ i=1 exp (−xi σˆ ) + nµˆ = 0 ⇒ −n σˆ + n∑ i=1 xi exp (−xi σˆ ) n∑ i=1 exp (−xi σˆ ) = − n∑ i=1 xi ⇒ σˆ + n∑ i=1 xi exp (−xi σˆ ) n∑ i=1 exp (−xi σˆ ) = 1n n∑ i=1 xi ⇒ n∑ i=1 xi exp (−xi σˆ ) n∑ i=1 exp (−xi σˆ ) = 1n n∑ i=1 xi − σˆ ⇒ n∑ i=1 xi exp ( −xi σˆ ) = ( 1 n n∑ i=1 xi − σˆ ) n∑ i=1 exp ( −xi σˆ ) ⇒ n∑ i=1 xi exp ( −xi σˆ ) − ( 1 n n∑ i=1 xi − σˆ ) n∑ i=1 exp ( −xi σˆ ) = 0. (2.35) 39 Logo, obteˆm-se a func¸a˜o G(σˆ): G(σˆ) = n∑ i=1 xi exp ( −xi σˆ ) − ( 1 n n∑ i=1 xi − σˆ ) n∑ i=1 exp ( −xi σˆ ) = 0. (2.36) Embora func¸a˜o apenas de σ, essa equac¸a˜o na˜o possui soluc¸a˜o anal´ıtica. Uma maneira de resolve-la e´ utilizar o me´todo iterativo de Newton-Raphson (NAGHETTINI; PINTO, 2007). Partindo-se de uma valor inicial para σ, o valor da pro´xima iterac¸a˜o e´ atualizado pela expressa˜o: σˆj+1 = σˆj − G (σˆj) G′ (σˆj) , (2.37) em que G ′ (.) e´ a derivada de (2.36) em relac¸a˜o a σ, sendo dada por: G ′ (σˆ) = 1 σˆ2 n∑ i=1 x2i exp ( −xi σˆ ) + n∑ i=1 exp ( −xi σˆ ) + 1 σˆ n∑ i=1 xi exp ( −xi σˆ ) . (2.38) Segundo Hao e Hamed (2000), as interac¸o˜es em (2.37) terminam quando G (σˆj) esta´ suficientemente pro´ximo de zero, obtendo assim a estimativa de σ. 2.6.2 Estimac¸a˜o por intervalo Como destacado em 2.6, a estimac¸a˜o dos paraˆmetros pode ser realizada pela estimac¸a˜o pontual ou pela estimac¸a˜o intervalar. O maior interesse num processo de estimac¸a˜o pon- tual e´ informar o valor do estimador θˆ obtido de uma amostra espec´ıfica, ou seja, obter uma estimativa pontual que esteja na vizinhanc¸a do verdadeiro e desconhecido valor de um paraˆmetro θ (NAGHETTINI; PINTO, 2007). Todavia, a estimac¸a˜o pontual na˜o per- mite informar a magnitude do erro cometido, que surge como consequeˆncia do processo de selec¸a˜o aleato´ria da amostra. Esse fato nos remete a construc¸a˜o dos chamados intervalos de confianc¸a, na qual e´ poss´ıvel informar a probabilidade de um intervalo [I,S ], com limite inferior (I ) e superior (S ), conter o verdadeiro valor de um paraˆmetro θ. Neste trabalho, a estimac¸a˜o com intervalos de confianc¸a para os paraˆmetros da dis- tribuic¸a˜o Gumbel sera´ realizada pela aproximac¸a˜o normal assinto´tica dos estimadores de ma´xima verossimilhanc¸a, isto e´, (µˆ, σˆ) ∼ N [(µˆ, σˆ) , I−1 (µˆ, σˆ)] , (2.39) 40 com n → ∞, em que I−1 (µˆ, σˆ) e´ igual a inversa da matriz de informac¸a˜o de Fisher. A matriz de informac¸a˜o de Fisher da distribuic¸a˜o Gumbel e´ dada por: I (µˆ, σˆ) = ( n σˆ2 0, 4228 n σˆ2 0, 4228 n σˆ2 1, 8237 n σˆ2 ) . (2.40) Segundo Beijo (2002), os intervalos com 100δ% de confianc¸a para os paraˆmetros posic¸a˜o µ e escala σ sa˜o dados respectivamente por: µˆ− zα 2 √ var (µˆ) < µ < µˆ+ zα 2 √ var (µˆ) (2.41) σˆ − zα 2 √ var (σˆ) < σ < σˆ + zα 2 √ var (σˆ), (2.42) em que “var”indica a variaˆncia dos estimadores e α e´ o n´ıvel de significaˆncia. Os valores de var (µˆ) e var (σˆ) podem ser obtidas de: I−1 (µˆ, σˆ) = [ var (µˆ) cov (µˆ, σˆ) cov (µˆ, σˆ) var (σˆ) ] = ( 1, 1087 σˆ 2 n −0, 2570 σˆ2 n −0, 2570 σˆ2 n 0, 6079 σˆ 2 n ) , (2.43) em que I−1 (µˆ, σˆ) e´ a matriz de covariaˆncia assinto´tica dos estimadores de ma´xima veros- similhanc¸a de µ e σ. 2.7 Probabilidade de ocorreˆncia de eventos extremos ma´ximos Seja {x1, x2, . . . , xn} um conjunto de observac¸o˜es ma´ximas e x um valor desse con- junto, de modo que x > min {x1, x2, . . . , xn}. A probabilidade P que ocorra um evento extremo superior a x e´ estimada pelo complementar da fd de Gumbel em x : P (X > x) = 1− F (x| µˆ, σˆ) = 1− exp { − exp [ − ( x− µˆ σˆ )]} . (2.44) 41 2.8 Tempo de retorno O tempo de retorno T representa o inverso da probabilidade com que um dado evento E tenha ocorrido. Dada a ocorreˆncia de um evento E, o tempo de retorno T e´ o tempo me´dio necessa´rio (em anos) para que esse evento recorra, em um ano qualquer. Em termos pra´ticos, seu significado e´: se ocorrer um evento de intensidade x, qual e´ o tempo me´dio (T ) esperado para que o evento de intensidade x ocorra novamente? Por definic¸a˜o, segue que o tempo de retorno T associado ao evento E e´ dado por: T = 1 P (E) . (2.45) No presente trabalho, o evento E e´: a precipitac¸a˜o ma´xima que excede um determi- nado valor x e a probabilidade de excedeˆncia de E e´ obtido por 1− F (x). Assim: T = 1 P (E) = 1 1− F (x) . (2.46) 2.9 Estimativa dos n´ıveis de retorno da distribuic¸a˜o Gumbel Conforme Bautista (2002), o n´ıvel de retorno (xp) e´ obtido pela soluc¸a˜o da seguinte equac¸a˜o: xp∫ −∞ f (x|µ, σ) dx = 1− p, (2.47) em que xp esta´ associado ao tempo de retorno T e p = 1 T . De (2.47) segue que: F (xp|µ, σ) = 1− p. (2.48) Dessa forma, considerando que as observac¸o˜es ma´ximas seguem uma distribuic¸a˜o Gumbel, o estimador do p-quantil xp e´ dado por: xp = F −1 (1− p|µ, σ) . (2.49) 42 Invertendo-se a equac¸a˜o (2.48), temos que: F (xp|µ, σ) = 1− p⇒ exp [ − exp ( −xp − µ σ )] = 1− p ⇒ exp ( −xp − µ σ ) = − ln (1− p) ⇒ −xp − µ σ = ln [− ln (1− p)] ⇒ xp − µ = −σ ln [− ln (1− p)] ⇒ xp = µ− σ ln [− ln (1− p)] . (2.50) Da relac¸a˜o p = 1 T , temos que a func¸a˜o de quantis da distribuic¸a˜o Gumbel pode ser expressa da seguinte forma: xp = y (T ) = µ− σ ln [ − ln ( 1− 1 T )] . (2.51) A estimativa xˆp do n´ıvel de retorno xp para tempos de retorno T = 1 p e´ obtida pela substituic¸a˜o das estimativas de ma´xima verossimilhanc¸a de µ e σ na func¸a˜o (2.51). 2.10 Intervalos de confianc¸a para os quantis xp da distribuic¸a˜o Gumbel Segundo Bautista (2002), o intervalo de confianc¸a para o p-quantil xp, com 100δ% de confianc¸a e´ dado por: xˆp − zα 2 √ var (xˆp) < xp < xˆp + zα 2 √ var (xˆp), (2.52) em que Z e´ uma varia´vel com distribuic¸a˜o N (0, 1), zα 2 e´ o valor tal que P (|Z| < zα 2 ) = 1− α e var (xˆp) e´ a variaˆncia associada ao p-quantil xˆp. Em relac¸a˜o a` variaˆncia do n´ıvel de retorno xp segue que: var (xp) ∼= ( ∂xp ∂µ ∣∣∣∣ Aˆ)2 var (µ) + 2( ∂xp∂µ ∣∣∣∣ Aˆ)( ∂xp∂σ ∣∣∣∣ Aˆ) cov (µ, σ) + + ( ∂xp ∂σ ∣∣∣∣ Aˆ)2 var (σ) , (2.53) 43 sendo Aˆ = 〈µˆ, σˆ〉 o vetor de estimativas de ma´xima verossimilhanc¸a de µ e σ. Assim, ( ∂xp ∂µ ∣∣∣∣ µˆ, σˆ) = ∂ {µ− σ ln [− ln (1− p)]}∂µ ∣∣∣∣ 〈µˆ,σˆ〉 = 1 (2.54) e ( ∂xp ∂σ ∣∣∣∣ µˆ, σˆ) = ∂ {µ− σ ln [− ln (1− p)]}∂σ ∣∣∣∣ 〈µˆ,σˆ〉 = − ln [− ln (1− p)]|〈µˆ,σˆ〉 = xˆp − µˆ σˆ . (2.55) Substituindo (2.54) e (2.55) em (2.53), resulta que: var (xˆp) ∼= var (µˆ) + 2 ( xˆp − µˆ σˆ ) cov (µˆ, σˆ) + ( xˆp − µˆ σˆ )2 var (σˆ) . (2.56)2.11 Ajuste da distribuic¸a˜o Gumbel A distribuic¸a˜o candidata a modelar uma varia´vel aleato´ria pode ser avaliada a partir de alguns crite´rios, que informara˜o se essa distribuic¸a˜o pode representar adequadamente um conjunto de dados provenientes da varia´vel estudada. A qualidade do ajuste da distribuic¸a˜o aos dados pode ser feita com base emp´ırica, usando te´cnicas visuais subjetivas ou utilizando-se testes estat´ısticos mais objetivos. No presente trabalho, o ajuste da distribuic¸a˜o Gumbel aos dados sera´ verificada pela ana´lise do gra´fico Quantil-Quantil (QQ-plot) e pelo teste de adereˆncia de Kolmogorov-Smirnov (KS). 2.11.1 Teste de Kolmogorov-Smirnov O teste de KS e´ um teste de adereˆncia na˜o parame´trico, aplica´vel a varia´veis aleato´rias cont´ınuas. Sua estat´ıstica de teste baseia-se na comparac¸a˜o entre as func¸o˜es de proba- bilidades acumuladas, emp´ırica e teo´rica, tendo como base a maior diferenc¸a entre essas 44 func¸o˜es. O teste adapta uma espec´ıfica e bem conhecida distribuic¸a˜o F (x) a dados provenientes de uma populac¸a˜o emp´ırica Fˆ (x). A hipo´tese nula (H0) especifica alguma distribuic¸a˜o F (x). Uma amostra {x1, x2, . . . , xn} e´ retirada de alguma populac¸a˜o, cuja distribuic¸a˜o Fˆ (x) e´ desconhecida. O confronto entre Fˆ (x) e F (x) e´ estabelecido para verificar se e´ razoa´vel estudar os dados utilizando F (x), admitida como a verdadeira fd da amostra casualizada. Conforme Siegel e Castellan Ju´nior (2006), para a realizac¸a˜o do teste de KS segue-se os seguintes passos: i) colocar a se´ries de dados em ordem ascendente; ii) obter os valores de probabilidade da distribuic¸a˜o teo´rica F ( x(i) ) e os valores de pro- babilidade da distribuic¸a˜o emp´ırica Fˆ ( x(i) ) ; iii) calcular a estat´ıstica D atrave´s da seguinte expressa˜o: D = max ∣∣∣F (x(i))− Fˆ (x(i))∣∣∣ . (2.57) iv) A hipo´tese H0, de que a distribuic¸a˜o emp´ırica Fˆ (x) segue uma distribuic¸a˜o teo´rica F (x), e´ testada pela comparac¸a˜o de D com um D tabelado ou pela comparac¸a˜o do valor p com o n´ıvel de significaˆncia (α) adotado. Se ao n´ıvel de significaˆncia α estabelecido, o valor observado de D > Dn,α, rejeita-se H0. A hipo´tese nula tambe´m e´ rejeitada quando o valor p e´ inferior ao n´ıvel de significaˆncia α. 2.12 Testes de aleatoriedade e independeˆncia O desenvolvimento teo´rico realizado nas sec¸o˜es de (2.5) a (2.11) foi feito conside- rando que o conjunto de observac¸o˜es amostrais e´ iid. Essas pressuposic¸o˜es sa˜o exigidas para a utilizac¸a˜o das distribuic¸o˜es oriundas da TVE, como a distribuic¸a˜o Gumbel. Dois testes utilizados para verificar a independeˆncia e a aleatoriedade de um conjunto de n observac¸o˜es amostrais {x1, x2, . . . , xn} sa˜o respectivamente o teste de Ljung-Box e o Runs test. 2.12.1 Teste de Ljung-Box Conforme Ljung e Box (1978), o teste de Ljung-Box, tambe´m conhecido como teste de Portmanteau, e´ um teste que verifica se alguns grupos de autocorrelac¸a˜o de uma se´rie temporal sa˜o diferentes de zero. Esse teste verifica a aleatoriedade total baseando-se 45 no nu´mero de desvios, ao inve´s de testar a aleatoriedade de cada desvio distinto. Se representarmos o coeficiente de autocorrelac¸a˜o por r, temos que o par de hipo´teses desse teste consiste em: { H0 : r1 = r2 = ... = rk = 0 H1 : pelo menos um rk na˜o e´ nulo. A estat´ıstica do teste de Ljung-Box e´ dada por: Q = n (n+ 2) S∑ j=1 r2k (n− k) , (2.58) em que n e´ o nu´mero de observac¸o˜es, S e´ o nu´mero de coeficientes para se testar a autocorrelac¸a˜o e rk e´ o coeficiente de autocorrelac¸a˜o para o desvio k. A estat´ıstica em (2.58) distribu´ı-se como uma χ2 com S graus de liberdade. Esco- lhendo um n´ıvel de significaˆncia α, rejeita-se a hipo´tese H0 de que todos os coeficientes de autocorrelac¸a˜o sa˜o iguais a zero se Q for superior ao valor cr´ıtico χ2α de uma distribuic¸a˜o Qui-Quadrado. 2.12.2 Runs test Segundo Siegel e Castellan Ju´nior (2006), o Runs test e´ empregado na detecc¸a˜o de desvios na aleatoriedade de uma sequeˆncia de medic¸o˜es quantitativas no tempo, ocasio- nados por tendeˆncia ou periodicidade. O procedimento inicial desse teste consiste em, a partir da amostra original {x1, x2, . . . , xn}, aplicar a cada xi a seguinte func¸a˜o indicadora, definindo uma sequeˆncia dicotoˆmica Bi(i = 1, 2, ..., n). Bi = { +1, se xi > Md −1, se xi < Md (2.59) em que Md e´ a mediana dos dados. Nesse me´todo, o(s) caso(s) em que xi = Md sa˜o omitidos. Assim, sa˜o criadas sequeˆncias (B1, B2, ..., Bn) de uns positivos e uns negativos. Seja R a varia´vel aleato´ria nu´mero total de uns positivos e uns negativos na sequeˆncia (B1, B2, ..., Bn), r seu valor observado, n1 o nu´mero de ocorreˆncias observadas de +1 e n2 o nu´mero de ocorreˆncias observadas de −1. Para n1, n2 ≤ 30 teˆm-se os pares de valores cr´ıticos r1(α,n1,n2) e r2(α,n1,n2), ao n´ıvel de significaˆncia α. A hipo´tese H0 de que os escores ocorrem 46 aleatoriamente acima e abaixo da mediana dos dados e´ rejeitada caso r ≤ r1(α,n1,n2) ou r ≥ r2(α,n1,n2). Sob a hipo´tese H0 de aleatoriedade, no caso em que n1, n2 ≥ 30, tem-se que assinto- ticamente R segue uma distribuic¸a˜o Normal (SILVA R. R., 2008). Como H1 na˜o prediz a direc¸a˜o do desvio de aleatoriedade (teste bilateral), a um n´ıvel de significaˆncia α, a decisa˜o de se rejeitar H0 ocorre se: ∣∣∣∣∣∣r − Eˆ (R) + h√Vˆ ar (R) ∣∣∣∣∣∣ > z, (2.60) em que h = +1/2, se r < Eˆ (R), h = −1/2, se r > Eˆ (R) e z e´ o valor cr´ıtico da N (0,1), que corresponde a uma probabilidade de 1− α/2. As estimativas da esperanc¸a (E (R)) e da variaˆncia (Var(R)) sa˜o obtidas respectiva- mente a partir de: Eˆ (R) = 2n1n2 n1 + n2 + 1 (2.61) Vˆ ar (R) = 2n1n2 (2n1n2 − n1 − n2) (n1 + n2) 2 (n1 + n2 − 1) . (2.62) 47 CAPI´TULO 3 APLICAC¸A˜O AOS DADOS DE PRECIPITAC¸A˜O MA´XIMA ANUAL DE PIRACICABA-SP 3.1 Introduc¸a˜o A ocorreˆncia de eventos clima´ticos extremos severos tem chamado a atenc¸a˜o da socie- dade e da comunidade cient´ıfica, principalmente pelo seu poder de destruic¸a˜o, acarretando perdas de vidas humanas e animais e, de ordem econoˆmica. Como eventos clima´ticos ex- tremos e´ poss´ıvel citar fenoˆmenos naturais tais como chuvas intensas, secas prolongadas, vendavais, furaco˜es, mare´s meteorolo´gicas e temperaturas mı´nimas ou ma´ximas. O in- teresse na ana´lise em um dos referidos eventos centra-se tanto na intensidade de sua manifestac¸a˜o quanto na sua durac¸a˜o prolongada. Por apresentarem baixa frequeˆncia rela- tiva e elevado impacto, a previsa˜o desses eventos torna-se dif´ıcil por parte dos especialistas que os estudam (IDALINO; OLIVEIRA; LUCIO, 2009). O conhecimento do comporta- mento de um evento clima´tico extremo, ao longo do tempo, e´ relevante para uma melhor compreensa˜o de sua natureza, sendo essa informac¸a˜o importante para o planejamento de atividades vulnera´veis a sua ocorreˆncia. Dessa maneira, o presente cap´ıtulo tem como objetivos espec´ıficos: 48 • Realizar uma revisa˜o sobre a ocorreˆncia de eventos clima´ticos extremos recentes no Brasil; • verificar o ajuste da distribuic¸a˜o Gumbel a` se´rie histo´rica de precipitac¸o˜es ma´ximas anuais de Piracicaba-SP; • calcular as probabilidades de excedeˆncia de precipitac¸o˜es ma´ximas anuais iguais a 40, 60, 80, 100, 120 e 140mm; • determinar as precipitac¸o˜es ma´ximas anuais esperadas para os tempos de retorno de 2, 5, 10, 30, 50 e 100 anos no munic´ıpio. 3.2 Eventos clima´ticos extremos recentes no Brasil Sem mencionar fatos histo´ricos anteriores que ocorreram no Brasil sobre eventos clima´ticos extremos, apenas a observac¸a˜o da ocorreˆncia desses eventos na primeira de´cada do se´culo XXI tem demonstrado a vulnerabilidadedo Brasil a grandes desvios de um es- tado clima´tico moderado. Isso torna-se mais evidente em relac¸a˜o a precipitac¸a˜o, uma vez que diversas atividades econoˆmicas e processos ambientais sa˜o altamente dependentes dessa varia´vel. Elevados regimes de precipitac¸a˜o podem ocasionar graves efeitos, como enchentes, deslizamentos de terras, atrasos nas colheitas, entre outros. Entretanto, o de´ficit de precipitac¸a˜o em larga escala, muitas vezes, causam efeitos adversos sobre atividades como agricultura, silvicultura, produc¸a˜o hidrele´trica, ecossistemas alagados (manguezais) e vida selvagem (MARENGO et al., 2010). O baixo ı´ndice de chuvas durante o vera˜o e o outono de 2001 culminou com uma reduc¸a˜o significativa do fluxo dos rios brasileiros, afetando a produc¸a˜o de energia hi- drele´trica no Brasil. As medidas impostas pelo governo, quanto a conservac¸a˜o de energia, visaram impedir a interrupc¸a˜o total do fornecimento de energia (blackout) durante 2001 e 2002. Conforme Beijo et al. (2003), a crise energe´tica vivenciada no Brasil em 2001 evidenciou a relevaˆncia de estudos abrangendo precipitac¸o˜es pluviais, especialmente para manutenc¸a˜o de reservato´rios e lagos, pela consequeˆncia do de´ficit pluviome´trico na gerac¸a˜o de energia ele´trica. Em marc¸o de 2004, o estado de Santa Catarina foi acometido por um furaca˜o que atingiu a sua regia˜o litoraˆnea. Esse furaca˜o ficou conhecido como Catarina, sendo o primeiro a ser documentado no oceano Atlaˆntico Sul. Como consequeˆncia, o furaca˜o 49 Catarina deixou 9 mortes, ale´m de perdas econoˆmicas que foram estimadas em 1 bilha˜o de do´lares (MARENGO et al., 2010). Anomalias no regime de precipitac¸a˜o no sudoeste da amazoˆnia foram presenciadas em 2005, culminando em uma das secas mais severas dos u´ltimos cem anos na regia˜o. A navegac¸a˜o em rios como o Amazonas, o Solimo˜es e o rio Madeira foi prejudicada, afetando dessa forma a populac¸a˜o ribeirinha. Pa´ıses como o Brasil, a Bol´ıvia, o Peru e a Coloˆmbia declararam estado de calamidade pu´blica em setembro de 2005. Devido a baixa umidade, estima-se que o nu´mero de inceˆndios florestais em 2005 foi cerca de 300% maior do que em 2004. Como consequeˆncia, a fumac¸a originada dos inceˆndios afetou o tra´fego ae´reo, escolas e empresas foram fechadas, e muitas pessoas foram atendidas nos hospitais devido a inalac¸a˜o da fumac¸a (MARENGO et al. 2008). Va´rios munic´ıpios de Santa Catarina, do Rio de Janeiro e de Minas Gerais vieram a decretar estado de calamidade devido a fortes chuvas ocorridas nos meses de novembro e dezembro de 2008. Essas chuvas fortes causaram destruic¸a˜o total de casas, deixando milhares de pessoas desabrigadas e centenas de mortos. De acordo com informac¸o˜es do Instituto Nacional de Pesquisas Espaciais (INPE, 2008), no Estado de Santa Catarina, os preju´ızos causados por esse evento pluvial extremo, pelas subsequentes enchentes e deslizamentos foram estimados em 350 milho˜es de do´lares, principalmente pelo fechamento do Porto de Paranagua´. (a) Balnea´rio de Camboriu´-SC (b) Blumenau-SC Figura 5: Chuvas intensas em Santa Catarina (2008), com destaque a um temporal em Camboriu´ e um deslizamento de uma encosta em Blumenau. Fonte: INPE, 2008. 50 A ana´lise de eventos clima´ticos extremos a que a sociedade e suas diversas atividades esta˜o expostos e´ de grande importaˆncia para o devido dimensionamento dos impactos causados pelas suas ocorreˆncias. Com o intuito de prover informac¸o˜es a respeito dos n´ıveis ma´ximos de precipitac¸a˜o anual em Piracicaba-SP, nas subsec¸o˜es seguintes procedeu-se a metodologia de ana´lise dos dados dessa varia´vel clima´tica e a consequente discussa˜o dos resultados obtidos. 3.3 Material A se´rie histo´rica de precipitac¸a˜o pluviome´trica (mm) foi obtida a` partir dos registros histo´ricos da Estac¸a˜o Convencional do Posto Agrometeorolo´gico da Escola Superior de Agricultura “Luiz de Queiroz”(ESALQ/USP, 2013). A se´rie compreende o per´ıodo de 1917 a 2012, totalizando 96 anos de observac¸o˜es. O clima de Piracicaba, conforme a classificac¸a˜o de Ko¨ppen, e´ do tipo Cwa: tropical de altitude, com chuvas de vera˜o e seca no inverno, sendo os meses de junho, julho e agosto mais secos. A temperatura me´dia do meˆs mais quente e´ superior a 22oC e a do meˆs mais frio na˜o e´ inferior a 16oC (GHIBERTO; MORAES, 2011). O munic´ıpio de Piracicaba situa-se entre as coordenadas geogra´ficas de 22o42’30”de latitude Sul e de 47o38’01”de longitude oeste, com uma altitude me´dia de 554 metros. A a´rea total do munic´ıpio e´ de 1378 km2 e a populac¸a˜o e´ estimada em 364571 habitantes, sendo que aproximadamente 97% encontra-se na a´rea urbana de Piracicaba (IBGE, 2010). Figura 6: Localizac¸a˜o da a´rea de estudo, com destaque ao munic´ıpio de Piracicaba-SP. 51 3.4 Me´todos Os me´todos utilizados para a ana´lise da se´rie histo´rica de precipitac¸a˜o pluviome´trica esta˜o sistematizados a seguir. 3.4.1 Composic¸a˜o da se´rie histo´rica de precipitac¸o˜es ma´ximas anuais A TVE constitu´ı-se de duas metodologias para selec¸a˜o de valores extremos. Na pri- meira abordagem dessa teoria e´ considerado como ma´ximo (ou mı´nimo) o maior (ou menor) valor observado em um determinado per´ıodo (dia, meˆs ou ano). De cada per´ıodo e´ extra´ıdo o valor ma´ximo (ou mı´nimo) que constitu´ıra a amostra de valores extremos. Esse me´todo e´ conhecido como me´todo dos blocos. Na segunda abordagem da TVE e´ considerado como ma´ximo (ou mı´nimo) aquele(s) valor(es) que excede(m) um determi- nado limiar suficientemente alto (ou baixo). Esse te´cnica de obtenc¸a˜o de valores ma´ximos ou mı´nimos e´ conhecida como Peaks Over Threshold (POT). No presente trabalho sera´ utilizado o me´todo dos blocos ma´ximos. Conforme Tsay (2002), o me´todo dos blocos ma´ximos consiste em dividir a amostra em subamostras e, a partir dessas subamostras sa˜o retirados os valores ma´ximos verificados. Assumindo que existem nk observac¸o˜es {xi}nki=1 a serem analisadas, inicialmente dividi- mos a amostra em k subamostras na˜o sobrepostas, cada uma contendo n observac¸o˜es. Matematicamente, a te´cnica dos blocos pode ser expressa por: { x1, ..., xn|xn+1, ..., x2n|x2n+1, ..., x3n|...|x(k−1)n+1, ..., xkn } . (3.1) No presente trabalho considerou-se como bloco cada ano do estudo. A obtenc¸a˜o da amostra de valores ma´ximos de precipitac¸a˜o anual em Piracicaba-SP consistiu em seleci- onar as observac¸o˜es ma´ximas anuais registradas entre os anos de 1917 e 2012 (TABELA 1). Ao utilizar-se a TVE em amostras de valores extremos e´ essencial que k seja sufici- entemente grande, uma vez que a escolha do valor de n pode variar conforme o interesse do estudo. O tamanho (k = 96) da se´rie de precipitac¸o˜es ma´ximas anuais utilizada nesse trabalho segue as recomendac¸o˜es da World Meteorological Organization, que preconiza que o nu´mero mı´nimo de anos de dados clima´ticos para ana´lise e´ de 30 anos (BADDOUR; KONTONGOMDE; TREWIN, 2007). 52 Tabela 1: Precipitac¸o˜es ma´ximas anuais (PMA) observadas em Piracicaba-SP, no per´ıodo de 1917 a 2012. ANO PMA ANO PMA ANO PMA ANO PMA 1917 65,0 1941 77,9 1965 80,4 1989 97,8 1918 68,0 1942 104,9 1966 70,7 1990 62,0 1919 65,0 1943 97,7 1967 49,1 1991 73,9 1920 64,0 1944 111,2 1968 63,0 1992 87,8 1921 65,0 1945 95,3 1969 73,7 1993 46,9 1922 51,0 1946 64,4 1970 71,6 1994 65,4 1923 64,0 1947 75,2 1971 50,0 1995 62,1 1924 60,0 1948 46,8 1972 80,4 1996 68,5 1925 57,0 1949 108,4 1973 99,5 1997 76,8 1926 66,5 1950 55,5 1974 68,6 1998 113,2 1927 64,0 1951 62,4 1975 76,0 1999 108,2 1928 50,0 1952 73,9 1976 72,3 2000 71,6 1929 89,2 1953 54,4 1977 71,8 2001 60,2 1930 86,5 1954 57,8 1978 46,4 2002 97,4 1931 93,0 1955 80,1 1979 63,4 2003 53,3 1932 69,0 1956
Compartilhar