Baixe o app para aproveitar ainda mais
Prévia do material em texto
ANÁLISE SOBRE A EXPOSIÇÃO DE SEIS ESPÉCIES DA FLORA BRASILEIRA AMEAÇADAS DE EXTINÇÃO AOS INCÊNDIOS FLORESTAIS DE 2012 FELIPE SODRÉ MENDES BARROS ANÁLISE SOBRE A EXPOSIÇÃO DE SEIS EXPÉCIES DA FLORA BRASILEIRA AMEAÇADAS DE ESTINÇÃO AOS INCÊNDIOS FLORESTAIS DE 2012 Monografia submetida ao corpo docente do Curso de Pós- Graduação Lato sensu em Análise Ambiental e Gestão do Território, da Escola Nacional de Ciências Estatísticas, como parte dos requisitos necessários para a obtenção do certificado de Especialista em Análise Ambiental e Gestão do Território. RIO DE JANEIRO, RJ - BRASIL 2013 ANÁLISE SOBRE A EXPOSIÇÃO DE SEIS EXPÉCIES DA FLORA BRASILEIRA AMEAÇADAS DE ESTINÇÃO AOS INCÊNDIOS FLORESTAIS DE 2012 Felipe Sodré Mendes Barros MONOGRAFIA SUBMETIDA AO CORPO DOCENTE DO CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM ANÁLISE AMBIENTAL E GESTÃO DO TERRITÓRIO COMO PARTE DOS REQUISITOS NECESSÁRIOS PARA A OBTENÇÃO DO CERTIFICADO DE ESPECIALISTA EM ANÁLISE AMBIENTAL E GESTÃO DO TERRITÓRIO. Aprovada por: ________________________________________________ Prof. Daniel Takata Gomes, Me. ________________________________________________ Prof. Luciana Mara Temponi de Oliveira, Dra. ________________________________________________ Prof. Marinez Ferreira de Siqueira, Dra. ________________________________________________ Prof. Miguel Davila de Moraes, Me. RIO DE JANEIRO, RJ - BRASIL AGOSTO DE 2013 BARROS, FELIPE SODRÉ ANÁLISE SOBRE A EXPOSIÇÃO DE SEIS EXPÉCIES DA FLORA BRASILEIRA AMEAÇADAS DE ESTINÇÃO AOS INCÊNDIOS FLORESTAIS DE 2012 [Rio de Janeiro] 2013 LXXVIII pg.,78 pg. Monografia (Curso de Especialização) - Escola Nacional de Ciências Estatísticas. Curso Lato sensu em Análise Ambiental e Gestão do Território. 1. Análise espacial de processos pontuais 2. Flora brasileira ameaçada de extinção 3. Incêndios Florestais I. ENCE/IBGE II. Título (série) Essentially, all models are wrong but some are useful. George Box RESUMO Incêndio florestal é qualquer incêndio não controlado onde a vegetação é o principal combustível de queima, sendo, portanto, tema de extrema importância nas pautas de gestão territorial e ambiental do Brasil, uma vez que este possui 10% das espécies de plantas terrestres conhecidas no mundo, sendo 56% delas endêmicas ao Brasil e 6% consideradas raras. E é justamente esta diversidade biológica que está exposta à tal ameaça. Assim, a presente pesquisa tem como objetivos identificar (a) o padrão de distribuição dos focos de incêndio ocorridos em 2012, (b) o padrão de distribuição espacial das espécies Alcantharea glaziouana, Dyckia maritima, Comanthera harleyi, Banisteriopsis hatschbachii, Thryallis labrunum e Micropholis splendens , avaliadas como ameaçadas de extinção (CNCFlora, 2013) para, enfim, (c) analisar a tendência de interação delas aos focos de incêndios. Para tal, utilizou-se o estimador Kernel, a função L uni e bivariada, respectivamente. Junto às análises realizadas com a função L, foram geradas 99 simulações Monte Carlo baseadas no modelo teorético de distribuição espacial completamente aleatória (h0) , nos dando um nível de significância de 2%. Inferiu-se, desta forma, que todos os processos analisados (tanto os incêndios florestais, quanto as espécies estudadas) refutam a hipótese de estacionaridade e isotropia, sendo portanto processos que apresentam dependência espacial com intensidade variável na área de estudo. Sobre o padrão de distribuição dos registros de ocorrência das espécies da flora ameaçada, percebe-se a tendência de interação positiva em pequenas distâncias evidenciando distribuições aglomeradas e restritas, com desvios significativos da h0 . Com relação ao grau de exposição da flora aos incêndios, evidenciou-se a tendência de interação aleatória entre ambos processos em pequenas distâncias, seguindo para tendência de inibição em distâncias maiores à exceção das espécies Thryallis laburnum e Micropholis splendens que evidenciaram a tendência de interação positiva com os focos de incêndio. Conclui-se portanto, que as espécies Thryallis laburnum e Micropholis splendens apresentaram exposição elevada aos focos de incêndio e que, apesar das evidências de inibição entre as demais espécies e os incêndios, em maiores distâncias, houve indícios de exposição aleatória em pequenas distâncias. É importante expandir tal pesquisa a mais espécies ameaçadas de extinção e com recorte temporal maior para subsidiar projetos de conservação e/ou prevenção de incêndios florestais. Palavras-chave: Análise de processos pontuais. Kernel. Função L. Focos de incêndios florestais. Flora brasileira ameaçada de extinção. Exposição à ameaças incidentes. SUMÁRIO INTRODUÇÃO...............................................................................................................................................................1 OBJETIVOS GERAIS..................................................................................................................................................4 OBJETIVOS ESPECÍFICOS.........................................................................................................................................4 REVISÃO BIBLIOGRÁFICA.............................................................................................................................................5 ANÁLISE ESPACIAL...................................................................................................................................................5 ANÁLISE ESPACIAL DE PROCESSOS PONTUAIS........................................................................................................6 ANÁLISES DE PRIMEIRA ORDEM:.......................................................................................................................8 O ESTIMADOR KERNEL:...............................................................................................................................11 ANÁLISES DE SEGUNDA ORDEM:.....................................................................................................................15 FUNÇÃO G: “MEAN NEAREST NEIGHBOR DISTANCE”.................................................................................16 FUNÇÃO F: “EMPTY SPACE FUNCTION”......................................................................................................19 FUNÇÃO K (RIPLEY’S K-FUNCTION): “REDUCED SECOND MOMENT MEASURE”.........................................21 FUNÇÃO L (FUNÇÃO K TRANSFORMADA):..................................................................................................24 NÍVEL DE SIGNIFICÂNCIA PARA ANÁLISES DE SEGUNDA ORDEM................................................................25 FUNÇÃO DE SEGUNDA ORDEM MULTIVARIADO.........................................................................................26 CONSIDERAÇÕES SOBRE ANÁLISES ESPACIAIS.................................................................................................28 DESENVOLVIMENTO...................................................................................................................................................30 PROCEDIMENTOS METODOLÓGICOS....................................................................................................................30 DADOS UTILIZADOS..............................................................................................................................................33 DADOS DAS ESPÉCIES DA FLORA BRASILEIRA AMEAÇADAS DE EXTINÇÃO.......................................................33 Alcantharea glaziouana (Leme) J.R.Grant BROMELIACEAE ........................................................................35 Dyckia maritima Baker BROMELIACEAE.....................................................................................................35 Comanthera harleyi (Moldenke) L.R.Parra& Giul. ERIOCAULACEAE...........................................................36 Banisteriopsis hatschbachii B.Gates MALPIGHIACEAE................................................................................36 Thryallis laburnum S.Moore MALPIGHIACEAE............................................................................................37 Micropholis splendens Gilly ex Aubrév. SAPOTACEAE.................................................................................37 DADOS DOS INCÊNDIOS FLORESTAIS...............................................................................................................37 ANÁLISE ESPACIAL DAS ESPÉCIES E DOS FOCOS DE INCÊNDIO NOS BIOMAS: ......................................................40 AMAZÔNIA......................................................................................................................................................40 CAATINGA........................................................................................................................................................43 CERRADO.........................................................................................................................................................47 MATA ATLÂNTICA.............................................................................................................................................50 PAMPA.............................................................................................................................................................53 PANTANAL........................................................................................................................................................56 CONSIDERAÇÕES FINAIS............................................................................................................................................60 ANEXO 1.....................................................................................................................................................................67 ÍNDICE DE ILUSTRAÇÕES Figura 1: Exemplo da análise “quadrat count” para uma espécie hipotética com grade de 5X5................................10 Figura 2: Exemplo da análise “quadrat count” para uma espécie hipotética com grade de 10X10............................11 Figura 3: Esquema ilustrativo do cálculo da intensidade de kernel em processos pontuais......................................12 Figura 4: Exemplo de densidade com diferentes larguras de bandas de suavização de para valores hipotéticos......13 Figura 5: Esquema ilustrativo do cálculo de vizinhança da Função G.........................................................................16 Figura 6:Exemplo da gráfico da função G para uma espécies hipotética...................................................................17 Figura 7: Esquema ilustrativo de eventos reflexivos..................................................................................................18 Figura 8: Distribuição espacial de dois processos pontuais hipotéticos, apresentando tanto distribuição regular, quanto agregada, em escalas diferentes....................................................................................................................18 Figura 9: Esquema ilustrativo do cálculo da Função F................................................................................................19 Figura 10: Esquema ilustrativo da estimação da função K.........................................................................................21 Figura 11: Esquema ilustrativo do processo desenvolvido pelo CNCFlora para controle da qualidade dos dados geográficos da flora em risco de extinção..................................................................................................................33 Figura 12: Categorias e status de ameaça da IUCN, destacando aquelas consideradas ameaçadas..........................34 Figura 13: Série histórica da quantidade de focos de incêndios mapeados pelos satélites de referência..................39 Figura 14: Mapa de distribuição da espécie Micropholis splendens e os incêndios florestais de 2012 para o bioma Amazônia...................................................................................................................................................................40 Figura 15: Análise da propriedade de primeira ordem (estimador Kernel) da espécie Micropholis splendens e dos focos de incêndios de 2012 no bioma Amazônia.......................................................................................................41 Figura 16: Gráfico da análise do padrão de distribuição de segunda ordem, função L, da espécie Micropholis splendens...................................................................................................................................................................42 Figura 17: Gráfico da análise do padrão de distribuição entre a espécie Micropholis splendens e os incêndios florestais de 2012 do bioma Amazônia (função L bivariada)......................................................................................43 Figura 18: Mapas de distribuição da espécie Comanthera haleyi e dos focos de incêndio de 2012 para o bioma Caatinga.....................................................................................................................................................................44 Figura 19: Análise da propriedade de primeira ordem (estimador Kernel) da espécie Comanthera harleyi e dos focos de incêndio de 2012 no bioma Caatinga..........................................................................................................44 Figura 20: Gráfico da análise do padrão de distribuição de segunda ordem, função L, da espécie Comanthera harleyi........................................................................................................................................................................45 Figura 21: Gráfico da análise do padrão de distribuição entre a espécie Comanthera harleyi e os focos de incêndio de 2012 no bioma Caatinga (função L bivariada).......................................................................................................46 Figura 22: Mapa de distribuição da Banisteriopsis hatschbachii e dos focos de incêndio de 2012 para o bioma Cerrado......................................................................................................................................................................47 Figura 23: Análise da propriedade de primeira ordem (estimador kernel) da espécie Banisteriopsis hatschbachii e dos focos de incêndio de 2012 no bioma Cerrado.....................................................................................................48 Figura 24: Gráfico da análise do padrão de distribuição de segunda ordem, função L, da espécie Banisteriopsis hatschbachii...............................................................................................................................................................49 Figura 25: Gráfico da análise do padrão de distribuição entre espécie Banisteriopsis hatschbachii e os focos de incêndio de 2012 no bioma Cerrado (função L bivariada).........................................................................................49 Figura 26: Mapa de distribuição da espécie Alcantarea glaziouana e dos focos de incêndio de 2012 no bioma Mata Atlântica.....................................................................................................................................................................50 Figura 27: Análise da propriedade de primeira ordem (estimador Kernel) da espécie Alcantharea glaziouana e dos focos de incêndio de 2012 no bioma Mata Atlântica.................................................................................................51 Figura 28: Gráfico da análise do padrão de distribuição de segunda ordem, função L, da espécie Alcanthareaeglaziouana..................................................................................................................................................................52 Figura 29: Gráfico da análise do padrão de distribuição entre a espécie Alcantharea glaziouana e os focos de incêndio de 2012 no bioma Mata Atlântica (função L bivariada)...............................................................................52 Figura 30: Mapa de distribuição da espécie Dyckia maritima e dos focos de incêndio de 2012 no bioma Pampa....53 Figura 31: Análise da propriedade de primeira ordem (estimador Kernel) da espécie Dyckia maritima e dos focos de incêndio de 2012.......................................................................................................................................................54 Figura 32: Gráfico da análise do padrão de distribuição de segunda ordem, função L, da espécie Dyckia maritima.55 Figura 33: Gráfico da análise do padrão de distribuição entre a espécie Dyckia maritima e os focos de incêndio de 2012 no bioma Pampa (função L bivariada)...............................................................................................................55 Figura 34: Mapa de distribuição da espécie Thryallis laburnum e dos focos de incêndio de 2012 no bioma Pantanal ...................................................................................................................................................................................56 Figura 35: Análise da propriedade de primeira ordem (estimador Kernel) da espécie Thryallis Laburnum e dos focos de incêndio de 2012 no bioma Pantanal....................................................................................................................57 Figura 36: Gráfico da análise do padrão de distribuição de segunda ordem, função L, da espécie Thyryallis Laburnum..................................................................................................................................................................58 Figura 37: Gráfico da análise do padrão de distribuição entre a espécie Thryallis laburnum e os focos de incêndio de 2012 no bioma Pantanal (função L bivariada).......................................................................................................58 LISTA DE TABELAS Tabela 1: Identificação das espécies a serem analisadas (Espécies), suas categorias de risco de extinção (Categoria), quantidade de registros totais (n total), quantidade de registros dentro do bioma (n Bioma) e fora (n fora Bioma) e respetivo Bioma de análise (Bioma)...........................................................................................................................35 Tabela 2: Tabela de contingência do vizinho mais próximo entre a espécie SAPOTACEAE Micropholis splendens e os incêndios florestais de 2012......................................................................................................................................43 Tabela 3: Tabela de contingência da análise do vizinho mais próximo entre a espécie Eiocaulaceae Comanthera Harleyi e os focos de incêndio de 2012......................................................................................................................47 Tabela 4: Tabela de contingência da análise do vizinho mais próximo entre a espécie Banisteriopsis hatschbachii e os focos de incêndio de 2012.....................................................................................................................................50 Tabela 5: Tabela de Contingencia da análise do vizinho mais próximo entre a espécie Alcantarea glaziouana e os focos de incêndio de 2012.........................................................................................................................................53 Tabela 6: Tabela de Contingência da análise do vizinho mais próximo entre a espécie Dyckia maritima e os focos de incêndio de 2012.......................................................................................................................................................56 Tabela 7: Tabela de Contingencia da análise do vizinho mais próximo entre a espécie Thryallis laburnum e os focos de incêndio de 2012..................................................................................................................................................59 Tabela 8: Intensidades média (quantidade de registros por unidade de área) das espécies estudadas e dos focos de incêndio registrados em 2012....................................................................................................................................61 Tabela 9: Satélites de monitoramento das queimadas..............................................................................................67 INTRODUÇÃO Incêndio florestal é definido como qualquer incêndio não controlado onde a vegetação é o principal combustível de queima. Segundo Dias (2006), os incêndios florestais, existem desde período Pleistoceno (2.588 milhões de anos atrás) e possuem características distintas aos causados pela ação humana, iniciado no Holoceno (11,5 mil anos atrás). Os incêndios de causas naturais ocorrem, em sua maioria, no final das épocas de estiagem e início dos períodos chuvosos, pois possuem como fator disparador, os raios, além de contarem como cenário, as biomassas mais secas pela falta de chuvas antecedentes. Neste sentido, são geralmente de menor intensidade e frequência, e por isso acabam fazendo parte do processo ecológico (LINDENMAYER e BURGMAN, 2005). Os incêndios florestais provocados pelo homem, por sua vez, apresentam características diferentes, ocorrendo com maior frequência e em época preferencial de ocorrência variando de acordo com questões culturais, econômicas e sociais (MINISTÉRIO DO MEIO AMBIENTE, 2010). Assim, pode-se perceber que ao invés de ser um elemento a mais na dinâmica ecossistêmica, os incêndios florestais causados pelo homem, trazem consigo um caráter negativo das queimas, causando prejuízos ambientais, mineralização da matéria orgânica do solo, altera o ciclo natural dos nutrientes, além de ameaçar espécies nativas, já que ocorrem de forma indiscriminada e não respeitando os processos naturais de dispersão e floração (LINDENMAYER e BURGMAN, 2005). Ainda com relação aos incêndios causados pelo homem é fundamental considerar que estes possuem íntima relação de causa e efeito com fatores culturais e econômicos. E, neste sentido, os incêndios florestais são um tema de extrema importância e presente nas pautas de gestão territorial e ambiental (MMA, 2011; INPE, 2013). No Brasil, desde 1987, o Instituto de Pesquisas Espaciais (INPE) têm mapeado os focos de incêndio florestal através do projeto de Monitoramento de Queimadas e Incêndios Florestais. Este projeto identifica e mapeia os focos de incêndio florestal através de Sensores Orbitais (presentes em satélites), com metodologia própria e específica para tal fim, e continua em funcionamento ininterruptamente (INPE, 2013). Visando apoiar tal projeto de monitoramento, em 1988 foi criada a Comissão de Prevenção e Combate aos Incêndios Florestais (CONACIF) no âmbito do extinto Instituto Brasileiro de Desenvolvimento Florestal (IBDF). Esta comissão é vista como a primeira ação do Governo 1 Federal com objetivo de controlar as queimadas e, neste sentido, deu-se ênfase na elaboração de normas e critérios para o uso e controle de queimadas em Unidades de Conservação Federal (IBAMA, 2013). No ano seguinte, 1989 foi sancionado o decreto n° 97.635 que estabeleceu na estrutura do Instituto Brasileiro do Meio Ambiente e Recursos Renováveis (IBAMA), o Sistema Nacional de Prevenção e Combate aos Incêndios Florestais (PREVFOGO) (BRASIL, 1989). Em 8 de Julho de 1998, foi publicado o decreto 2.661, que regulamenta o parágrafo único do artigo 27 do antigo Código Florestal(Lei 4.771/65), e estabelece as normas de precaução ao emprego do fogo em práticas agropastoris e florestal. Neste mesmo decreto é atribuído ao PREVFOGO, a responsabilidade pelo desenvolvimento de programas entre as diferentes esferas de governo, não apenas articulando o monitoramento e prevenção dos incêndios florestais, mas desenvolvendo e difundindo técnicas de manejo controlado do fogo (BRASIL, 1998). Tal resolução criou um marco ao estabelecer legalmente o emprego do fogo (controlado) como um instrumento do manejo agropastoril e florestal, mesmo que para tal, seja necessária licença expedida por órgão competente, ao mesmo tempo em que proíbe o emprego do fogo “em florestas e quais quer formas de vegetação” (BRASIL, 1998). Para somar à legislação federal, foi instituída a portaria n° 425, em 2009, que cria a Comissão Ministerial CONAFOGO com a finalidade de organizar, articular e aperfeiçoar as demais instituições direcionadas às questões dos incêndios florestais para a implantação do Programa Nacional de Redução do uso do Fogo nas Áreas Rurais e Florestais (PRONAFOGO) e fortalecer as ações do PREVFOGO (MMA, 2009). Apesar dos marcos evolutivos na legislação federal, percebe-se que devido à dimensão territorial do Brasil, foram privilegiadas as áreas consideradas de importância biológica, principalmente as Unidades de Conservação (UC) e ações de combate aos incêndios florestais, sem enfatizar a importância dos estudos para reconhecimento da dinâmica dos incêndios florestais para uma atuação no sentido da prevenção. E neste sentido, é importante estudos mais profundos sobre os regimes de incêndios florestais, bem como o grau de ameaça que estes apresentam a elementos sociais e ambientais. Segundo Forzza et al.(2013), o Brasil possui 10% das espécies de plantas terrestres conhecidas, o que o leva a ser reconhecido como um país megadiverso. Além disso, ainda segundo a autora, das espécies da flora brasileira, 56% são endêmicas (o que coloca o Brasil em oitavo lugar no mundo em taxa de endemismo) e 6% são consideradas raras (FORZZA et al., 2013). Tal conhecimento evidencia a importância que o Brasil possui frente a diversidade mundial de espécies da flora e que estão, de alguma forma, expostos à ameaças, como os incêndios florestais. 2 Assim sendo, torna-se fundamental uma análise mais apurada sobre o grau de exposição das espécies da flora aos focos de incêndio visando identificar o quão predatório tem se configurado tal exposição. A pertinência dessa análise fica ainda mais urgente no momento em que se tem um esforço grande não apenas para a avaliação do status de conservação da flora brasileira, mas também para a definição de estratégias e planos de ação para a conservação (MORAES et al. in press). O Ministério do Meio Ambiente (MMA), através da Instrução Normativa n° 6, publicada em 2008, delegou a coordenação do estudo de espécies ameaçadas, e a elaboração de planos de ação, ao Jardim Botânico do Rio de Janeiro (JBRJ) e ao Instituto Chico Mendes (ICMBIO) (MMA, 2008). Para tal, foi criado em 2009, pelo MMA, através da portaria n° 401, o Centro Nacional de Conservação da Flora, dentro do Instituto de Pesquisas do Jardim Botânico, a quem ficou atribuída a coordenação dos esforços para cumprimento das metas traçadas pela Estratégia Global para a Conservação (GSPC) (MMA, 2009). Das principais metas traçadas, há a avaliação do estado de conservação das espécies conhecidas e a orientação de ações de conservação para reverter o quadro de conservação observado. Dentro deste desafio, estabeleceu-se um processo objetivo que considera parâmetros quantitativos para a identificação do status de conservação das espécies. Esta metodologia foi feita alinhada à Internation Union for Conservation of Nature and Natural Resorces (IUCN, 2012), que desenvolveu um sistema de critérios de avaliação que, além de amplamente discutido, possui o rigor de métodos científicos para a categorização do status de conservação das espécies. Neste sentido, a presente pesquisa tem como perspectiva a articulação de ambas temáticas: os focos de incêndio e espécies da flora brasileira ameaçada de extinção, conforme exposto a seguir. OBJETIVOS GERAIS O presente trabalho tem como objetivo geral rever as técnicas estatísticas para processos pontuais, almejando identificar as análises mais propícias para identificarmos os padrões espaciais apresentados pelos focos de incêndio e de seis espécies da flora, bem como a tendência de interação entre ambos processos. OBJETIVOS ESPECÍFICOS Como objetivo específico, pretende-se utilizar as análises de estatística identificadas como as mais pertinentes a partir da revisão bibliográfica para obter ganho de conhecimento sobre: 1. O padrão de distribuição dos focos de incêndio ocorridos em 2012 em cada bioma brasileiro; 3 2. O padrão de distribuição de seis espécies ameaçadas de extinção nos biomas brasileiros; 3. Identificar o grau de exposição de tais espécies da flora ameaçada aos focos de incêndio ocorridos em 2012; Para tal, utilizar-se-á dois dados básicos: registros de ocorrência da flora ameaçada de extinção, organizados e sistematizados pelo CNCFlora, e os focos de incêndio florestal, organizados, sistematizados e distribuídos pelo INPE, ambos mapeados enquanto processos pontuais. 4 REVISÃO BIBLIOGRÁFICA ANÁLISE ESPACIAL A análise espacial é um conjunto de procedimentos utilizados em dados geográficos1, que consideram, de forma explícita, o relacionamento espacial do fenômeno estudado. Tais procedimentos vão desde as visualizações dos dados em mapas e análises exploratórias, até modelagens mais complexas buscando não apenas descrever a distribuição do dado, mas também fazer inferências a respeito da estrutura e propriedades de distribuição de tais processos. Neste sentido, Bailey e Gatrel (1995) e Bivand, Pebesma e Rubio (2011) identificam duas questões principais de interesse na análise espacial: a estrutura de distribuição dos eventos e a existência de possíveis interações entre eles. O conceito de dependência espacial é fundamental para que não se tire conclusões precipitadas a respeito do fenômeno estudado. Esse conceito pode ser sintetizado pela frase: “todas as coisas são parecidas, mas coisas mais próximas se parecem mais que coisas mais distantes” (TOBLER apud CÂMARA e CARVALHO, 2005). A autocorrelação espacial é o termo computacional adotado para representar essa dependência espacial, usando-se o conceito estatístico de correlação que mensura o relacionamento entre duas variáveis aleatórias. Uma consequência dessa dependência espacial é a perda de valor explicativo o que leva à: “variâncias maiores para as estimativas, níveis menores de significância em testes de hipóteses e um ajuste pior para os modelos estimados, comparados a dados de mesma dimensão que exibam independência” (CÂMARA e CARVALHO, 2005) E isto implica em considerar os dados espaciais, não como dados aleatórios e independentes, mas como consequência de um processo estocástico. Ainda segundo Câmara e Carvalho (2005) na inferência estatística de dados estocásticos, em vez de cada observação apresentar informações independentes como nos casos de dados aleatórios, todas as observações são utilizadas para entendimento e descrição do fenômeno espacial estudado, sendo portanto, necessário ferramentas específicas de análise. 1 Os dados geográficos, também conhecidos por dados espaciais, são representações de fenômenos e/ou elementos do mundo real nos quais a sua localização geográfica é uma característica inerente e fundamental para seu entendimento e análise. 5 felipe felipe felipe felipe ANÁLISE ESPACIAL DE PROCESSOS PONTUAIS Os processos pontuais sãodefinidos como um conjunto de dados espaciais mapeados pontualmente onde, não apenas a sua localização espacial, mas principalmente seus atributos, que os define, identifica e diferencia dos demais, são objetos de estudo. Para Bailey e Gatrel (1995), os processos pontuais são o exemplo mais simples de dados espaciais por serem formados, basicamente por pares de coordenadas definindo cada evento, independente da existência de outros atributos relacionados a tais eventos. A análise de processos pontuais é conceitualmente definido por Dixon (2012) como sendo um conjunto de ferramentas para estudo da distribuição de pontos discretos em uma dada área de estudo, que através de análises estatísticas busca compreender a estrutura espacial dos eventos observados. Esta estrutura espacial muitas vezes são representações de leis e restrições subjacentes ao processo estudado, sendo por este motivo, um importante elemento a ser estudado. Um referencial teórico para análise de processos pontuais é a distribuição de probabilidade de Poisson. Segundo Bivand, Pebesma e Rubio (2011), a distribuição de Poisson é amplamente usada por oferecer uma simples aproximação a uma ampla gama de problemas e, de forma geral, têm-se como hipótese nula os chamados processos pontuais homogêneos de Poisson (“Homogeneous Poisson Point Processes – HPP”). O HPP é caracterizado pela distribuição uniforme e independente de todos os eventos de um dado processo, onde a intensidade de primeira ordem é constante em toda área de estudo. Ou seja, a ocorrência de um evento não afeta a probabilidade de outros eventos ocorrerem próximo e dessa forma, não havendo área com maior probabilidade de ocorrência dos eventos. Processos com esta característica são chamados de estacionários (BIVAND, PEBESMA e RUBIO, 2011). Porém, além da estacionaridade, os processos homogêneos de poisson podem, ainda, ser isotrópico. Sendo esta última característica definida quando a intensidade depende apenas da distância entre os eventos e independente da posição relativa dos mesmos (BIVAND, PEBESMA e RUBIO, 2011). Ou seja, a dependência espacial é a mesma em todas as direções (CÂMARA e CARVALHO, 2005). Todas essas características são as definições formais da distribuição espacial completamente aleatória. Logo, um HPP é a representação formal de um processo aleatoriamente distribuído no espaço (Complete Spatial Randomness – CSR) Os processos com distribuição aleatória (HPP) contrariam a fala de Tobler exposta anteriormente, pois a existência de eventos não modifica a probabilidade de ocorrência de outros eventos próximos, e nesse sentido não há uma área definida com maior probabilidade de ocorrência destes. 6 felipe felipe felipe felipe felipe felipe felipe felipe felipe felipe Dessa forma, tanto na análise espacial de processos pontuais tanto da flora, quanto dos incêndios florestais, passa-se a ter como objetivo, compreender a distribuição e as inter-relações espaciais e ambientais entre os eventos, contribuindo para a compreensão de seu mecanismo gerador. Segundo Lloyd (2007), o desenvolvimento dessas análises teve grande relação com a evolução de estudos ecológicos. Para tal, é importante entender que a análise de processos pontuais, como é chamado estatisticamente, consiste em um conjunto de pontos georreferenciados ( X1 , ..., X n ) em uma área de estudo R , onde os eventos foram observados. Segundo Bailey e Gatrel (1995), Lloyd (2007), Waller e Gotway (2004), o termo 'evento', na análise espacial de processos pontuais, tem sido amplamente utilizado como forma de distinguir a localização de uma observação de qualquer outra localização arbitrária na área de estudo, definida pelos pares de coordenadas (x i1 , yi1) . E a partir disso, pode-se considerar como um padrão espacial de processos pontuais, a presença de uma estrutura espacial repetida de eventos sobre a região R (Newberry et al. 1986 apud ANJOS et al., 2004). O termo localidade ( S1, ..., Sn ), por sua vez, é utilizado para definir uma determinada posição ( xs1 , ys1 ) dentro da área de trabalho, que não representa, portanto, a localidade de um evento observado (BAILEY e GATREL, 1995). Bivand, Pebesma e Rubio (2011), Câmara e Carvalho (2005), Bailey e Gatrel (1995), Lloyd (2007) e Waller e Gotway (2004) apresentam duas categorias de análises diferentes na caracterização de dados estocásticos. A primeira, conhecida como análises de primeira ordem, baseia-se em análise de área, considerando a intensidade de eventos na área de estudo. A segunda categoria de análise considera as distâncias entre os eventos, sendo, então, chamadas de análises de segunda ordem. ANÁLISES DE PRIMEIRA ORDEM: As análises de primeira ordem, também considerados globais ou de larga escala, segundo Câmara e Carvalho (2005), correspondem às análises com relação às variações no valor médio de eventos no espaço. Isto é, analisa elementos como a intensidade e a densidade de evento de um dado processo no espaço. Ou seja, o número de eventos por unidade de área, e por isso são mensurações baseadas em análise de área. 7 felipe felipe felipe felipe felipe felipe felipe felipe felipe felipe Geralmente, os termos densidades e intensidade são usados indiscriminadamente, e muitas vezes chegam a ser considerados sinônimos. Contudo, Lloyd (2007) e Waller e Gotway (2004), apontam as diferenças conceituais entre os termos. Segundo ambos os autores, densidade é a probabilidade de ocorrer um evento na localidade sn . Já intensidade, corresponde ao número de eventos esperados por unidade de área na localidade sn da área de estudo R . Apesar das diferenças, quando estas funções são utilizadas na análise exploratória de dados espaciais, como ferramenta de análise dos picos (que evidenciam a grade incidência de eventos), e dos vales (representando a baixa incidência), estes podem, sim, ser utilizados como sinônimos. Porém, caso pretenda-se trabalhá-los matematicamente, é preciso ter conhecimento dessas diferenças para evitar o uso indevido (WALLER e GOTWAY, 2004). As análises de primeira ordem são as primeiras estimativas que podem ser feitas sobre dados pontuais espaciais (BIVAND, PEBESMA e RUBIO, 2011). E, segundo os referidos autores, a intensidade é proporcional à densidade espacial onde a proporcionalidade é o número esperado de observações na área de estudo: “Para dois processos pontuais com a mesma densidade espacial, mas diferentes intensidades, o número de eventos observados será maior para o processo com maior intensidade” (TOBLER, 1970 apud CÂMARA e CARVALHO, 2005). Ou seja, as análises de primeira ordem descreverão como os valores esperados (média) dos eventos do processo analisado variam através do espaço (GATTRELL et al., 1995) Um dos primeiros métodos desenvolvidos para inferência de propriedades de primeira ordem em análise de processos pontuais, muito difundido e utilizado, baseia-se em amostragens aleatórias da área de estudo usando grades regulares e de tamanhos iguais, como exemplificado na figura 1. Essas grades são utilizadas para contar o número de eventos contidos nestes, de onde se derivam índices como a probabilidade e o valor esperado de eventos para toda área de estudo. Por este motivo esse método é chamado de “quadrat counts” (DIXON,2012;BAILEY e GATREL, 1995;LLOYD, 2007). 8 Figura 1: Exemplo da análise “quadrat count” para uma espécie hipotética com grade de 5X5. Esta proposta apresenta a densidade de eventos através de sua contagem, mas caiu em desuso frente as novas funções propostas e às restrições de seu método, das quais uma é dada pelo fato de que índices derivados dessa análise teriam resultados dependentes do tamanho e formato da grade utilizada. Por exemplo, o resultado de uma análise baseada em “quadrat-count”varia ao alterarmos o tamanho dos quadrantes e, consequentemente a quantidade deles (BAILEY e GATREL, 1995). Para ilustrarmos, produzimos outro resultado do método (figura 2) para a mesma espécie hipotética anterior, mas com tamanho das grades diferentes. Figura 2: Exemplo da análise “quadrat count” para uma espécie hipotética com grade de 10X10. 9 Dessa forma, percebeu-se que tal método, além das restrições conceituais, desconsidera muito da informação sobre a localização dos eventos, por generalizá-los através das grades. Na busca por uma análise mais eficiente, desenvolveu-se a análise de densidade local com o estimador de intensidade Kernel. O ESTIMADOR KERNEL: É um estimador muito conhecido e com ampla gama de utilização. Nesta análise, estuda-se a quantidade de eventos existentes dentro da área de estudo R como forma de se estimar a intensidade do processo enquanto valor esperado de eventos por unidade de área, na localidade s1 . Esta análise se dá pelo estudo da quantidade de eventos em uma determinada região de influência a partir de uma localidade aleatória. Dessa forma, estima-se a densidade em todas as localidades da área de estudo, não apenas, onde há eventos observados. Os eventos observados dentro da região de influência centrados em uma localidade aleatória sn são contados e ponderados pela distância de cada um a uma localização de interesse. Segundo Bailey e Gatrel (1995), Bivand, Pebesma e Rubio (2011), Câmara e Carvalho (2005) Lloyd (2007) e Waller e Gotway (2004), os parâmetros básicos, para o cálculo da densidade λ() , são: Raio de influência, ou largura de banda h (onde h ≥0) que, centrado na localidade sn define a área de influência para estimação da quantidade de eventos x i , considerando n eventos ( x i , ... , x i+n−1 ), e uma função de estimação kernel k() , como ilustrado na figura 3: Figura 3: Esquema ilustrativo do cálculo da intensidade de kernel em processos pontuais Gatrell et al. (1996). A função de estimação Kernel ( k() ) segundo Bivand, Pebesma e Rubio (2011), e Waller e Gotway (2004), pode ser calculada segundo diferentes equações, como por exemplo: K ( x−x i r ) em uma equação uniforme; 10 felipe felipe felipe k (1−| d i r |) em uma equação triangular; k ( 3 π (1− r i 2 r )) em uma equação quártica; k ( 1 √2π e −ri 2 2 r 2 ) em uma equação Gaussiana; Ao definirmos, por exemplo, a equação uniforme, a função de intensidade fica definida por: Na estimação da intensidade λ̂( x) há outras variáveis importantes, além das diferentes possibilidades de equação da função kernel. Um desses elementos é a função de correção de borda q(x) que visa compensar possíveis tendências na função quando o evento se localiza próximo ao limite ou fora da região de estudo R. Outro elemento é a largura de banda h também conhecida por “bandwidth” definirá o nível de suavização da função. É este elemento que também definirá a região de influência mencionada anteriormente. Ainda com relação a este último elemento, a largura de banda, de forma geral, quando se define um valor de raio muito pequeno, é comum ter como resultado uma superfície descontínua, menos suavizada e, quando o raio definido for muito grande, a superfície ficará muito abrangente. Para ilustrar essa diferença, na imagem 4, apresentamos um histograma de uma determinada variável, com o calculo de sua suavização, segundo diferentes larguras de banda. Neste, pode-se perceber que quanto menor a largura de banda, mais fiel ao picos e vales do histograma é a linha da densidade, ao passo que quanto maior a largura de banda, mais a linha de densidade é atenuada. 11 λ̂( x)= 1 r² ∑ i=1 n k ( x−xi r )/q (x) felipe Figura 4: Exemplo de densidade com diferentes larguras de bandas de suavização de para valores hipotéticos. Por este motivo, vários autores (BAILEY e GATREL, 1995; BIVAND, PEBESMA e RUBIO, 2011; GATTRELL et al.,1995; WALLER e GOTWAY, 2004; KELSALL e DIGGLE, 1995 e ZHANG, KING e HYNDMAN, 2004) salientam o fato de que a definição deste elemento é de fundamental importância para o resultado da função, chegando até a ser mais importante que a equação Kernel utilizada: “Diferentes equações Kernel produzirão estimativas muito similares para larguras de banda iguais, mas a mesma equação Kernel com diferentes larguras de banda vão produzir resultados muito diferentes.” (BIVAND, PEBESMA e RUBIO, 2011, p.167 – tradução livre) Essa importância pode ainda ser evidenciada pela grande produção científica que busca propor diversos métodos para definir e identificar a melhor largura de banda (BIVAND, PEBESMA e RUBIO, 2011; LLOYD, 2007; WALLER e GOTWAY, 2004 e ZHANG, KING e HYNDMAN, 2004). Neste sentido, Bailey e Gatrel (1995), propõem como forma de definição da largura de banda (h) , a fórmula: h=0.68n⁻ 0.2 . Onde n é o número de eventos observados na área de estudo, tornando a estimação mais prática e independente de análises prévias. Lloyd (2007) e Scott (1992), por sua vez, frisam a importância em se definir a largura de banda de acordo com a minimização do erro quadrático médio (tradução livre de: “mean integrated squared error - MISE”), do resultado estimado. Já para Waller e Gotway (2004), a melhor proposta seria buscar minimizar o erro quadrático médio assimtótico integrado (tradução livre de “asymptotic mean integrated squared error – AMISE”). Em todos os casos mencionados anteriormente, propõem-se usar a mesma largura de banda em toda área de estudo. Contudo, há a possibilidade de se utilizar diferentes larguras de banda de forma adaptada de acordo com a distribuição dos eventos localmente. Assim, onde há maior intensidade de eventos, a largura de banda seria menor e mais sensível, ao passo que, onde há menos densidade de eventos, a largura de banda utilizada seria maior, prevenindo suavização excessiva do kernel estimado. Ou seja, esta análise, chamada de kernel adaptável (“adaptive kernel”) terá a largura de banda dependente da intensidade ( λ() ) subjacente a cada localidade Waller e Gotway (2004). Com essa proposta se busca a otimização do kernel estimado, porém há maior gasto com recursos computacionais. 12 Vale evidenciar que as estimativas de primeira ordem não apresentam nenhuma informação a respeito da interação entre as ocorrências espaciais do processo estudado. Por serem análises de primeira ordem, elas medem e estimam a distribuição dos eventos na área de estudo, sendo de grande valia para se ter uma visão geral da distribuição dos eventos no espaço, sendo de fácil interpretação. ANÁLISES DE SEGUNDA ORDEM: São análises que auxiliam no entendimento do comportamento de distribuição espacial a partir das distâncias entre os eventos. Segundo Bailey e Gatrel (1995), Câmara e Carvalho (2005) e Waller e Gotway (2004) a análise de segunda ordem, também consideradas como local ou de pequena escala, descreverá a covariância (ou correlação) entre os valores do processo em diferentes regiões da área de estudo. Neste sentido, analisa através das distâncias entre os eventos ou entre localidades e eventos, a tendência de interação, dependência e a estrutura de distribuição espacial do processo estudado. Considera-se enquanto hipótese nula h0 uma distribuição espacial completamente aleatória (Complete Spatial Randomness – CSR) gerada sem dependência espacial sobre a área R, também definida como processo pontual de Poisson (BAILEY e GATREL, 1995; LLOYD, 2007;WALLER e GOTWAY, 2004; PÉSSIER e GOREAUD, 2001). Contrários à distribuição espacial completamente aleatória, estão as distribuições regulares (que apresentam um caráter de inibição da interação entre eventos) e as distribuições aglomeradas, que apresentam dependência espacial e interação positiva entre eventos. O conceito de CSR é utilizado em diversos métodos para se caracterizar os efeitos de segundaordem, analisando o padrão de interação e distribuição dos eventos observados e contrastando-os a tal modelo teórico enquanto h0 . Análises como o cálculo da distância do vizinho mais próximo (“Distance to the Nearest event”) também chamada de função G, o cálculo da distância do ponto para o evento mais próximo (“Distance from a point to the nearest event), chamada de função F, assim como a função K de Ripley, também conhecida como “reduced second moment measure”, são muito utilizados para inferir o padrão de distribuição e interação entre os eventos observados. Por este motivo, Câmara e Carvalho (2005) e Waller e Gotway (2004) consideram as análises de segunda ordem como estimadores de dependência espacial. 13 felipe felipe felipe felipe felipe felipe felipe felipe FUNÇÃO G: “MEAN NEAREST NEIGHBOR DISTANCE” A função G, também conhecida como “método vizinho mais próximo”, estima a média das distâncias entre eventos ( x i1 , ... , xi n ) do processo pontual X a partir de um evento aleatório à outro mais próximo, como ilustrado na imagem 5. Justamente por analisar as distâncias entre os vizinhos mais próximos, a função G caracteriza-se como uma análise de segunda ordem, ou de escala local. Figura 5: Esquema ilustrativo do cálculo de vizinhança da Função G. Segundo Protázio (2007) o procedimento básico consiste em estimar a densidade média λ() usando informações sobre a distância média entre eventos e, neste sentido, pode-se dizer que através dele, têm-se uma perspectiva da estrutura de distribuição desses eventos, ao contrapor a análise do processo pontual observado com o valor esperado para hipótese nula, de completa aleatoriedade. A função G() pode ser definida pela equação Ĝ(r )= #(rmin ( x i )>r ) n onde: # é “o número de ventos”, rmin é a menor distancia do evento x i ao evento vizinho mais próximo, dividido pela quantidade de eventos observados ( n ) (BAILEY e GATREL, 1995; LLOYD, 2007). Assim, o valor esperado de Ĝ() assumindo a completa aleatoriedade espacial é igual a 1 (BAILEY e GATREL, 1995; LLOYD, 2007; PROTÁZIO, 2007). Ao utilizarmos esta ferramenta para analisarmos o processo estudado, poderemos inferir a tendência de distribuição aleatória nas distâncias em que a função Ĝ() apresenta valores iguais a 1, tendência de distribuição regular quando Ĝ() menor que 1, e tendência de aglomeração com Ĝ() maior que 1. 14 A forma mais comum de analisar a função Ĝ() é através do gráfico onde o seu valor é plotado contra as distâncias r utilizadas na estimação (figura 6). Assim, ao analisar o gráfico, podemos identificar os padrões de distribuição e interação espacial da espécie em diferentes distâncias. Figura 6:Exemplo da gráfico da função G para uma espécies hipotética. Caso a distribuição espacial do evento estudado apresente distribuição aleatória ( Gtheo ) em determinada distância, este ( Gobs ) apresentará uma curva linear com ângulo 45°. Quando houver interação entre as observações apresentando agrupamentos, a linha do Gobs estimado será superior aos 45°. E, quando tal processo pontual apresentar uma distribuição espacial regular, a linha ficará abaixo da linha de 45° (BIVAND, PEBESMA e RUBIO, 2011). Uma consideração importante feita por Dixon (2012) é a negligência que esta função apresenta sobre dois elementos muito importantes: a dependência espacial entre eventos e o fato de muitas distâncias entre vizinhos próximos serem correlatas, ou seja, o evento X i1 é o vizinho mais próximo de X i2 , ao passo que X i2 também é o vizinho mais próximo de X i1 (figura 7). Esse exemplo é muitas vezes apresentado como eventos reflexivos e chegam a representar 62% das distâncias em processos espaciais completamente aleatórios (DIXON, 2012). Por este fato, muitas vezes a função G é apresentada como superestimadora (DIXON, 2012). 15 Figura 7: Esquema ilustrativo de eventos reflexivos. Outro ponto importante a ser evidenciado sobre esta função é que ela apresenta a média das distâncias, sendo este um único sumário de inferência sobre o padrão de distribuição. Assim, um determinado processo pontual pode ter um mesmo valor para a função G que outro processo e apresentar padrão de distribuição completamente diferente (DIXON, 2012). Bailey e Gatrel (1995) vão além ao expor que esta função, por considerar apenas as distâncias dos vizinhos mais próximos, acabam por se limitar às escalas locais, tornando-se pouco pertinente quando o processo pontual em análise apresentar uma variação de intensidade (λ) em escala global. É importante analisar este último caso, uma vez que, em se tratando de dados da flora, podem ocorrer distribuições espaciais regulares de eventos agregados, ou ainda, distribuição agregada de eventos regulares, como apresentado na figura 8. Fica evidente que, em tais casos, a abordagem proposta pelo método “vizinho mais próximo” não é efetivo para evidenciar toda a complexidade da distribuição espacial. Figura 8: Distribuição espacial de dois processos pontuais hipotéticos, apresentando tanto distribuição regular, quanto agregada, em escalas diferentes (WALLER e GOTWAY, 2004). Essa complexidade de distribuição espacial é muito importante por caracterizar heterogeneidade espacial, ou até fenômenos ecológicos que apresentem combinações de efeitos. De qualquer forma, evidencia a influência da escala na análise do comportamento de distribuição de determinado processo e a importância do mesmo na análise utilizada. 16 FUNÇÃO F: “EMPTY SPACE FUNCTION” A função F̂() , é chamada de função do espaço vazio (“empty space”), por mensurar a média da distância entre uma localidade aleatória sn da área de estudo e o evento vizinho mais próximo, como apresentado no esquema da figura 9, contemplando todos os eventos do processo estudado. Ou seja, a função F̂() estima a distância entre uma localidade e o evento mais próximo, e não a distância entre eventos, como faz a função Ĝ() , apresentada anteriormente. Figura 9: Esquema ilustrativo do cálculo da Função F. A função F̂() é, por sua vez, definida matematicamente pela equação F̂(x)= #(rmin ( si , X )>r ) sn onde: # é “o número de eventos”, rmin é a menor distância da localidade si ao evento mais próximo do processo pontual X estudado, dividido pela quantidade de localidades aleatoriamente amostradas ( sn )(BAILEY e GATREL, 1995; LLOYD, 2007). Assim como na função G, o valor esperado de F̂() considerando a completa aleatoriedade espacial é igual a 1 (BAILEY e GATREL, 1995; LLOYD, 2007; PROTÁZIO, 2007). Como se pode perceber, tal definição em pouco se distingue da equação da função Ĝ() , uma vez que ambas as funções estimam as distâncias médias entre vizinhos mais próximos. A única diferença, portanto, é a definição conceitual, onde a função F̂() estima distância média do vizinho mais próximo de uma localidade da área de estudo, e não entre eventos observados. Por ter um processo de análise similar à função Ĝ() , a função F̂() acaba por contemplar as mesmas críticas quando se considera a questão das escalas (BAILEY e GATREL, 1995). Contudo, ao analisarmos ambas as funções, devemos ter em mente que cada análise apresenta um escopo diferente, não sendo, portanto, excludentes, mas sim, complementares. E, neste sentido, Lloyd (2007) observa que a função F̂() apresenta vantagem em comparação à Ĝ() quando a quantidade de observações das amostras é elevada. Para Gignoux, Duby e Barot (1999) a função 17 F̂() apresenta, ainda a vantagem de ter em seu denominador um valor fixo, tornando-o não enviesado, o que não acontece com a função Ĝ() que possui como denominador um valor aleatório. FUNÇÃO K (RIPLEY’S K-FUNCTION): “REDUCED SECOND MOMENT MEASURE” É uma das ferramentas mais conhecidas e utilizadas na análise exploratória de processos espaciais pontuais. Assimcomo as demais funções de análise de segunda ordem, possui como hipótese nula a distribuição espacial aleatória e independente, a partir de onde se pode contrastar com a distribuição observada e mensurar a tendência de distribuição do processo analisado. Para Waller e Gotway (2004), sua popularidade se deve à sua facilidade de análise. Contudo, Dixon(2002), Péssier e Goreaud (2001), argumenta que além disto, a função K tem a vantagem de possibilitar a compreensão da estrutura espacial do processo, em diferentes escalas simultaneamente, o que não é possível com as funções Ĝ() e F̂() . Além disso, Bailey e Gatrel (1995) e Dixon (2002) afirmam ainda, que esta é uma ótima ferramenta para análise exploratória, teste de hipótese, estimação de parâmetros e ajuste de modelos de distribuição espacial para processos pontuais. A função K̂ () é definida como a média de eventos dentro da distância r centrado em um evento x i1 , dividido pela unidade de área. Como se pode perceber, esta função difere das funções anteriores ( Ĝ() e F̂() ) ao calcular a média de eventos em diferentes distâncias (figura 10), não considerando apenas o vizinho mais próximo. Justamente por esta diferença, a função K̂ () passa a considerar em suas análises a estrutura de distribuição espacial dos processos pontuais em diferentes escalas, e não apenas a escala local. E neste sentido, estimar a função K̂ () , que considera todos os eventos observados, para todas as distâncias r é o equivalente ao mensurar a variância da distribuição espacial do processo analisado var (n/(a)) (Ripley, 1977 apud WALLER e GOTWAY, 2004). 18 felipe felipe Figura 10: Esquema ilustrativo da estimação da função K (BAILEY e GATREL, 1995) A função K é definida como uma função de densidade de probabilidade (ANJOS et al., 2004) e, segundo Péssier e Goreaud (2001), a função é definida pelo processo de intensidade λ de forma que λ k() é o número esperado de eventos englobados pelo círculo de raio r centrado em um evento arbitrário. Ao considerarmos uma distribuição espacial aleatória, a função K () é dada por K ()=π r² (DIXON, 2002; PEREIRA e TURKMAN, 2010; GATTRELL et al., 1996). Sendo esta a prerrogativa básica, para valores de K () maiores de πh² , evidencia-se tendência de distribuição espacial aglomerada com evidências de interação entre os eventos, enquanto valores de K () menores de πh² , caracterizam padrão de distribuição regular com evidências de inibição de interação entre os eventos do processo. Contudo, há outros parâmetros a serem considerados já que a análise não é tão simples. Há que se considerar elementos como a correção de borda e a área de estudo, ficando definida pela função: K̂ ()=n ⁻ 2 |R |∑ i=1 n ∑ j=1 n ws −1 I r( xi−x j) , para i≠ j e r>0 2 Sendo n o número de eventos, R a área de estudo, r o raio de avaliação. w s −1 (x i−x j) É a função de peso para correção de borda, utilizada para evitar tendências quando há eventos próximos ao limite da área de estudo. I r(x i−x j) a função indicadora, sendo igual a 1 se (x i−x j)≤r ou igual a 0 se (x i−x j)>r ; 2 Para maiores informações, consultar Anjos et al. (2004) ou Gatrel et al. (1996) 19 felipe felipe felipe felipe A função para correção de borda se deve ao fato de que eventos situados fora da área de estudo não são analisados, mesmo que estejam a uma distância r (ou menor) de um evento dentro da área de estudo. Assim, ao estimarmos a função K () (ou outra função de segunda ordem, como a Ĝ() e F̂() ) de um evento próximo ao limite da área de estudo, há a possibilidade de seu vizinho mais próximo estar fora desta área, não sendo, portanto, considerado na análise, e com isso, conduzindo a uma estimação equivocada da função. Essa tendência pode ser encarada como um erro sistemático, como sugere Gignoux, Duby e Barot (1999) e Dixon (2002), que consideram, ainda, que tal tendência seja mais forte em distâncias r maiores. O efeito de borda pode ser tratado das seguintes formas: 1. Realizar a análise dos processos pontuais, considerando uma área de guarda, onde eventos dentro desta área são considerados nas análises centradas nos eventos dentro da subárea definida (GATTRELL et al., 1996); 2. Desconsiderar da análise os eventos mais próximos da borda da área de estudo, do que do vizinho mais próximo dentro desta (GIGNOUX, DUBY e BAROT, 1999); 3. Eliminação de todos os pontos situados a uma distância h da borda (GIGNOUX, DUBY e BAROT, 1999); 4. Considerar densidade da área dentro do raio r , mas fora da área de estudo igual à densidade calculada dentro da área de estudo(DIXON, 2012; PROTÁZIO, 2007, BIVAND, PEBESMA e RUBIO, 2011), conforme proposto por Ripley (BIVAND, PEBESMA e RUBIO, 2011); 5. A correção Toroidal é possível nos casos onde a área de estudo é retangular. Neste caso, considera-se o limite superior, como unida ao limite inferior, e o limite esquerdo unido ao direito formando uma grade 3X3 (BAILEY e GATREL, 1995). Contudo, Gignoux, Duby e Barot (1999) ressaltam, que a correção do efeito de borda, em alguns casos, pode ser muito prudente e, por isso, é passível de desconsideração para as funções Ĝ() e F̂() . A possibilidade de se desconsiderar a correção do efeito de borda vale também para conjunto de dados com reduzido número de amostras. O autor justifica que os testes realizados para conjunto de dados possuindo 10 amostras tiveram menor variância do que os testes com a função de correção do efeito de borda. Independente de sua pertinência, o uso da correção do efeito de borda interfere na sensibilidade da análise estatística e afeta, consequentemente, seu poder de inferência, uma vez que aumenta a variância nas amostras (GIGNOUX, DUBY e BAROT, 1999). 20 FUNÇÃO L (FUNÇÃO K TRANSFORMADA): Uma vez que a função K () é baseada no quadrado da distância, o resultado pode ficar muito elevado para grandes distâncias de análise (LLOYD, 2007). Portanto, propõe-se uma pequena mudança na função K () para estabilizar a variância de seus resultados, sendo por isto conhecida como função K transformada. Tal alteração é feita ao extrair a raiz quadrada da função K () dividida por π r e subtraída pelo raio (r ) (ANJOS et al., 2004; PÉSSIER e GOREAUD, 2001; PEREIRA e TURKMAN, 2010), ficando, então definida por: L̂()=√K̂ ()π r −r , sendo r>0 Trata-se de uma transformação conceitual, uma vez que os valores esperados e as formas de analisar os resultados se dão de forma igual à função K () , mencionada anteriormente. Assim, o valor de L() esperado para um padrão de distribuição dado ao acaso é igual a 0. Quando L()<0 indica que há poucos eventos vizinhos dentro do raio r , evidenciando tendência de inibição de interação entre os eventos (distribuição regular). Para L()>0 , evidencia-se a tendência de interação entre os eventos e, consequentemente distribuição aglomerada para a distância r . 21 NÍVEL DE SIGNIFICÂNCIA PARA ANÁLISES DE SEGUNDA ORDEM Uma forma de identificar o nível de significância das análises de segunda ordem, é simulando m distribuições espaciais baseadas na hipótese nula (h0) . Este método consiste em calcular primeiramente o valor da função K () do processo observado para, posteriormente, simular a mesma função m vezes respeitando a intensidade λ() do processo observado mas segundo o modelo teórico da hipótese nula. A partir de tais simulações serão computadas os valores extremos (críticos), tanto superiores, quanto inferiores ( Linf (r)=mini=1...,m{Li(r )} e Lsup(r)=maxi=1...,m{Li(r )} , respectivamente), o que torna possível identificar desvios significativos do processo observado frente a hipótese nula (h0) quando Lobs(r)>Lsup(r ) ou Lobs(r)>Linf (r ) .(BAILEY e GATREL, 1995; WALLER e GOTWAY, 2004). Sendo a h0 mais comum na análise de processos pontuais,a completa aleatoriedade espacial, utiliza-se, então uma simulação a partir do modelo de Monte Carlo. Essa proposta é amplamente difundida pela linha de pesquisa frequentista, uma vez que cada simulação realizada proporciona uma função estimada, em vez de um único teste de significância (WALLER e GOTWAY, 2004), tornando a análise mais robusta e significativa. Assim, o nível de significância é dados pela quantidade de simulações realizadas e, este é calculado pela equação 2 m+1 , onde m é a quantidade de simulações realizadas. Assim, para uma análise com nível de significância de 2%, realiza-se 99 simulações (BAILEY e GATREL, 1995). Quanto à hipótese nula, há uma grande discussão sobre o modelo teórico a ser utilizado. O fato desta estabelecer, mesmo que indiretamente, determinadas bases teóricas sobre a qual o modelo observado será contrastado, torna a sua definição, um elemento a ser tratado cuidadosamente (WALLER e GOTWAY, 2004). Muitas vezes, a hipótese nula de distribuição espacial completamente aleatória não se faz pertinente pela natureza do dado e não apenas pela estrutura de distribuição espacial apresentada (BAILEY e GATREL, 1995; LLOYD, 2007; WALLER e GOTWAY, 2004). Um exemplo são os estudos em saúde pública que não devem considerar a distribuição e eventos de determinada doença de forma aleatória no espaço, pois deve-se levar em conta que a população em risco à tal doença não é constante através da área de estudo. Em tais casos, o 22 conhecimento da população exposta, ou em risco, a esta doença se faz fundamental para uma análise contundente, pois se realiza estimações dos eventos por unidade de população exposta (LLOYD, 2007; WALLER e GOTWAY, 2004). É importante perceber que o que está por de trás das considerações dos pesquisadores da área da saúde pública, pode ser traduzida, nos estudos em ecologia, como heterogeneidade ambiental (PÉSSIER e GOREAUD, 2001; WALLER e GOTWAY, 2004). Uma vez que há uma variação na estrutura espacial de fatores exógenos (clima, precipitação, etc.) e endógenos dos ecossistemas, é mais do que esperado que os eventos não se deem de forma aleatória no espaço. Contudo, o modelo conceitual da distribuição espacial completamente aleatório se faz pertinente quando não se tem informações sobre a variação da população no espaço. Ou seja, quando não há informações quanto à heterogeneidade ambiental (BAILEY e GATREL, 1995). FUNÇÃO DE SEGUNDA ORDEM MULTIVARIADO Outra aplicação das funções de segunda ordem, é a possibilidade de análise de padrões espaciais multivariados. Este tipo de análise emerge do fato de, muitas vezes, cada processo ou evento pontual trazer outras informações (quantitativas ou qualitativas) consigo, além de sua espacialização. Um por exemplo seria a identificação da espécie, altitude de ocorrência, indicação de presença ou ausência, etc. Esses processos pontuais são chamados multivariados e são formados por eventos marcados, sendo as marcações, as informações agregadas a cada evento (também chamado de atributos nos Sistemas de Informações Geográficas). Esta análise emerge de questão como: “Os atributos dos eventos observados são independentes de sua localização?” ou “Determinados processos pontuais têm a tendência de ocorrerem agregados?”. Assim, será através da análise espacial de processos pontuais multivariados que poderemos avaliar a correlação existente entre os atributos e os padrões de distribuição observados. Neste sentido, pode-se estudar a estrutura do padrão de distribuição entre diferentes processos pontuais (X i e X j) , tornando possível inferir a tendência de um evento ocorrer agregado a outro. Esta função pode ser utilizada, ainda para analisar os eventos com diferentes atributos de um único processo pontual. Um exemplo para este último caso, seria a análise da distribuição de uma espécie levando-se em consideração seu atributo que indica a altitude onde a coleta foi realizada. A função K̂ () para processo marcados, fica definida por: K̂mm ()= 1 λ̂ 2 ∑ i=1 n ∑ j=1 n w s I r ( x i1−x j1)mi1m j1 , para r>0 3 3 Para maiores informações, consultar Anjos et al. (2004) ou Gatrell et al. (1996) 23 Sendo X i e X j dois processos pontuais diferentes. Para cada processo pontual Xn , estimar-se-á Xn 2 funções K̂ () , uma vez que um padrão observado para x i em comparação a x j , não implica no oposto. Ou seja, K̂ (ij) não necessariamente é igual à função K̂ ( ji) (DIXON, 2012) Nesta análise, calcula-se as distâncias entre eventos com um determinado valor de atributo ( x i ) para eventos com valores diferentes ( x j ) . Assim, pode-se inferir a relação entre a distribuição espacial dos eventos e determinados atributos relacionados a estes. Contribuindo para se vislumbrar até que ponto tais atributos estão relacionados ao padrão de distribuição do evento estudado. A análise para funções de segunda ordem de processos multivariáveis pode ser feita, contrastando a função K̂ () através de um gráfico, ou através de uma tabela de contingência, onde são apresentadas as identificações (marcas ou atributos) dos eventos e a quantidade de vizinhos mais próximos. A função L() , também permite a análise de padrões espaciais multivariados, ficando, então, definida por: L̂x i x j()=√K̂ x i x j(r )πµ −r , sendo r>0 Este tipo de análise tem sido muito utilizada nos estudos de saúde pública (WALLER e GOTWAY, 2004), uma vez que há a possibilidade de aferir a incidência de doenças próximas às fontes de poluição, por exemplo. O seu potencial para uso nas pesquisas em ecologia é enorme por possibilitar analisar a tendência de ocorrência de determinada espécie próxima a outra, ou até inferir o grau de vulnerabilidade de uma espécie pela sua proximidade a eventos considerados como ameaças a sua existência. CONSIDERAÇÕES SOBRE ANÁLISES ESPACIAIS Há inúmeras críticas e considerações a respeito das análises exploratórias de processos espaciais pontuais, principalmente quando se tratam de dados biológicos (GATTRELL et al., 1995; PÉSSIER e GOREAUD, 2001). Para Gatrell et al. (1995) muitas análises são aplicadas de forna inapropriadas e em conjuntos de dados de relevância duvidosa, o que, consequentemente afeta no resultado obtido. Soma-se a isso, o fato de que o modelo teórico que fundamenta tais análises (distribuição de Poisson homogênea, ou distribuição espacial completamente aleatória), não são de valor práticos para determinados objetos de estudo. 24 Entretanto, o próprio Gatrell et al. (1995) identifica uma mudança comportamental a partir do desenvolvimento e difusão dos Sistemas de Informações Geográficas (SIGs) que possibilitam, a visualização dos dados através de mapas e até, análises exploratórias da estrutura dos dados estimando sumários e testes de hipóteses mais fáceis e adequados. Contudo, o modelo teórico da distribuição espacial completamente aleatória segue como pressuposto básico das análises exploratórias de processos pontuais. Emergem deste fundamento teórico outras inferências que tornam possível responder questões como: “Em que escala há tendência de agrupamento entre os eventos observados?” ou “Tais agrupamentos são resultados de heterogeneidade da área estudada?”. Ou seja, questões que vão muito além da simples constatação e comparação dos diferentes padrões de distribuição espacial. Neste sentido, Gatrell et al. (2005) é enfático ao afirmar que não podemos acreditar que com análises espaciais consigamos contemplar toda a complexa gama que caracterizam os processos pontuais, mas pode-se investigar algumas propriedades que representam importantes aspectos da estrutura espacial de tais processos. Para além das reflexões anteriormente apresentadas, há que se ter atenção para o fato de queos efeitos de primeira e segunda ordem podem ser facilmente confundidos. Por exemplo, uma função K () calculada sobre um processo pontual com efeitos de primeira ordem (intensidade variável sobre área de estudo), pode estar sendo tendenciosa em seu resultado evidenciando tal efeito e não necessariamente a interação entre os eventos. Tal fato se, dá não apenas pela dificuldade de diferenciação de cada efeito, mas também pela natureza do dado. Além disso, é importante salientar que cada uma das funções de segunda ordem aqui expostas não possui um caráter excludente. Pelo contrário, cada função possui sua especificidade e sensibilidade frente a determinados padrões. Por este motivo, tais funções são consideradas complementares. 25 DESENVOLVIMENTO PROCEDIMENTOS METODOLÓGICOS Tendo em vista a revisão bibliográfica realizada e visando cumprir os objetivos específicos traçados, foi estabelecido como procedimentos metodológicos: 1. Utilizar a função Kernel tanto para os dados de incêndios florestais quanto para as espécies selecionadas visando identificar as propriedades de primeira ordem de ambos os processos em cada bioma brasileiro; 2. Utilizar a função L para identificar a tendência de interação espacial entre os eventos das espécies selecionadas, visando ter um ganho de conhecimento sobre as mesmas; 3. Utilizar a função L multivariada para identificar a tendência de interação entre eventos das espécies e os eventos de incêndios florestais ocorridos em 2012 para identificar a tendência de exposição das espécies da flora ameaçada de extinção aos incêndios. 4. Identificar pontos críticos e benéficos (ganho de informação, pertinência, confiabilidade) da análise proposta; Para todas as análises propostas, utilizar-se-á o pacote estatístico R (R Core Team, 2012). O R é um software livre para análises estatísticas baseada em linha de comando que, devido à sua natureza de fácil entendimento e disponibilidade do código fonte, possibilitou que fossem criados diferentes pacotes complementares visando incrementar ainda mais as possíveis análises. Para as análises de processos pontuais, será, portanto, necessário utilizar o pacote estatístico 'spatstat' (BADDELEY e TURNER, 2005). O primeiro passo desenvolvido foi a análise de intensidade para ambos os processos em questão (espécies em extinção e os incêndios florestais de 2012) tendo como área de estudo os biomas brasileiros. Esta análise exploratória é estritamente espacial e nos permite identificar a variação do processo no espaço. Para tal análise, foi utilizado o estimador Kernel gaussiano que, através do número esperado de eventos por unidade de área em determinada localidade da área de estudo, nos possibilita vislumbrar se os processos analisados apresentam tendência da estacionaridade e isotropia, caracterizando a inexistência de dependência espacial. Tal análise foi realizada com correção de borda, uma vez que alguns eventos dos processos estudados estão muito próximos aos limites da área de estudos ou possuem alguns registros de ocorrência fora do mesmo, visando reduzir tendências na análise realizada (GIGNOUX, DUBY e 26 BAROT, 1999). A correção de borda utilizada foi proposta por Ripley (BIVAND, PEBESMA e RUBIO, 2008), onde a intensidade na borda da área de estudo (u) é recíproca à intensidade em sua proximidade, sendo R a área de análise, dada pela formula: 1 e(u) =∫R k (v−u)dv . Com relação à largura de banda da função ( h ), utilizou-se a regra proposta por Scott (1992), a qual é definida de acordo com os dados observados, de forma a minimizar o erro quadrático médio. Tal proposta possui grande respaldo científico e sua utilização é amplamente discutida (SCOTT, 1992; LLOYD, 2006; WALLER e GOTWAY, 2004), principalmente pela largura de banda ser definida de acordo com o melhor ajuste estatístico frente aos dados observados e não por escolha subjetiva do pesquisador. Uma vez analisado o valor esperado da intensidade de primeira ordem dos incêndios florestais de 2012 e das espécies ameaçadas de extinção, passou-se a estudar as propriedades de segunda ordem das espécies selecionadas, através da função k transformada (função L). É evidente a importância de desenvolver tal análise também para os focos de incêndio mapeados. Contudo, devido à grande quantidade de registros de ocorrência dos Incêndios florestais em cada bioma, não foi possível realizar a função pra este conjunto de dado. Tais dados possuem mais de 3.000 registros de ocorrência, superando o limite suportado pelo pacote estatístico utilizado (BADDELEY and TURNER, 2005). Portanto, apenas foi possível analisar as propriedades de segunda ordem das espécies da flora brasileira ameaçada de extinção. A análise de segunda ordem, foi realizada com os mesmos parâmetros propostos para o estimador Kernel. Dessa forma, o valor de intensidade, foi o composto pela análise discutida e apresentada por Scott (1992) e a correção de borda desenvolvida por Ripley (BIVAND, PEBESMA e RUBIO, 2008). Ainda com relação à análise de segunda ordem, foram geradas 99 simulações de processos aleatórios, com mesma intensidade apresentada pelo processo estudado, mas com distribuição espacial completamente aleatórios (h0) , para identificarmos valores críticos altos e baixos nos permitindo identificar se o processo analisado apresenta desvio significativo frente a tais valores. Assim, contrastando o resultado da função L estimado com as simulações realizadas, pode-se identificar os desvios destes à hipótese nula que, por sua vez indicam a tendência de interação entre eventos (distribuição agregada), ou interação negativa apontando a tendência de inibição entre os eventos (caracterizando distribuição regular), quando L()>0 e L()<0 , respectivamente. 27 Uma vez ciente das propriedades de primeira e segunda ordem dos processos e do padrão de distribuição espacial destes, estimou-se a tendência de interação entre ambos processos, como forma de identificar a tendência de exposição da espécie aos incêndios mapeados em 2012, utilizando a função L multivariada. Com a função multivariada, se analisa a tendência de interação positiva (indicando tendência de distribuição aglomerada), negativa (indicando tendência de inibição entre os processos e distribuição regular) ou distribuição aleatória entre dois processos diferentes (quando só valores estimados se mantêm dentro dos valores críticos estimados segunda a h0 ). Assim como na análise univariada, realizou-se 99 simulações de distribuição aleatória entre os processos, para se identificar os desvios significativos da distribuição observada frente a hipótese nula (CSR). 28 DADOS UTILIZADOS DADOS DAS ESPÉCIES DA FLORA BRASILEIRA AMEAÇADAS DE EXTINÇÃO O trabalho desenvolvido pelo CNCFlora, no processo de avaliação do status de conservação e elaboração de planos de ação, considerou uma vasta pesquisa bibliográfica, de herbario e de campo a respeito das espécies avaliadas, assim como, vislumbrou a importância das análises espaciais dos registros de ocorrência de tais espécies no processo de análise proposto. Ciente da complexidade de considerar os dados de herbarium espacializados em seu trabalho, o CNCFlora desenvolveu um procedimento que inclui a limpeza e georreferenciamento de tais dados, com posterior validação pelos especialistas de cada família e/ou espécie, visando garantir consistência e qualidade dos dados. Dessa forma, as análises espaciais foram feitas apenas com os registros de ocorrência válidos. Todo o processo desenvolvido pelo CNCFlora é ilustrado na figura 11. Figura 11: Esquema ilustrativo do processo desenvolvido pelo CNCFlora para controle da qualidade dos dados geográficos da flora em risco de extinção. a) Composição do banco de
Compartilhar