Baixe o app para aproveitar ainda mais
Prévia do material em texto
Article PDF Available Geoestatística em estudos de variabilidade espacial do solo. In: NOVAIS, R. F et al (Eds) January 2000 Authors: Discover the world's research 20+ million members 135+ million publications 700k+ research projects Content uploaded by Sidney Rosa Vieira Content may be subject to copyright. Sidney Rosa Vieira Instituto Agronômico de Campinas Citations (535) References (42) Join for free Public Full-text 1 Author content GEOESTATÍSTICA EM ESTUDOS DE VARIABILIDADE ESPACIAL DO SOLO1 Sidney R. Vieira2 Resumo Quando uma determinada propriedade varia de um local para outro com algum grau de organização ou continuidade, expresso pela dependência espacial, a estatística clássica deve ser abandonada e dar lugar a uma estatística relativamente nova: a geoestatística. Por estatística clássica entende-se aquela que utiliza parâmetros como média e desvio padrão para representar um fenômeno, e baseia-se na hipótese principal de que as variações de um local para outro são aleatórias. Desse modo, esses dois ramos da estatística têm validade de aplicação em condições perfeitamente distintas. Para se determinar qual das duas deve ser usada em cada caso, utiliza-se o semivariograma que expressa a dependência espacial entre as amostras. Havendo dependência espacial, pode-se estimar valores da propriedade em estudo para os locais não amostrados dentro do campo, sem tendenciosidade e com variância mínima, pelo método denominado krigagem. Além disso, muitas vezes, duas propriedades correlacionam-se entre si e no espaço, e uma é mais difícil ou mais cara para se medir no campo. A dependência espacial entre duas propriedades no espaço pode ser expressa pelo semivariograma cruzado, e se ele existir, o método chamado co-krigagem pode ser utilizado para estimar aquela mais difícil de se medir, utilizando-se os dados de ambas. Estes métodos oferecem a escolha de se medir a propriedade mais difícil com um número mínimo possível. A construção de mapas de contornos (isolinhas), e o delineamento de espaçamento e disposição ótima de amostras no campo são outras aplicações imediatas. Neste trabalho procurou-se dar o maior detalhamento possível nos aspectos teóricos e nos conceitos básicos de geoestatística, numa linguagem simples e compreensível ao leitor. Para ilustrar, utilizaram-se dados da literatura, como exemplo aplicativo para propriedades químicas de solo. Os dados e os programas de geoestatística utilizados estão listados em apêndice no final do trabalho. Termos de indexação: semivariogramas, krigagem, co-krigagem, “jack-knifing” ABSTRACT: GEOSTATISTICS IN SOIL SPATIAL VARIABILITY STUDIES When a given soil property varies from place to place with some degree of continuity, as expressed through its autocorrelation, classical statistical analysis is not valid and a relatively new tool in soil science called geostatistics must be used. Classical statistical is understood as that which uses such parameters as mean and standard deviation, to represent a phenomenon and is based on the principal hypothesis that spatial variation is random. These 1 Recebido para publicação em e aceito em 2 Pesquisador, Centro de Solos e Recursos Agroambientais, Instituto Agronômico, Caixa Postal 28 - 13001-970, Campinas, SP. Email: sidney@cec.iac.br aspects of statistics are applicable in perfectly distinct circunstances. In order to determine which should be used in which instance, semivariograms are used to show autocorrelation among samples. Autocorrelation allows estimation of values for places not sampled in the field, without bias and with minimum variance, with the kriging method. Furthermore, two properties may have spatial autocorrelation with each other, and one may be more difficult or more expensive to measure in the field. Spatial autocorrelation between two properties can be expressed with cross- semivariograms, and in some cases, the co-kriging method can be used to estimate the property more difficult to measure, thus using both measures. This method allow selection of the most difficult property to measure with the lowest possible number of samples. Immediate applications of these methods are the creation of contour maps and delineation of optimal spacing of field samples. This paper seeks to provide a high level of detail about theoretical aspects and basic concepts of geostatistics in a comprehensible format to the reader. As examples, data available from the literature are used for applications of soil chemical properties. The data and geoestatistics programs used in this paper are listed in appendices at the end of the paper. Index terms: semivariograms, kriging, co-kriging, “jack-knifing”. ÍNDICE RESUMO ABSTRACT I. INTRODUÇÃO 1. Variabilidade: preocupação antiga 2. Repetição e casualização: Fisher entra em cena 3. Das minas de ouro da África do Sul para Fontainebleau na França: nasce a geoestatística 4. Da mineração à Geologia, Dendrologia, Hidrologia e Ciência do Solo: e a moda pega 5. Os objetivos e as ressalvas II. AS HIPÓTESES 1. Campo de estudo: o domínio e as definições básicas 2. Hipótese de estacionaridade de ordem 2 3. Hipótese intrínseca 4. Hipótese de tendência: krigagem universal III. O SEMIVARIOGRAMA 1. A equação de cálculo 2. As características ideais 3. Os modelos 4. Os exemplos IV. A KRIGAGEM 1. O estimador 2. As condições requeridas 3. A dedução do sistema de equações 4. Sistema matricial 5. Particularidades do sistema e métodos de solução 6. Os exemplos V. O SEMIVARIOGRAMA CRUZADO 1. As definições pertinentes 2. A equação de cálculo 3. As características ideais 4. Os exemplos VI. A CO-KRIGAGEM 1. O estimador 2. As condições requeridas 3. A dedução do sistema de equações 4. Sistema matricial 5. Os exemplos VII. A VARIÂNCIA DA ESTIMATIVA 1. Significado 2. Utilidade VIII. A VIZINHANÇA USADA NA ESTIMATIVA 1. Vizinhança única 2. Distância constante 3. Número constante de vizinhos 4. Quadrantes IX. A AUTOVALIDAÇÃO: UMA PODEROSA FERRAMENTA 1. O gráfico 1:1 - Medido vs. Estimado 2. O erro absoluto 3. O erro reduzido 4. Os exemplos X. CONCLUSÕES XI. LITERATURA CITADA XII. APÊNDICE 1. Listagem dos dados de Waynick & Sharp (1919) Lista das figuras 1. Semivariograma típico. 2. Esquema de amostragem, onde os sinais "+" indicam posição onde amostras foram coletadas. 3. Semivariogramas escalonados médios para C e N, para dados originais, nos dois locais. 4. Semivariogramas escalonados médios para C/N, para dados originais nos dois locais. 5. Semivariogramas mostrando o efeito da tendência: (a) carbono – Davis; (b) carbono – Oakley; (c) nitrogênio – Davis; (d) nitrogênio - Oakley. 6. Semivariogramas para os resíduos de tendência, para os dois locais: (a) carbono, com modelo esférico com parâmetros 0,4; 0,6 e 15,0: (b) nitrogênio, com modelo esférico com parâmetros 0,0; 1,0 e 25,0. 7. Semivariograma escalonado médio para C/N - Davis, com modelo esférico com parâmetros 0,3; 0,7 e 25,0. 8. Mapa para carbono (%), Davis. 9. Mapa para carbono (%), Oakley. 10. Mapa para nitrogênio (%), Davis. 11. Mapa para nitrogênio (%), Oakley. 12. Semivariogramas escalonados médios para carbono versus nitrogênio, para Davis e Oakley, com modelo gaussiano com parâmetros 0,0, 1,0 e 13,0. 13. Mapa para nitrogênio (%), Oakley, obtido por cokrigagem. I. INTRODUÇÃO 1. Variabilidade: preocupação antiga A variabilidade espacial de propriedades do solo vem sendo uma das preocupações de pesquisadores, praticamente desde o início do século. Smith (1910) estudou a disposição de parcelas no campo em experimentos de rendimento de variedades de milho, numa tentativa de eliminar o efeito de variaçõesno solo. Montgomery (1913), preocupado com o efeito do nitrogênio no rendimento de trigo, fez um experimento com 224 parcelas nas quais mediu o rendimento de grãos. E assim, vários outros, como Robinson e Lloyd (1915) e Pendleton (1919) estudaram erros em amostragem e diferenças em solos do mesmo grupo. Waynick (1918) estudou a variabilidade espacial da nitrificação no solo. Waynick e Sharp (1919) estudaram o nitrogênio total e o carbono no solo, todos com grande intensidade de amostras, nos mais variados esquemas de amostragem, mas sempre com a preocupação de caracterizar ou conhecer a variabilidade. Numa tentativa de encontrar uma maneira única de analisar uma vasta coleção de dados, Harris (1920) utilizou uma equação muito semelhante a que hoje conhecemos como variância de blocos. 2. Repetição e casualização: Fisher entra em cena É lamentável que experimentos como os anteriormente descritos não tenham tido continuidade no tempo, porque é provável que se poderia ter muito mais conhecimento sobre a variabilidade hoje. A maior causa dessa descontinuidade foi a adoção de técnicas como casualização e repetição, e melhor conhecimento de funções de distribuição, que levaram à adoção de amostragem ao acaso, desprezando assim as coordenadas geográficas do ponto amostrado. Esse procedimento, somado à distribuição normal de freqüências era, e ainda é, usado para assumir independência entre as amostras e assim garantir a validade do uso da média e do desvio padrão para representar o fenômeno. Esses conceitos da estatística clássica e seus fundamentos podem ser encontrados em Fisher (1956), ou Snedecor & Cochran (1967). 3. Das minas de ouro da África do Sul para Fontainebleau na França: nasce a geoestatística A distribuição normal não garante, de maneira alguma, a independência entre amostras, a qual pode ser verificada pela autocorrelação. A principal razão para isto é que o cálculo da freqüência de distribuição não leva em conta a distância na qual as amostras foram coletadas no campo. A presença de dependência espacial requer o uso de um tipo de estatística chamada geoestatística, que surgiu na África do Sul, quando Krige (1951), trabalhando com dados de concentração de ouro, concluiu que não conseguia encontrar sentido nas variâncias, se não levasse em conta a distância entre as amostras. Matheron (1963, 1971), baseado nessas observações, desenvolveu uma teoria, a qual ele chamou de Teoria das Variáveis Regionalizadas e que contém os fundamentos da geoestatística. Matheron (1963) define Variável Regionalizada como uma função espacial numérica, que varia de um local para outro, com uma continuidade aparente e cuja variação não pode ser representada por uma função matemática simples. Essa continuidade ou dependência espacial pode ser estimada pelo semivariograma. A geoestatística tem um método de interpolação chamado krigagem (nome dado por Matheron (1963), em homenagem ao matemático sul-africano D. G. Krige), que usa a dependência espacial entre amostras vizinhas, expressa no semivariograma, para estimar valores em qualquer posição dentro do campo, sem tendência e com variância mínima. Essas duas características fazem da krigagem um interpolador ótimo (Burgess e Webster, 1980a). Quando se tem duas variáveis medidas no mesmo campo, com parte dos pontos de amostragem ou todos, coincidentes, pode-se avaliar o grau de semelhança da variação das duas no espaço, pelo semivariograma cruzado. Um bom exemplo dessas variáveis é o teor de areia e a taxa de infiltração, porque se sabe, de antemão, que elas são correlacionadas, ou seja, espera-se que nos locais onde o teor de areia é alto, a infiltração também seja alta. Se isso for verdade, o que pode ser mostrado pelo semivariograma cruzado, um outro método de interpolação, chamado co- krigagem, pode ser usado. Sabe-se de antemão que o teor de areia é mais fácil de medir do que a infiltração. Assim, seria desejável amostrar-se com menor freqüência o mais difícil, por exemplo a cada 50 m, e com maior freqüência o mais fácil, por exemplo a cada 10 m. E assim, usando-se a correlação cruzada entre as duas variáveis, pode-se estimar valores da infiltração a cada 10 metros ou qualquer outra distância desejável, usando os valores e a correlação cruzada entre ambos, pela co-krigagem. Esses dois métodos de interpolação possibilitam a construção de mapas de contornos (isolinhas) com alta precisão, uma vez que após a interpolação a densidade espacial dos dados será muito maior do que antes, além de oferecer também os limites de confiança para o mapa, pela variância da estimativa. Além disso, conhecendo-se os semivariogramas das variáveis em estudo e os semivariogramas cruzados daquelas correlacionadas, pode-se usar a krigagem ou a co-krigagem para delinear o espaçamento e a disposição de amostras no campo para se obter um valor prefixado de variância da estimativa. 4. Da mineração à Geologia, Dendrologia, Hidrologia e Ciência do Solo: e a moda pega A geoestatística teve suas primeiras aplicações em mineração (Blais e Carlier, 1968; David, 1970; Ugarte, 1972; Journel, 1974; Olea, 1975, 1977), depois em hidrologia (Delhomme, 1976). Já existem vários estudos em ciência do solo (Hajrasuliha et al., 1980; Burgess & Webster, 1980a e 1980b; Webster & Burgess, 1980; Vieira et al., 1981; Vauclin et al., 1982; Vieira et al., 1983; Nielsen et al., 1983; Vieira et al., 1987, Vieira et al., 1991; Vieira et al., 1992) e em sensoriamento remoto (Vauclin et al., 1982; Vieira & Hatfield, 1984). Além disso, existem alguns livros tratando do assunto, dentre os quais destacam-se David (1977) e Journel & Huijbregts (1978). 5. Os objetivos e as ressalvas O objetivo principal deste trabalho é fornecer ao leitor uma bibliografia em português, em linguagem simples e completa, com todos os detalhes teóricos e aplicações da geoestatística. Isto se faz necessário pela importância do problema variabilidade espacial, e de um possível método de solução e conhecimento, a geoestatística. O nível de detalhes teóricos foi mantido propositalmente para auxiliar no acompanhamento e compreensão. A matemática envolvida, embora à primeira vista assustadora pelo tamanho das equações, é na maioria das vezes álgebra elementar, probabilidade e operações com matrizes. O leitor é encorajado a seguir as deduções, passo a passo, o que facilitará grandemente sua compreensão. Um conjunto de dados obtidos da literatura será usado como exemplo, listado no apêndice 1. É importante também salientar que o presente trabalho não tem por finalidade desencorajar o uso de estatística clássica, a qual tem seu espaço, potencialidade e limitações. É justamente nos problemas onde a estatística clássica tem limitações que a geoestatística tem suas maiores aplicações. II. AS HIPÓTESES Todos os conceitos teóricos de geoestatística têm suas bases em funções e variáveis aleatórias, as quais, por convenção, recebem símbolos maiúsculos. Os valores medidos recebem símbolos minúsculos. É preciso também entender que uma realização em particular de uma função é um valor numérico assumido por esta função dentro de uma dada condição fixa. Por exemplo, Cos(0) = 1, então 1 é uma realização da função coseno para o ângulo 0 (zero) graus. 1. Campos de estudo: o domínio e as definições básicas Para o estabelecimento do problema, considere-se um campo de área S, para o qual se tem um conjunto de valores medidos {z(xi), i=1, n}, onde xi identifica uma posição no espaço ou no tempo, e representa pares de coordenadas (xi, yi). Esse procedimento é usado para simplicidade de representação na dedução das equações. O ponto de referência para o sistema de coordenadas é arbitrário e fixado a critério do interessado. Para uma dada posição fixa xk, cada valor medido da variável em estudo, z(xk), pode ser considerado como uma realização de uma certa variável aleatória,Z(xk). A variável regionalizada Z(xk), para qualquer x dentro da área i S, por sua vez pode ser considerada uma realização do conjunto de variáveis aleatórias {Z(xi), para qualquer xi dentro de S}. Esse conjunto de variáveis aleatórias é chamado uma função aleatória e é simbolizado por Z(xi) (Journel e Huijbregts, 1978). O exposto acima se faz necessário porque, pelo fato de uma função aleatória ser contínua, pode ser submetida a uma grande gama de hipóteses, sem as quais a dedução de equações é impossível. O que se deve esperar é que com pontos discretos de amostragem, se possa satisfazer as hipóteses às quais as funções aleatórias estão sujeitas. Com uma única amostragem, tudo o que se sabe de uma função aleatória Z(ki) é uma única realização. Então, para se estimar valores para os locais não amostrados, ter-se-á que introduzir a restrição de que a variável regionalizada seja, necessariamente, estacionária estatisticamente. Formalmente, uma variável regionalizada é estacionária se os momentos estatísticos da variável aleatória Z(xi+h) forem os mesmos para qualquer vetor h. De acordo com o número k de momentos estatísticos que são constantes, a variável é chamada de estacionária de ordem k. Estacionariedade de ordem 2 é tudo que é requerido em geoestatística (Olea, 1975). Supondo-se que a função aleatória Z(xi) tenha valores esperados E{Z(xi)} = m(xi) e E{Z(xi+h)} = m(xi+h) e variâncias VAR {Z(xi)} e VAR {Z(xi+h)}, respectivamente, para os locais xi e xi+h, e qualquer vetor h, então, a covariância C(xi, xi+h) entre Z(xi) e Z(xi+h) é definida por C( x ,x + h) = E {Z( x ) Z( x + h)} - m( x ) m( x + h) i i i i i i (1) e o variograma 2γ(xi, xi+h) é definido por (2) 2 ( x ,x + h) = E {Z( x ) - Z( x + h) } i i i i 2γ A variância de Z(xi) é (3) VAR {Z( x )} = E {Z( ) Z(x x +0) - m( x ) m( x +0)} = = E { Z ( x )-m ( x )} = C( x ,x ) i i i i i 2 2 i i i i i e a variância de Z(xi+h) é (4) VAR {Z( x + h)} = E { Z ( x + h) - m ( x + h)} = C ( x + h, x + h)i 2 i 2 i i Assim, existem três hipóteses de estacionaridade de uma função aleatória Z(xi), e pelo menos uma delas deve ser satisfeita antes de se fazer qualquer aplicação de geoestatística. 2. Hipótese de estacionaridade de ordem 2 Uma função aleatória Z(xi) é estacionária de ordem 2 se: (5) E {Z( x )} = m i a) O valor esperado E{Z(xi)} existir e não depender da posição x, ou seja para qualquer xi dentro da área S. b) Para cada par de variáveis aleatórias, {Z(xi), Z(xi+h)}, a função covariância, C(h), existir e for função de h: (6) C(h) = E {Z( x ) Z( x + h)} - m i i 2 para qualquer xi dentro da área S. A equação (6), estacionaridade da covariância, implica na estacionaridade da variância e do variograma. Assim, usando a linearidade do operador valor esperado, E, na equação (3), obtém-se: (7) VAR {Z( x )} = E {Z( x +0)} - E {m ( x )}i i 2 i e aplicando as condições de estacionaridade (5) e (6) obtém-se: (8) VAR {Z( x )} = E {Z ( x )} - m = C(0)i 2 i 2 O variograma na equação (2) pode ser desenvolvido em: h)}+x(Z + h)+xZ()x( Z2 - )x(Z{ E = (h)2 = h)+x,x(2 i2iii2ii γγ (9) Somando e subtraindo 2m2: (10) 2 (h) = E { Z ( x )-m - 2Z( x ) Z( x + h)+ 2 m + Z ( x + h) - m }2 i 2 i i 2 2 i 2γ Usando a linearidade do operador E, e reconhecendo que o valor esperado de uma constante é a própria constante tem-se: (11) 2 (h) = E { Z ( x )}- m - 2(E {Z( x )Z( x + h)} - m )+ E {Z ( x + h)} - m2 i 2 i i 2 2 i 2γ Substituindo as equações (6) e (8) na equação (11), tem-se: 2 (h) = C(0)- 2C(h)+ C(0) = 2 C(0) - 2 C(h)γ (12) ou simplificando, γ (h) = C(0) - C(h) (13) Isolando C(h), tem-se: C(h) = C(0) - (h)γ (14) Dividindo ambos os lados por C(0) e reconhecendo que o correlograma ρ(h) = C(h)/C(0): ρ γ ρ γ (h) = C(h) C(0) = C(0) C(0) - (h) C(0) (h) = 1 - (h)C(0) Portanto, se a hipótese de estacionaridade de ordem 2 puder ser satisfeita, a covariância C(h) e o variograma 2γ(h) são ferramentas equivalentes para caracterizar a dependência espacial. A existência de estacionaridade dá a oportunidade de repetir um experimento mesmo que as amostras devam ser coletadas em pontos diferentes, porque todas são consideradas pertencentes a populações com os mesmos momentos estatísticos. 3. Hipótese intrínseca A hipótese de estacionaridade de ordem 2 implica a existência de uma variância finita dos valores medidos, VAR {Z(x)} = C(0). Esta hipótese pode não ser satisfeita para alguns fenômenos físicos que têm uma capacidade infinita de dispersão. Exemplos incluem a concentração de ouro em minas da África do Sul (Krige, 1951), o movimento browniano (Journel e Huijbregts, 1978) e algumas cadeias de Markov (Bartlett, 1966). Para tais situações, uma hipótese menos restritiva, a hipótese intrínseca, pode ser aplicável. Essa hipótese requer apenas a existência e estacionaridade do variograma, sem nenhuma restrição quanto à existência de variância finita. Uma função aleatória é intrínseca quando, além de satisfazer a condição expressa na equação (5), a estacionaridade do primeiro momento estatístico, também o incremento {Z(xi i) - Z(x +h)} tem variância finita, e não depende de xi para qualquer vetor h.. Matematicamente, isso pode ser escrito: (16) { } ]h)+x Z(- )xE[Z( =])h+x Z(- )x [Z( VAR 2iiii para qualquer xi dentro da área S. Substituindo a equação (2) na equação (16), tem-se: (17) 2 (h) = E[Z( x ) - Z( x + h) ]i i 2γ A função γ (h) é o semivariograma. A razão para o prefixo "semi" é que a equação (17) pode ser escrita na forma: (18) γ (h) = 1/ 2 E[Z( x ) - Z( x + h) ]i i 2 O fator 2 foi introduzido na definição do variograma, 2γ(h), para cancelamento e simplificação da equação (13) e a quantidade mais freqüentemente usada é γ(h) e não 2γ(h). A hipótese intrínseca é, na verdade, a mais freqüentemente usada em geoestatística, principalmente por ser a menos restritiva. 4. Hipótese de tendência - krigagem universal Nesta hipótese, a função aleatória Z(xi), para qualquer posição, xi, consiste de dois componentes: (19) ) xe(+)xm(=)xZ( iii onde m(xi) é o "drift" (tendência principal) e e(xi) é o erro residual. Portanto, para se trabalhar sob esta hipótese é preciso, para cada posição xi, determinar o "drift", m(xi), e ter uma expressão para o semivariograma dos resíduos (Webster & Burgess, 1980). Devido à arbitrariedade envolvida na expressão do "drift" e do semivariograma dos resíduos, não será apresentado aqui nenhum desenvolvimento teórico para krigagem universal. Trabalhos sobre este assunto podem ser encontrados em Olea (1975 e 1977) e um exemplo de aplicação pode ser visto em Webster & Burgess (1980). O leitor é encorajado a consultar essas literaturas para maiores informações. Se uma função aleatória é estacionária de ordem k (k>0), ela também será estacionária de todas as ordens menores que k. Consequentemente, se uma função aleatória Z(xi) é estacionária de ordem 2, ela será também intrínseca. Entretanto, o contrário não é necessariamente verdade. Não existe um método fácil para testar em qual tipo de estacionaridade os dados se enquadram. O exame do semivariograma, como será visto a seguir, e um teste conhecido como "jack-knifing", mostrado no capítulo IX deste trabalho, são as principais ferramentas utilizadas para se conhecer indiretamente a estacionaridade dos dados. III. O SEMIVARIOGRAMA Até o início dos anos 60, a análise de dados era feita sob a hipótese de independência estatística ou distribuição espacial aleatória, para permitir o uso de métodos estatísticos como análise de variância e parâmetros como o coeficiente de variação (Harradine, 1949; Ball & Williams, 1968). Entretanto, esse tipo de hipótese não pode simplesmente ser feito antes que se prove a não existência de correlação deamostras com distância. Se provada a correlação espacial, a hipótese de independência fracassa. Um dos métodos mais antigos de se estimar a dependência no espaço ou no tempo de amostras vizinhas é pelo uso da autocorrelação. Esse método tem suas origens em análise de séries temporais e tem sido largamente usado em ciência do solo (Webster, 1973; Webster & Cuanalo, 1975; Vieira et al., 1981), principalmente para medições efetuadas em uma linha reta (transeto). A sua análise pode auxiliar na localização de divisas entre dois tipos de solos, ou na análise de periodicidade nos dados, pela análise espectral (Vauclin et al. 1982). Porém, quando as amostras forem coletadas nas duas dimensões do campo e interpolação entre locais medidos for necessária para a construção de mapas de isolinhas, será preciso usar uma ferramenta mais adequada para medir a dependência espacial. Essa ferramenta é o semivariograma (Vieira et al., 1983). 1. A equação de cálculo O semivariograma é, por definição: (20) }h)+xZ(-)x Z({E 1/2 = (h) 2iiγ e pode ser estimado por: γ ∗ ∑ (h) = 1 2 N(h ) [Z( x ) - Z( x + h) ]i=1 N(h) i i 2 (21) onde N(h) é o número de pares de valores medidos Z(x +h), separados por um vetor h i), Z(xi (Journel & Huijbregts, 1978, pag. 12). O gráfico de γ*(h) versus os valores correspondentes de h, chamado semivariograma, é uma função do vetor h, e portanto depende de ambos, magnitude e direção de h. Quando o gráfico do semivariograma é idêntico para qualquer direção de h ele é chamado isotrópico e representa uma situação bem mais simples do que quando é anisotrópico. Neste último caso, o semivariograma deve sofrer transformações antes de ser usado. É importante notar que a maioria das variáveis de ciência do solo poderá ter um comportamento anisotrópico, isto é, mudar de maneira diferente para direções diferentes. É óbvio que isso depende muito da propriedade em estudo, das dimensões do campo de estudo e do tipo de solo envolvido. Existem algumas maneiras de se transformar um semivariograma anisotrópico em isotrópico (Journel & Huijbregts, 1978, pag. 175; Burgess & Webster, 1980a). Em geral, a precisão da interpolação ou o tipo de hipótese satisfeita não são afetados se, em vez de se preocupar com a escolha do método de transformação da anisotropia, apenas se limitar a faixa de distância na qual se utiliza o semivariograma. De qualquer maneira, é sempre aconselhável examinar semivariogramas para várias direções, antes de tomar decisões. As principais direções que devem ser examinadas são: 0° - na direção do eixo X, 90° - na direção do eixo Y, 45° e - 45° - nas duas diagonais. O método "jack-knifing", descrito no capítulo IX, é também de grande utilidade para se determinar a faixa de distância na qual o semivariograma pode ser, na prática, considerado isotrópico. De qualquer maneira, sob isotropia ou não, a equação (21) é a que é usada para o cálculo do semivariograma. Os programas de computador, como aqueles listados no apêndice 2, utilizados para calcular o semivariograma, simplesmente calculam aquela equação. Quando os dados forem coletados em transeto, o semivariograma é unidirecional e nada pode ser dito a respeito de anisotropia, mas por outro lado é uma preocupação a menos. 2. As características ideais A figura 1 mostra um semivariograma típico com características bem próximas do ideal, as quais serão discutidas a seguir. Seu comportamento representa o que, intuitivamente, se deve esperar de dados de campo. É de se esperar que as diferenças {Z(xi) - Z(xi+h)} decresçam assim que h, a distância que os separa, decresça. É esperado que medições localizadas próximas sejam mais parecidas entre si do que aquelas separadas por grandes distâncias. Dessa maneira, é de se esperar que γ(h) aumente com a distância h. Por definição, γ(0)=0, como pode ser visto pela equação (21), quando h=0. Entretanto, na prática, à medida que h tende para 0 (zero), γ(h) se aproxima de um valor positivo chamado efeito pepita (“nugget effect”) e que recebe o símbolo C0. Resultados com valores de efeito pepita maiores que zero foram encontrados para precipitação pluvial (Delhomme, 1976), pH (Campbell, 1978), condutância elétrica (Hajrasuliha et al., 1980) e distribuição de tamanho de partículas de solo (Vieira et al., 1983). O valor de C0 revela a descontinuidade do semivariograma para distâncias menores do que a menor distância entre as amostras. Parte dessa descontinuidade pode ser também devida a erros de medição (Delhomme, 1976), mas é impossível quantificar qual contribui mais, se os erros de medição ou a variabilidade em uma escala menor do que aquela amostrada. À medida que h aumenta, γ(h) também aumenta até um valor máximo no qual se estabiliza. Esse valor no qual γ(h) se estabiliza chama-se patamar ("sill"), e é aproximadamente igual à variância dos dados, VAR(z). A distância na qual γ(h) atinge o patamar é chamada de alcance ("range"), recebe o denominação de a, e é a distância limite de dependência espacial. Medições localizadas a distâncias maiores que a tem distribuição espacial aleatória e por isto são independentes entre si. Para essas amostras, a Estatística Clássica pode ser aplicada sem restrições. Por outro lado, amostras separadas por distâncias menores que a, são correlacionadas umas às outras, o que permite que se faça interpolações para espaçamentos menores do que os amostrados. Dessa maneira, o alcance a é a linha divisória para a aplicação de geoestatística ou Estatística Clássica, e por isso o cálculo do semivariograma deveria ser feito rotineiramente para dados de campo, para garantir as hipóteses estatísticas sob as quais serão analisados. Dados que apresentarem semivariogramas semelhantes ao da figura 1 muito provavelmente poderão ser estacionários de ordem 2, porque têm um patamar claro e definido e, com toda certeza, estarão sob a hipótese intrínseca. Se o semivariograma, ao invés de ser crescente e dependente de h como o mostrado na figura 1, for constante e igual ao patamar para qualquer valor de h, então tem-se um efeito pepita puro ou ausência total de dependência espacial. Isto significa que o alcance a, para os dados em questão, é menor do que o menor espaçamento entre amostras. Para esses dados, tem-se uma distribuição espacial completamente aleatória, e a única estatística aplicável é a Estatística Clássica (Silva et al., 1989). É bastante comum um semivariograma que, partindo do valor do efeito pepita, C0, cresce além do valor do patamar ("sill"), até uma determinada distância e depois cai e apresenta flutuações abaixo do valor do patamar. Pode até apresentar flutuações abaixo do valor do patamar para pequenas distâncias. Isso é indicação de periodicidade nos dados. A periodicidade nos dados requer um tratamento específico chamado densidade espectral. Esse assunto está descrito em McBratney & Webster (1981), Nielsen et al. (1983) e Vieira et al. (1983), onde o leitor encontrará os detalhes necessários. Um outro tipo de semivariograma que pode ocorrer é aquele que cresce, sem limites, para todos os valores de h calculados. Esse semivariograma indica a presença de fenômeno com capacidade infinita de dispersão, o qual não tem variância finita e para o qual a covariância (equação (6)) não pode ser definida. Ele indica, também, que o tamanho do campo amostrado não foi suficiente para exibir toda a variância e é provável que exista uma grande tendência nos dados em determinada direção. Se isto puder ser constatado, tem-se duas alternativas distintas: a) remove-se a tendência e trabalha-se nos resíduos para examinar se se enquadram nas hipóteses de estacionaridade de ordem 2 ou intrínseca; b) trabalha-se com hipótese de tendência nos dados originais. Por simplicidade, deve-se preferir a primeira alternativa. Um método bastante eficiente para retirada da tendência é pela superfície de tendência (Davis,1973). Se, após retirar a tendência, não houver nenhuma dependência espacial expressa no semivariograma dos resíduos, isto significa que a superfície de tendência encontrada é a melhor representação espacial do fenômeno. Um exemplo de retirada de tendência em dados unidimensionais e análise dos resíduos pode ser encontrado em Vieira et al. (1983) e Vieira & Hatfield (1984). 3.Os modelos O gráfico do semivariograma experimental, γ(h) versus h, calculado usando a equação (21), mostrará uma série de pontos discretos de γ(h) correspondendo a cada valor de h e para o qual uma função contínua deve ser ajustada. Delhomme (1976) discutiu vários modelos de ajuste aplicáveis a diferentes fenômenos. Neste trabalho serão discutidos apenas os principais. O ajuste de um modelo teórico ao semivariograma experimental é um dos aspectos mais importantes das aplicações da Teoria das Variáveis Regionalizadas e pode ser uma das maiores fontes de ambigüidade e polêmica nessas aplicações. Todos os cálculos de geoestatística dependem do valor do modelo do semivariograma para cada distância especificada (Vieira et al., 1981). Por isso, se o modelo ajustado estiver errado, todos os cálculos seguintes também o estarão. Um outro ponto importante é que o ajuste de curvas com calculadoras ou computador, usando métodos automáticos, embora possa ser usado, não é necessário. Existem programas comerciais que fazem ajuste pelo método dos quadrados mínimos, considerando o número de pares como pesos nas ponderações. Da mesma maneira, esses também podem ser usados, embora não seja necessário. O método de tentativa e erro, aliado ao exame dos resultados do "jack- knifing", como será visto no último capítulo deste trabalho, são suficientes. Como regra, quanto mais simples puder ser o modelo ajustado, melhor, e não se deve dar importância excessiva a pequenas flutuações que podem ser artifícios referentes a um pequeno número de dados. É importante que o modelo ajustado represente a tendência de γ(h) em relação a h. Matemática e estatisticamente, é obrigatório que o modelo ajustado tenha positividade definida condicional (Journel & Huijbregts, 1978), embora o significado desta exigência esteja além dos objetivos deste trabalho. Além disso, essa condição não é fácil de entender nem de testar. A grosso modo, o modelo que satisfaça a condição acima garantirá que γ(h) > 0 e γ(-h) = γ(h), qualquer que seja h. De qualquer modo, os modelos apresentados neste trabalho satisfazem a exigência de positividade definida condicional e são suficientes para praticamente qualquer situação. Dependendo do comportamento de γ(h) para altos valores de h, os modelos podem ser classificados em: modelos com patamar ("sill") e modelos sem patamar. 3.1 Modelos com patamar Nos modelos seguintes, C0 é o efeito pepita, C0 + C1 é o patamar e a é o alcance do semivariograma. a) Modelo linear: γ γ (h) = C + Ca h 0 <h < a (h) = C + C h >a 0 1 0 1 (22) onde C1/a é o coeficiente angular para 0<h<a. Nesse modelo, o patamar é determinado por inspeção; o coeficiente angular, C1/a, é determinado pela inclinação da reta que passa pelos primeiros pontos de γ(h), dando-se maior peso àqueles que correspondem ao maior número de pares; o efeito pepita, C0, é determinado pela interseção da reta no eixo γ(h); o alcance, a, é o valor de h correspondente ao cruzamento da reta inicial com o patamar; e C1 = patamar - C0. b) Modelo esférico: γ γ (h) = C + C [ 32 ( h a )- 1 2 ( h a ) ] 0 < h <a (h) = C + C h >a 0 1 3 0 1 (23) O modelo esférico é obtido selecionando-se os valores do efeito pepita, C0, e do patamar, C0 + C1, depois passando-se uma reta que intercepte o eixo y em C0 e seja tangente aos primeiros pontos próximos de h=0. Essa reta cruzará o patamar à distância, a'=2/3 a. Assim, o alcance, a, será a=3a'/2. O modelo esférico é linear até aproximadamente 1/3 a. c) Modelo exponencial: γ (h) = C + C [1- (-3 h a )] 0 < h < d 0 1 exp (24) onde d é a máxima distância na qual o semivariograma é definido. Uma diferença fundamental entre o modelo exponencial e o esférico é que o exponencial atinge o patamar apenas assintóticamente, enquanto que o modelo esférico o atinge no valor do alcance. O parâmetro a é determinado visualmente como a distância após a qual o semivariograma se estabiliza. Os parâmetros C e C0 1 para os modelos exponencial e gaussiano (explicado a seguir) são determinados da mesma maneira que para o esférico. d) Modelo gaussiano: γ (h) = C + C [1- (-3 ( h a ) )] 0 < h < d0 1 2 exp (25) 3.2. Modelos sem patamar Esses modelos correspondem a fenômenos que têm uma capacidade infinita de dispersão e, por isso, não têm variância finita e a covariância não pode ser definida. Podem ser escritos da seguinte maneira : (26) γ (h) = C + Ah 0 < B < 2B O parâmetro B tem que ser estritamente maior que zero e menor que 2, a fim de garantir que o semivariograma tenha positividade definida condicional. Alguns fenômenos podem ter semivariogramas que mostram estrutura entrelaçada, ou seja, mais de um patamar e mais de um alcance. Isso acontece quando se tem diferentes escalas de variabilidade nos dados. McBratney et al. (1982), analisando a variabilidade de teores de cobre e cobalto extraídos de amostras retiradas da superfície do solo do sudoeste da Escócia, encontraram três estruturas: uma correspondente à variação de uma fazenda a outra, com alcance de 3 km, uma correspondente à escala geológica, com alcance de 15 km, e a última espacialmente independente, ou efeito pepita puro. Em situações como essa é necessário ajustar mais de um modelo, ou um modelo para cada estrutura, pois um modelo único não é suficiente para representar o semivariograma. 4. Os exemplos Dois conjuntos de dados obtidos por Waynick e Sharp (1919) serão utilizados neste trabalho como exemplo. A figura 2 mostra o diagrama das áreas amostradas, com os locais de onde as amostras foram tomadas. Os autores esclarecem que os campos foram amostrados na forma apresentada na figura 2, com a finalidade de verificar o efeito da distância entre amostras na variabilidade. Dois campos foram amostrados no Estado da Califórnia, EUA. Um, na então chamada Fazenda Universitária em Davis, em solo franco argiloso, e o outro, perto da cidade de Oakley, em solo arenoso. Os campos foram selecionados por parecerem uniformes e porque se encontravam sem vegetação na época da amostragem. Ambos eram quase perfeitamente planos. As amostras foram coletadas com um trado de 7,62cm de diâmetro e levadas ao laboratório para análise de nitrogênio e carbono totais. Os resultados são dados em porcentagem. Os dados originais estão listados no apêndice 1 e os principais momentos estatísticos estão no quadro 1. Os coeficientes de simetria e curtose são apresentados no quadro 1, para comparação com a distribuição normal, para a qual esses coeficientes têm valores 0 e 3 respectivamente. Não é intenção, neste trabalho, procurar a distribuição exata das variáveis estudadas. Entretanto, é importante notar que, exceto para nitrogênio-Davis, as demais variáveis têm distribuição diferente da normal. Isso pode ser visto principalmente pelos altos coeficientes de curtose, indicando um excesso de valores próximos à média. Outro fato notável é a baixíssima variância. Com a finalidade de comparar os semivariogramas e, conseqüentemente, as variabilidades espaciais de cada uma das variáveis, pode-se realizar do seu escalonamento, como o utilizado por Vieira et al. (1991). Os semivariogramas escalonados médios para as quatro variáveis (C e N nos dois locais) estão mostrados na figura 3. É chamado de semivariograma médio porque a direção dos vetores h não é considerada e, implicitamente, assume-se isotropia,ou seja, variabilidade idêntica em todas as direções. Esse deve ser o procedimento adotado como rotina, pois é inútil explorar a anisotropia quando não existe dependência espacial na média. Após o exame dos semivariogramas médios, se a dependência espacial for encontrada, então deve-se examinar os semivariogramas direcionais. O exame dos semivariogramas da figura 3 revela alguns fatos importantes. Deduz-se que a variabilidade espacial das duas variáveis (carbono e nitrogênio), nos dois locais (Davis e Oakley), têm alguma semelhança. Em geral, pode-se notar também que as duas variáveis têm semivariâncias maiores no solo arenoso de Oakley do que no solo franco argiloso de Davis. Um outro fato bastante importante é que nenhum desses semivariogramas tem patamar bem definido, denotando a falta de estacionaridade nestes dados. Os semivariogramas para as relações C/N para os dois locais estão na figura 4, onde se observa que, para Oakley, não existe dependência espacial para esta variável e, para Davis, a dependência espacial é pequena, como se pode notar pelo alto valor do efeito pepita em relação ao patamar. Assim, para Oakley, os valores da relação C/N não tem nenhuma relação com seus vizinhos, isto é, valores próximos não são necessariamente mais parecidos entre si do que valores distantes. Nesse caso, o valor médio pode representar o fenômeno. Devido à aparente falta de estacionaridade para carbono e nitrogênio para os dois locais, como indicado na figura 3, devem ser calculadas as superfícies parabólicas de tendências de acordo com Davis (1973), usando a equação, (27) est 0 1 2 3 2 4 2 5 Z (x, y) = A + A .x + A .y+ A .x + A .y + A .xy pelo método dos quadrados mínimos. Dessa maneira, pode-se calcular o resíduo (28) res est Z (x,y) = Z(x, y) - Z (x,y) Os semivariogramas da variável Zres devem ter patamar indicando que o procedimento para remoção da tendência foi eficiente. Os semivariogramas resultantes dos resíduos da tendência para carbono e nitrogênio para os dois locais, estão mostrados na figura 5. De seu exame pode-se deduzir que a maior tendência existia, na realidade, para os dados relativos ao solo de Davis, pois nas figuras 5a e 5c pode-se ver que os semivariogramas para Zres têm um patamar bem definido, quando antes não o tinham. Por outro lado, para o solo de Oakley, os semivariogramas para Z e Zres são quase idênticos, indicando que não havia tendência retirável pela superfície parabólica. Nesse caso, pode-se usar os dados originais sem problema; porém, para dar condições iguais aos de Davis, quando escalonados, os resíduos serão usados A figura 6 mostra os semivariogramas para os resíduos de tendência para carbono e nitrogênio de ambos os solos. É notável tanto o efeito da remoção da tendência, estabelecendo nitidamente o patamar, como também a semelhança nas variabilidades de carbono para os dois locais e de nitrogênio para os dois locais . O carbono apresenta uma variabilidade inicial maior do que o nitrogênio, como indica o valor do efeito pepita (0,4). Já o nitrogênio tem efeito pepita nulo em ambos os solos. Pela semelhança entre esses semivariogramas escalonados, pode-se dizer que, apesar das diferenças básicas de textura dos dois solos, os fenômenos que regeram a concentração desses elementos no solo foram parecidos, fazendo com que suas variabilidades fossem parecidas. É provável que o efeito climático ao longo dos anos tenha sido o maior responsável por estas concentrações, uma vez que os locais amostrados estavam livres de vegetação na época da amostragem. O semivariograma para a relação C/N para Davis está na figura 7, com um modelo esférico (Esf), com 0,3 de efeito pepita, 1,0 de patamar e 25,0 m de alcance. A relação C/N não apresenta uma dependência espacial muito boa, implicando alta incerteza na estimativa pela krigagem, devido à alta variação ao acaso em distâncias pequenas, mas não se pode negar que ela existe. IV. A KRIGAGEM Conhecido o semivariograma da variável, e havendo dependência espacial entre as amostras, como mostram os semivariogramas para C e N, para Davis e Oakley (Figura 6), pode-se interpolar valores em qualquer posição no campo de estudo, sem tendência e com variância mínima. O método de interpolação chama-se krigagem, nome dado por Matheron (1963) em homenagem ao matemático sul-africano Krige. Suponha-se, então, que se queira expressar o resultado do trabalho em forma de mapa de isolinhas ou de superfície tridimensional. A precisão da localização das isolinhas entre dois pontos é extremamente dependente da densidade de pontos por área e, conseqüentemente, da distância entre os pontos. A maneira mais comum de localizar uma isolinha entre dois pontos é pela interpolação linear. Existem programas de computador para se ajustar polinômios bidimensionais, chamados superfície de tendência (“trend surface”; Davis, 1973). Entretanto, a forma na qual os dados variam de um local para outro no campo não tem, necessariamente, que seguir equações lineares ou polinômios. Na verdade, é comumente impossível determinar com exatidão que tipo de equação matemática descreve a variação dos dados no campo. E, mesmo que se consiga, na prática, ajustar algum polinômio aos dados, sua forma e grau podem não ter nenhuma interpretação física para o fenômeno, fato que é revelado no semivariograma, embora não se conheça a equação que descreveria os dados. Os dados de Waynick e Sharp (1919) usados nesse trabalho foram amostrados na distância básica de 9,12m, com uma minoria de amostras a 4,56m e 3,04m umas das outras. A distância de 9,12m é muito grande para se ter uma boa precisão na localização de isolinhas, e ficaria bem mais fácil se houvesse mais dois pontos entre os amostrados a 9,12m. Isso significa ter um espaçamento básico de 3,04m para todo o campo. O pesquisador que fosse começar esse experimento poderia ter a opção de amostrar já no espaçamento de 3,04m. Porém, essa seria uma opção muito cara, e a krigagem pode estimar valores nesse ou qualquer outro espaçamento menor, sem gastos de amostragem, análise e processamento, e sem tendência e com variância mínima, como será visto a seguir. 1. O estimador Suponha-se que se queira estimar valores, z*, para qualquer local, x0, onde não se tem valores medidos, e que a estimativa deve ser uma combinação linear dos valores medidos, ou seja (29) )( x = )x(* ii N 1i= 0 zλ∑z onde N é o número de valores medidos, z(xi), envolvidos na estimativa, e λi são os pesos associados a cada valor medido, z(xi). A determinação do número de vizinhos envolvidos na estimativa de um valor constitui-se em assunto complexo e merece ser tratado separadamente, o que se fará no capítulo VIII deste trabalho. Tomando-se z(xi) como uma realização da função aleatória Z(xi) e, por hora, assumindo estacionaridade de ordem 2, o estimador fica, )xi Z(i N 1=i = )x0(*Z λ∑ (30) Note-se que o estimador anterior não apresenta nada de novidade pois praticamente todos os métodos de interpolação seguem essa forma. Por exemplo, na interpolação linear os pesos são todos iguais a 1/N, e na interpolação baseada no inverso do quadrado das distâncias os pesos recebem valores variáveis de acordo com o inverso do quadrado da distância que separa o valor interpolado dos valores medidos usados. No método da krigagem, os pesos são variáveis de acordo com a variabilidade espacial expressa no semivariograma. Esse estimador nada mais é que uma média móvel ponderada. O que torna a krigagem um interpolador ótimo, então, é a maneira como os pesos são distribuídos, como será visto a seguir. 2. As condições requeridas Para que o estimador seja ótimo, ele não pode ser tendencioso e deve ter variância mínima. Matematicamente, (31) E {Z *( x ) - Z( x )} = 00 0 e (32) mínima = })]x Z(- )x(*{[Z E = )}xZ(-)x (*{Z VAR 20000As equações (31) e (32) representam as condições de não-tendência e de variância mínima, respectivamente. Essas duas condições devem ser rigorosamente satisfeitas e, para tanto, são usadas como ponto de partida para a dedução das equações. A condição de não- tendência significa que, em média, a diferença entre valores estimados e medidos para o mesmo ponto deve ser nula. A condição de variância mínima significa que, embora possam existir diferenças ponto por ponto entre o valor estimado e o medido, essas diferenças devem ser mínimas. À primeira vista, pode parecer estranho quando se fala em diferenças entre valor estimado e medido, quando o propósito da krigagem é justamente estimar valores para locais onde estes não foram medidos. Porém, as condições impostas nas equações (31) e (32) são feitas tendo- se em mente o que poderia acontecer se o valor naquele ponto fosse conhecido. Em outras palavras, o objetivo é que a estimativa represente, o melhor possível, o que seria o valor medido para aquele local. Na verdade, essas duas condições e o raciocínio anterior constituem o princípio básico do "jack-knifing", que será discutido no capítulo IX deste trabalho. 3. A dedução do sistema de equações O raciocínio geral na dedução do sistema de equações da krigagem envolve aplicação da fórmula do estimador (equação (30)) na condição de não tendência, encontrando-se a primeira restrição imposta nos pesos. Em seguida, aplicando-se esta restrição na condição de variância mínima e empregando técnicas de Lagrange para minimização de equações, chega-se ao sistema de equações da krigagem. Esta dedução será mantida com todos os detalhes para facilidade de acompanhamento e compreensão. Substituindo-se a equação (30) na equação (31) tem-se: 0=)}x0Z(-)xi Z(i N 1=i { E = )}x0Z(-)x0(Z*{ E λ∑ (33) Aplicando a linearidade do operador valor esperado, E, tem-se: 0=)}x0{Z( E-)}xi{Z( E i N 1=i { = )}x0Z(-)x0(Z*{ E λ∑ (34) Substituindo-se a primeira condição de estacionaridade, expressa na equação (5), tem-se 0=1) - i N 1=i ( m =} m - m i N 1=i { = )}x0Z(-)x0(Z*{ E λλ ∑∑ (35) Para que a equação (35) seja verdade para qualquer valor de m, é necessário que 0=1- i N 1=i λ∑ ou seja, 1 i N 1=i =∑λ (36) Portanto, para que a estimativa não tenha tendência, é necessário que a soma dos pesos seja igual a 1, qualquer que seja a distribuição de seus valores. Desenvolvendo a equação (32) e chamando-a de σ2kZ(x0), variância da estimativa, tem-se: (37) K 2 * * 0 0 0 2 * 0 2 0 * 0 0 Z ( (x ) = E {Z x ) - Z( x ) } = = E { Z ( x )+Z ( x )-2 Z ( x ) Z( )}x2 σ Cada termo do lado direito da equação (37) será individualmente desenvolvido a seguir. Substituindo-se a equação (30), no primeiro termo, })2)xi Z(i N 1=i {( E = )}x0(Z*2{ E λ∑ (38) Aplicando-se propriedades de operações com álgebra linear tem-se: (39) )}x j Z()x i{Z( E j i N 1=j N 1=i = )}x j Z()x i Z(j N 1=j i N 1=i { E= )}x j Z(j N i=j )x i Z(i N 1=i { E = )}x 0(Z * 2{ E λλ λλ λλ ∑∑ ∑∑ ∑∑ A equação (6) pode ser reordenada para C(h)= E{Z( x )Z( x + h)} - mi i 2 (40) E {Z( x ) Z( x + h)} = C(h) + mi i 2 Substituindo-se a equação (40) na equação (39), tem-se: (41) E {Z ( x )} = C( x ,x ) + m2* 0 i=1 N j=1 N i j i j 2∑ ∑ λ λ onde C(xi, xj) refere-se à função covariância correspondente a um vetor h, com origem em xi e extremidade em xj. O segundo termo no lado direito da equação (37) é: (42) E {Z ( x )} = E {Z(x )Z( x +0)}2 0 0 0 Substituindo a equação (40) na equação (42) para o valor apropriado de h tem-se: (43) E {Z ( x )} = C(0) + m 2 0 2 O terceiro termo no lado direito da equação (37) é: )}x0 Z()xi{Z( E i N 1=i = )}x0 Z()xi Z(i N 1=i { E = )}x0)Z(x0(Z*{ E λ λ ∑ ∑ (44) Substituindo-se a equação (40) na equação (44), tem-se: ]m2 + )x0 ,xi[C( i N 1=i = )}x0 Z()x0(Z*{ E λ ∑ (45) Substituindo-se as equações (41), (43) e (45) na equação (37), tem-se: )m2 + )x0 ,xiC( i N 1=i ( 2- m2 + C(0) + m2 + )x j ,xiC( ji N 1=j N 1=i = )x0Z(2k λ λλσ ∑ ∑∑ ou simplificando: )]x0 ,xiC( i N 1=i [ 2- C(0) + )x j ,xiC( ji N 1=j N 1=i = )x0Z(2k λ λλσ ∑ ∑∑ (46) A equação (46) deve ser minimizada sob a restrição de que 1 = i N 1=i λ∑ Esse processo de minimização pode ser feito pelas técnicas de Lagrange, as quais podem ser encontradas em livros de cálculo avançado. Para satisfazer a condição expressa na equação (32), é preciso que as N derivadas parciais λλµσ i / )1 N 1=i 2-)x0(2( k ∂∑∂ (47) sejam igualadas a 0 (zero); µ é um multiplicador de Lagrange. Assim, se a derivada parcial expressa na equação (47) for efetuada obtém-se, 0= 2 - )x0 ,xi2C( - )x j ,xiC( i N 1=i 2 µλ∑ (48) Cancelando o fator 2, rearranjando e combinando com a equação (36), tem-se o sistema de krigagem expresso em termos de função covariância: 1 = j N 1=j N a 1=i ),x0 ,xiC( = - )x j ,xiC( j N 1=j λ µλ ∑ ∑ (49) As primeiras N equações no sistema (49) podem ser rearranjadas em: )x0 ,xiC( + = )x j ,xiC( j N 1=j µλ∑ (50) Substituindo a equação (50) na equação (46), tem-se: )x0 ,xiC(i N 1=i -+C(0) = )x0Z(2k )x0 ,xiC(i N 1=i 2-)x0 ,xiC(i N 1=i ++C(0) = )x0Z(2k )x0 ,xiC( i N 1=i 2-C(0)+))x0 ,xiC(+(i N 1=i = )x0Z(2k λµσ λλµσ λµλσ ∑ ∑∑ ∑∑ (51) A equação (51) é expressão da variância mínima da estimativa. Quando a estacionaridade de ordem 2 puder ser aceita, o sistema krigagem (49) e a variância da estimativa expressa na equação (51) podem ser escritos ambos na forma de função covariância, C(h), ou de semivariograma, γ(h). Existem algumas vantagens computacionais em se usar covariância, que serão discutidas no final deste capítulo. Entretanto, se a hipótese intrínseca for o máximo que se puder assumir, então, obrigatoriamente, tem-se que usar o semivariograma, γ(h), nas equações (50) e (51). A transformação do sistema de krigagem (49) e da variância da estimativa (51), em termos de semivariograma, pode ser feita através da equação (13), substituindo-se C(h) por C(0) - γ(h). Assim, o sistema de krigagem fica: (52) 1 = j N 1=j N a 1=i ),x0 ,xi( = +)x j ,xi(j N 1=j λ γµγλ ∑ ∑ e a variância da estimativa, σ2k Z(x0), fica )x0 ,xi(i N 1=i + = )x0Z(2k γλµσ ∑ (53) Os sistemas (49) e (52) contêm N+1 equações e N+1 incógnitas, e uma única solução produz N pesos, λ, e um multiplicador de Lagrange, µ. 4. Sistema matricial O sistema de krigagem da equação (49) pode ser escrito em notação matricial como [C] [ ] = [b]λ (54) ou, quando se usa semivariograma, [ ] [ ] = [b]γ λ (55) cujas soluções são (56) [ ]= [C ] [b]-1λ ou (57) [ ]= [ ] [b] -1λ γ onde, [C] é a matriz covariância, [γ] é a matriz semivariância, [C]-1 e [γ]-1 são seus inversos, respectivamente, [λ] é a matriz dos pesos procurados λi, e [b] é o lado direito das equações (49) ou (52), quando se usa C(h) ou γ(h), respectivamente. As equações (51) e (53), da variância da estimativa, podem ser expressas em notação matricial, como (58) [b] ][ - C(0) = )xZ(o t02k λ ou (59) [b] ][ = )xZ(o t02k λ respectivamente, quando se usa C(h) ou γ(h). A matriz [λ]t é o transposto da matriz [λ]. Suponha que N=4. Então as matrizes [C] e [γ] são matrizes 5x5 e podem ser, explicitamente, escritas como (60) ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ 01111 1)x,xC()x,xC()x,xC()x,xC( 1)x,xC()x,xC()x,xC()x,xC( 1)x,xC()x,xC()x,xC()x,xC( 1)x,xC()x,xC()x,xC()x,xC( =[C] 44342414 43332313 42322212 41312111 ou (61) ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ 01111 1)x,x()x,x()x,x()x,x( 1)x,x()x,x()x,x()x,x( 1)x,x()x,x()x,x()x,x( 1)x,x()x,x()x,x()x,x( =][ 44342414 43332313 42322212 41312111 γγγγ γγγγ γγγγ γγγγ γ A matriz de lâmbdas [ ] podeser escrita como λ (62) ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ µ λ λ λ λ λ - =] [ 4 3 2 1 ou (63) ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ µ λ λ λ λ λ 4 3 2 1 =] [ E a matriz do lado direito dos sistemas de krigeagem pode ser escrita como, (64) ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ 0 )x,xC( )x,xC( )x,xC( )x,xC( =[b] 04 03 02 01 ou (65) ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ 0 )x,x( )x,x( )x,x( )x,x( =[b] 04 03 02 01 γ γ γ γ respectivamente, quando se usa C(h) ou γ(h). 5. Particularidades do sistema e métodos de solução Os sistemas de krigagem das equações (49) e (52) têm algumas particularidades que facilitam grandemente os cálculos e a solução do sistema e mesmo a análise de esquemas de amostragem. É preciso lembrar que, para cada estimativa ou interpolação efetuada, ter-se-á um sistema de equações de krigagem para o qual ter-se-á que achar a solução. Essa operação é a que envolve o maior tempo de processamento de computador, e quando esse tempo é pago, é a operação que envolve os maiores custos. Por isto, é imprescindível que se faça uso das particularidades do sistema de krigagem para aumentar eficiência, precisão e velocidade e diminuir custo de estimativa. Primeiramente serão examinadas as particularidades da matriz de coeficientes, ou seja, as matrizes covariância ou semivariograma, expressas em (60) e (61) para o caso particular de N=4. Tanto as funções covariância, C(h), ou semivariograma, γ(h), são simétricas ao redor de zero (0). Isso significa que C(h)=C(-h) e γ(h)=γ(-h). Isso faz com que as matrizes (60) e (61) sejam simétricas, isto é, a parte que fica acima da diagonal principal é exatamente igual à parte que fica abaixo dela, porque C(x1, x , x3) = C(x3 1) ou γ(x1 3 1, x ) = γ(x3, x ). Uma outra particularidade importante é a diagonal principal, a qual deve ser preenchida com valores de C(h) ou γ(h), correspondentes a vetores nulos, isto é, para h=0. Isso faz com que a diagonal principal para a matriz (60) tenha valores máximos e iguais a C(0) e para a matriz (61) tenha zeros (0). Isso acontece porque C(0) é o máximo valor da função covariância e é igual ao patamar do semivariograma, e γ(0)=0 qualquer que seja o efeito pepita, C(0). Esta afirmação pode parecer estranha, mas o que deve ser mantido é que γ(0)=0, e γ(e) = C(0) (efeito pepita), onde e é a menor distância entre amostras. Existem vários métodos de solução de sistemas lineares de equação como o do sistema de krigagem (Burden et al., 1978, pag. 299 a 361), como também existem métodos mais eficientes que levam em conta as particularidades das matrizes (Journel e Huijbregts, 1978, pag. 357 a 360). O método mais comum seria o de inverter a matriz de coeficientes, (60) ou (61), e multiplicar do lado direito. Porém esse é também o método mais demorado em termos de tempo de processamento e o que envolve o maior número de operações de multiplicação/divisão e soma/subtração e, por isso, é também o que apresenta a maior propagação de erros. O método de eliminação Gaussiana envolve um número bastante menor de operações e, por isso mesmo, é mais rápido e mais preciso. Esse método procura, primeiramente, o elemento chamado pivô, o qual é o valor máximo encontrado em cada coluna da matriz. Desse modo, se for usada a covariância, C(h), no sistema de krigagem, poder-se-á eliminar essa operação de procura do pivô, pois na matriz de covariância (60) a diagonal sempre vai conter o elemento máximo. Quanto à ressalva de estacionaridade de ordem 2 e conseqüente existência de covariância finita, Journel & Huijbregts, (1978, pag. 357) recomendam que se pode definir uma função pseudocovariância C(h)=A - γ(h), onde A é uma constante maior que qualquer γ(h) usado no sistema. Devido à condição de não tendência, (Σλi=1), o valor A será eliminado do sistema da krigagem, e esta operação não altera os valores dos pesos calculados na solução. 6. Os exemplos Uma vez que existe uma distância bastante grande entre os pontos medidos, com alguns pontos mais próximos (Figura 2), é desejável fazer estimativas para os locais não medidos, para construção de mapas. Além disso, graças à existência de dependência espacial, expressa pelos semivariogramas da Figura 6, pode-se utilizar krigagem para efetuar as estimativas. Dessa maneira, foram estimados valores para cada ponto localizado na grade quadrada de 1,52m, regularizando assim a distância de separação entre amostras em todo o campo. Usando-se esses dados para cada uma das variáveis, construíram-se os mapas de isolinhas para cada uma das variáveis, mostrados nas Figuras 8, 9, 10 e 11. Com esses mapas pode-se ver agora, por exemplo, porque o carbono e nitrogênio para o solo de Davis têm semivariogramas parecidos, pois variam de maneiras muito semelhantes. Isso pode ser observado nas figuras 8 e 9, respectivamente para carbono e nitrogênio para o solo de Davis, onde, para quase todas situações de máximo ou de mínimo para carbono, corresponde uma situação igual para nitrogênio. Outro fato notório nas Figuras 8 e 9 é a tendência de crescimento na direção y, o que confirma a tendência encontrada. Join for free LoginDownload full-text PDF Advertisement 19/11/21, 09:38 Página 1 de 1
Compartilhar