Buscar

(PDF) Geoestatistica em estudos de variabilidade espacial do solo. In NOVAIS, R. F et al (Eds)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Article PDF Available
Geoestatística em estudos de
variabilidade espacial do solo. In:
NOVAIS, R. F et al (Eds)
January 2000
Authors:
Discover the world's research
20+ million members
135+ million publications
700k+ research projects
Content uploaded by Sidney Rosa Vieira
Content may be subject to copyright.
Sidney Rosa Vieira
Instituto Agronômico de Campinas
Citations (535) References (42)
Join for free
Public Full-text 1
Author content
 
 
 
 
 GEOESTATÍSTICA EM ESTUDOS DE VARIABILIDADE ESPACIAL DO SOLO1
 
 
 Sidney R. Vieira2
 
 
 
 Resumo 
 
 
 
 Quando uma determinada propriedade varia de um local para outro com algum 
grau de organização ou continuidade, expresso pela dependência espacial, a estatística clássica 
deve ser abandonada e dar lugar a uma estatística relativamente nova: a geoestatística. Por 
estatística clássica entende-se aquela que utiliza parâmetros como média e desvio padrão para 
representar um fenômeno, e baseia-se na hipótese principal de que as variações de um local para 
outro são aleatórias. Desse modo, esses dois ramos da estatística têm validade de aplicação em 
condições perfeitamente distintas. Para se determinar qual das duas deve ser usada em cada caso, 
utiliza-se o semivariograma que expressa a dependência espacial entre as amostras. Havendo 
dependência espacial, pode-se estimar valores da propriedade em estudo para os locais não 
amostrados dentro do campo, sem tendenciosidade e com variância mínima, pelo método 
denominado krigagem. Além disso, muitas vezes, duas propriedades correlacionam-se entre si e 
no espaço, e uma é mais difícil ou mais cara para se medir no campo. A dependência espacial 
entre duas propriedades no espaço pode ser expressa pelo semivariograma cruzado, e se ele 
existir, o método chamado co-krigagem pode ser utilizado para estimar aquela mais difícil de se 
medir, utilizando-se os dados de ambas. Estes métodos oferecem a escolha de se medir a 
propriedade mais difícil com um número mínimo possível. A construção de mapas de contornos 
(isolinhas), e o delineamento de espaçamento e disposição ótima de amostras no campo são outras 
aplicações imediatas. Neste trabalho procurou-se dar o maior detalhamento possível nos aspectos 
teóricos e nos conceitos básicos de geoestatística, numa linguagem simples e compreensível ao 
leitor. Para ilustrar, utilizaram-se dados da literatura, como exemplo aplicativo para propriedades 
químicas de solo. Os dados e os programas de geoestatística utilizados estão listados em apêndice 
no final do trabalho. 
 
Termos de indexação: semivariogramas, krigagem, co-krigagem, “jack-knifing” 
 
ABSTRACT: GEOSTATISTICS IN SOIL SPATIAL VARIABILITY STUDIES 
 
 
 When a given soil property varies from place to place with some degree of 
continuity, as expressed through its autocorrelation, classical statistical analysis is not valid and a 
relatively new tool in soil science called geostatistics must be used. Classical statistical is 
understood as that which uses such parameters as mean and standard deviation, to represent a 
phenomenon and is based on the principal hypothesis that spatial variation is random. These 
 
1 Recebido para publicação em e aceito em
2 Pesquisador, Centro de Solos e Recursos Agroambientais, Instituto Agronômico, Caixa Postal 
28 - 13001-970, Campinas, SP. Email: sidney@cec.iac.br 
 
 
 
aspects of statistics are applicable in perfectly distinct circunstances. In order to determine which 
should be used in which instance, semivariograms are used to show autocorrelation among 
samples. Autocorrelation allows estimation of values for places not sampled in the field, without 
bias and with minimum variance, with the kriging method. Furthermore, two properties may have 
spatial autocorrelation with each other, and one may be more difficult or more expensive to 
measure in the field. Spatial autocorrelation between two properties can be expressed with cross-
semivariograms, and in some cases, the co-kriging method can be used to estimate the property 
more difficult to measure, thus using both measures. This method allow selection of the most 
difficult property to measure with the lowest possible number of samples. Immediate applications 
of these methods are the creation of contour maps and delineation of optimal spacing of field 
samples. This paper seeks to provide a high level of detail about theoretical aspects and basic 
concepts of geostatistics in a comprehensible format to the reader. As examples, data available 
from the literature are used for applications of soil chemical properties. The data and geoestatistics 
programs used in this paper are listed in appendices at the end of the paper. 
 
 
Index terms: semivariograms, kriging, co-kriging, “jack-knifing”. 
 
 
 
ÍNDICE 
RESUMO 
 
ABSTRACT 
 
I. INTRODUÇÃO 
 1. Variabilidade: preocupação antiga 
 2. Repetição e casualização: Fisher entra em cena 
 3. Das minas de ouro da África do Sul para Fontainebleau na França: nasce a geoestatística 
 4. Da mineração à Geologia, Dendrologia, Hidrologia e Ciência do Solo: e a moda pega 
 5. Os objetivos e as ressalvas 
 
II. AS HIPÓTESES 
 1. Campo de estudo: o domínio e as definições básicas 
 2. Hipótese de estacionaridade de ordem 2 
3. Hipótese intrínseca 
 4. Hipótese de tendência: krigagem universal 
 
III. O SEMIVARIOGRAMA 
 1. A equação de cálculo 
 2. As características ideais 
3. Os modelos 
4. Os exemplos 
 
IV. A KRIGAGEM 
1. O estimador 
 2. As condições requeridas 
 3. A dedução do sistema de equações 
4. Sistema matricial 
 5. Particularidades do sistema e métodos de solução 
6. Os exemplos 
 
 V. O SEMIVARIOGRAMA CRUZADO 
 1. As definições pertinentes 
 2. A equação de cálculo 
 3. As características ideais 
4. Os exemplos 
 
VI. A CO-KRIGAGEM 
1. O estimador 
 2. As condições requeridas 
 3. A dedução do sistema de equações 
 4. Sistema matricial 
5. Os exemplos 
 
VII. A VARIÂNCIA DA ESTIMATIVA 
1. Significado 
2. Utilidade 
 
 
 
 
VIII. A VIZINHANÇA USADA NA ESTIMATIVA 
1. Vizinhança única 
2. Distância constante 
 3. Número constante de vizinhos 
4. Quadrantes 
 
IX. A AUTOVALIDAÇÃO: UMA PODEROSA FERRAMENTA 
 1. O gráfico 1:1 - Medido vs. Estimado 
 2. O erro absoluto 
 3. O erro reduzido 
4. Os exemplos 
 
X. CONCLUSÕES 
 
XI. LITERATURA CITADA 
 
XII. APÊNDICE 
 1. Listagem dos dados de Waynick & Sharp (1919) 
 
 
 
 
 Lista das figuras 
 
 
 1. Semivariograma típico. 
 2. Esquema de amostragem, onde os sinais "+" indicam posição onde amostras foram 
coletadas. 
 3. Semivariogramas escalonados médios para C e N, para dados originais, nos dois locais. 
 4. Semivariogramas escalonados médios para C/N, para dados originais nos dois locais. 
 5. Semivariogramas mostrando o efeito da tendência: (a) carbono – Davis; (b) carbono – 
Oakley; (c) nitrogênio – Davis; (d) nitrogênio - Oakley. 
 6. Semivariogramas para os resíduos de tendência, para os dois locais: (a) carbono, com 
modelo esférico com parâmetros 0,4; 0,6 e 15,0: (b) nitrogênio, com modelo esférico com 
parâmetros 0,0; 1,0 e 25,0. 
 7. Semivariograma escalonado médio para C/N - Davis, com modelo esférico com parâmetros 
0,3; 0,7 e 25,0. 
 8. Mapa para carbono (%), Davis. 
 9. Mapa para carbono (%), Oakley. 
 10. Mapa para nitrogênio (%), Davis. 
 11. Mapa para nitrogênio (%), Oakley. 
 12. Semivariogramas escalonados médios para carbono versus nitrogênio, para Davis e Oakley, 
com modelo gaussiano com parâmetros 0,0, 1,0 e 13,0. 
 13. Mapa para nitrogênio (%), Oakley, obtido por cokrigagem. 
 
 
 
 
 I. INTRODUÇÃO 
 
 
1. Variabilidade: preocupação antiga 
 
 A variabilidade espacial de propriedades do solo vem sendo uma das preocupações de 
pesquisadores, praticamente desde o início do século. Smith (1910) estudou a disposição de 
parcelas no campo em experimentos de rendimento de variedades de milho, numa tentativa de 
eliminar o efeito de variaçõesno solo. Montgomery (1913), preocupado com o efeito do 
nitrogênio no rendimento de trigo, fez um experimento com 224 parcelas nas quais mediu o 
rendimento de grãos. E assim, vários outros, como Robinson e Lloyd (1915) e Pendleton (1919) 
estudaram erros em amostragem e diferenças em solos do mesmo grupo. Waynick (1918) estudou 
a variabilidade espacial da nitrificação no solo. Waynick e Sharp (1919) estudaram o nitrogênio 
total e o carbono no solo, todos com grande intensidade de amostras, nos mais variados esquemas 
de amostragem, mas sempre com a preocupação de caracterizar ou conhecer a variabilidade. 
Numa tentativa de encontrar uma maneira única de analisar uma vasta coleção de dados, Harris 
(1920) utilizou uma equação muito semelhante a que hoje conhecemos como variância de blocos. 
 
 
2. Repetição e casualização: Fisher entra em cena 
 
 É lamentável que experimentos como os anteriormente descritos não tenham tido 
continuidade no tempo, porque é provável que se poderia ter muito mais conhecimento sobre a 
variabilidade hoje. A maior causa dessa descontinuidade foi a adoção de técnicas como 
casualização e repetição, e melhor conhecimento de funções de distribuição, que levaram à adoção 
de amostragem ao acaso, desprezando assim as coordenadas geográficas do ponto amostrado. Esse 
procedimento, somado à distribuição normal de freqüências era, e ainda é, usado para assumir 
independência entre as amostras e assim garantir a validade do uso da média e do desvio padrão 
para representar o fenômeno. Esses conceitos da estatística clássica e seus fundamentos podem ser 
encontrados em Fisher (1956), ou Snedecor & Cochran (1967). 
 
3. Das minas de ouro da África do Sul para Fontainebleau na França: nasce a geoestatística 
 
 A distribuição normal não garante, de maneira alguma, a independência entre amostras, a 
qual pode ser verificada pela autocorrelação. A principal razão para isto é que o cálculo da 
freqüência de distribuição não leva em conta a distância na qual as amostras foram coletadas no 
campo. A presença de dependência espacial requer o uso de um tipo de estatística chamada 
geoestatística, que surgiu na África do Sul, quando Krige (1951), trabalhando com dados de 
concentração de ouro, concluiu que não conseguia encontrar sentido nas variâncias, se não levasse 
em conta a distância entre as amostras. Matheron (1963, 1971), baseado nessas observações, 
desenvolveu uma teoria, a qual ele chamou de Teoria das Variáveis Regionalizadas e que contém 
os fundamentos da geoestatística. Matheron (1963) define Variável Regionalizada como uma 
função espacial numérica, que varia de um local para outro, com uma continuidade aparente e cuja 
variação não pode ser representada por uma função matemática simples. Essa continuidade ou 
dependência espacial pode ser estimada pelo semivariograma. A geoestatística tem um método de 
interpolação chamado krigagem (nome dado por Matheron (1963), em homenagem ao matemático 
sul-africano D. G. Krige), que usa a dependência espacial entre amostras vizinhas, expressa no 
semivariograma, para estimar valores em qualquer posição dentro do campo, sem tendência e com 
 
 
 
variância mínima. Essas duas características fazem da krigagem um interpolador ótimo (Burgess e 
Webster, 1980a). Quando se tem duas variáveis medidas no mesmo campo, com parte dos pontos 
de amostragem ou todos, coincidentes, pode-se avaliar o grau de semelhança da variação das duas 
no espaço, pelo semivariograma cruzado. Um bom exemplo dessas variáveis é o teor de areia e a 
taxa de infiltração, porque se sabe, de antemão, que elas são correlacionadas, ou seja, espera-se 
que nos locais onde o teor de areia é alto, a infiltração também seja alta. Se isso for verdade, o que 
pode ser mostrado pelo semivariograma cruzado, um outro método de interpolação, chamado co-
krigagem, pode ser usado. Sabe-se de antemão que o teor de areia é mais fácil de medir do que a 
infiltração. Assim, seria desejável amostrar-se com menor freqüência o mais difícil, por exemplo a 
cada 50 m, e com maior freqüência o mais fácil, por exemplo a cada 10 m. E assim, usando-se a 
correlação cruzada entre as duas variáveis, pode-se estimar valores da infiltração a cada 10 metros 
ou qualquer outra distância desejável, usando os valores e a correlação cruzada entre ambos, pela 
co-krigagem. Esses dois métodos de interpolação possibilitam a construção de mapas de 
contornos (isolinhas) com alta precisão, uma vez que após a interpolação a densidade espacial dos 
dados será muito maior do que antes, além de oferecer também os limites de confiança para o 
mapa, pela variância da estimativa. Além disso, conhecendo-se os semivariogramas das variáveis 
em estudo e os semivariogramas cruzados daquelas correlacionadas, pode-se usar a krigagem ou a 
co-krigagem para delinear o espaçamento e a disposição de amostras no campo para se obter um 
valor prefixado de variância da estimativa. 
 
 
4. Da mineração à Geologia, Dendrologia, Hidrologia e Ciência do Solo: e a moda pega 
 
 A geoestatística teve suas primeiras aplicações em mineração (Blais e Carlier, 1968; David, 
1970; Ugarte, 1972; Journel, 1974; Olea, 1975, 1977), depois em hidrologia (Delhomme, 1976). 
Já existem vários estudos em ciência do solo (Hajrasuliha et al., 1980; Burgess & Webster, 1980a 
e 1980b; Webster & Burgess, 1980; Vieira et al., 1981; Vauclin et al., 1982; Vieira et al., 1983; 
Nielsen et al., 1983; Vieira et al., 1987, Vieira et al., 1991; Vieira et al., 1992) e em sensoriamento 
remoto (Vauclin et al., 1982; Vieira & Hatfield, 1984). Além disso, existem alguns livros tratando 
do assunto, dentre os quais destacam-se David (1977) e Journel & Huijbregts (1978). 
 
5. Os objetivos e as ressalvas 
 
 O objetivo principal deste trabalho é fornecer ao leitor uma bibliografia em português, em 
linguagem simples e completa, com todos os detalhes teóricos e aplicações da geoestatística. Isto 
se faz necessário pela importância do problema variabilidade espacial, e de um possível método de 
solução e conhecimento, a geoestatística. O nível de detalhes teóricos foi mantido propositalmente 
para auxiliar no acompanhamento e compreensão. A matemática envolvida, embora à primeira 
vista assustadora pelo tamanho das equações, é na maioria das vezes álgebra elementar, 
probabilidade e operações com matrizes. O leitor é encorajado a seguir as deduções, passo a 
passo, o que facilitará grandemente sua compreensão. Um conjunto de dados obtidos da literatura 
será usado como exemplo, listado no apêndice 1. É importante também salientar que o presente 
trabalho não tem por finalidade desencorajar o uso de estatística clássica, a qual tem seu espaço, 
potencialidade e limitações. É justamente nos problemas onde a estatística clássica tem limitações 
que a geoestatística tem suas maiores aplicações. 
 
 
 
 
 II. AS HIPÓTESES 
 
 Todos os conceitos teóricos de geoestatística têm suas bases em funções e variáveis 
aleatórias, as quais, por convenção, recebem símbolos maiúsculos. Os valores medidos recebem 
símbolos minúsculos. É preciso também entender que uma realização em particular de uma 
função é um valor numérico assumido por esta função dentro de uma dada condição fixa. Por 
exemplo, Cos(0) = 1, então 1 é uma realização da função coseno para o ângulo 0 (zero) graus. 
 
 
1. Campos de estudo: o domínio e as definições básicas 
 
 Para o estabelecimento do problema, considere-se um campo de área S, para o qual se tem 
um conjunto de valores medidos {z(xi), i=1, n}, onde xi identifica uma posição no espaço ou no 
tempo, e representa pares de coordenadas (xi, yi). Esse procedimento é usado para simplicidade de 
representação na dedução das equações. O ponto de referência para o sistema de coordenadas é 
arbitrário e fixado a critério do interessado. Para uma dada posição fixa xk, cada valor medido da 
variável em estudo, z(xk), pode ser considerado como uma realização de uma certa variável 
aleatória,Z(xk). A variável regionalizada Z(xk), para qualquer x dentro da área i S, por sua vez 
pode ser considerada uma realização do conjunto de variáveis aleatórias {Z(xi), para qualquer xi 
dentro de S}. Esse conjunto de variáveis aleatórias é chamado uma função aleatória e é 
simbolizado por Z(xi) (Journel e Huijbregts, 1978). 
 O exposto acima se faz necessário porque, pelo fato de uma função aleatória ser contínua, 
pode ser submetida a uma grande gama de hipóteses, sem as quais a dedução de equações é 
impossível. O que se deve esperar é que com pontos discretos de amostragem, se possa satisfazer 
as hipóteses às quais as funções aleatórias estão sujeitas. 
 Com uma única amostragem, tudo o que se sabe de uma função aleatória Z(ki) é uma única 
realização. Então, para se estimar valores para os locais não amostrados, ter-se-á que introduzir a 
restrição de que a variável regionalizada seja, necessariamente, estacionária estatisticamente. 
Formalmente, uma variável regionalizada é estacionária se os momentos estatísticos da variável 
aleatória Z(xi+h) forem os mesmos para qualquer vetor h. De acordo com o número k de 
momentos estatísticos que são constantes, a variável é chamada de estacionária de ordem k. 
Estacionariedade de ordem 2 é tudo que é requerido em geoestatística (Olea, 1975). 
 Supondo-se que a função aleatória Z(xi) tenha valores esperados E{Z(xi)} = m(xi) e 
E{Z(xi+h)} = m(xi+h) e variâncias VAR {Z(xi)} e VAR {Z(xi+h)}, respectivamente, para os locais 
xi e xi+h, e qualquer vetor h, então, a covariância C(xi, xi+h) entre Z(xi) e Z(xi+h) é definida por 
 C( x ,x + h) = E {Z( x ) Z( x + h)} - m( x ) m( x + h) i i i i i i (1) 
 
e o variograma 2γ(xi, xi+h) é definido por 
 (2) 2 ( x ,x + h) = E {Z( x ) - Z( x + h) } i i i i 2γ
 
 A variância de Z(xi) é 
 (3) 
 VAR {Z( x )} = E {Z( ) Z(x x +0) - m( x ) m( x +0)} = 
 
 
 = E { Z ( x )-m ( x )} = C( x ,x )
i i i i i
2 2
i i i i
 
 
 
i
 
e a variância de Z(xi+h) é 
 (4) VAR {Z( x + h)} = E { Z ( x + h) - m ( x + h)} = C ( x + h, x + h)i 2 i 2 i i
 
 Assim, existem três hipóteses de estacionaridade de uma função aleatória Z(xi), e pelo 
menos uma delas deve ser satisfeita antes de se fazer qualquer aplicação de geoestatística. 
 
 
 
2. Hipótese de estacionaridade de ordem 2 
 
 Uma função aleatória Z(xi) é estacionária de ordem 2 se: 
 (5) E {Z( x )} = m i
a) O valor esperado E{Z(xi)} existir e não depender da posição x, ou seja 
para qualquer xi dentro da área S. 
b) Para cada par de variáveis aleatórias, {Z(xi), Z(xi+h)}, a função covariância, C(h), existir e for 
função de h: 
 (6) C(h) = E {Z( x ) Z( x + h)} - m i i 2
para qualquer xi dentro da área S. 
 A equação (6), estacionaridade da covariância, implica na estacionaridade da variância e do 
variograma. Assim, usando a linearidade do operador valor esperado, E, na equação (3), obtém-se: 
 (7) VAR {Z( x )} = E {Z( x +0)} - E {m ( x )}i i 2 i
e aplicando as condições de estacionaridade (5) e (6) obtém-se: 
 (8) VAR {Z( x )} = E {Z ( x )} - m = C(0)i 2 i 2
 O variograma na equação (2) pode ser desenvolvido em: 
 h)}+x(Z + h)+xZ()x( Z2 - )x(Z{ E = (h)2 = h)+x,x(2 i2iii2ii γγ (9) 
 Somando e subtraindo 2m2: 
 (10) 2 (h) = E { Z ( x )-m - 2Z( x ) Z( x + h)+ 2 m + Z ( x + h) - m }2 i 2 i i 2 2 i 2γ
 Usando a linearidade do operador E, e reconhecendo que o valor esperado de uma constante 
é a própria constante tem-se: 
 (11) 2 (h) = E { Z ( x )}- m - 2(E {Z( x )Z( x + h)} - m )+ E {Z ( x + h)} - m2 i 2 i i 2 2 i 2γ
 Substituindo as equações (6) e (8) na equação (11), tem-se: 
 2 (h) = C(0)- 2C(h)+ C(0) = 2 C(0) - 2 C(h)γ (12) 
ou simplificando, 
 γ (h) = C(0) - C(h) (13) 
 Isolando C(h), tem-se: 
 C(h) = C(0) - (h)γ (14) 
 
 
 
 Dividindo ambos os lados por C(0) e reconhecendo que o correlograma ρ(h) = C(h)/C(0): 
ρ
γ
ρ
γ
 (h) = 
C(h)
C(0) = 
C(0)
 C(0) - 
(h)
C(0)
 
 
 (h) = 1 - (h)C(0)
 Portanto, se a hipótese de estacionaridade de ordem 2 puder ser satisfeita, a covariância C(h) 
e o variograma 2γ(h) são ferramentas equivalentes para caracterizar a dependência espacial. A 
existência de estacionaridade dá a oportunidade de repetir um experimento mesmo que as amostras 
devam ser coletadas em pontos diferentes, porque todas são consideradas pertencentes a 
populações com os mesmos momentos estatísticos. 
 
 
3. Hipótese intrínseca 
 
 A hipótese de estacionaridade de ordem 2 implica a existência de uma variância finita dos 
valores medidos, VAR {Z(x)} = C(0). Esta hipótese pode não ser satisfeita para alguns fenômenos 
físicos que têm uma capacidade infinita de dispersão. Exemplos incluem a concentração de ouro 
em minas da África do Sul (Krige, 1951), o movimento browniano (Journel e Huijbregts, 1978) e 
algumas cadeias de Markov (Bartlett, 1966). Para tais situações, uma hipótese menos restritiva, a 
hipótese intrínseca, pode ser aplicável. Essa hipótese requer apenas a existência e estacionaridade 
do variograma, sem nenhuma restrição quanto à existência de variância finita. Uma função 
aleatória é intrínseca quando, além de satisfazer a condição expressa na equação (5), a 
estacionaridade do primeiro momento estatístico, também o incremento {Z(xi i) - Z(x +h)} tem 
variância finita, e não depende de xi para qualquer vetor h.. Matematicamente, isso pode ser 
escrito: 
 (16) { } ]h)+x Z(- )xE[Z( =])h+x Z(- )x [Z( VAR 2iiii
para qualquer xi dentro da área S. 
 Substituindo a equação (2) na equação (16), tem-se: 
 (17) 2 (h) = E[Z( x ) - Z( x + h) ]i i 2γ
 A função γ (h) é o semivariograma. A razão para o prefixo "semi" é que a equação (17) pode 
ser escrita na forma: 
 (18) γ (h) = 1/ 2 E[Z( x ) - Z( x + h) ]i i 2
 O fator 2 foi introduzido na definição do variograma, 2γ(h), para cancelamento e 
simplificação da equação (13) e a quantidade mais freqüentemente usada é γ(h) e não 2γ(h). A 
hipótese intrínseca é, na verdade, a mais freqüentemente usada em geoestatística, principalmente 
por ser a menos restritiva. 
 
 
4. Hipótese de tendência - krigagem universal 
 
 Nesta hipótese, a função aleatória Z(xi), para qualquer posição, xi, consiste de dois 
 
 
 
componentes: 
 (19) ) xe(+)xm(=)xZ( iii
onde m(xi) é o "drift" (tendência principal) e e(xi) é o erro residual. Portanto, para se trabalhar sob 
esta hipótese é preciso, para cada posição xi, determinar o "drift", m(xi), e ter uma expressão para o 
semivariograma dos resíduos (Webster & Burgess, 1980). Devido à arbitrariedade envolvida na 
expressão do "drift" e do semivariograma dos resíduos, não será apresentado aqui nenhum 
desenvolvimento teórico para krigagem universal. Trabalhos sobre este assunto podem ser 
encontrados em Olea (1975 e 1977) e um exemplo de aplicação pode ser visto em Webster & 
Burgess (1980). O leitor é encorajado a consultar essas literaturas para maiores informações. 
 Se uma função aleatória é estacionária de ordem k (k>0), ela também será estacionária de 
todas as ordens menores que k. Consequentemente, se uma função aleatória Z(xi) é estacionária de 
ordem 2, ela será também intrínseca. Entretanto, o contrário não é necessariamente verdade. 
 Não existe um método fácil para testar em qual tipo de estacionaridade os dados se 
enquadram. O exame do semivariograma, como será visto a seguir, e um teste conhecido como 
"jack-knifing", mostrado no capítulo IX deste trabalho, são as principais ferramentas utilizadas 
para se conhecer indiretamente a estacionaridade dos dados. 
 
 III. O SEMIVARIOGRAMA 
 
 
 Até o início dos anos 60, a análise de dados era feita sob a hipótese de independência 
estatística ou distribuição espacial aleatória, para permitir o uso de métodos estatísticos como 
análise de variância e parâmetros como o coeficiente de variação (Harradine, 1949; Ball & 
Williams, 1968). Entretanto, esse tipo de hipótese não pode simplesmente ser feito antes que se 
prove a não existência de correlação deamostras com distância. Se provada a correlação espacial, 
a hipótese de independência fracassa. Um dos métodos mais antigos de se estimar a dependência 
no espaço ou no tempo de amostras vizinhas é pelo uso da autocorrelação. Esse método tem suas 
origens em análise de séries temporais e tem sido largamente usado em ciência do solo (Webster, 
1973; Webster & Cuanalo, 1975; Vieira et al., 1981), principalmente para medições efetuadas em 
uma linha reta (transeto). A sua análise pode auxiliar na localização de divisas entre dois tipos de 
solos, ou na análise de periodicidade nos dados, pela análise espectral (Vauclin et al. 1982). 
Porém, quando as amostras forem coletadas nas duas dimensões do campo e interpolação entre 
locais medidos for necessária para a construção de mapas de isolinhas, será preciso usar uma 
ferramenta mais adequada para medir a dependência espacial. Essa ferramenta é o 
semivariograma (Vieira et al., 1983). 
 
1. A equação de cálculo 
 
 O semivariograma é, por definição: 
 (20) }h)+xZ(-)x Z({E 1/2 = (h) 2iiγ
e pode ser estimado por: 
 γ ∗ ∑ (h) = 
1
 2 N(h ) [Z( x ) - Z( x + h) ]i=1
N(h)
i i
2 (21) 
onde N(h) é o número de pares de valores medidos Z(x +h), separados por um vetor h i), Z(xi
(Journel & Huijbregts, 1978, pag. 12). O gráfico de γ*(h) versus os valores correspondentes de h, 
 
 
 
chamado semivariograma, é uma função do vetor h, e portanto depende de ambos, magnitude e 
direção de h. Quando o gráfico do semivariograma é idêntico para qualquer direção de h ele é 
chamado isotrópico e representa uma situação bem mais simples do que quando é anisotrópico. 
Neste último caso, o semivariograma deve sofrer transformações antes de ser usado. É importante 
notar que a maioria das variáveis de ciência do solo poderá ter um comportamento anisotrópico, 
isto é, mudar de maneira diferente para direções diferentes. É óbvio que isso depende muito da 
propriedade em estudo, das dimensões do campo de estudo e do tipo de solo envolvido. Existem 
algumas maneiras de se transformar um semivariograma anisotrópico em isotrópico (Journel & 
Huijbregts, 1978, pag. 175; Burgess & Webster, 1980a). Em geral, a precisão da interpolação ou o 
tipo de hipótese satisfeita não são afetados se, em vez de se preocupar com a escolha do método de 
transformação da anisotropia, apenas se limitar a faixa de distância na qual se utiliza o 
semivariograma. De qualquer maneira, é sempre aconselhável examinar semivariogramas para 
várias direções, antes de tomar decisões. As principais direções que devem ser examinadas são: 0° 
- na direção do eixo X, 90° - na direção do eixo Y, 45° e - 45° - nas duas diagonais. O método 
"jack-knifing", descrito no capítulo IX, é também de grande utilidade para se determinar a faixa de 
distância na qual o semivariograma pode ser, na prática, considerado isotrópico. 
 De qualquer maneira, sob isotropia ou não, a equação (21) é a que é usada para o cálculo do 
semivariograma. Os programas de computador, como aqueles listados no apêndice 2, utilizados 
para calcular o semivariograma, simplesmente calculam aquela equação. Quando os dados forem 
coletados em transeto, o semivariograma é unidirecional e nada pode ser dito a respeito de 
anisotropia, mas por outro lado é uma preocupação a menos. 
 
2. As características ideais 
 
 A figura 1 mostra um semivariograma típico com características bem próximas do ideal, as 
quais serão discutidas a seguir. Seu comportamento representa o que, intuitivamente, se deve 
esperar de dados de campo. É de se esperar que as diferenças {Z(xi) - Z(xi+h)} decresçam assim 
que h, a distância que os separa, decresça. É esperado que medições localizadas próximas sejam 
mais parecidas entre si do que aquelas separadas por grandes distâncias. Dessa maneira, é de se 
esperar que γ(h) aumente com a distância h. Por definição, γ(0)=0, como pode ser visto pela 
equação (21), quando h=0. Entretanto, na prática, à medida que h tende para 0 (zero), γ(h) se 
aproxima de um valor positivo chamado efeito pepita (“nugget effect”) e que recebe o símbolo C0. 
Resultados com valores de efeito pepita maiores que zero foram encontrados para precipitação 
pluvial (Delhomme, 1976), pH (Campbell, 1978), condutância elétrica (Hajrasuliha et al., 1980) e 
distribuição de tamanho de partículas de solo (Vieira et al., 1983). O valor de C0 revela a 
descontinuidade do semivariograma para distâncias menores do que a menor distância entre as 
amostras. Parte dessa descontinuidade pode ser também devida a erros de medição (Delhomme, 
1976), mas é impossível quantificar qual contribui mais, se os erros de medição ou a variabilidade 
em uma escala menor do que aquela amostrada. 
 À medida que h aumenta, γ(h) também aumenta até um valor máximo no qual se estabiliza. 
Esse valor no qual γ(h) se estabiliza chama-se patamar ("sill"), e é aproximadamente igual à 
variância dos dados, VAR(z). A distância na qual γ(h) atinge o patamar é chamada de alcance 
("range"), recebe o denominação de a, e é a distância limite de dependência espacial. Medições 
localizadas a distâncias maiores que a tem distribuição espacial aleatória e por isto são 
independentes entre si. Para essas amostras, a Estatística Clássica pode ser aplicada sem 
restrições. Por outro lado, amostras separadas por distâncias menores que a, são correlacionadas 
umas às outras, o que permite que se faça interpolações para espaçamentos menores do que os 
amostrados. Dessa maneira, o alcance a é a linha divisória para a aplicação de geoestatística ou 
Estatística Clássica, e por isso o cálculo do semivariograma deveria ser feito rotineiramente para 
 
 
 
dados de campo, para garantir as hipóteses estatísticas sob as quais serão analisados. Dados que 
apresentarem semivariogramas semelhantes ao da figura 1 muito provavelmente poderão ser 
estacionários de ordem 2, porque têm um patamar claro e definido e, com toda certeza, estarão sob 
a hipótese intrínseca. 
 Se o semivariograma, ao invés de ser crescente e dependente de h como o mostrado na 
figura 1, for constante e igual ao patamar para qualquer valor de h, então tem-se um efeito pepita 
puro ou ausência total de dependência espacial. Isto significa que o alcance a, para os dados em 
questão, é menor do que o menor espaçamento entre amostras. Para esses dados, tem-se uma 
distribuição espacial completamente aleatória, e a única estatística aplicável é a Estatística Clássica 
(Silva et al., 1989). 
 É bastante comum um semivariograma que, partindo do valor do efeito pepita, C0, cresce 
além do valor do patamar ("sill"), até uma determinada distância e depois cai e apresenta 
flutuações abaixo do valor do patamar. Pode até apresentar flutuações abaixo do valor do patamar 
para pequenas distâncias. Isso é indicação de periodicidade nos dados. A periodicidade nos dados 
requer um tratamento específico chamado densidade espectral. Esse assunto está descrito em 
McBratney & Webster (1981), Nielsen et al. (1983) e Vieira et al. (1983), onde o leitor encontrará 
os detalhes necessários. 
 Um outro tipo de semivariograma que pode ocorrer é aquele que cresce, sem limites, para 
todos os valores de h calculados. Esse semivariograma indica a presença de fenômeno com 
capacidade infinita de dispersão, o qual não tem variância finita e para o qual a covariância 
(equação (6)) não pode ser definida. Ele indica, também, que o tamanho do campo amostrado não 
foi suficiente para exibir toda a variância e é provável que exista uma grande tendência nos dados 
em determinada direção. Se isto puder ser constatado, tem-se duas alternativas distintas: a) 
remove-se a tendência e trabalha-se nos resíduos para examinar se se enquadram nas hipóteses de 
estacionaridade de ordem 2 ou intrínseca; b) trabalha-se com hipótese de tendência nos dados 
originais. Por simplicidade, deve-se preferir a primeira alternativa. Um método bastante eficiente 
para retirada da tendência é pela superfície de tendência (Davis,1973). Se, após retirar a tendência, 
não houver nenhuma dependência espacial expressa no semivariograma dos resíduos, isto significa 
que a superfície de tendência encontrada é a melhor representação espacial do fenômeno. Um 
exemplo de retirada de tendência em dados unidimensionais e análise dos resíduos pode ser 
encontrado em Vieira et al. (1983) e Vieira & Hatfield (1984). 
 
 
3.Os modelos 
 
 O gráfico do semivariograma experimental, γ(h) versus h, calculado usando a equação (21), 
mostrará uma série de pontos discretos de γ(h) correspondendo a cada valor de h e para o qual uma 
função contínua deve ser ajustada. Delhomme (1976) discutiu vários modelos de ajuste aplicáveis 
a diferentes fenômenos. Neste trabalho serão discutidos apenas os principais. 
 O ajuste de um modelo teórico ao semivariograma experimental é um dos aspectos mais 
importantes das aplicações da Teoria das Variáveis Regionalizadas e pode ser uma das maiores 
fontes de ambigüidade e polêmica nessas aplicações. Todos os cálculos de geoestatística 
dependem do valor do modelo do semivariograma para cada distância especificada (Vieira et al., 
1981). Por isso, se o modelo ajustado estiver errado, todos os cálculos seguintes também o 
estarão. Um outro ponto importante é que o ajuste de curvas com calculadoras ou computador, 
usando métodos automáticos, embora possa ser usado, não é necessário. Existem programas 
comerciais que fazem ajuste pelo método dos quadrados mínimos, considerando o número de 
pares como pesos nas ponderações. Da mesma maneira, esses também podem ser usados, embora 
não seja necessário. O método de tentativa e erro, aliado ao exame dos resultados do "jack-
 
 
 
knifing", como será visto no último capítulo deste trabalho, são suficientes. Como regra, quanto 
mais simples puder ser o modelo ajustado, melhor, e não se deve dar importância excessiva a 
pequenas flutuações que podem ser artifícios referentes a um pequeno número de dados. É 
importante que o modelo ajustado represente a tendência de γ(h) em relação a h. Matemática e 
estatisticamente, é obrigatório que o modelo ajustado tenha positividade definida condicional 
(Journel & Huijbregts, 1978), embora o significado desta exigência esteja além dos objetivos deste 
trabalho. Além disso, essa condição não é fácil de entender nem de testar. A grosso modo, o 
modelo que satisfaça a condição acima garantirá que γ(h) > 0 e γ(-h) = γ(h), qualquer que seja h. 
De qualquer modo, os modelos apresentados neste trabalho satisfazem a exigência de positividade 
definida condicional e são suficientes para praticamente qualquer situação. 
 Dependendo do comportamento de γ(h) para altos valores de h, os modelos podem ser 
classificados em: modelos com patamar ("sill") e modelos sem patamar. 
 
 
3.1 Modelos com patamar 
 
 Nos modelos seguintes, C0 é o efeito pepita, C0 + C1 é o patamar e a é o alcance do 
semivariograma. 
 
a) Modelo linear: 
 
γ
γ
 (h) = C + Ca h 0 <h < a 
 
 
 (h) = C + C h >a
0
1
0 1
 (22) 
onde C1/a é o coeficiente angular para 0<h<a. Nesse modelo, o patamar é determinado por 
inspeção; o coeficiente angular, C1/a, é determinado pela inclinação da reta que passa pelos 
primeiros pontos de γ(h), dando-se maior peso àqueles que correspondem ao maior número de 
pares; o efeito pepita, C0, é determinado pela interseção da reta no eixo γ(h); o alcance, a, é o valor 
de h correspondente ao cruzamento da reta inicial com o patamar; e C1 = patamar - C0. 
 
b) Modelo esférico: 
 
γ
γ
 (h) = C + C [ 32 (
h
a )-
1
2 (
h
 a
) ] 0 < h <a
 
 
 (h) = C + C h >a
0 1 
3
0 1
 (23) 
O modelo esférico é obtido selecionando-se os valores do efeito pepita, C0, e do patamar, C0 + C1, 
depois passando-se uma reta que intercepte o eixo y em C0 e seja tangente aos primeiros pontos 
próximos de h=0. Essa reta cruzará o patamar à distância, a'=2/3 a. Assim, o alcance, a, será 
a=3a'/2. O modelo esférico é linear até aproximadamente 1/3 a. 
 
c) Modelo exponencial: 
 
 
 
 γ (h) = C + C [1- (-3 
h
a )] 0 < h < d 0 1 exp (24) 
onde d é a máxima distância na qual o semivariograma é definido. Uma diferença fundamental 
entre o modelo exponencial e o esférico é que o exponencial atinge o patamar apenas 
assintóticamente, enquanto que o modelo esférico o atinge no valor do alcance. O parâmetro a é 
determinado visualmente como a distância após a qual o semivariograma se estabiliza. Os 
parâmetros C e C0 1 para os modelos exponencial e gaussiano (explicado a seguir) são 
determinados da mesma maneira que para o esférico. 
 
d) Modelo gaussiano: 
 γ (h) = C + C [1- (-3 ( 
h
a
) )] 0 < h < d0 1 2 exp (25) 
 
 
3.2. Modelos sem patamar 
 
 Esses modelos correspondem a fenômenos que têm uma capacidade infinita de dispersão e, 
por isso, não têm variância finita e a covariância não pode ser definida. Podem ser escritos da 
seguinte maneira : 
 (26) γ (h) = C + Ah 0 < B < 2B
 O parâmetro B tem que ser estritamente maior que zero e menor que 2, a fim de garantir que 
o semivariograma tenha positividade definida condicional. 
 Alguns fenômenos podem ter semivariogramas que mostram estrutura entrelaçada, ou seja, 
mais de um patamar e mais de um alcance. Isso acontece quando se tem diferentes escalas de 
variabilidade nos dados. McBratney et al. (1982), analisando a variabilidade de teores de cobre e 
cobalto extraídos de amostras retiradas da superfície do solo do sudoeste da Escócia, encontraram 
três estruturas: uma correspondente à variação de uma fazenda a outra, com alcance de 3 km, uma 
correspondente à escala geológica, com alcance de 15 km, e a última espacialmente independente, 
ou efeito pepita puro. 
 Em situações como essa é necessário ajustar mais de um modelo, ou um modelo para cada 
estrutura, pois um modelo único não é suficiente para representar o semivariograma. 
 
4. Os exemplos 
 
 Dois conjuntos de dados obtidos por Waynick e Sharp (1919) serão utilizados neste trabalho 
como exemplo. A figura 2 mostra o diagrama das áreas amostradas, com os locais de onde as 
amostras foram tomadas. Os autores esclarecem que os campos foram amostrados na forma 
apresentada na figura 2, com a finalidade de verificar o efeito da distância entre amostras na 
variabilidade. Dois campos foram amostrados no Estado da Califórnia, EUA. Um, na então 
chamada Fazenda Universitária em Davis, em solo franco argiloso, e o outro, perto da cidade de 
Oakley, em solo arenoso. Os campos foram selecionados por parecerem uniformes e porque se 
encontravam sem vegetação na época da amostragem. Ambos eram quase perfeitamente planos. 
As amostras foram coletadas com um trado de 7,62cm de diâmetro e levadas ao laboratório para 
análise de nitrogênio e carbono totais. Os resultados são dados em porcentagem. Os dados 
originais estão listados no apêndice 1 e os principais momentos estatísticos estão no quadro 1. 
 Os coeficientes de simetria e curtose são apresentados no quadro 1, para comparação com a 
 
 
 
distribuição normal, para a qual esses coeficientes têm valores 0 e 3 respectivamente. Não é 
intenção, neste trabalho, procurar a distribuição exata das variáveis estudadas. Entretanto, é 
importante notar que, exceto para nitrogênio-Davis, as demais variáveis têm distribuição diferente 
da normal. Isso pode ser visto principalmente pelos altos coeficientes de curtose, indicando um 
excesso de valores próximos à média. Outro fato notável é a baixíssima variância. 
 Com a finalidade de comparar os semivariogramas e, conseqüentemente, as variabilidades 
espaciais de cada uma das variáveis, pode-se realizar do seu escalonamento, como o utilizado por 
Vieira et al. (1991). 
 Os semivariogramas escalonados médios para as quatro variáveis (C e N nos dois locais) 
estão mostrados na figura 3. É chamado de semivariograma médio porque a direção dos vetores h 
não é considerada e, implicitamente, assume-se isotropia,ou seja, variabilidade idêntica em todas 
as direções. Esse deve ser o procedimento adotado como rotina, pois é inútil explorar a 
anisotropia quando não existe dependência espacial na média. Após o exame dos 
semivariogramas médios, se a dependência espacial for encontrada, então deve-se examinar os 
semivariogramas direcionais. O exame dos semivariogramas da figura 3 revela alguns fatos 
importantes. Deduz-se que a variabilidade espacial das duas variáveis (carbono e nitrogênio), nos 
dois locais (Davis e Oakley), têm alguma semelhança. Em geral, pode-se notar também que as 
duas variáveis têm semivariâncias maiores no solo arenoso de Oakley do que no solo franco 
argiloso de Davis. Um outro fato bastante importante é que nenhum desses semivariogramas tem 
patamar bem definido, denotando a falta de estacionaridade nestes dados. 
 Os semivariogramas para as relações C/N para os dois locais estão na figura 4, onde se 
observa que, para Oakley, não existe dependência espacial para esta variável e, para Davis, a 
dependência espacial é pequena, como se pode notar pelo alto valor do efeito pepita em relação ao 
patamar. Assim, para Oakley, os valores da relação C/N não tem nenhuma relação com seus 
vizinhos, isto é, valores próximos não são necessariamente mais parecidos entre si do que valores 
distantes. Nesse caso, o valor médio pode representar o fenômeno. 
 Devido à aparente falta de estacionaridade para carbono e nitrogênio para os dois locais, 
como indicado na figura 3, devem ser calculadas as superfícies parabólicas de tendências de 
acordo com Davis (1973), usando a equação, 
 (27) est 0 1 2 3 2 4 2 5 Z (x, y) = A + A .x + A .y+ A .x + A .y + A .xy
 pelo método dos quadrados mínimos. 
 Dessa maneira, pode-se calcular o resíduo 
 (28) res est Z (x,y) = Z(x, y) - Z (x,y)
 Os semivariogramas da variável Zres devem ter patamar indicando que o procedimento para 
remoção da tendência foi eficiente. Os semivariogramas resultantes dos resíduos da tendência 
para carbono e nitrogênio para os dois locais, estão mostrados na figura 5. De seu exame pode-se 
deduzir que a maior tendência existia, na realidade, para os dados relativos ao solo de Davis, pois 
nas figuras 5a e 5c pode-se ver que os semivariogramas para Zres têm um patamar bem definido, 
quando antes não o tinham. Por outro lado, para o solo de Oakley, os semivariogramas para Z e 
Zres são quase idênticos, indicando que não havia tendência retirável pela superfície parabólica. 
Nesse caso, pode-se usar os dados originais sem problema; porém, para dar condições iguais aos 
de Davis, quando escalonados, os resíduos serão usados 
 A figura 6 mostra os semivariogramas para os resíduos de tendência para carbono e 
nitrogênio de ambos os solos. É notável tanto o efeito da remoção da tendência, estabelecendo 
nitidamente o patamar, como também a semelhança nas variabilidades de carbono para os dois 
locais e de nitrogênio para os dois locais . O carbono apresenta uma variabilidade inicial maior do 
que o nitrogênio, como indica o valor do efeito pepita (0,4). Já o nitrogênio tem efeito pepita nulo 
 
 
 
em ambos os solos. Pela semelhança entre esses semivariogramas escalonados, pode-se dizer que, 
apesar das diferenças básicas de textura dos dois solos, os fenômenos que regeram a concentração 
desses elementos no solo foram parecidos, fazendo com que suas variabilidades fossem parecidas. 
 É provável que o efeito climático ao longo dos anos tenha sido o maior responsável por estas 
concentrações, uma vez que os locais amostrados estavam livres de vegetação na época da 
amostragem. 
 O semivariograma para a relação C/N para Davis está na figura 7, com um modelo esférico 
(Esf), com 0,3 de efeito pepita, 1,0 de patamar e 25,0 m de alcance. A relação C/N não apresenta 
uma dependência espacial muito boa, implicando alta incerteza na estimativa pela krigagem, 
devido à alta variação ao acaso em distâncias pequenas, mas não se pode negar que ela existe. 
 
 
 
IV. A KRIGAGEM 
 
 
 Conhecido o semivariograma da variável, e havendo dependência espacial entre as 
amostras, como mostram os semivariogramas para C e N, para Davis e Oakley (Figura 6), pode-se 
interpolar valores em qualquer posição no campo de estudo, sem tendência e com variância 
mínima. O método de interpolação chama-se krigagem, nome dado por Matheron (1963) em 
homenagem ao matemático sul-africano Krige. Suponha-se, então, que se queira expressar o 
resultado do trabalho em forma de mapa de isolinhas ou de superfície tridimensional. A precisão 
da localização das isolinhas entre dois pontos é extremamente dependente da densidade de pontos 
por área e, conseqüentemente, da distância entre os pontos. A maneira mais comum de localizar 
uma isolinha entre dois pontos é pela interpolação linear. Existem programas de computador para 
se ajustar polinômios bidimensionais, chamados superfície de tendência (“trend surface”; Davis, 
1973). Entretanto, a forma na qual os dados variam de um local para outro no campo não tem, 
necessariamente, que seguir equações lineares ou polinômios. Na verdade, é comumente 
impossível determinar com exatidão que tipo de equação matemática descreve a variação dos 
dados no campo. E, mesmo que se consiga, na prática, ajustar algum polinômio aos dados, sua 
forma e grau podem não ter nenhuma interpretação física para o fenômeno, fato que é revelado no 
semivariograma, embora não se conheça a equação que descreveria os dados. 
 Os dados de Waynick e Sharp (1919) usados nesse trabalho foram amostrados na 
distância básica de 9,12m, com uma minoria de amostras a 4,56m e 3,04m umas das outras. A 
distância de 9,12m é muito grande para se ter uma boa precisão na localização de isolinhas, e 
ficaria bem mais fácil se houvesse mais dois pontos entre os amostrados a 9,12m. Isso significa ter 
um espaçamento básico de 3,04m para todo o campo. O pesquisador que fosse começar esse 
experimento poderia ter a opção de amostrar já no espaçamento de 3,04m. Porém, essa seria uma 
opção muito cara, e a krigagem pode estimar valores nesse ou qualquer outro espaçamento menor, 
sem gastos de amostragem, análise e processamento, e sem tendência e com variância mínima, 
como será visto a seguir. 
 
 
 
1. O estimador 
 
 Suponha-se que se queira estimar valores, z*, para qualquer local, x0, onde não se tem 
valores medidos, e que a estimativa deve ser uma combinação linear dos valores medidos, ou seja 
 (29) )( x = )x(* ii
N
1i=
0 zλ∑z
onde N é o número de valores medidos, z(xi), envolvidos na estimativa, e λi são os pesos 
associados a cada valor medido, z(xi). A determinação do número de vizinhos envolvidos na 
estimativa de um valor constitui-se em assunto complexo e merece ser tratado separadamente, o 
que se fará no capítulo VIII deste trabalho. Tomando-se z(xi) como uma realização da função 
aleatória Z(xi) e, por hora, assumindo estacionaridade de ordem 2, o estimador fica, 
 )xi Z(i
N
1=i
 = )x0(*Z λ∑ (30) 
 Note-se que o estimador anterior não apresenta nada de novidade pois praticamente todos 
os métodos de interpolação seguem essa forma. Por exemplo, na interpolação linear os pesos são 
 
 
 
todos iguais a 1/N, e na interpolação baseada no inverso do quadrado das distâncias os pesos 
recebem valores variáveis de acordo com o inverso do quadrado da distância que separa o valor 
interpolado dos valores medidos usados. No método da krigagem, os pesos são variáveis de 
acordo com a variabilidade espacial expressa no semivariograma. Esse estimador nada mais é que 
uma média móvel ponderada. O que torna a krigagem um interpolador ótimo, então, é a maneira 
como os pesos são distribuídos, como será visto a seguir. 
 
2. As condições requeridas 
 
 Para que o estimador seja ótimo, ele não pode ser tendencioso e deve ter variância 
mínima. Matematicamente, 
 (31) E {Z *( x ) - Z( x )} = 00 0
e 
 (32) mínima = })]x Z(- )x(*{[Z E = )}xZ(-)x (*{Z VAR 20000As equações (31) e (32) representam as condições de não-tendência e de variância 
mínima, respectivamente. Essas duas condições devem ser rigorosamente satisfeitas e, para 
tanto, são usadas como ponto de partida para a dedução das equações. A condição de não-
tendência significa que, em média, a diferença entre valores estimados e medidos para o mesmo 
ponto deve ser nula. A condição de variância mínima significa que, embora possam existir 
diferenças ponto por ponto entre o valor estimado e o medido, essas diferenças devem ser 
mínimas. 
 À primeira vista, pode parecer estranho quando se fala em diferenças entre valor 
estimado e medido, quando o propósito da krigagem é justamente estimar valores para locais onde 
estes não foram medidos. Porém, as condições impostas nas equações (31) e (32) são feitas tendo-
se em mente o que poderia acontecer se o valor naquele ponto fosse conhecido. Em outras 
palavras, o objetivo é que a estimativa represente, o melhor possível, o que seria o valor medido 
para aquele local. Na verdade, essas duas condições e o raciocínio anterior constituem o princípio 
básico do "jack-knifing", que será discutido no capítulo IX deste trabalho. 
 
 
3. A dedução do sistema de equações 
 
 O raciocínio geral na dedução do sistema de equações da krigagem envolve aplicação da 
fórmula do estimador (equação (30)) na condição de não tendência, encontrando-se a primeira 
restrição imposta nos pesos. Em seguida, aplicando-se esta restrição na condição de variância 
mínima e empregando técnicas de Lagrange para minimização de equações, chega-se ao sistema 
de equações da krigagem. Esta dedução será mantida com todos os detalhes para facilidade de 
acompanhamento e compreensão. 
 Substituindo-se a equação (30) na equação (31) tem-se: 
 0=)}x0Z(-)xi Z(i
N
1=i
{ E = )}x0Z(-)x0(Z*{ E λ∑ (33) 
 Aplicando a linearidade do operador valor esperado, E, tem-se: 
 0=)}x0{Z( E-)}xi{Z( E i
N
1=i
{ = )}x0Z(-)x0(Z*{ E λ∑ (34) 
 
 
 
Substituindo-se a primeira condição de estacionaridade, expressa na equação (5), tem-se 
 0=1) - i
N
1=i
( m =} m - m i
N
1=i
{ = )}x0Z(-)x0(Z*{ E λλ ∑∑ (35) 
Para que a equação (35) seja verdade para qualquer valor de m, é necessário que 
 0=1- i
N
1=i
λ∑
ou seja, 
 1 i
N
1=i
=∑λ
 (36) 
 Portanto, para que a estimativa não tenha tendência, é necessário que a soma dos pesos 
seja igual a 1, qualquer que seja a distribuição de seus valores. Desenvolvendo a equação (32) e 
chamando-a de σ2kZ(x0), variância da estimativa, tem-se: 
 (37) 
K
2 * *
0 0 0
2
*
0
2
0
*
0 0
 Z ( (x ) = E {Z x ) - Z( x ) } =
 
= E { Z ( x )+Z ( x )-2 Z ( x ) Z( )}x2
σ
 Cada termo do lado direito da equação (37) será individualmente desenvolvido a seguir. 
 Substituindo-se a equação (30), no primeiro termo, 
 })2)xi Z(i
N
1=i
{( E = )}x0(Z*2{ E λ∑ (38) 
 Aplicando-se propriedades de operações com álgebra linear tem-se: 
 (39) 
)}x j Z()x i{Z( E j i
N
1=j
N
1=i
=
 
)}x j Z()x i Z(j
N
1=j
 i
N
1=i
{ E=
 
)}x j Z(j
N
i=j
)x i Z(i
N
1=i
{ E = )}x 0(Z *
2{ E
λλ
λλ
λλ
∑∑
∑∑
∑∑
 A equação (6) 
 pode ser reordenada para C(h)= E{Z( x )Z( x + h)} - mi i 2
 (40) E {Z( x ) Z( x + h)} = C(h) + mi i 2
 Substituindo-se a equação (40) na equação (39), tem-se: 
 (41) E {Z ( x )} = C( x ,x ) + m2* 0
i=1
N
j=1
N
i j i j 
2∑ ∑ λ λ
 
 
 
onde C(xi, xj) refere-se à função covariância correspondente a um vetor h, com origem em xi e 
extremidade em xj. 
 O segundo termo no lado direito da equação (37) é: 
 (42) E {Z ( x )} = E {Z(x )Z( x +0)}2 0 0 0
 Substituindo a equação (40) na equação (42) para o valor apropriado de h tem-se: 
 (43) E {Z ( x )} = C(0) + m 2 0 2
 
 
O terceiro termo no lado direito da equação (37) é: 
 
)}x0 Z()xi{Z( E i
N
1=i
=
 
 )}x0 Z()xi Z(i
N
1=i
{ E = )}x0)Z(x0(Z*{ E
λ
λ
∑
∑
 (44) 
 Substituindo-se a equação (40) na equação (44), tem-se: 
]m2 + )x0 ,xi[C( i
N
1=i
 = )}x0 Z()x0(Z*{ E λ ∑ (45) 
 Substituindo-se as equações (41), (43) e (45) na equação (37), tem-se: 
 
)m2 + )x0 ,xiC( i
N
1=i
( 2-
 
m2 + C(0) + m2 + )x j ,xiC( ji
N
1=j
 
N
1=i
 = )x0Z(2k
λ
λλσ
∑
∑∑
 
ou simplificando: 
 
)]x0 ,xiC( i
N
1=i
[ 2-
 
C(0) + )x j ,xiC( ji
N
1=j
 
N
1=i
 = )x0Z(2k
λ
λλσ
∑
∑∑
 (46) 
 A equação (46) deve ser minimizada sob a restrição de que 
 1 = i
N
1=i
λ∑ 
 Esse processo de minimização pode ser feito pelas técnicas de Lagrange, as quais podem 
ser encontradas em livros de cálculo avançado. Para satisfazer a condição expressa na equação 
(32), é preciso que as N derivadas parciais 
 
 
 
 λλµσ i / )1
N
1=i
 2-)x0(2( k ∂∑∂ (47) 
sejam igualadas a 0 (zero); µ é um multiplicador de Lagrange. Assim, se a derivada parcial 
expressa na equação (47) for efetuada obtém-se, 
 0= 2 - )x0 ,xi2C( - )x j ,xiC( i
N
1=i
2 µλ∑ (48) 
 Cancelando o fator 2, rearranjando e combinando com a equação (36), tem-se o sistema 
de krigagem expresso em termos de função covariância: 
 
1 = j
N
1=j
 
N a 1=i ),x0 ,xiC( = - )x j ,xiC( j 
N
1=j
λ
µλ
∑
∑
 (49) 
 As primeiras N equações no sistema (49) podem ser rearranjadas em: 
 )x0 ,xiC( + = )x j ,xiC( j
N
1=j
µλ∑ (50) 
 Substituindo a equação (50) na equação (46), tem-se: 
 
)x0 ,xiC(i
N
1=i
-+C(0) = )x0Z(2k
 
)x0 ,xiC(i
N
1=i
2-)x0 ,xiC(i
N
1=i
++C(0) = )x0Z(2k
 
)x0 ,xiC( i
N
1=i
2-C(0)+))x0 ,xiC(+(i
N
1=i
 = )x0Z(2k
λµσ
λλµσ
λµλσ
∑
∑∑
∑∑
 (51) 
 A equação (51) é expressão da variância mínima da estimativa. Quando a estacionaridade 
de ordem 2 puder ser aceita, o sistema krigagem (49) e a variância da estimativa expressa na 
equação (51) podem ser escritos ambos na forma de função covariância, C(h), ou de 
semivariograma, γ(h). Existem algumas vantagens computacionais em se usar covariância, que 
serão discutidas no final deste capítulo. 
Entretanto, se a hipótese intrínseca for o máximo que se puder assumir, então, obrigatoriamente, 
tem-se que usar o semivariograma, γ(h), nas equações (50) e (51). A transformação do sistema de 
krigagem (49) e da variância da estimativa (51), em termos de semivariograma, pode ser feita 
através da equação (13), substituindo-se C(h) por C(0) - γ(h). 
 Assim, o sistema de krigagem fica: 
 
 
 
 (52) 
1 = j
N
1=j
N a 1=i ),x0 ,xi( = +)x j ,xi(j
N
1=j
λ
γµγλ
∑
∑
e a variância da estimativa, σ2k Z(x0), fica 
 )x0 ,xi(i
N
1=i
 + = )x0Z(2k γλµσ ∑ (53) 
 Os sistemas (49) e (52) contêm N+1 equações e N+1 incógnitas, e uma única solução 
produz N pesos, λ, e um multiplicador de Lagrange, µ. 
 
 
4. Sistema matricial 
 
 O sistema de krigagem da equação (49) pode ser escrito em notação matricial como 
 [C] [ ] = [b]λ (54) 
ou, quando se usa semivariograma, 
 [ ] [ ] = [b]γ λ (55) 
cujas soluções são 
 (56) [ ]= [C ] [b]-1λ
ou 
 (57) [ ]= [ ] [b] -1λ γ
onde, [C] é a matriz covariância, [γ] é a matriz semivariância, [C]-1 e [γ]-1 são seus inversos, 
respectivamente, [λ] é a matriz dos pesos procurados λi, e [b] é o lado direito das equações (49) ou 
(52), quando se usa C(h) ou γ(h), respectivamente. 
 As equações (51) e (53), da variância da estimativa, podem ser expressas em notação 
matricial, como 
 (58) [b] ][ - C(0) = )xZ(o t02k λ
ou 
 (59) [b] ][ = )xZ(o t02k λ
respectivamente, quando se usa C(h) ou γ(h). A matriz [λ]t é o transposto da matriz [λ]. 
Suponha que N=4. Então as matrizes [C] e [γ] são matrizes 5x5 e podem ser, explicitamente, 
escritas como 
 
 
 
 (60) 
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
01111
1)x,xC()x,xC()x,xC()x,xC(
1)x,xC()x,xC()x,xC()x,xC(
1)x,xC()x,xC()x,xC()x,xC(
1)x,xC()x,xC()x,xC()x,xC(
=[C]
44342414
43332313
42322212
41312111
ou 
 (61) 
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
01111
1)x,x()x,x()x,x()x,x(
1)x,x()x,x()x,x()x,x(
1)x,x()x,x()x,x()x,x(
1)x,x()x,x()x,x()x,x(
=][
44342414
43332313
42322212
41312111
γγγγ
γγγγ
γγγγ
γγγγ
γ
 A matriz de lâmbdas [ ] podeser escrita como λ
 (62) 
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
µ
λ
λ
λ
λ
λ
-
=] [
4
3
2
1
ou 
 (63) 
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
µ
λ
λ
λ
λ
λ
4
3
2
1
=] [
 E a matriz do lado direito dos sistemas de krigeagem pode ser escrita como, 
 (64) 
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
0
)x,xC(
)x,xC(
)x,xC(
)x,xC(
=[b] 
04
03
02
01
ou 
 
 
 
 (65) 
⎥
⎥
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎢
⎢
⎣
⎡
0
)x,x(
)x,x(
)x,x(
)x,x(
=[b] 
04
03
02
01
γ
γ
γ
γ
respectivamente, quando se usa C(h) ou γ(h). 
 
5. Particularidades do sistema e métodos de solução 
 
 Os sistemas de krigagem das equações (49) e (52) têm algumas particularidades que 
facilitam grandemente os cálculos e a solução do sistema e mesmo a análise de esquemas de 
amostragem. É preciso lembrar que, para cada estimativa ou interpolação efetuada, ter-se-á um 
sistema de equações de krigagem para o qual ter-se-á que achar a solução. Essa operação é a que 
envolve o maior tempo de processamento de computador, e quando esse tempo é pago, é a 
operação que envolve os maiores custos. Por isto, é imprescindível que se faça uso das 
particularidades do sistema de krigagem para aumentar eficiência, precisão e velocidade e diminuir 
custo de estimativa. Primeiramente serão examinadas as particularidades da matriz de coeficientes, 
ou seja, as matrizes covariância ou semivariograma, expressas em (60) e (61) para o caso 
particular de N=4. 
 Tanto as funções covariância, C(h), ou semivariograma, γ(h), são simétricas ao redor de 
zero (0). Isso significa que C(h)=C(-h) e γ(h)=γ(-h). Isso faz com que as matrizes (60) e (61) 
sejam simétricas, isto é, a parte que fica acima da diagonal principal é exatamente igual à parte 
que fica abaixo dela, porque C(x1, x , x3) = C(x3 1) ou γ(x1 3 1, x ) = γ(x3, x ). 
 Uma outra particularidade importante é a diagonal principal, a qual deve ser preenchida 
com valores de C(h) ou γ(h), correspondentes a vetores nulos, isto é, para h=0. Isso faz com que a 
diagonal principal para a matriz (60) tenha valores máximos e iguais a C(0) e para a matriz (61) 
tenha zeros (0). Isso acontece porque C(0) é o máximo valor da função covariância e é igual ao 
patamar do semivariograma, e γ(0)=0 qualquer que seja o efeito pepita, C(0). Esta afirmação pode 
parecer estranha, mas o que deve ser mantido é que γ(0)=0, e γ(e) = C(0) (efeito pepita), onde e é a 
menor distância entre amostras. 
 Existem vários métodos de solução de sistemas lineares de equação como o do sistema de 
krigagem (Burden et al., 1978, pag. 299 a 361), como também existem métodos mais eficientes 
que levam em conta as particularidades das matrizes (Journel e Huijbregts, 1978, pag. 357 a 360). 
O método mais comum seria o de inverter a matriz de coeficientes, (60) ou (61), e multiplicar do 
lado direito. Porém esse é também o método mais demorado em termos de tempo de 
processamento e o que envolve o maior número de operações de multiplicação/divisão e 
soma/subtração e, por isso, é também o que apresenta a maior propagação de erros. O método de 
eliminação Gaussiana envolve um número bastante menor de operações e, por isso mesmo, é mais 
rápido e mais preciso. Esse método procura, primeiramente, o elemento chamado pivô, o qual é o 
valor máximo encontrado em cada coluna da matriz. Desse modo, se for usada a covariância, 
C(h), no sistema de krigagem, poder-se-á eliminar essa operação de procura do pivô, pois na 
matriz de covariância (60) a diagonal sempre vai conter o elemento máximo. Quanto à ressalva 
de estacionaridade de ordem 2 e conseqüente existência de covariância finita, Journel & 
Huijbregts, (1978, pag. 357) recomendam que se pode definir uma função pseudocovariância 
C(h)=A - γ(h), onde A é uma constante maior que qualquer γ(h) usado no sistema. Devido à 
condição de não tendência, (Σλi=1), o valor A será eliminado do sistema da krigagem, e esta 
 
 
 
operação não altera os valores dos pesos calculados na solução. 
 
6. Os exemplos 
 Uma vez que existe uma distância bastante grande entre os pontos medidos, com alguns 
pontos mais próximos (Figura 2), é desejável fazer estimativas para os locais não medidos, para 
construção de mapas. Além disso, graças à existência de dependência espacial, expressa pelos 
semivariogramas da Figura 6, pode-se utilizar krigagem para efetuar as estimativas. Dessa 
maneira, foram estimados valores para cada ponto localizado na grade quadrada de 1,52m, 
regularizando assim a distância de separação entre amostras em todo o campo. Usando-se esses 
dados para cada uma das variáveis, construíram-se os mapas de isolinhas para cada uma das 
variáveis, mostrados nas Figuras 8, 9, 10 e 11. Com esses mapas pode-se ver agora, por exemplo, 
porque o carbono e nitrogênio para o solo de Davis têm semivariogramas parecidos, pois variam 
de maneiras muito semelhantes. Isso pode ser observado nas figuras 8 e 9, respectivamente para 
carbono e nitrogênio para o solo de Davis, onde, para quase todas situações de máximo ou de 
mínimo para carbono, corresponde uma situação igual para nitrogênio. Outro fato notório nas 
Figuras 8 e 9 é a tendência de crescimento na direção y, o que confirma a tendência encontrada. 
 
Join for free LoginDownload full-text PDF
Advertisement
19/11/21, 09:38
Página 1 de 1

Outros materiais