Buscar

Ednaldo Guimarães 2004 Geoestatística Básica e Aplicada [PT]

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 78 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 78 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 78 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 1 
 
UNIVERSIDADE FEDERAL DE UBERLÂNDIA 
FACULDADE DE MATEMÁTICA 
 
NÚCLEO DE ESTUDOS ESTATÍSTICOS E BIOMÉTRICOS 
 
 
 
 
 
 
 
 
 
 
 
GEOESTATÍSTICA BÁSICA E APLICADA 
 
 
 
 
 
 
 
 
 
 
 
 
EDNALDO CARVALHO GUIMARÃES 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Fevereiro - 2004 
Uberlândia - MG 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 1 
 
SUMÁRIO 
1. INTRODUÇÃO........................................................................................................... 2 
2. ANÁLISE EXPLORATÓRIA DE DADOS............................................................. 3 
2.1. Distribuição de freqüências e histograma............................................................... 3 
2.2. As estatísticas............................................................................................................. 3 
2.3. Outras análises descritivas........................................................................................ 7 
2.4. Amostragem........................................................................................................................................... 
 7 
2.5. Exemplos de análise exploratória aplicando o programa GS+............................. 8 
3. PRINCÍPIOS DA ANÁLISE GEOESTATÍSTICA.................................................. 14 
3.1. Um breve histórico.................................................................................................... 14 
3.2. Estacionaridade......................................................................................................... 15 
3.3. Krigagem universal................................................................................................... 20 
4. ANÁLISE DA DEPENDÊNCIA ESPACIAL............................................................ 21 
4.1. Autocorrelação e Autocorrelograma....................................................................... 21 
4.2. Semivariograma......................................................................................................... 25 
4.3. O uso do software GS+ na determinação do semivariograma.............................. 36 
4.4. Exemplos de aplicação............................................................................................... 41 
5. KRIGAGEM................................................................................................................. 50 
5.1. O interpolador........................................................................................................... 50 
5.2. A krigagem no programa GS+................................................................................. 52 
6. SEMIVARIOGRAMA CRUZADO E COKRIGAGEM.......................................... 55 
6.1. Semivariograma cruzado.......................................................................................... 55 
6.2. Co-krigagem.............................................................................................................. 56 
6.3. Variância da estimativa............................................................................................ 60 
6.4. Número de vizinhos das estimativas........................................................................ 62 
6.5. O uso do programa GS+ na determinação do semivariograma cruzado, 
da co-krigagem e no mapeamento da variável....................................................... 
 
64 
6.6. Exemplos de aplicação no GS+................................................................................ 67 
7. VALIDAÇÃO DE MODELOS DE SEMIVARIOGRAMAS................................... 70 
8. BIBLIOGRAFIA RECOMENDADA......................................................................... 74 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 2 
 
1. INTRODUÇÃO 
 
 Métodos clássicos de análise estatística de dados geralmente supõem que, as 
realizações das variáveis aleatórias são independentes entre si, ou seja, que observações 
vizinhas não exercem influências umas sobre as outras. 
 Fenômenos naturais apresentam-se freqüentemente com uma certa estruturação nas 
variações entre vizinhos, desta forma pode-se dizer que as variações não são aleatórias e, 
portanto, apresentam algum grau de dependência espacial. 
 A análise espacial de dados apresenta-se como uma alternativa e/ou como uma 
complementação da análise clássica de dados, sendo que este tipo de análise considera as 
correlações entre as observações quando se faz estimativas. 
 A literatura apresenta alguns procedimentos de análise espacial de dados, sendo que, 
nos últimos tempos, uma metodologia de análise denominada “geoestatística” ganhou 
ênfase neste tipo de estudo. 
 Neste trabalho serão abordados aspectos básicos da metodologia geoestatística para 
a análise espacial de dados, com ênfase na análise do semivariograma como ferramenta de 
determinação da dependência espacial. 
 Inicialmente serão abordados aspectos básicos de uma análise exploratória de 
dados; em seguida serão introduzidos conceitos básicos da geoestatística e da análise da 
dependência espacial por meio de semivariograma e também de interpolação utilizando a 
metodologia da krigagem e, por fim serão abordados conceitos básicos de semivariogramas 
cruzados e co-krigagem. Sempre que possível os tópicos serão acompanhados de exemplos 
de aplicação. 
 
 
 
 
 
 
 
 
 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 3 
 
2. A ANÁLISE EXPLORATÓRIA DE DADOS 
 A análise exploratória de dados é um procedimento de grande importância na 
análise estatística e aplica-se para qualquer metodologia que se queira utilizar. Nesta 
análise preliminar dos dados tem-se o objetivo de conhecer a variável em estudo e resumi-
la. Basicamente, este tipo de análise se baseia em construção e interpretação gráfica e 
cálculos e interpretação de estatísticas. 
 No presente texto faremos uma revisão dos principais instrumentos de análise 
exploratória de dados, sendo que estes procedimentos podem ser encontrados em cursos de 
estatística básica e em livros de estatística básica como Costa Neto (1979), Bussab e 
Morettin (1987), Triola (1999), Lopes (1999), entre outros. 
 
 
2.1. A distribuição de freqüências e o histograma 
 A distribuição de freqüências consiste em agrupar as observações de uma variável 
em classes ou categorias e o histograma é uma das representações gráficas dessa 
distribuição. A distribuição de freqüências e o histograma podem ser obtidos em programas 
computacionais comercias com o Excel, Statistica e em programas específicos para análise 
geoestatística, como, por exemplo, o GS+. 
 A finalidade da distribuição de freqüências e do histograma é a de permitir uma 
visualização do comportamento da variável em estudo, com relação à tendência de 
concentração de dados (tendência simétrica ou assimétrica). Esta tendência, principalmente 
na análise não espacial de dados, pode direcionar procedimentos diferenciados de análise. 
 
 
2.2. As estatísticas 
 O cálculo de estatísticas como a média, a variância, o desvio padrão, o coeficiente 
de variação, valor mínimo, valor máximo, coeficiente de assimetria e coeficiente de 
curtose, colaboram na descrição da variável. Passaremos a rever rapidamente estas 
estatísticas. 
 
 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 4 
 
- A média aritmética ( X ) 
A média aritmética é uma medida de posição bastante utilizada na estatística e tem 
como características principais à facilidadede cálculo, a sua adaptabilidade ao tratamento 
algébrico e, também, geralmente, é uma medida não tendenciosa, precisa, eficiente e 
suficiente. 
Vale ressaltar que nem sempre a média aritmética é a medida de posição que melhor 
representa uma variável, por exemplo, em dados com assimetria à direita acentuada a moda 
ou a média geométrica pode representar melhor a variável em estudo. 
A fórmula para o cálculo da média é: 
n
x
X
n
i
i∑
=
=
1
 
em que: X é a média aritmética; xi é cada valor observado; n é o número total de 
observações. 
 
- Variância (s2) e desvio padrão (s) 
A variância e o desvio padrão são estatísticas que nos fornece uma idéia de 
variabilidade das observações em torno da média aritmética. 
As fórmulas de cálculo são, respectivamente: 
1
2
12
−
−
=
∑
=
n
)Xx(
s
n
i
i
 
2ss += 
Note que em interpretações de dados, ou seja, na análise descritiva a média 
aritmética deve estar sempre acompanhada do desvio padrão para que possamos visualizar 
a dispersão média dos valores. 
 
- Coeficiente de variação (CV) 
O coeficiente de variação fornece a dispersão relativa dos dados, facilitando 
visualizar a dimensão da dispersão dos valores observados em relação à média. 
O coeficiente de variação é dado por: 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 5 
 
X
sCV 100(%) = 
 
 
- Valor Mínimo e Valor Máximo 
Estes valores permitem visualizar a menor ocorrência e a maior ocorrência e 
podem ser um primeiro indicativo de erros de amostragem, digitação, etc.. 
A obtenção desses valores se faz a partir da ordenação das observações. 
 
- Coeficiente de assimetria (Cs) e coeficiente de curtose (Ck) 
O coeficiente de assimetria mostra o afastamento da variável em relação a um valor 
central, ou seja, na distribuição simétrica tem-se 50% dos valores observados acima da 
observação central e 50% abaixo. Se a distribuição é assimétrica, esta relação não é 
observada. 
O coeficiente de curtose mostra a dispersão (achatamento) da distribuição em 
relação a um padrão, geralmente a curva normal. 
Estes dois coeficientes são utilizados para inferências sobre a normalidade da 
variável em estudo. 
Antes de definirmos estes dois coeficientes e tecermos comentários sobre eles 
vamos definir os momentos estatísticos. 
Se x1, x2, ... ,xn são os n valores assumidos pela variável X, definimos o momento de 
ordem t dessa variável como: 
n
x
M
n
i
t
i
t
∑
=
=
1
 
Note que se t=1 temos a média aritmética, ou seja, a média aritmética é igual ao 
primeiro momento em relação à origem. 
O momento de ordem t centrado em uma constante K , com K ≠ 0 é definido como: 
n
Kx
M
n
i
t
i
K
t
∑
=
−
=
1
)(
 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 6 
 
Observe que: se t = 1 e K = X , temos 011 == mM
X
 (propriedade da média 
aritmética) e, se t =2 e K = X , temos XM 2 = m2 = σ2. 
Vamos definir agora o coeficiente de assimetria (Cs) e o coeficiente de curtose 
(Ck). 
O coeficiente de assimetria é utilizado para caracterizar como e quanto à 
distribuição de freqüências se afasta da simetria, sendo que: se Cs > 0 temos a distribuição 
assimétrica à direita; se Cs < 0 a distribuição é assimétrica à esquerda; e se Cs = 0 a 
distribuição é simétrica. 
O momento centrado na média de ordem 3 pode ser utilizado como medida de 
assimetria, entretanto, é mais conveniente a utilização de uma medida admensional e que 
será chamada de coeficiente de assimetria: 
3
2
3
)(m
m
C s = 
Em que m2 e m3 são, respectivamente, o segundo e o terceiro momento centrados 
na média. 
O coeficiente de curtose é utilizado para caracterizar a forma da distribuição de 
freqüências quanto ao seu “achatamento”. O termo médio de comparação é a distribuição 
normal e esta apresenta o valor de Ck = 3. A classificação da distribuição quanto à curtose 
recebe a seguinte denominação: se Ck = 3 a distribuição é mesocúrtica (distribuição 
normal); se Ck < 3 a distribuição é platicúrtica; e se Ck > 3 a distribuição é leptocúrtica. Em 
alguns programas computacionais como o Excel, Statistica e GS+ existe uma padronização 
do valor de Ck e o valor de comparação é o zero, portanto, se Ck = 0 temos a mesocúrtica, 
se Ck < 0 temos a platicúrtica e se Ck > 0 temos a leptocúrtica. 
Para verificar o termo de comparação é necessário consultar o manual ou a "ajuda" 
do programa. 
A fórmula para cálculo de Ck é : 
4
2
4
)(m
mCk = 
sendo que: m4 é o quarto momento em relação à média aritmética. 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 7 
 
 Para uma melhor interpretação do coeficiente de assimetria e do coeficiente de 
curtose, alguns programas, como o GS+, calcula também o erro padrão desses coeficientes 
e a partir dos valores dos coeficientes associados com seus respectivos erros padrão, pode-
se concluir se os dados tem distribuição normal ou não. Por exemplo: Se o valor obtido na 
amostra para Cs = 0,30 com erro padrão de 0,65 e se o valor de Ck = 2,5 com erro padrão de 
0,80, podemos dizer que a distribuição tende a normal (simétrica e mesocúrtica), pois 
0,3±0,65 e 2,5±0,80, incluem os valores zero e três, respectivamente. 
 
 
2.3. Outras análises descritivas 
 As análises descritas acima são as mais comuns e as que freqüentemente são usadas 
como análise exploratória dos dados. Entretanto outros recursos podem ser aplicados como, 
por exemplo: gráfico box-plot; gráficos da distribuição normal; gráfico h-dispersão, outras 
estatísticas (quartil, mediana, moda, etc.); testes de normalidade (Shapiro – Wilk, 
Kolmogorov – Smirnov, etc.), etc.. Tais resultados também contribuem para a descrição e 
conhecimento da variável em estudo. Os procedimentos para este tipo de análise são 
encontrados em programas de estatísticas. 
 
 
2.4. Amostragem 
 Um requisito básico na amostragem para fins de análise de dependência espacial 
utilizando métodos geoestatísticos é que as observações, ou seja, que as amostras sejam 
referenciadas. Não é necessário utilizar coordenadas geográficas, mas algum tipo de 
referenciação deve existir. 
 Exemplos de referenciações são: a) amostras coletadas ao longo do tempo � cada 
observação é referenciada com relação ao tempo (Ex: Estudo da precipitação anual na 
região X); b) amostras coletadas ao longo de uma linha reta em uma certa cultura agrícola 
�
 cada observação é referênciada por um único ponto no espaço (Ex: amostras coletadas 
em transeções); c) amostras coletadas em uma área � cada observação será identificada 
por um par ordenado de coordenadas pertencente ao espaço (Ex: amostras coletadas em 
uma área X). 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 8 
 
 Um tipo de amostragem bastante utilizado em geoestatística é a amostragem 
sistemática. Neste tipo de amostragem os pontos avaliados (amostras) são obtidos de forma 
equidistantes, quer seja no espaço ou no tempo, formando uma malha de pontos no caso 
bidimensional. No entanto esse não é um procedimento obrigatório, basta que se tenha a 
referenciação dos dados para se proceder a análise espacial. Um exemplo típico de 
amostragem não sistemática é para variáveis climáticas, onde as estações climatológicas, 
geralmente, não são equidistantes mas apresentam a referencia geográfica. 
 Outro questinamento básico da geoestatística é "Quantas amostras devo utilizar para 
a análise geoestatística?". Alguns autores recomendam que seja utilizados pelo menos 100 
pontos amostrais, entretanto isso não é regra e sim recomenndação, existem trabalhos com 
bons resultados de ajuste de semivariogramas usando 45 pontos de amostragem. É sabidoque quanto maior o número de pontos, maior será o número de pares para o cálculo das 
semivariâncias e, teoricamnte, maior será a precisão das estimativas das semivariâncias. 
Pode-se dizer que o número de observações dependerá dos objetivos que se tem no 
trabalho, da escala (ou seja da dimensão), entre os outros fatores que devem ser avaliados 
pelo pesquisador. Outro aspecto relacionado com o ajuste de semivariograma e 
indiretamente com o tamanho da amostra é a presença de tendência da variável e/ou o uso 
de duas populações distintas que abordaremos em tópicos seguintes, mas que, de maneira 
geral, dificultam o ajuste de semivariogramas com dados originais, mesmo que o volume 
de observações seja grande. 
 
 
2.5. Exemplos de análise exploratória aplicando programa GS+ 
 Passaremos a descrever exemplos de análise exploratória de dados do GS+. Nestes 
exemplos será utilizado a Versão Beta do GS+ (5.0.3) que é de domínio publico, conforme 
mostra a Figura 1. 
 
 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 9 
 
 
Figura 1. Programa GS+ Versão 5.0.3 
 
 Como ponto de partida vamos descrever a estrutura de arquivos de dados com 
vistas a posterior análise geoestatística, pois, na análise geoestatística necessita-se que os 
dados observados estejam referenciados, ou seja, tenham coordenadas. Trabalharemos com 
a análise bidimensional e, portanto, teremos as coordenadas X e Y para cada observação. 
Vale ressaltar que, se o objetivo do estudo não for a geoestatística ou a análise espacial, esta 
referenciação não se faz necessária e ainda ressaltamos que a estrutura de dados 
apresentada neste tópico é válida para diversos programas de análise espacial. 
 O arquivo pode ser criado no próprio programa GS+ ou em outro programa como o 
Excel, necessitando, neste caso de uma importação de dados ou do famoso "copiar" e 
"colar". A Figura 2 mostra o aspecto básico do arquivo de dados. 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 10 
 
 
Figura 2. Janela inicial do GS+ com exemplo de arquivo de dados contento as coordenadas 
(x,y) e 4 variáveis para a análise. 
 
 Neste exemplo temos um arquivo de dados editado no GS+. Na primeira coluna 
temos a coordenada X, na segunda coluna temos a coordenada Y e da terceira a sexta 
colunas temos as variáveis, ou seja, neste caso estamos trabalhando com 4 variáveis. 
 Se o arquivo for editado em outro programa, deve-se importar os dados para o GS+ 
utilizando o procedimento padrão do Windows de copiar e colar, ou recortar e colar, ou 
ainda, ativar o ícone Import file localizado no canto superior direto da Figura 2. 
 Para selecionar outra variável a ser estudada basta clicar na coluna correspondente e 
selecioná-la como a variável principal. Por exemplo, se o objetivo é a análise da terceira 
variável (usatpc), procederíamos da seguinte forma (Figura 3): 
 
Figura 3. Exemplo de mudança de variável para análise 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 11 
 
 
- clique sobre a coluna de interesse (coluna 5, neste exemplo). A coluna é selecionada e 
aparece a segunda janela, indicando a coluna ativa. 
- Clique em Z (Primary variable) para selecionar esta coluna como sendo sua variável de 
analise. 
- Clique em OK para confirmar a opção 
 
Pode-se ainda trabalhar com duas variáveis simultaneamente. Neste caso seleciona-
se uma variável Z2 como covariável. Voltaremos ao assunto no tópico de semivariograma 
cruzado. 
Voltando à Figura 2 vamos descrever os procedimento da análise exploratória de 
dados. 
A barra de ferramenta apresenta os seguintes símbolos que são destinados a este tipo 
de análise: 
 
 
 
 
 
 Os ícones não ativos são destinados a análise com duas variáveis (semivariograma 
cruzados, co-krigagem, etc). 
 Para exemplificar o resultado deste tipo de análise vamos utilizar os dados da 
primeira variável (usatpd – coluna 3). Ativando o ícone ∑∑ e teremos o resultado das 
principais estatísticas, conforme Figura 4: 
Planilha 
ativa Principais 
Estatística
s 
Análise gráfica 
histograma 
Posição das observações 
selecionadas por quartil 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 12 
 
 
Figura 4. Estatísticas da variável “usatpd”. 
 
 
 Como uma análise geral desses dados verifica-se que a umidade de saturação do 
solo no plantio direto (usatpd) apresentou média de 44,0069 (cm3/100cm3), com uma 
dispersão média em torno desse valor de 4,3190 (cm3/100cm3) e, portanto, uma 
variabilidade de 9,81%, deste modo nota-se que as observações se dispersam relativamente 
pouco em torno da média. O menor valor observado (36,27 cm3/100cm3) e o maior valor 
observado (54,810 cm3/100cm3) reforçam a idéia de baixa variabilidade das observações e 
também mostram que, provavelmente, não temos valores discrepantes que poderiam ser 
atribuídos a erros de determinação, digitação ou de amostragem. O histograma mostra uma 
tendência dos dados à simetria e este fato também pode ser verificado por meio dos 
coeficientes de assimetria e curtose associados aos seus respectivos erros padrão, que são 
respectivamente: 0,46±0,30 e 0,34±0,50, ou seja, assimetria e curtose próximos de zero 
indicando distribuição normal aproximada dos dados. 
 Note ainda que existe a possibilidade de se fazer análises com dados transformados. 
 Um detalhamento da distribuição da variável pode ser obtida clicando o ícone do 
histograma na barra de ferramentas. Em um primeiro momento tem-se a visualização 
do histograma e posteriormente pode-se fazer análises com distribuição de freqüências 
acumuladas e gráfico da distribuição normal, conforme mostra a Figura 5. 
média 
Desvio padrão
 
variância 
mínimo 
máximo 
Número de dados e 
Dados perdidos 
histograma 
Coeficiente de assimetria 
e erro padrão 
Coeficiente de curtose e 
erro padrão 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 13 
 
 
Figura 5. Análise gráfica dos dados 
 
 Uma outra análise utilizada no GS+ é a localização espacial dos pontos amostrados 
com relação a intervalos de ocorrência. Este mapa é obtido por meio do ícone . Veja o 
exemplo na Figura 6. 
 
Figura 6. Localização espacial das observações 
 
 Verifica-se, por meio da Figura 6, que a princípio não há indícios de concentração 
de valores altos ou baixos em setores específicos da malha, portanto parece não existir 
tendência nos dados e, provavelmente, se existir relação espacial, esta poderá ser 
representada por um semivariograma médio (isotrópico). 
Histograma – 
freqüência simples 
Gráfico de freqüência 
acumulada 
Gráfico da distribuição 
normal 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 14 
 
3. PRINCÍPIOS DA ANÁLISE GEOESTATÍSTICA 
3.1. Um breve histórico 
A preocupação com a dependência espacial ou temporal de observações realizadas 
para um determinado atributo é bastante antiga, sendo comprovado este fato por trabalhos 
científicos datados do início do século XX, conforme mostra Vieira (1995). 
Em algumas áreas da ciência, como a agricultura, a partir da metade do século XX 
adotou-se a metodologia de análise de dados proposta por Fisher. Esta metodologia 
considera, no seu desenvolvimento e aplicação, as seguintes suposições: normalidade da 
variável; independência de erros e homocedasticidade de variância (homogeneidade de 
variância). 
A normalidade da variável e a homogeneidade de variâncias podem ser testadas 
facilmente em programas de estatísticas por meio de testes específicos como, por exemplo, 
Shapiro-Wilk (W teste) para normalidade e F máximo de Hartley para homogeneidade de 
variâncias. Se for observadonão normalidade de dados e/ou não homogeneidade de 
variâncias, procedimentos como a transformação de dados podem ser adotados para que a 
variável atenda estas hipóteses básicas da metodologia de análise não espacial proposta por 
Fisher. 
Já a independência não pode ser testada por métodos simples e a solução deste 
problema, proposta pela metodologia não espacial, é a repetição e a aleatorização das 
observações. Esta solução, em muitos casos, não garante a independência entre as 
observações, isto porque algumas variáveis apresentam forte dependência espacial 
(autocorrelação entre as observações) que não é desfeita com este procedimento. 
Krige (1951) citado por Vieira (1995), em seus trabalhos com dados de mineração 
da África do Sul, concluiu que a variância dos dados possuía uma estruturação que 
dependia da distância de amostragem. A partir desta constatação surgiu os conceitos 
básicos de geoestatística. 
Os fundamentos teóricos da geoestatística podem ser encontrados nos trabalhos 
desenvolvidos por Matheron (1963) e Matheron (1971). 
A análise espacial de dados, utilizando a geoestatística, ganhou impulso em áreas 
distintas da mineração e da geologia a partir de 1980, com grande aplicabilidade na ciência 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 15 
 
do solo. Uma justificativa para tal fato é a facilidade computacional que viabilizou alguns 
cálculos relativamente trabalhosos nesta metodologia. 
No Brasil destaca-se trabalhos pioneiros nesta área desenvolvidos pelos 
pesquisadores Sidney Rosa Vieira, Paulo Libardi e Klaus Reichardt. Ainda na década de 
80. 
Atualmente a aplicabilidade e a utilização da geoestatística como metodologia de 
análise de dados no espaço ou no tempo esta difundida em vários ramos da ciência, 
envolvendo áreas de ciências humanas, biológicas e exatas. 
Em linhas gerais podemos dizer que a geoestatística está interessada em determinar 
a dependência espacial das observações de uma variável e recebeu tal denominação devido 
aos trabalhos desenvolvidos por Krige na África do Sul. Este pesquisador é homenageado 
com o nome do método de interpolação utilizado na geoestatística, a krigagem. 
Outras metodologias e alternativas de análise de dependência espacial são descritas 
em Papadakis (1937), Bartlett (1978), Zimmerman e Harville (1991), Cressie e Hartfield 
(1996), Duarte (2000), entre outros autores. 
 
 
3.2. Estacionaridade 
Antes de iniciarmos a discussão sobre a estacionaridade da variável vamos adotar 
uma simbologia para a variável em estudo. Ao falarmos da variável Z(t) estaremos falando 
de ocorrências da variável Z com uma referenciação t, que pode ser uma posição no tempo 
(unidimensional, por exemplo: t1, t2, ...,tk) ou no espaço (unidimensional, por exemplo: x1, 
x2, ..., xn; ou bidimensional, por exemplo; (x1,y1),(x1,y2), ..., (xn, yn)) 
Diz-se que um processo (ou uma variável) é estacionária se o desenvolvimento 
desse processo no tempo ou no espaço ocorrer de maneira mais ou menos homogênea, com 
oscilações aleatórias contínuas em torno de um valor médio, em que nem a amplitude 
média e nem as oscilações mudam bruscamente no tempo ou no espaço. Como exemplo de 
processo estacionário pode-se citar as oscilações da tensão em uma rede elétrica. 
Note que as características de um processo estacionário independe da origem 
adotada. 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 16 
 
Diz-se que um processo é não estacionário quando não apresenta as características 
citadas anteriormente e, neste caso, as características do processo dependem da origem que 
é tomada como referência. Pode-se utilizar como exemplo de um processo não estacionário 
o relevo no estado de Minas Gerais, ou ainda, as chuvas mensais durante um ano no estado 
de Minas Gerais. 
 
Observação: Processos não estacionários podem apresentar trechos estacionários. 
 
Pode-se definir uma função aleatória Z(t) como estacionária, se todos os momentos 
estatísticos são invariantes para toda mudança de origem. 
Estatisticamente pode-se dizer que, se o processo é estacionário de ordem k, então: 
E[Z(t)] = m1(t) = constante ∀ t 
E[Z2(t)] = m2(t) = constante ∀ t 
. . . 
. . . 
. . . 
E[Zk(t)] = mk = constante ∀ t 
 
 Observação: Se um processo é estacionário na ordem k ele também será 
estacionário para as ordens inferiores a k. Por exemplo, se o processo é estacionário de 
ordem 4, ele também será estacionário nas ordens 1, 2 e 3. 
 
 Para estudos de geoestatística necessita-se, como restrição máxima, que o primeiro e 
o segundo momento em relação à origem sejam constante, ou seja, exige-se no máximo a 
estacionaridade de segunda ordem. 
 Se a esperança matemática de uma variável aleatória é constante, 
independentemente da origem que se toma no espaço ou no tempo, podemos dizer que a 
variável é estacionária de primeira ordem e, portanto, a média será a mesma para todo o 
processo. 
E[Z(t)] = m1(t) = µ = constante 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 17 
 
 Se o segundo momento em relação à origem é constante, temos então que a 
variância é constante independente da origem no espaço ou no tempo e, portanto, o 
processo é estacionário de ordem 2. 
 E[Z2(t)] = m2(t) = constante 
 Var [Z(t)] = E[Z2(t)] – {E[Z(t)]}2 = m2(t) – [m1(t)]2 = constante 
 Seja agora a covariância, ou seja, a esperança do produto do que ocorre em t e t’, 
com h = t’ – t, definida como: 
 C(t, t’) = E[Z(t).Z(t’)] - µ2 
Se Z(t) é estacionária esta covariância não depende de t e t’, ou seja, da origem, mas 
somente da distância h entre os pontos e desta forma: 
 C(t, t+h) = C(h) 
 Note que a variância é um caso particular da covariância quando h = 0. 
 C(0) = E[Z2(t)] - µ2 = Var[Z(t)] 
 Geralmente utiliza-se a função de covariância normada pela variância: 
 )]([
)()(
tZVar
hCh =ρ 
 Neste caso chamamos ρ de função de correlação ou coeficiente de correlação, que 
nada mais é do que a correlação entre seções da variável separadas por um passo h. 
Portanto, ρ(0) = 1. 
Podemos definir uma variável como estritamente estacionária se seus momentos 
estatísticos são invariantes a translações na origem. Isto significa que o processo Z(t) e 
Z(t+h) tem a mesma estatística para qualquer h. 
Uma variável é chamada de estacionária de segunda ordem se: 
 A média é constante: 
 E[Z(t)] = µ 
 O segundo momento existe: 
 E[Z2(t)] < ∞ 
 Para cada par {Z(t), Z(t+h)} a função covariância existe e depende apenas de 
h. 
 C(t, t+h) = C(h) 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 18 
 
A estacionaridade da covariância implica na estacionaridade da variância: 
Var{Z(t)}= C(0) e do variograma que é definido como: 
 2γ(h) = E{[Z(t+h) – Z(t)]2} = 
 = E{[Z(t+h)2}+E{[Z(t)]2}-2E{Z(t+h) Z(t)}= 
 = E{[Z(t+h)]2}+E{[Z(t)]2}-2µ2 = 
 = E{[Z(t+h)]2}- µ2+ E{[Z(t)]2}-µ2 = 
 = C(0) – C(h) 
O coeficiente de correlação entre Z(t+h) e Z(t), chamado de correlograma ou 
autocorrelograma, é igual a: 
 )0(
)(1)0(
)()(
C
h
C
hChr γ−== 
Note que, se ocorre a estacionaridade de segunda ordem, o correlograma 
(autocorrelograma) e o variograma (semivariograma) serão ferramentas correspondentes na 
determinação da dependência espacial. Mas se a estacionaridade de segunda ordem não é 
atendida o autocorrelograma não pode ser usado, pois, o denominador da função 
autocorrelação é uma variância e, neste caso, C(0) ≠ constante. 
 
Observação: A existência de estacionaridade permite a repetição de um 
experimento, mesmo que as amostras sejam coletadas em pontos diferentes, em relação ao 
experimentoinicial. Esta fato é justificado em função de que todas as amostras pertencem a 
populações com os mesmos momentos estatísticos. 
 
A dependência espacial ou temporal de uma variável Z(t) é definida por uma 
amplitude a, sendo que para variáveis com estacionaridade de segunda ordem: 
 C(h) = 0 se | h | > a 
Ou 
 γ(h) = C(0) = Var [Z(t)] se | h | > a 
 Quando se trabalha com o tempo a constante a é chamada de tempo de correlação 
de Z(t). Se o estudo for espacial, por analogia, podemos chamar a de domínio de 
correlação. 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 19 
 
 A hipótese de estacionaridade de segunda ordem assume a existência de uma 
covariância e assim de uma variância finita. Var[Z(t)] = C(0). A existência do variograma é 
uma hipótese mais fraca do que a existência da covariância, e existem muitos fenômenos 
que possuem uma grande capacidade de dispersão, isto é, que não possuem uma variância a 
priori nem uma covariância, mas um variograma pode ser definido. Uma hipótese mais 
fraca (mais abrangente) é a hipótese intrínseca. 
 Na hipótese intrínseca temos: 
a) a esperança Z(t) existe e não depende do ponto t. 
E[Z(t)] = µ 
b) para todo h, a variância da diferença [Z(t+h) – Z(t)] existe e não depende do ponto t. 
Var[Z(t+h) – Z(t)] = E{[Z(t+h) – Z(t)]2} = 2γ(h) 
 
 Observação: Se uma variável é estacionária de segunda ordem, então ela é também 
intrínseca, mas o inverso nem sempre ocorre. 
 
 A hipótese intrínseca é a hipótese mais freqüentemente usada em geoestatística, por 
ser menos restritiva e, portanto, o semivariograma é a ferramenta mais difundida na 
geoestatística porque exige apenas a hipótese intrínseca, enquanto o autocorrelograma 
exige a estacionaridade de segunda ordem. 
 As Figuras 7A, 7B e 7C ilustram, respectivamente, uma variável estacionária de 
segunda ordem, uma variável estacionária de primeira ordem e uma outra não estacionária. 
Note que no caso da Figura 7A, para qualquer trecho que selecionarmos e calcularmos a 
média e a variância, estas permanecerão aproximadamente constante, já no caso da Figura 
7B, apenas a média permanece constante e no caso da Figura 7C nem a media e nem a 
variância permanecem constantes. 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 20 
 
18
20
22
24
26
28
0 10 20 30 40 50
X
Y
 
15
17
19
21
23
25
27
29
0 10 20 30 40 50
X
Y
 
5
10
15
20
25
30
0 10 20 30 40 50
X
Y
 
Figura 7. Exemplos de estacionaridade: A) Processo estacionário de segunda ordem; B) 
Processo estacionário de primeira ordem e C) Processo não estacionário 
 
 
3.3. Krigagem universal (tendência) 
Na hipótese de tendência (Krigagem universal), a variável Z(t) pode ser decomposta 
em dois componentes: 
 Z(t) = m(t) + e(t) 
A 
B 
C 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 21 
 
em que m(t) é a tendência principal (drift) e e(t) é o resíduo. 
 Para se trabalhar com essa hipótese é necessário que, para cada posição t se 
determine à tendência m(t) e, assim, trabalha-se com o semivariograma dos resíduos. 
 Note que se m(t) = constante, então o semivariograma da variável Z(t), usando as 
observações reais, será igual ao semivariograma dos resíduos e(t), mas, se ocorre algum 
tipo de tendência nos dados (tendência linear, quadrática, etc.), o semivariograma dos 
resíduos pode-se apresentar com melhor estruturação e definição dos parâmetros, 
produzindo estimativas mais confiáveis (com menor variância) na krigagem. 
 
 
 
4. ANÁLISE DA DEPENDÊNCIA ESPACIAL 
As duas funções utilizadas com maior intensidade na geoestatística para a 
determinação da dependência espacial ou temporal de variáveis são a função autocorrelação 
(que gera o autocorrelograma) e a função semivariância (que gera o semivariograma). 
Passaremos a descrever rapidamente a função autocorrelação e em seguida, com 
maior detalhamento, será descrita a função semivariância e semivariograma com 
instrumento de análise espacial de dados. 
 
 
4.1. Autocorrelação e autocorrelograma 
Quando estamos trabalhando com variáveis bidimensionais, temos que a 
covariância é uma medida de associação entre as variáveis. Entretanto esta função tem a 
desvantagem de possuir as unidades das variáveis que a geram e, também, não ter um 
padrão de comparação, por exemplo, se calculamos a covariância entre X e Y e 
encontramos o valor de 0,75 não podemos dizer se as variáveis estão com forte associação 
positiva ou não. 
A covariância é dada por: 
]}yY].[xX{[E)y,xcov( µ−µ−= 
O cálculo da covariância pode ser pensada também para a análise espacial. Se 
analisarmos a Variável Z nas posições t e t+h temos: 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 22 
 
)])ht(Z).()t(Z[(E)]ht(Z),t(Zcov[ )ht(Z)t(z +µ−+µ−=+ 
Se a variável Z é estacionária, esta função poderá ser estimada por: 
1
1
−
−+−
=+
∑
=
)h(n
]Z)ht(Z[]Z)t(Z[
))ht(Z),t(Zcov(
)h(n
i
ii
, pois 
neste caso a média de Z(t) será igual à média de Z(t+h). 
Uma propriedade da covariância diz que "se duas variáveis aleatórias são 
independentes então a covariância entre elas é igual a zero". Portanto, ao analisarmos a 
variável Z nas posições t e t+h, com h=1,2,...k, espera-se que o valor da covariância comece 
alto e depois tenda a zero, sendo que quanto maior for o valor da covariância maior será a 
relação espacial e para covariância zero teremos independência. A Figura 9 ilustra uma 
função covariância. 
-1
0
1
2
3
0 100 200 300 400 500 600
distâncias (m)
co
va
riâ
nc
ia
s
 
Figura 8. Exemplo de uma função covariância 
 
Comentamos, anteriormente, que a autocovariância apresenta algumas dificuldades 
de interpretação. Vamos então definir a função autocovariância como uma alternativa de 
interpretação da dependência espacial de uma variável Z. 
Esta função tem a vantagem de ser adimensional e estar limitada ao valor -1 e 1, 
permitindo comparações entre variáveis e também inferências sobre o grau de associação 
(dependência). 
Vamos inicialmente fazer uma analogia com as variáveis bidimensionais. 
Considerando as variáveis X e Y, temos: 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 23 
 
yx
)]Y,Xcov[)y,x(
σσ
=ρ que pode ser estimada por: 
yx
n
i
SS
n
]YY[]XX[
)y,x(r 1
1
−
−−
=
∑
=
 
 Neste caso quanto mais próximo de 1 ou de -1, maior a relação entre as variáveis e 
quanto mais próximo de 0, menor a relação linear entre X e Y. 
A função autocorrelação é definida como sendo a razão entre a covariância dos 
valores assumidos pela variável Z, nas posições t e t+h e a variância dessa variável Z, em 
função da distância h, no caso de variável estacionária de segunda ordem. Desta forma tem-
se: 
 2
)](),([
)]([
)](),(cov[)(
σ
ρ htZtZCov
tZVar
htZtZh +=+= 
Trabalhando-se com dados amostrais ρ(h) pode ser estimado por r(h): 
 2
1
1
s
)h(n
]Z)ht(Z[]Z)t(Z[
)h(r
)h(n
i
ii
−
−+−
=
∑
=
 
em que: 
ρ (h) é a autocorrelação entre os valores da variável Z, separados pela distância h 
(autocorrelação populacional); 
Cov [Z(t), Z(t+h)] é a covariância entre a variável Z(t) e a variável Z(t+h); 
Var[Z(t)] = σ2 é a variância populacional, ou seja, a covariância entre Z(t) e Z(t+h) quando 
h=0; 
r(h) é a autocorrelação amostral para a distância h; 
n(h) é o número de pontos amostrais separados pela distância h; 
Z é o valor médio (média amostral) da variável Z(t); 
s
2
 é a variância amostral de Z(t). 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 24 
 
A Figura 9 mostraum exemplo de comportamento da função autocorrelação. 
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
0 100 200 300 400 500 600
distância (m)
r(h
)
 
Figura 9. Exemplo de um autocorrelograma experimental 
 
 O uso dessa função no estudo da dependência espacial ou temporal só é válida se a 
hipótese de estacionaridade de segunda ordem for atendida. 
 Teoricamente, para h = O a autocorrelação é máxima, ou seja, r(0) = 1 e este valor 
decresce até o zero, ou seja, até uma distância ou tempo que não exista relação entre as 
observações. Esta distância define a amplitude de dependência espacial ou temporal (a), 
sendo que acima dessa distância os dados são considerados independentes entre si. Este tipo 
de comportamento indica que quanto mais próximas estiverem as amostras maior o grau de 
semelhança entre elas e este grau de semelhança decresce com o aumento da distância entre 
observações. 
 Podemos ter ainda o autocorrelograma para toda distância com valor de 
autocorrelação igual a zero (r(h) = 0), exceto para h=0 em que r(0) = 1, assim temos 
independência entre as amostras para toda à distância ou tempo de estudo. 
Uma outra possibilidade é o autocorrelograma com autocorrelações flutuando em 
torno de zero (indica independência entre as observações) e o autocorrelograma cíclico, que 
indica flutuações periódicas na variável estudada, conforme Figura 10A e 10B. 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 25 
 
-0.2
0
0.2
0.4
0.6
0.8
1
1.2
0 5 10 15 20
h
r(h
)
 
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
1.2
0 5 10 15 20
h
r(h
)
 
Figura 10. Exemplos de autocorrelogrmas: A) independência entre observações; B) 
periodicidade da variável. 
 
 
4.2. Semivariograma 
a) Definição do semivariograma 
 O semivariograma é definido como: 
 )]}()([{
2
1)( htZtZVarh +−=γ 
 Note que Var[Z(t) –Z(t+h)] é a variância dos dados separados por uma distância h, 
mas, na expressão acima, esta variância está sendo divida por dois, então se utiliza o 
prefixo “semi” para distinguir da variância e daí vem o nome semivariância para γ(h) e 
semivariograma para o gráfico de γ(h) em função de h. 
A 
B 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 26 
 
 
Observação: O divisor 2 da variância surge das deduções e simplificações 
matemáticas. 
 
Sob a suposição de tendência zero, temos: E[Z(t+h)] = E[Z(t)] e, portanto: 
 })]()([{
2
1)( 2tZhtZEh −+=γ 
e uma estimativa de γ(h) chamada de )(
^
hγ é dada por: 
 )(2
)]()([
)(
)(
1
2
^
hn
tZhtz
h
hn
i
∑
=
−+
=γ 
em que n(h) é o número de pares separados pela distância h. 
 Relembrando a condição de estacionaridade, temos que a utilização do 
semivariograma exige que pelo menos a hipótese intrínseca seja atendida, ou seja, exige a 
condição de estacionaridade mais fraca quando comparada com a autocorrelação. 
 
b) Caracterização do semivariograma 
 Analisando a expressão da função semivariância, pode-se imaginar que quanto mais 
próximos estiverem os pontos amostrados, maior será a semelhança entre eles e, portanto, 
menor a semivariância; e quanto mais distantes estiverem os pontos amostrados menor será 
a semelhança e, consequentemente, maior a dispersão (variância). Na teoria temos que para 
a distância h=0 a semivariância γ(0) = 0 e, a semivariância γ(h) cresce com o incremento 
de h, até atingir um valor constante para γ(h) que corresponde às variações aleatórias, ou 
seja, variações que não são justificada pela semelhança de um ponto com outro. 
 A distância h a partir da qual γ(h) se torna aproximadamente constante é chamada 
de alcance da dependência espacial (a) sendo que as medições realizadas a distâncias 
maiores que a, tem distribuição espacial aleatória e, portanto, são independentes entre si. O 
valor de γ(h) constante é chamado de patamar (C). 
 A utilização de dados amostrais na estimativa da semivariância e na construção do 
semivariograma, revela que, freqüentemente, para h = 0 a semivariância γ(0) difere de zero. 
A impossibilidade de se fazer reamostragem exatamente sobre um ponto já amostrado 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 27 
 
(nestes casos pode ocorrer variações a distâncias menores do que a menor distância de 
amostragem) e erros como erros de amostragem, erros de análise de laboratório, etc., são 
justificativas dessa descontinuidade na origem. Quando γ(0) ≠ 0, surge um novo termo no 
semivariograma chamado de efeito pepita (C0) e, neste caso, o patamar é dado por: 
C0 + C. 
 
 Observação: Pode-se mostrar que o patamar do semivariograma (C0 + C) é uma 
estimativa sem tendência da variância (σ2) da variável Z(t). 
 
 Nas Figuras 11A e 11B apresentamos o comportamento ideal de um 
semivariograma e também são mostrados os parâmetros do modelo descritos acima. 
 
 
 
 Figura 11. Semivariogramas: (A) sem efeito pepita; (B) com efeito pepita 
 
 Os semivariogramas apresentados na Figura 11 indicam estacionaridade de segunda 
ordem para a variável, porque apresenta patamar claro e bem definido. 
 Se o semivariograma for constante e igual ao patamar para qualquer valor de h, 
temos o efeito pepita puro e, neste caso, temos a ausência total de dependência espacial, 
ou seja, a dependência espacial, se existir, será manifestada à distância ou tempo menor do 
que o menor espaçamento entre amostras. 
 Um outro tipo de semivariograma é aquele que apresenta a semivariância com 
flutuações. Este semivariograma é chamado de semivariograma periódico ou cíclico e 
indica uma periodicidade nos dados que pode ser explicada por algum fator conhecido e 
analisada por meio da densidade espectral. 
a 
C 
C0 + C 
C0 
a INDEP 
DEP. DEP. 
INDEP. 
(A) (B) 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 28 
 
Também podemos ter um tipo de semivariograma em que as semivariâncias 
crescem, sem limites, para todos os valores de h, ou seja, semivariogramas sem patamar 
definido. Este semivariograma indica que a hipótese de estacionaridade de segunda ordem 
não foi atendida e, provavelmente, estamos trabalhando com a hipótese intrínseca ( 
fenômeno com capacidade infinita de dispersão). Ele indica também que a máxima 
distância h entre as amostras não foi capaz de exibir toda a variância dos dados e 
provavelmente existe tendência dos dados para determinada direção. Se for verificada a 
tendência remove-se esta tendência e verifica-se se a variável resíduo apresenta 
semivariograma com patamar (estacionaridade de segunda ordem). Uma outra alternativa é 
trabalhar com a hipótese de tendência nos dados originais. Vale ressaltar que a primeira 
alternativa é a mais simples e a mais utilizada. Se o semivariograma dos resíduos apresenta 
efeito pepita puro, pode-se dizer que a superfície de tendência é a melhor representação 
espacial da variável. Uma metodologia de se ajustar superfícies de tendência é a utilização 
de regressão múltipla. 
Podemos ter ainda um semivariograma com mais de uma estrutura de variância, que 
são chamados de semivariogramas com estruturas entrelaçadas ou semivariogramas 
imbricados. Neste caso uma explicação prática poderia estar associada ao fato de estarmos 
trabalhando com mais de uma população, ou seja, até uma distância X estamos trabalhando 
com uma determinada população e a partir daí outra ou outras populações. 
As Figuras 12A, 12B, 12C, 12D e 12E, mostram respectivamente, semivariogramas 
experimentais com patamar definido, efeito pepita puro, sem patamar, cíclico e com 
estruturas entrelaçadas. 
 
 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 29 
 
0
5
10
15
20
0 510 15 20
h
ga
m
a 
(h)
 
0
5
10
15
20
0 5 10 15 20
h
ga
m
a 
(h)
 
0
5
10
15
20
0 5 10 15 20
h
ga
m
a 
(h)
 
0
2
4
6
8
10
0 5 10 15 20
h
ga
m
a 
(h)
 
A 
B 
C 
D 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 30 
 
0
10
20
30
40
0 5 10 15 20 25 30
h
ga
m
a(h
)
 
Figura 12. Semivariogramas: A) Com patamar; B) Efeito pepita puro; C) sem patamar 
D)Cíclico e E) Com estruturas entrelaçadas 
 
 
c) Grau de dependência espacial 
 Quanto ao grau de dependência espacial da variável em estudo, podemos classifica-
la como: 
i) variável com forte dependência espacial – se o efeito pepita for menor ou igual a 25% 
do patamar 



<
+
25,0
0
0
CC
C
; 
ii) variável com moderada dependência espacial – se o efeito pepita representar entre 
25% e 75% do patamar 



≤
+
≤ 75,025,0
0
0
CC
C
; 
iii) variável com fraca dependência espacial – se a relação entre efeito pepita e patamar 
estiver entre 75% e 100% 



<
+
< 00,175,0
0
0
CC
C
 
iv) variável independente espacialmente – se a relação entre efeito pepita e patamar for 
igual a 100%, neste caso temos o semivariograma com efeito pepita puro 




=
+
00,1
0
0
CC
C
. 
 
 
 
E 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 31 
 
d) Isotropia e anisotropia 
 Note que h é um vetor e, consequentemente, o semivariograma depende da 
magnitude e da direção de h. Quando o semivariograma é idêntico para qualquer direção de 
h ele é chamado de isotrópico e quando o semivariograma apresenta os parâmetros C, C0, a 
e/ou modelo diferenciado dependendo da direção de h, ele é chamado anisotrópico 
(podemos classificar a anisotropia em anisotropia geométrica ou anisotropia zonal). Se o 
semivariograma é anisotrópico ele deve sofrer transformações antes de ser usado. Vieira 
(1995) alega que, em geral, a precisão da interpolação ou o tipo de hipótese satisfeita, não 
são afetados se, ao invés de se preocupar com a escolha de método de transformação de 
anisotropia, apenas limitar a faixa de distância na qual se utiliza o semivariograma. As 
principais direções de h que são examinadas são: 0o (na direção X), 90o (na direção Y), 45o 
e 1350 (nas duas diagonais principais). 
 Quando os dados forem coletados em uma transeção (linha), o semivariograma é 
unidimensional e nada pode ser dito sobre anisotropia. 
 
e) Os principais modelos de semivariogramas 
 Dados experimentais são influenciados por uma série de fatores. Um pesquisador, 
geralmente, não é capaz de controlar todos os fatores que influenciam um conjunto de 
dados. Desta idéia surge a distinção entre modelo matemático e modelo estatístico. 
 No modelo matemático não temos desvios em relação à função proposta, ou seja, 
todos os pontos experimentais devem estar sobre a função proposta para explicar 
determinado fenômeno. Por exemplo, se tomarmos os pares ordenados (0,0); (2,4); (3,9); 
(4,16) e (5,25) como sendo valores experimentais e propormos o modelo: Yi= Xi2, como o 
modelo que explique o comportamento desses dados experimentais, estaremos trabalhando 
com um modelo matemático, pois, todas as observações pertencem ao modelo proposto 
(Figura 13). 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 32 
 
 
y = x2 
-5
0
5
10
15
20
25
30
0 1 2 3 4 5 6
X
Y
 
Figura 13. Modelo Matemático 
 
 Para o modelo estatístico os valores experimentais apresentam desvios (erros) em 
relação ao modelo proposto (ajustado) e estes erros são atribuídos a fontes de variações não 
controladas pelo pesquisador. Por exemplo, podemos ter o seguinte modelo estatístico que 
explique o comportamento linear de uma variável Y em função de X: Yi = a +bXi +ei, 
(Figura 14) em que a e b são as constantes que definem a reta e ei são os erros 
experimentais (maiores detalhes podem ser obtidos em textos e livros sobre modelos 
lineares ou análise de regressão). 
 
y = 2.0286x + 1.4286+ei
0
5
10
15
0 1 2 3 4 5 6
X
Y
 
 Figura 14. Modelo Estatístico 
 
 Na aplicação da teoria geoestatística a dados experimentais, vamos ajustar modelos 
teóricos de semivariogramas as semivariâncias experimentais, e desta forma estaremos 
trabalhando com modelos estatísticos de semivariogramas. 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 33 
 
 O gráfico da semivariância (γ(h)) em função da distância (h), mostrará uma série de 
pontos discretos que é chamado semivariograma experimental. Uma função contínua deve 
ser ajustada as semivariâncias experimentais. 
 A escolha do modelo de semivariograma que será utilizado é um dos aspectos mais 
importantes da geoestatística. Todos os cálculos da geoestatística dependem do modelo de 
semivariograma ajustado e, conseqüentemente, se o modelo ajustado não for apropriado, 
todos os cálculos seguintes conterão erros que poderão afetar as inferências, portanto o 
ajuste de semivariograma é uma fase crucial na análise geoestatística e deve receber uma 
atenção especial. 
 Vários métodos são utilizados para verificar a qualidade do ajuste do 
semivariograma aos dados experimentais. 
Vieira et al (1983) sugerem o método de ajuste por tentativa e erro (ajuste a critério 
do observador) associado à avaliação do modelo pela técnica de validação cruzada ou 
autovalidação (“jack-Knifing”). 
Macbratney e Webster (1986) sugerem o método do Critério de Informação de 
Akaike (AIC) para avaliar o modelo. Já Pannatier (1996) sugere a utilização do "Indicação 
da Qualidade do Ajuste" (IGF). 
A descrição de cada método de seleção pode ser encontrado nos respectivos 
trabalhos originais dos autores e cada programa de análise geoestatística de dados apresenta 
um critério de seleção. 
O programa GS+, com o qual estamos exemplificando este texto, aplica a 
metodologia dos mínimos quadrados para os ajustes dos modelos e utiliza como critérios 
para seleção do modelo: i) o coeficiente de determinação (R2), que, relembrando os 
conceitos de análise de regressão, é uma relação entre a soma de quadrados devido ao 
modelo ajustado e a soma de quadrados total (mede a variação dos dados devido ao modelo 
ajustado em relação à variação total dos dados) e quanto mais próximo da unidade estiver o 
valor de R2 melhor será o modelo ajustado; ii) Soma de quadrados de resíduos (RSS) – 
quanto menor for este valor, melhor será o modelo de semivariograma. O GS+ utiliza este 
resultado para a seleção do modelo e, por meio de combinações dos parâmetros do modelo, 
minimiza esta soma de quadrados de resíduos. O autor do programa alega que a utilização 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 34 
 
desse critério na seleção do modelo é preferido, por ser este mais sensível e mais robusto 
quando comparado com o coeficiente de determinação (R2). 
 
Observação: Em muitos casos (talvez na maioria dos casos) a sensibilidade de quem está 
trabalhando com os dados e o conhecimento sobre a variável é de fundamental importância 
na opção do modelo de semivariograma. Às vezes é preferível selecionar um modelo com 
R2 um pouco menor ou RSS um pouco maior que o sugerido pelo programa, mas que 
represente melhor os dados. De maneira geral, quanto mais simples puder ser o modelo 
ajustado, melhor, e também não se deve dar importância excessiva a pequenas flutuações. 
 
 A condição para o ajuste de modelos a dados experimentais é que ele represente a 
tendência de γ(h) em relação à h e que o modelo tenha positividade definida condicional. 
De maneira geral, um modeloé positivamente condicional se γ(h)> 0 e γ(-h) = γ(h), 
qualquer que seja h. 
 Definindo C0 como efeito pepita, C0 + C como patamar e a como alcance, os 
principais modelos de semivariogramas utilizados na geoestatística são: 
i) modelo linear com patamar 



>+
≤≤+
=
ahCC
ahh
a
CC
h
0
0 0)(γ
 
Neste caso C/a é o coeficiente angular para 0< h < a 
 
ii) modelo esférico 



>+
≤≤



 


−


+
=
ahCC
ah
a
h
a
hCC
h
0
3
0 02
1
2
3
)(γ
 
 
iii) modelo exponencial 
[ ] dheCCh ah <<−+= − 01)( )]/(3[0γ 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 35 
 
Neste modelo e no modelo de gaussiano d é a distância máxima na qual o semivariograma 
é definido e nestes modelos o patamar (a) é atingido apenas assintoticamente O parâmetro a 
é determinado visualmente como a distância após a qual o semivariograma se estabiliza. 
 
iv) modelo gaussiano 
[ ] dheCCh ah ≤≤−+= − 01)( 2)/(3[0γ 
v) modelos sem patamar 
200 <<+=γ BAhC)h( B 
Os parâmetros A e B são constantes que definem o modelo, sendo que B tem que ser 
estritamente maior que zero e menor que dois para garantir a condição de positividade 
definida condicional. 
 
Observação: dependendo da escala de trabalho e do espaçamento entre amostras, pode-se 
ter mais de um modelo de semivariograma para os dados. Nestes casos temos as estruturas 
entrelaçadas. 
 
 As Figuras 15A e 15B mostram os aspectos gerais dos modelos de semivariogramas 
discutidos anteriormente. 
 
 
Figura 15. Modelos de semivariograma: (A) com patamar; (B) sem patamar. 
 
Observação: Nos modelos exponencial e gaussiano, apresentados no programa GS+, a 
amplitude a que deve ser considerada como a amplitude de dependência espacial deve ser 
igual a três vezes e 3 vezes, respectivamente, o valor de A0, ou seja, a amplitude efetiva 
Linear 
Gaussiano 
Exponencial 
Esférico 
A=8,0; B=0,5 
A=0,9; B=1,0 
A=0,1;B=1,5 
(A) (B) 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 36 
 
apresentada na coluna posterior a coluna de A0. Isto ocorre porque os modelos 
exponencial e gaussiano utilizados no programa não consideram o fator 3 apresentados nos 
modelos anteriores. 
 
4.3. O uso do software GS+ na determinação do semivariograma 
No programa GS+ o ícone indica que a análise da dependência espacial será 
realizada por meio do semivariograma. 
 
Observação: Existem outras opções de análises que são apresentadas em 
“autocorrelation” ou nos respectivos ícones na barra de ferramentas. 
 
Ativando o ícone do semivariograma, o programa apresenta a seguinte janela 
(Figura 16): 
 
 
 
 
 
 
 
Figura 16. Análise da semivariância 
Distância máxima 
para cálculo das 
semivariâncias 
Passos para 
cálculo da 
semivariância 
Análise de 
anisotropia 
Cálculo das 
semivariâncias e do 
semivariograma 
Exibe o 
semivar. 
Variância 
amostral 
Semivar. 
escalonado 
Semivariograma 
isotrópico 
Semivariogramas 
anisotrópicos 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 37 
 
A distância máxima para cálculo da semivariância deve ser no máximo igual à 
máxima distância de coleta da amostra. O GS+ adota como critério inicial 80% da distância 
máxima, isto se justifica pelo fato de que a grandes distâncias o número de pares para o 
cálculo da semivariância reduz-se drasticamente, fazendo com que a estimativa da 
semivariância tenha pouca precisão. Este valor pode ser alterado pelo usuário. 
Os passos para cálculo das semivariâncias consiste em como as semivariâncias 
vão ser agrupadas. Quanto maior for este valor menos pontos teremos no semivariograma. 
Vale ressaltar também que, se este passo for muito pequeno, teremos classes de distância 
sem pares para cálculo da semivariância. 
Para a análise do semivariograma isotrópico o ângulo de tolerância (offset 
tolerance) deve ser de 900 e, neste caso, os semivariogramas para as diferentes direções 
(anisotrópico) serão iguais ao semivariograma isotrópico. Não abordaremos neste texto a 
discussão sobre anisotropia e procedimentos de análise de anisotropia. 
A janela apresentada na Figura 9 mostra também as opções de exibição do 
semivariograma. Se marcarmos apenas a primeira opção, teremos o semivariograma 
experimental e uma proposta de modelo ajustado. Marcando-se a primeira e a segunda 
opções, temos o semivariograma experimental, a proposta de modelo e uma linha paralela 
ao eixo X que representa a variância dos dados. Na terceira opção é exibido o 
semivariograma escalonado, ou seja, o semivariograma onde cada semivariância é dividida 
pela variância dos dados. 
A Figura 17 ilustra o resultado de um semivariograma. 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 38 
 
 
 
 
 
Figura 17. Exemplo de um semivariograma 
 
Note que a Figura 17 apresenta ainda a opção model e a opção expand. O resultado 
da execução dessas funções são apresentados nas Figuras 18 e 19. 
A Figura 18 exibe as opções de modelos de semivariogramas. 
 
 
 
 
 
 
Figura 18. Modelos e análises dos modelos 
Mostra o semivariograma 
com os respectivos 
parâmetros e ajuste 
Mostra as opções de modelos 
com os parâmetros e ajuste 
modelos 
Efeito 
pepita 
patamar amplitude 
Amplitude 
efetiva (exp 
e gaussiano). 
Relação 
entre C e 
patamar 
Coef. 
Determinação e 
soma de quadrados 
de erros 
Refaz o semivariograma 
padrão do GS+ 
Aplica o novo 
modelo caso haja 
modificação 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 39 
 
 O GS+ permite, no comando model (Figura 18), visualizar os modelos com os 
respectivos ajuste feito pelo programa (vale relembrar que o GS+ seleciona o modelo com 
menor soma de quadrados de resíduos (RSS)). Ao usuário é permitido a modificação do 
modelo selecionado pelo GS+ ou, então, dos parâmetros dos modelos e, realizadas 
modificações, o comando apply deve ser ativado para que o programa tome este modelo 
como o modelo de variabilidade espacial ou temporal daquela variável. Para retornar ao 
modelo padrão do GS+ utilize o comando refit. 
 
Observações: 
a) O programa não apresenta o modelo de efeito pepita puro. Para obter este modelo 
utilize o modelo linear com C0 = C0 +C. 
b) A amplitude efetiva é utilizada no GS+ para determinar a amplitude de dependência 
espacial dos modelos exponencial e gaussiano, devido a formula de cálculo desses 
modelos no programa, A0 ≠ A (Estes modelos no GS+ não consideram o fator 
multiplicativo 3). 
c) A inclinação no modelo linear e linear com patamar (coeficiente angular) e dado pela 
relação entre C e A0, ou seja, C/A0. 
d) A relação entre C e C0+C nos dá uma idéia do grau de dependência espacial da variável, 
sendo que quanto mais próximo de 1, maior a dependência espacial. Note que 
CC
C
CC
C
+
−=
+ 00
0 1 e o primeiro termo já foi discutido no item grau de dependência 
espacial, classificando a dependência como fraca, moderada e forte. 
e) R2 (coeficiente de determinação) e RSS (soma de quadrados de resíduos) nos informa 
sobre a qualidade do ajuste do modelo. 
f) No ajuste do modelo a sensibilidade do usuário é muito mais importante do que os 
valores de R2 e RSS e, portanto, tentativas de ajustes diferentes ao proposto pelo 
programa devem ser utilizadas, mesmo que isso cause queda no valor de R2 e acréscimo 
no valor de RSS. 
g) O programa não apresenta a opção de ajuste de modelo sem patamar diferente do linear. 
Neste caso, sugere-se que se copie as semivariâncias calculadas para outro programa e 
que o gráficoseja feito neste outro programa, por exemplo, O Excel. 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 40 
 
 
 
 
A Figura 19 mostra o resultado da execução do comando expand. 
 
 
 
 
 
 
Figura 19. Semivariograma e opções de edição 
 
 Nesta tela temos a exibição das semivariância calculadas, do modelo de 
semivariograma ajustado e dos parâmetros desse modelo. A listagem dos valores de 
semivariâncias com as respectivas distâncias de cálculo (list values), permite que estes 
valores sejam transportados para outros programas e que se faça vários modelos em uma 
única figura. 
 
 
 
 
Semivariograma 
experimental e 
modelo ajustado 
Parâmetros do 
modelo 
ajustado 
Lista semivariância 
calculada, com 
distâncias e número de 
pares 
Mostra as diferenças 
quadráticas que geram 
a semivariância 
Edita o 
semivariograma 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 41 
 
4.4. Exemplos de aplicação 
1) Suponha que os dados abaixo representem a variável Z (por exemplo, % de areia de um 
certo solo). A amostragem foi feita em uma transeção e as amostras foram coletadas a 
cada 20 m. Faça a análise descritiva da variável, calcule as semivariâncias, monte o 
semivariograma experimental e proponha um modelo de ajuste. (note que estes dados 
são unidimensionais). 
Tabela 1. Dados de % de areia em um solo. 
h (m) 0 20 40 60 80 100 120 140 
%Areia 16 18 17 20 15 15 15 15 
h(m) 160 180 200 220 240 260 280 300 
%Areia 17 17 17 18 18 19 18 18 
h(m) 320 340 360 380 400 420 440 460 
%Areia 18 21 16 20 16 18 18 17 
h(m) 480 500 520 540 560 580 600 620 
%Areia 18 18 20 17 17 17 17 18 
Observação: para ser resolvido sem o uso de programas de geoestatística 
Solução: 
a) Análise descritiva 
Média 17.46875 
Erro 
padrão 
0.265581 
Mediana 17.5 
Moda 18 
Desvio 
padrão 
1.50235 
Variância 2.257056 
Curtose 0.129546 
Assimetria 0.27713 
Mínimo 15 
Máximo 21 
 
A análise descritiva mostra que os dados possuem uma distribuição de probabilidade 
normal aproximada (média, mediana e moda aproximadamente iguais; curtose e assimetria 
próximos de zero; gráfico tendendo à simetria). A variabilidade do dados é relativamente 
baixa (desvio padrão = 1,5023 e CV = 8,6%) e os valores mínimo e máximo indicam a não 
existência de problemas amostrais com os dados. 
 
 
 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 42 
 
b) Semivariância e semivariograma 
Os valores das distâncias h, das semivariâncias (γ(h)) e números de pares(n(h)) utilizados 
no cálculo são apresentados abaixo. 
 
Distâncias de cálculo, valores de semivariância e número de pares. 
Distância h (m) Semivariância (γ(h)) Número de pares (n(h)) 
20 2,129 31 
40 1,417 30 
60 2,500 29 
80 2,214 28 
100 2,037 27 
120 2,327 26 
140 2,120 25 
160 2,396 24 
180 2,065 23 
200 2,545 22 
220 2,738 21 
240 2,825 20 
260 2,711 19 
280 1,778 18 
300 2,735 17 
320 1,719 16 
340 3,367 15 
360 1,857 14 
380 2,808 13 
400 2,375 12 
420 2,318 11 
440 2,400 10 
460 1,056 9 
 
A representação gráfica (semivariograma) das semivariâncias em função da distância h 
(semivariograma experimental) e uma proposta de modelo ajustado aos dados 
experimentais são apresentados na figura abaixo. 
0.000
1.000
2.000
3.000
4.000
0 100 200 300 400 500
h (m)
se
m
iv
ar
iâ
nc
ia
 
Semivariograma experimental e modelo ajustado. 
 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 43 
 
O modelo proposto inicialmente é um modelo exponencial, com efeito pepita (C0) 
de 1,0 (%)2, patamar (C0+C) de 2,3 (%)2 e alcance (a) de 120 m. (Observação: não foi 
realizado nenhum teste para verificar se este é o melhor modelo de semivariograma para 
esta variável). 
 Neste caso o semivariograma mostra uma dependência espacial para a % de areia 
até 120 m, ou seja, amostras coletadas a distância inferiores a 120 m possui dependência 
espacial e, no caso da utilização de métodos de análises estatísticas que consideram 
independência entre amostras, à distância de amostragem mínima deveria ser de 120 m. 
OBS: Exercício resolvido com o auxílio do MS-EXCEL 
 
2) Utilizando os dados do exemplo anterior (exemplo1) refaça a análise utilizando o GS+ 
Solução: 
a) Análise descritiva 
 
 
b) Semivariograma 
O modelo proposto pelo GS+ foi: 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 44 
 
 
O modelo proposto no exemplo 1 apresenta o seguinte resultado: 
 
Comparando os dois modelos verifica-se ligeiro aumento de r2, mantendo-se o mesmo valor 
de RSS, desta forma o modelo proposto no exemplo 1 poderia ser utilizado. 
As descrições e discussões seguem o padrão do exemplo 1. 
Lembre-se que o modelo adotado foi o exponencial e portanto o alcance efetivo será de 
40,80 m no primeiro caso e de 120 m no segundo caso. 
Outros modelos poderiam ser sugeridos neste caso. 
 
 
 
 
 
 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 45 
 
3) A seguir apresentamos as coordenadas X (m), Y (m) e a variável silte (%) em uma área 
experimental. 
X 0 0 0 0 0 0 0 0 10 10 10 10 10 10 10 10 
Y 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70 
PBPD 12.77 12.84 11.39 12.30 12.43 12.43 12.45 12.74 11.39 12.32 12.16 11.49 10.39 11.32 11.24 12.49 
X 20 20 20 20 20 20 20 20 30 30 30 30 30 30 30 30 
Y 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70 
PBPD 11.25 11.97 12.38 12.85 12.55 12.49 12.58 12.82 12.49 11.67 11.59 12.72 11.12 11.18 11.53 11.48 
X 40 40 40 40 40 40 40 40 50 50 50 50 50 50 50 50 
Y 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70 
PBPD 11.81 11.19 11.46 11.44 12.39 12.17 11.69 12.32 11.58 11.11 11.55 10.79 11.13 11.29 12.62 12.01 
X 60 60 60 60 60 60 60 60 70 70 70 70 70 70 70 70 
Y 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70 
PBPD 12.66 11.49 11.25 12.87 12.77 11.95 11.96 11.11 10.81 11.65 12.36 11.90 12.16 12.56 12.54 11.46 
 
Realizar a análise dos dados e verificar se existe dependência espacial para essa variável. 
 SOLUÇÃO: 
a) Análise descritiva 
O resultado das principais estatísticas dessa variável é apresentado a seguir: 
 
Nota-se que a área apresenta, em média, 11,92% de silte, com dispersão média em torno 
desse valor de 0,6302%. Esta dispersão em torno da média representa uma variabilidade de 
5,29% (CV=5,29%), mostrando que os dados têm uma baixa dispersão. Os coeficientes de 
assimetria e curtose com os respectivos erros padrão indicam tendência simétrica dos 
dados, mas a curva do tipo platicúrtica, diferindo da curva normal (mesocúrtica). Com base 
em uma análise visual do histograma, verifica-se uma distribuição de freqüências bimodal 
para esta variável. 
 
A distribuição das amostras na área segundo o valor de ocorrência é a seguinte: 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 46 
 
 
Não se observa tendências de concentração de valores em posições específicas da área e 
também não ocorre sentido preferencial na distribuição dos dados, tal fato é um primeiro 
indicativo de que a distribuição espacial dessa variável, nesta área, é aleatória e isotrópica. 
 
b) Análise do semivariograma 
A seguir é mostrado o semivariograma dessa variável: 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 47 
 
 
O modelo apropriado para descrever o comportamento espacial dessa variável foi o modelo 
de efeito pepita puro. Nota-se que as semivariâncias experimentais estão em torno da linha 
paralela ao eixo x, ou seja, C0 + C = 0,397. Conclui-se, portanto, que a distribuição espacial 
do silte nesta área experimentalé aleatória e as amostras, para a malha amostrada (com 
distância entre pontos de 10 m), são independentes. 
 
4) Os dados apresentados abaixo referem-se a umidade de um solo. As amostras foram 
coletadas em uma malha contendo 63 pontos com espaçamento de 20 m entre amostra, 
perfazendo 9 colunas e 7 linhas de amostragem. 
 X 20 40 60 80 100 120 140 160 180 20 40 60 80 100 120 140 
Y 20 20 20 20 20 20 20 20 20 40 40 40 40 40 40 40 
U 28.16 27.16 26.09 27.27 27.61 26.61 26.13 29.73 31.12 27.52 26.54 26.45 24.98 27.93 26.91 24.13 
X 160 180 20 40 60 80 100 120 140 160 180 20 40 60 80 100 
Y 40 40 60 60 60 60 60 60 60 60 60 80 80 80 80 80 
U 27.80 29.69 28.40 27.63 27.42 26.81 26.37 28.61 27.66 30.17 28.86 26.58 26.03 26.72 27.50 26.44 
X 120 140 160 180 20 40 60 80 100 120 140 160 180 20 40 60 
Y 80 80 80 80 100 100 100 100 100 100 100 100 100 120 120 120 
U 23.63 26.83 25.46 24.17 26.61 24.49 22.35 22.05 22.05 24.98 23.35 26.18 22.30 27.89 24.64 24.20 
X 80 100 120 140 160 180 20 40 60 80 100 120 140 160 180 
Y 120 120 120 120 120 120 140 140 140 140 140 140 140 140 140 
PBPD 25.36 24.77 27.54 25.49 24.45 24.36 26.39 26.73 29.87 23.63 25.30 23.27 25.82 26.85 25.36 
 
Realizar a análise dos dados e verificar se existe dependência espacial para essa variável. 
 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 48 
 
Solução: 
a) Análise descritiva 
As estatísticas e o histograma da variável umidade foram: 
 
Verifica-se que este solo apresentou, na época de coleta, umidade média de 26, 24 g de 
água/100g de solo, com desvio padrão de 2,020 g/100g, o que representa uma variabilidade 
de 7,7%, considerada uma baixa variabilidade dos dados em torno do valor médio. Os 
histogramas, associado à assimetria e à curtose dos dados, mostram que os dados se 
distribuem segunda a curva normal. 
 
As posições ocupadas pelos valores de umidade do solo na área experimental (figura 
abaixo), mostram tendência de que os valores mais altos de umidade (acima de 27,50 
g/100g) se concentrem na metade inferior da malha, considerando o eixo Y como referência 
e, conseqüentemente, os valores abaixo de 27,50 g/100g se concentram na parte superior da 
malha, mostrando uma distribuição espacial não aleatória dos dados. Não é possível 
visualizar tendência de distribuição dos dados nas direções preferencias da malha, ou seja, 
provavelmente exista uma isotropia na distribuição da umidade do solo nesta área. 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 49 
 
 
b) Análise do semivariograma 
O semivariograma desta variável é: 
 
Nota-se que a variável umidade do solo apresenta dependência espacial, que pode ser 
descrita pelo modelo exponencial com alcance de 81 m, ou seja, amostras de umidade do 
solo selecionadas a distâncias inferiores a 81 m estão correlacionadas entre si. A relação 
entre o efeito pepita e o patamar de 13,63%, indica que a dependência espacial é forte. 
 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 50 
 
5. KRIGAGEM 
5.1. O interpolador 
O semivariograma é a ferramenta da geoestatística que permite verificar e modelar a 
dependência espacial de uma variável. Uma aplicação imediata do semivariograma é a 
utilização das informações geradas por ele na interpolação, ou seja, na estimativa de dados 
e posterior mapeamento da variável. O interpolador que utiliza o semivariograma em sua 
modelagem é chamado de krigagem. O nome krigagem é uma homenagem ao engenheiro 
sul-africano D. G. Krige. 
Para a aplicação da krigagem assume-se: que sejam conhecidas as realizações z(t1), 
z(t2), ..., z(tn) da variável Z(t), nos locais t1, t2, ..., tn; que o semivariograma da variável já 
tenha sido determinado; e que o interesse seja estimar um valor z* na posição t0. 
O valor estimado z*(t0) é dado por: 
 )()(*
1
0 ∑
=
=
n
i
ii tztz λ 
em que: n é o número de amostras de Z(t) envolvidas na estimativa de z*(t0), e λi são os 
pesos associados a cada valor medido, z(ti). 
 
Observação: Se existe a dependência espacial, os pesos λi são variáveis de acordo com a 
distância entre o ponto a ser estimado z*(t0) e os valores z(ti) envolvidos nas estimativas. Se 
ocorre a independência espacial, então : λi = 1/n e, portanto temos a média aritmética 
simples. 
 
A melhor estimativa de z*(t0) é obtida quando: 
a) o estimador é não tendencioso 
 0)}()(*{ 00 =− tztzE 
b) a variância da estimativa é mínima 
 mínimotztzVar =− )]()(*[ 00 
Para que z* seja uma estimativa não tendenciosa de z, a soma dos pesos das 
amostras tem que se igualar a 1. 
 1=∑ iλ 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 51 
 
E para obter a variância mínima sob a condição de ∑λi = 1, introduz-se o 
multiplicador de Lagrange para a dedução das equações e o sistema de krigagem resultante 
é: 
 ),(),( 0
1
tttt i
n
i
jii γµγλ =+∑
=
 
em que: µ é o multiplicador de Lagrange. 
A variância de estimativa é dada por: 
 ),( 02 tt iiE γλµσ ∑+= 
O sistema de equações da krigagem contém n+1 equações e n+1 incógnitas e uma 
única solução produz n pesos λ e um multiplicador de Lagrange µ. 
Em notação matricial, chamando de A a matriz das semivariâncias dos valores 
amostrados envolvidos na estimativa de z*(t0); λλ a matriz coluna que contém os pesos λi e o 
multiplicador de Lagrange e b a matriz coluna das semivariâncias entre os valores 
amostrados e o ponto a ser estimado, tem-se: 
 Aλλ=b 
E, portanto: 
 λλ=A-1b 
 A variância da estimativa (σE2) e dada por: 
 σE
2
 = btλλ 
 As matrizes A, b e λλ são: 
 
A=














0111
1),(.....),(),(
....
....
....
1),(....),(),(
1),(....),(),(
21
22212
12111
nnnn
n
n
tttttt
tttttt
tttttt
γγγ
γγγ
γγγ
; b=














1
),(
.
.
.
),(
),(
0
02
01
tt
tt
tt
nγ
γ
γ
; λλ= 














µ
λ
λ
λ
n
.
.
.
2
1
 
 
 
 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 52 
 
Observações: 
i) A matriz A é simétrica e possui diagonal principal igual a zero, ou igual ao valor do 
efeito pepita. 
ii) Os valores 1 que aparecem nas matrizes A e b são conseqüência do multiplicador de 
Lagrange. 
iii) O sistema deve ser resolvido para cada estimativa z* e para cada variação do 
número de amostras envolvidos na estimativa. 
 
5.2. A krigagem no programa GS+ 
A Figura 20 mostra a janela da krigagem no GS+. Para ativar a krigagem basta ativar o 
ícone com a letra k. 
 
 
 
 
 
Figura 20. Krigagem no GS+ 
 
A krigagem pode ser expressa por meio de mapas, sendo necessário para isto, ativar o ícone 
map, tendo como resultado a Figura 21. 
Informações sobre a 
malha 
Arquivo e tipo de 
arquivo para gravar a 
krigagem 
vizinhos 
Método de 
krigagem 
Modelo de 
semivariograma 
Validação cruzada 
UFU/FAMAT Geoestatística Básica e Aplicada 
Prof. Dr. Ednaldo Carvalho Guimarães 53 
 
 
Figura 21. Opções de mapas no GS+ 
 
Exemplo: Utilizando os dados no exemplo de umidade do solo (exemplo 4) fazer a 
krigagem e o mapeamento da variável umidade. 
Solução: 
Como exemplo de saída dos resultados da krigagem temos uma pequena parte dos 
resultados da krigagem, os resultados apresentam com as coordenadas (x,y), os valores 
krigados, os desvios padrão

Continue navegando