Buscar

Logistica nivelamento 01

Prévia do material em texto

23/06/2021
1
Agredecimentos ao Prof. Joaquim Barbosa que
gentilmente cedeu parte de seu curso de
Geoestatística para uso nessa disciplina.
Prof. Pedro Campos
Adaptado do curso do Prof. 
Joaquim Queiroz
1
Geoestatística
• Variáveis Regionalizadas
• Semivariograma Experimental
• Krigagem
• Análise Estrutural
• Isotropia e Anisotropia
• Efeito Pepita, Alcance e Patamar
• Validação Cruzada
• Simulação Geoestatística
P a l a v r a s - C h a v e
478
478.5
479
479.5
480
480.5
481
481.5
482
994
994.5
995
995.5
996
COME
RCIAL
HOSP
ITALID
ADE
CENT
RAL
N.HOR
IZONT
E
REMÉ
DIOS
 NOV
A BRA
SÍLIA
ELESB
ÃO
ICOMI
RIO AMAZONAS
CENT
RAL
ICOMI
CENT
RAL
ICOMI
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Adaptado do curso do Prof. Joaquim Queiroz
2
n Estatística
n Análise do inter-relacionamento entre amostras, sem considerar 
sua posição espacial.
Estatística x Geoestatística
1. Introdução à Geoestatística
n Geoestatística
n Análise da distribuição espacial das amostras
n Trabalha com amostras orientadas
n Trabalha com amostras anisotrópicas
n Somatório dos pesos 
n Minimiza a variância dos erros 
Adaptado do curso do Prof. Joaquim Queiroz
3
23/06/2021
2
• Envolve análise e inferência de variáveis distribuídas no espaço.
O QUE É GEOESTATÍSTICA ?
Limite da área
de estudo
Amostras de
campo••• • • • • • • • •
•
•
•
•
• • • • • • • • • •
• • • • • • • • • •
• • • • • • • • • •
• • • • • • • • •
• • • • • • • • • ••
•
•
•
•• • • • • • • • • • • •
• • • • • • • • • • •
•
• • • • • • • • •
•• •
Inferências
Ex: concentração de poluentes, variação do teor de zinco nos solos, etc.
Adaptado do curso do Prof. Joaquim Queiroz
4
Análise: estudar ou descrever a variabilidade espacial do fenômeno,
neste contexto denominado de análise estrutural ou modelagem
do semivariograma.
Inferência: conjunto de técnicas usadas para inferir valores, de uma
variável distribuída no espaço, em locais não amostrados. Neste
contexto denominado de Krigagem.
Adaptado do curso do Prof. Joaquim Queiroz
5
ORIGEM
• Estudo da variabilidade espacial de algumas características do solo:
uma das preocupações de pesquisadores desde o início do século.
• Smith (1910): estudou o efeito de variações do solo no
rendimento de milho.
• Montgomery (1913): estudou o efeito do nitrogênio no
rendimento do trigo, fez um experimento em 224 parcelas,
medindo o rendimento de grãos.
• Waynick e Sharp (1919): também estudaram variações de
nitrogênio e o carbono no solo.
Adaptado do curso do Prof. Joaquim Queiroz
6
23/06/2021
3
• Os procedimentos usados com base na estatística clássica e
utilizavam grandes quantidades de dados amostrais, visando
caracterizar a distribuição espacial da característica em estudo.
ORIGEM
Daniel G. Krige (1951): trabalhando com dados de concentração de
ouro na Africa do Sul, concluiu que somente a informação dada
pela variância seria insuficiente para explicar o fenômeno em
estudo. Para tal, seria necessário levar em consideração a
distância entre as observações.
Adaptado do curso do Prof. Joaquim Queiroz
7
ORIGEM
• Baseado nas observações de Krige, Matheron (1961, 1971)
desenvolve a Teoria das Variáveis Regionalizadas.
• A partir daí surge o conceito da GeoEstatística, que leva em
consideração a localização geográfica e a dependência
espacial.
Adaptado do curso do Prof. Joaquim Queiroz
8
Porque a Geoestatística ?
Existem vários métodos de estimativas ou de interpolação,
entretanto a geoestatística, dado a sua concepção, executa
estimativas minimizando os erros associados.
• Além dos valores estimados, são calculados os erros das
estimativas, que fornecerão o grau de precisão dos
mapas gerados.
• Toda a análise ou interpretação dos dados é feita sobre
modelos de variabilidade, que proporcionam a interação
da matemática com o fenômeno natural.
Adaptado do curso do Prof. Joaquim Queiroz
9
Krige.ppt
Matheron.ppt
23/06/2021
4
Usos da Geoestatística
• Transformação de um fenômeno físico em números 
(quantificação)
• Mapeamento : Interpolação – Extrapolação
• Estimação de distribuições espaciais
• Simulação para estudos críticos
• Quantificação e modelamento de incertezas
• Otimização amostral
• Análise de risco
• Integração de dados de diferentes tipos
Adaptado do curso do Prof. Joaquim Queiroz
10
Cuidados com a Geoestatística
• Ela não faz:
• Substituir dados adicionais
• Substituir o bom entendimento e correto 
julgamento do problema físico em questão 
(interpretação do fenômeno)
• Funcionar como caixa preta (uso indevido de 
softwares)
• Reduzir o tempo de trabalho
Adaptado do curso do Prof. Joaquim Queiroz
11
C E N Á R I O S
ETAPAS DO PROCESSO GEOESTATÍSTICO
ANÁLISE
EXPLORATÓRIA
ANÁLISE
ESTRUTURAL
REALIZAÇÃO DE
INFERÊNCIAS
D A D O S
Adaptado do curso do Prof. Joaquim Queiroz
12
23/06/2021
5
Roteiro um estudo geoestatístico
• Análise estatística preliminar
– Validação do banco de dados
– Análise exploratória dos dados
– Identificação de populações
• Análise da continuidade espacial
– Semivariância (ou autocorrelação) experimental
– Análise e interpretação dos variogramas
– Modelamento Þ proposta de modelo teóricos
• Previsões/Simulações
– Estimativas (interpolação)
– Avaliação de incertezas (intervalo de confiança, mapas 
probabilísticos)
– Modelos
Adaptado do curso do Prof. Joaquim Queiroz
13
Exemplo de estudo geoestatístico para avaliação de áreas contaminadas
14
• Geoeas (www.ai-geostats.com )
• GSLIB (www.gslib.com)
• Variowin (www.ai-geostats.com )
• Surfer 
• R (GeoR, gstat)
EXEMPLOS SOFTWARES GEOESTATÍSTICOS 
Adaptado do curso do Prof. Joaquim Queiroz
15
http://www.ai-geostats.com/
http://www.gslib.com/
http://www.ai-geostats.com/
23/06/2021
6
Estrutura da 
biblioteca 
geoestatística
GSLIB
• Deutsch e Journel (1992)
• Domínio Público
• Fortran 77
Adaptado do curso do Prof. 
Joaquim Queiroz
16
Variável Aleatória (VA) – é uma variável que pode apresentar uma série de
resultados de acordo com alguma distribuição de probabilidades
[freqüências] (pi, i = 1,...,N). As N probabilidades de ocorrências devem
satisfazer as condições :
• pi ³ 0, para todo i = 1,...,N e ∑
1=
1=
N
i
ip
2. Conceitos básicos de (geo)estatística
Representação: – VA Z
– Possíveis resultados zi , i = 1,...,N
• VA contínua: número de resultados possíveis é infinito. Ex. permeabilidade, 
porosidade, concentrações de metais, etc.
• VA discreta ou categórica: número de resultados ou ocorrências é finito. Ex. 
tipos de solos, uso da terra, especies de fosseis, contagem de insetos, etc.
• Geoestatística: – VA relacionada a alguma localização no espaço
– Notação Z(u), onde u é o vetor de coordenadas da localização.
– Z(u) : função aleatória (FA), indica um conjunto de VA’s 
definidos sobre um campo de interesse, {Z(u), u ϵ área de estudo}.
– A distribuição de probabilidades de Z(u) contínua pode ser 
caracterizada pela função de distribuição acumulada (FDA):
F(u;z) = Prob{ Z(u) £ z } z : valor de corte
17
• Propriedades da FDA : – F(u;z) é não decrescente;
– F(u;z) ϵ [0,1];
– F( – ͚ ) = 0 e F( ¥ ) = 1.
• A probabilidade de Z ocorrer em um intervalo [a,b], onde b > a, é dada 
pela diferença dos valores da FDA nos pontos a e b:
Prob { Z(u) Î [a,b] } = F(b) – F(a).
• A probabilidade de Z exceder um valor de corte z é escrita como:
Prob { Z(u) > z } = 1 – F(u;z).
• A função densidade de probabilidade (FDP) é a derivada da FDA, se 
esta for diferenciável, ou seja: 
dz
zFdzzF
zFzf
dz
);u()+;u(
lim=);u('=);u(
0→
• Função de distribuição acumulada condicional (FDAC) : FDA realizada 
para um conjunto de n valores de dados vizinhos Z(ua) = z(ua), a = 1,...,n, :
F(u;z|(n)) = Prob{Z(u) £ z|(n) }.
ou F(u;k|(n)) = Prob{Z(u) = k|(n) } , Z(u) categórica
– FDAC : função da localização u, do tamanho da amostra (n), da 
configuração geométrica (a localização dos dados em ua, a = 1,...,n) e dos 
valores amostrais (os n valores z(ua)´s).
Conceitos básicos de (geo)estatística
Adaptado do cursodo Prof. 
Joaquim Queiroz
18
23/06/2021
7
• Quantis – quantil-p de F(u;zp) : valor zp onde 
F(u; zp) = Prob{Z(u) < zp} = p Є [0,1]. É o valor zp da distribuição abaixo do 
qual estão uma proporção p de dados.
– Pode ser expresso em uma forma inversa da FDA, ou seja:
zp = F-1(u; p) com p Є [0,1].
– Quantis mais comumente usados :
1) Mediana (M): equivalente ao quantil z0.5 : M = F-1(u; 0.5). 2) 
Quartis inferior e superior: z0.25 = F-1(u; 0.25) e z0.75 = F-1(u; 0.75).
• Comparação de duas distribuições : Q-Q plot : cruzar graficamente os quantis
– Distribuições iguais: pontos sobre a linha de 45o, a partir da origem.
– Deslocamento sistemático acima ou abaixo da linha de 45o : os centros
ou médias das distribuições são diferentes. 
– Deslocamento acima da distribuição : os valores da distribuição Y são 
mais elevados do que os de X.
– Inclinação diferente de 45º : dispersões ou variâncias das duas 
distribuições são diferentes. 
– Inclinação maior do que 1 (ou 45o): a variância de Y é maior do que a de X.
– Curvatura sobre o Q-Q plot : as duas distribuições têm formas diferentes.
Conceitos básicos de (geo)estatística
Adaptado do curso do Prof. 
Joaquim Queiroz
19
Valor esperado de Z – é a média ponderada dos n possíveis resultados, 
em que cada resultado é ponderado por sua probabilidade de ocorrência:
∑∑
1=1=
1
===}{
N
i
i
N
i
ii zN
zpmZE
– no caso contínuo, sob condições de existência das integrais: 
dzzfzzdFzmZE );u(.=);u(.==}{ ∫∫
∞+
∞
∞+
∞
∑
1=
1+
' )];u();u([≈
K
k
kkk zFzFz ],]∈ 1+
'
kkk zzzcom 
onde F(u;z) e f(u;z) são a FDA e FDP, respectivamente. 
);u(.∫
∞+
∞
zdFz foi aproximada por K classes com respectivas freqüências 
[F(u;zk+1) – F(u;zk)] e é um valor dentro da k-ésima 
classe, por exemplo, o centro da classe. 
'
kz
– no caso discreto:
Conceitos básicos de (geo)estatística
Adaptado do curso do Prof. 
Joaquim Queiroz
20
Variância de Z: quadrado do desvio esperado de Z em relação à sua média:
Var{Z} = σ2 = E{[Z – m]2}= E[Z2] – m2 . 
– no caso discreto: ∑
1=
2)-(=)(
N
i
ii mzpZVar
– no caso contínuo: dzzfmzzdFmzZVar );()-(=);()-(=)( 2
∞+
∞
2∞+
∞ ∫∫ uu
• Desvio-padrão (s, ): raiz quadrada da variância
• Coeficiente de Variação (CV) (desvio-padrão relativo) : CV = σ/m – CV > 1: 
indício de valores altos (outliers) na distribuição. 
Coeficiente de assimetria: medida para avaliar a assimetria da distribuição: 
∑
1=
3
3]-)([(1
=
n
α σ
mαz
n
ε
Distribuições simétricas : ε = 0. 
Assimetria positiva : longa cauda à direita
Assimetria negativa : longa cauda à esquerda. 
Curtose (K): mede o grau de achatamento da distribuição em relação à normal. 
Distribuições normais (mesocúrticas): K=3 
Distribuições mais achatadas (platicúrticas): K < 3 
Distribuições mais afiladas (leptocúrticas) : K > 3.
∑
1=
4
4]-)([(1
=
n
α σ
mαz
n
K
Conceitos básicos de (geo)estatística
Adaptado do curso do Prof. 
Joaquim Queiroz
21
23/06/2021
8
Modelos relacionados a distribuição normal (ou Gaussiana)
Modelo normal (Gaussiano) : caracterizado por 2 parâmetros, média, m, e 
variância, s2, com função densidade de probabilidade, FDP, definida por,
-
2
1
exp
2
1
=)(
2
σ
mx
πσ
xg 2
-exp
2
1
=)(
2
0
x
π
xg
FDA Normal 
FDP Normal 
Modelo Normal: simétrico e permite a ocorrência de valores negativos. 
Conceitos básicos de (geo)estatística
Adaptado do curso do Prof. 
Joaquim Queiroz
22
Modelo Lognormal: Uma variável aleatória, X>0, tem distribuição lognormal 
se seu logaritmo Y=ln X é normalmente distribuído. 
A Função densidade de probabilidade da variável lognormal X, é dada por, 
2
2)-(ln(
2
1
2
1
=)( σ
μx
e
πσx
xf para x > 0 0=)(xf para x £ 0
μ )2σPara Y=ln X ~ N(
.Nessas condições, a 
variável aleatória X 
(lognormal) tem: 
2
2
+==)(
σμ
x eμXE
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
0.16
0 4 8 12 16 20
X
f(x
)
)1-.(==)(
22+22 σσμ
x eeσXVar
Conceitos básicos de (geo)estatística
Adaptado do curso do Prof. 
Joaquim Queiroz
23
Variáveis categóricas
nααs ,...,1=),(
ks )(αs
• Representam um atributo categórico s de um conjunto de observações 
medidos sobre n objetos α, ou seja, 
• O conjunto de K possíveis estados ou categorias, , que qualquer valor 
pode assumir é indicado por 
• Os K estados ou categorias são mutuamente exclusivos 
• A distribuição (histograma) de dados categóricos é descrito por uma tabela 
de freqüências, que lista os K estados e sua freqüência de ocorrência. 
• A freqüência de ocorrência do estado sk pode ser expressa como a média 
aritmética de n dados indicativos:
kss ,...,1
∑
1=
);(
1
=)(
n
α
kk sαin
sf
0
=)(1
=);(
contráriocaso
se k
k
sαs
sαiem que
A freqüência conjunta de ocorrência, ),( 'kk vsf
média aritmética de um produto de 
variáveis indicativas:∑
1=
'' );().;(
1
=),(
n
α
kkkk vαisαin
vsf
Conceitos básicos de (geo)estatística
Adaptado do curso do Prof. 
Joaquim Queiroz
24
23/06/2021
9
3. Análise exploratória de dados
3.1 Distribuição univariada
• Banco de dados : Jura (Goovaerts, 1997)
•.9 variáveis:
• Concentrações (em ppm) dos metais de Cd, 
Cu, Pb, Co, Cr, Ni e Zn (Contínuas)
• Uso da terra e tipo de rocha (Categóricas)
Exemplo 1: Realizar a análise exploratória das
variáveis contínuas do banco de dados Jura e
analisar as estatísticas descritivas
Adaptado do curso do Prof. 
Joaquim Queiroz
25
Estatísticas para o conjunto de dados Jura (ppm)
Estatísticas Cd Co Cr Cu Ni Pb Zn
Média 1.31 9.30 35.07 23.73 19.73 53.92 75.08
Mediana 1.07 9.76 34.84 17.60 20.56 46.40 73.56
Desvio padrão 0.92 3.58 10.96 20.71 8.23 29.79 29.02
Variância amostral 0.84 12.79 120.07 429.01 67.78 887.57 842.12
Curtose 2.58 -0.80 0.02 12.12 0.24 11.60 2.16
Assimetria 1.51 -0.18 0.29 2.88 0.16 2.91 1.03
Intervalo 4.99 16.17 58.88 162.44 49.00 210.60 194.12
Mínimo 0.14 1.55 8.72 3.96 4.20 18.96 25.20
Máximo 5.13 17.72 67.60 166.40 53.20 229.56 219.32
Tolerancia máxima 0.80 25.00 75.00 50.00 50.00 50.00 200.00
Contagem 259 259 259 259 259 259 259
Adaptado do curso do Prof. 
Joaquim Queiroz
26
Uso da Terra
(Landuse) Codigo
Tipo de Rocha 
(Rock) Codigo
Floresta 1 Argoviano 1
Pastos 2 Kimeridgiano 2
Prados 3 Sequaniano 3
Lavoura 4 Portlandiano 4
Quaternario 5
Dados Jura (Variáveis categóricas)
Adaptado do curso do Prof. 
Joaquim Queiroz
27
23/06/2021
10
Uso do programa R: 
Fornecem funções para análise de dados geoestatísticos usando o programa R. 
•Os comandos no programa R são apresentados em vermelho
•As saídas no programa R são apresentadas em azul
•O caractere # representa comentários, representados em preto
•Símbolos ou comandos importantes
•Sair do programa q()
•Salva o trabalho realizado save.image()
•Lista todos os objetos da área de trabalho atual ls()
•Remove o objeto x rm(x)
•Remove os objetos x e y rm(x,y)
•Dado ausente (data missing) NA
•Mostra todos os pacotes instalados library()
•Carregar (p.ex.) o pacote nlme library(nlme) 
ou require(nlme) (neste caso, se o pacote já estiver 
instalado o comando não é executado) 
Para a execução de uma linha de comando deve-se pressionar a tecla “Enter”
Adaptado do curso do Prof. 
Joaquim Queiroz
28
1) Arquivo de entrada: jura.txt
•Procedimento comum a todos os ensaios
># Carregar os pacotes necessários(Programa R.3.1.1)
>library(geoR)
>library(gstat)
>library(lattice)
>library(sp)
>#Definir a área de trabalho
>setwd("C:/PPGCA/CEDGeotec/CursoR/Ensaios")
>#carregar arquivo de dados
>Geo <- read.table("jura.txt", head=T)#banco de dados: jura.txt
>names(Geo) #mostrar o nome das variáveis do banco Geo
[1] "Landuse" "Rock" "Cd" "Co" "Cr" "Cu" "Ni"
[8] "Pb" "Zn"
>Geo #mostrar os dados (variáveis) na area de trabalho
>#Resumo do arquivo Geo
>summary(Geo)
Adaptado do curso do Prof. 
Joaquim Queiroz
29
Unidade1_1. Analise exploratoria (Unidade1.1)
#Carregar pacotes
library(geoR)
library(gstat)
library(lattice)
library(sp)
#Definir a area de trabalho 
setwd("C:/PPGCA/GeoestatisticaR")
#carregar arquivo de dados
Geo <- read.table("jura.txt", head=T)
names(Geo) #mostrar o nome dasvariáveis do banco Geo
Geo[1:5,] #mostrar 5 linha(variáveis) na area de 
trabalho
#Resumo do arquivo Geo
summary(Geo)
names(Geo)
Adaptado do curso do Prof. 
Joaquim Queiroz
30
23/06/2021
11
# Selecionar as variaveis quantitativas
Cd <- as.geodata(Geo,coords.col = 1:2, data.col = 5)
Co <- as.geodata(Geo,coords.col = 1:2, data.col = 6)
Cr <- as.geodata(Geo,coords.col = 1:2, data.col = 7)
Cu <- as.geodata(Geo,coords.col = 1:2, data.col = 8)
Ni <- as.geodata(Geo,coords.col = 1:2, data.col = 9)
Pb <- as.geodata(Geo,coords.col = 1:2, data.col = 10)
Zn <- as.geodata(Geo,coords.col = 1:2, data.col = 11)
# Principais estatísticas descritivas das variáveis
summary(Cd$data)
summary(Co$data)
summary(Cr$data)
summary(Cu$data)
summary(Ni$data)
summary(Pb$data)
summary(Zn$data)
Adaptado do curso do Prof. 
Joaquim Queiroz
31
#Construção das tabelas com as estatisticas descritivas
tab1<-cbind(summary(Cd$data),summary(Co$data),summary(Cr$data),
summary(Cu$data),summary(Ni$data),summary(Pb$data),summary
(Zn$data))
colnames(tab1) <- c("Cadmio","Cobalto","Cromo", 
"Cobre","Niquel","Chumbo", "Zinco") #Renomeando as colunas de 
cada categoria
#Salvando os resultados em uma tabela
write.table(tab1, file = "Descritivas.txt")
tab1 #exibindo os dados da tabela 
Cadmio Cobalto Cromo Cobre Niquel Chumbo Zinco
Min. 0.1350 1.552 8.72 3.96 4.20 18.96 25.20
1st Qu. 0.6375 6.520 27.44 11.02 13.80 36.52 55.00
Median 1.0700 9.760 34.84 17.60 20.56 46.40 73.56
Mean 1.3090 9.303 35.07 23.73 19.73 53.92 75.08
3rd Qu. 1.7150 11.980 42.22 27.82 25.42 60.40 89.92
Max. 5.1290 17.720 67.60 166.40 53.20 229.60 219.30
> Adaptado do curso do Prof. 
Joaquim Queiroz
32
#Histogramas
par(mfrow = c(2,2)) # set up the graphics
hist(Cd$data, breaks = 20, main = "", xlab = "Cadmio", 
ylab = "Freqüência", col = 2)
hist(Co$data, breaks = 20, main = "", xlab = "Cobalto", 
ylab = "Freqüência", col = 2)
hist(Cr$data, breaks = 20, main = "", xlab = "Cromo", ylab
= "Freqüência", col = 2)
hist(Cu$data, breaks = 20, main = "", xlab = "Cobre", ylab
= "Freqüência", col = 2)
par(mfrow = c(2,2)) # set up the graphics
hist(Ni$data, breaks = 20, main = "", xlab = "Niquel", 
ylab = "Freqüência", col = 2)
hist(Pb$data, breaks = 20, main = "", xlab = "Chumbo", 
ylab = "Freqüência", col = 2)
hist(Zn$data, breaks = 20, main = "", xlab = "Zinco", ylab
= "Freqüência", col = 2)Adaptado do curso do Prof. 
Joaquim Queiroz
33
23/06/2021
12
Adaptado do curso do Prof. 
Joaquim Queiroz
34
Adaptado do curso do Prof. 
Joaquim Queiroz
35
#QQ PLot
par(mfrow = c(2,2)) # set up the graphics
qqnorm(Cd$data, main = NULL, xlab = "Cadmio", ylab = 
"CdVal")
qqnorm(Co$data, main = NULL, xlab = "Coblato", ylab = 
"CoVal")
qqnorm(Cr$data, main = NULL, xlab = "Cromo", ylab = 
"CrVal")
qqnorm(Cu$data, main = NULL, xlab = "Cobre", ylab = 
"CuVal")
par(mfrow = c(2,2)) # set up the graphics
qqnorm(Ni$data, main = NULL, xlab = "Niquel", ylab = 
"NiVal")
qqnorm(Pb$data, main = NULL, xlab = "Chumbo", ylab = 
"PbVal")
qqnorm(Zn$data, main = NULL, xlab = "Zinco", ylab = 
"ZnVal")
Adaptado do curso do Prof. 
Joaquim Queiroz
36
23/06/2021
13
Adaptado do curso do Prof. 
Joaquim Queiroz
37
Adaptado do curso do Prof. 
Joaquim Queiroz
38
• Muitas variáveis em ciências da terra : distribuição assimétrica 
(cádmio, cobre e chumbo)
• Poucos valores muito pequenos ou muito grandes : afetam 
fortemente estatísticas tais como a média ou variância dos 
dados, o coeficiente correlação linear ou medidas de 
continuidade espacial. 
• Valores extremos podem ser analisados como:
1) Se forem declarados valores errôneos podem ser retirados;
2) Podem ser classificados em populações estatísticas 
separadas;
3) Usar estatísticas robustas, menos sensíveis a valores 
extremos;
4) Transformar os dados para reduzir a influencia de valores 
extremos.
COMENTÁRIOS
Adaptado do curso do Prof. 
Joaquim Queiroz
39
23/06/2021
14
3.2 Descrição espacial univariada
• Dados com distribuição espacial:
• Amostras mais próximas de outras apresentam-se mais
correlacionadas.
• A informação é dividida entre duas ou mais amostras,
especialmente em dados agrupados.
• Isso significa que cada uma das amostras tem alguma da
mesma informação e essa informação esta sendo considerada
mais de uma vez na distribuição dos dados.
• Essa redundância necessariamente introduz um viés.
• Para considerar esse viés, é necessário ponderar o valor de
cada amostra de um modo apropriado.
Adaptado do curso do Prof. 
Joaquim Queiroz
40
#Mapa de pontos
par(mfrow = c(2,2)) # set up the graphics
par(cex = .45) #definfindo o tamanho dos caracteres
points(Cd, xlab = "W-E", main = "Cadmio", ylab = "N-S", cex.min = 
1.2,cex.max =1.5, pt.divide = "quart", x.leg=c(0.2,1.8),y.leg=c(4.3,5.7))
points(Co, xlab = "W-E", main = "Cobalto", ylab = "N-S", cex.min = 
1.2,cex.max =1.5, pt.divide = "quart", x.leg=c(0.2,1.8),y.leg=c(4.3,5.7))
points(Cr, xlab = "W-E", main = "Cromo", ylab = "N-S", cex.min = 
1.2,cex.max =1.5, pt.divide = "quart", x.leg=c(0.2,1.8),y.leg=c(4.3,5.7))
points(Cu, xlab = "W-E", main = "Cobre", ylab = "N-S", cex.min = 
1.2,cex.max =1.5, pt.divide = "quart", x.leg=c(0.2,1.8),y.leg=c(4.3,5.7))
par(mfrow = c(2,2)) # set up the graphics
par(cex = .45) #definfindo o tamanho dos caracteres
points(Ni, xlab = "W-E", main = "Niquel", ylab = "N-S", cex.min = 
1.2,cex.max =1.5, pt.divide = "quart", x.leg=c(0.2,1.8),y.leg=c(4.3,5.7))
points(Pb, xlab = "W-E", main = "Chumbo", ylab = "N-S", cex.min = 
1.2,cex.max =1.5, pt.divide = "quart", x.leg=c(0.2,1.8),y.leg=c(4.3,5.7))
points(Zn, xlab = "W-E", main = "Zinco", ylab = "N-S", cex.min = 
1.2,cex.max =1.5, pt.divide = "quart", x.leg=c(0.2,1.8),y.leg=c(4.3,5.7))Adaptado do curso do Prof. 
Joaquim Queiroz
41
Adaptado do curso do Prof. 
Joaquim Queiroz
42
23/06/2021
15
Adaptado do curso do Prof. 
Joaquim Queiroz
43
Banco Jura: variáveis categóricas 
Freqüência (%) de ocorrência do uso da terra e tipos de rochas.
Uso da 
Terra Freqüência (%) Tipo de Rocha
Freqüência 
(%)
Floresta(1) 12.7 Argoviano (1) 20.5
Pastos(2) 21.6 Kimeridgiano (2) 32.8
Prados(3) 63.7 Sequaniano (3) 24.3
Cultivada(4) 1.9 Portlandiano(4) 1.2
Quaternario(5) 21.2
Adaptado do curso do Prof. 
Joaquim Queiroz
44
Freqüência (%) conjunta de ocorrência de uso da terra e tipos de rochas
Floresta Pastos Prados Cultivadas
Argoviano 2.7 2.3 15.1 0.4
Kimeridgiano 8.5 6.9 17.0 0.4
Sequaniano 1.2 9.7 12.7 0.8
Portlandiano 0.4 0.4 0.4 0.0
Quaternario 0.0 2.3 18.5 0.4
Florestas : preferencialmente localizadas sobre rochas Kimeridgiano 
Pastos : rochas Sequaniano e Kimeridgiano 
Prados e Cultivadas : igualmente sobre cada formação geológica, exceto Portlandiano Adaptado do curso do Prof. Joaquim Queiroz
45
23/06/2021
16
#Variavel qualitativa Landuse
# Selecionar a variavel Landuse
#carregar arquivo de dados categoricos (uso da terra)
land <- read.table("land.txt", head=T)
land[1:5,] #mostrar os dados (variáveis) na area de trabalho
names(land)
land[1:5,]
summary(land)
#Tabelas e Figuras
attach(land) #vincula os nomes das variáveis ao caminho de busca
tland <- table(Landuse) #cria tabela da variavel Landuse
tland <- as.data.frame(tland) #tabela com varios tipos de dados
tland$Porc <- round(tland$Freq/nrow(land)*100, dig = 2) # cria 
variavel percentagem
tland$Landuse <-c("Floresta", "Pasto", "Prado", "Lavoura“)#rótulos
na variavel Landuse
Adaptado do curso do Prof. 
Joaquim Queiroz
46
#Grafico de Pizza
pie(tland$Freq, labels = paste(tland$Porc, "%"), col = c(4,5,6, 
7))
legend("topleft", legend=tland$Landuse, fill = c(4,5,6,7), horiz
= FALSE, bty = "n", cex=1)
Adaptado do curso do Prof. 
Joaquim Queiroz
47
#Gráfico de Colunas
barplot(tland$Freq, labels = paste(tland$Porc, "%"), col = 
c(4,5,6,7))
legend("topleft", legend=tland$Landuse, fill = c(4,5,6,7), horiz
= FALSE, bty = "n", cex=1)
abline(h=0)
Adaptado do curso do Prof. 
Joaquim Queiroz
48
23/06/2021
17
#Criar arquivo tipo eps
postscript("usopiz.eps", horizontal=F,encoding = 
"TeXtext.enc", family = "ComputerModern", height=7, 
width=5) 
pie(tland$Freq, labels = paste(tland$Porc, "%"), col = 
c(4,5,6,7))
legend("topleft", legend=tland$Landuse, fill = c(4,5,6,7), 
horiz = FALSE, bty = "n", cex=1)
postscript("usocol.eps", horizontal=F, encoding = 
"TeXtext.enc", family = "ComputerModern", height=7, 
width=5) 
barplot(tland$Freq, labels = paste(tland$Porc, "%"), col = 
c(4,5,6,7))
legend("topleft", legend=tland$Landuse, fill = c(4,5,6,7), 
horiz = FALSE, bty = "n", cex=1)
dev.off()
Adaptado do curso do Prof. 
Joaquim Queiroz
49
#Exibir as frequencias e percentagens
tland[6,] <- c("Total", sum(tland[,2]), sum(tland[,3]))
detach(land) #desvincula os nomes das variáveis da 
lista de dados
#Salvando os resultados em uma tabela
write.table(tab1, file = “Landuse.txt")
tland #exibindo os dados da tabela 
Landuse Freq Porc
1 Floresta 33 12.74
2 Pasto 56 21.62
3 Prado 165 63.71
4 Lavoura 5 1.93
5 <NA> <NA> <NA>
6 Total 259 100
Adaptado do curso do Prof. 
Joaquim Queiroz
50
#Mapa de pontos
coordinates(land) = ~ X + Y
summary(land)
land[1:5,]
plot(land)
trellis.par.set(sp.theme()) 
spplot(land, "Landuse",key.space=list(x=0.1,y=0.9,corner 
=c(0,1)), scales=list(draw=T),cex = 1.5, cuts = 4)
title("Landuse")
Adaptado do curso do Prof. 
Joaquim Queiroz
51
23/06/2021
18
Adaptado do curso do Prof. 
Joaquim Queiroz
52
3.3 Descrição espacial bivariada
• Padrão de dependência de uma variável X em relação a outra Y : 
relação entre pares de valores (concentrações de metais) observados 
na mesma localização. 
• Distribuição conjunta de resultados de um par de v.a. X e Y : FDA
conjunta (ou bivariada) definida como:
FXY (x,y) = Prob{ X £ x, e Y £ y } 
proporção de pares de dados conjuntamente abaixo dos respectivos 
valores (valores de corte) x e y
Diagrama de dispersão : – grau de dependência entre X e Y
– dependência perfeita (X = Y) : todos os 
pares experimentais (xi,yi), i = 1,..., N plotados sobre a linha de 45oAdaptado do curso do Prof. 
Joaquim Queiroz
53
Diagrama de dispersão para os pares (xi , yi)
Descrição espacial bivariada
Adaptado do curso do Prof. 
Joaquim Queiroz
54
23/06/2021
19
Semivariograma do conjunto N de pares ( xi , yi ) – momento de inércia do diagrama de 
dispersão em torno da linha de 45o : definido como a metade da média das diferenças 
quadráticas dos teores entre as coordenadas de cada par, ou seja: 
Quanto maior o valor do 
semivariograma, maior a 
dispersão e menos 
relacionadas (ou similares) 
são as duas variáveis X e Y
∑ ∑
1= 1=
22 )-(
2
1
=
1
=
N
i
N
i
iiiXY yxN
d
N
γ
Descrição espacial bivariada
Adaptado do curso do Prof. 
Joaquim Queiroz
55
Descrição espacial bivariada
∑∑
1=1=
1
===}{
N
i
i
N
i
iiX xN
xpmXE
∫ ∫ ∫∫ ),(.=),(.=}{
∞+
∞
2∞+
∞
dxdyyxfxyyxFdxyXYE XYXY
dxxfxxdFxmXE X )(.=)(.==}{ ∫∫
∞+
∞
∞+
∞
Valor Esperado de X
dxdy
yxFd
yxf XYXY
),(
=),(
2
∑
1=
1
=)(
N
i
ii yxN
XYE Valor Esperado de XY
Função densidade de 
probabilidade (FDP) bivariada 
Covariância não centrada das duas VA’s X e Y
Adaptado do curso do Prof. 
Joaquim Queiroz
56
Covariância centrada (na média), ou simplesmente covariância 
Descrição espacial bivariada
[ ] [ ][ ]{ }YXXY mYmXEσYXCov --==, [ ] YX mmXYE .-=
[ ] ∑ ∑
1= 1=
-
1
=)-)(-(
1
=
N
i
N
i
YXiiYiXi mmyxN
mymx
N
XYCov
0≥-
1
=}]-{[=},{=}{= ∑
1=
2222
N
i
XiXX mxN
mXEXXCovXVarσ
Variância de X 
]1+,1-[∈
}{}.{
},{
==
YVarXVar
YXCov
σσ
σ
ρ
YX
XY
XY
Coeficiente de correlação linear 
Adaptado do curso do Prof. 
Joaquim Queiroz
57
23/06/2021
20
Relação experimental entre o variograma e a covariância 
Descrição espacial bivariada
∑
1=
2)-(
1
=2
N
i
iiXY yxN
γ
∑∑∑ 222222 ++2=-1+-1=2
i
YXii
i
Yi
i
XiXY mmyxN
my
N
mx
N
γ
Variograma
YXYX
i
YXiiYXXY mmmmmmyxN
σσγ 2-++-
1
2-+=2 2222 ∑
0≥)-(+2-+=2 222 YXXYYXXY mmσσσγ
• maior 2γXY menor σXY
• maior dispersão de (xi,yi) (menos similares) em torno de 45º, maior
será 2γXY e menor σXY e ρXY
• Variograma : medida de variabilidade (ou dissimilaridade) 
• Covariância e correlação : medidas de similaridade 
Adaptado do curso do Prof. 
Joaquim Queiroz
58
]1+,1-[∈=
-
.
-
='' XY
Y
Y
X
X
YX ρσ
mY
σ
mX
Eσ
Descrição espacial bivariada
Relação experimental entre o semivariograma e a covariância 
( )
X
X
σ
mX
X
-
='
( )
Y
Y
σ
mY
Y
-
=' 0== '' YX mm 1== 2'
2
' YX σσ
ρXY = 1 - γX’Y’ = 0 
Processo AR(1)
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
0 5 10 15 20 25 30 35 40 45 50
t
Au
to
co
rr
el
aç
ão
0
0.2
0.4
0.6
0.8
1
1.2
1.4
Se
m
iv
ar
io
gr
am
a
Autocorrelação
Semivariograma
[ ]2,0∈-1='' XYYX ργ
Adaptado do curso do Prof. 
Joaquim Queiroz
59
Descrição espacial bivariada
As VA’s X e Y podem representar:
(i) duas diferentes propriedades em uma mesma localização. 
Ex. teor de As e Mn no solo; X = ZAs(u), Y = ZMn (u)
(ii) a mesma propriedade em duas diferentes localizações do 
espaço. Ex. teor de As nas localizações u e u + h separadas 
por um vetor h; X = ZAs(u), Y = ZAs(u + h);
(iii) duas diferentes propriedades medidas em duas diferentes 
localizações. Ex. teor de arsênio na localização u e teor de 
manganês em u+h, sendo: X = ZAs(u), Y = ZMn(u + h).
• Grau de variabilidade (ou dissimilaridade)/similaridade 
entre as duas VA’s X e Y σXY ou ρXYAdaptado do curso do Prof. 
Joaquim Queiroz
60
23/06/2021
21
Semivariograma característico (ou experimental) da 
variabilidade espacial em uma área A 
Descrição espacial bivariada
∑
)(
1=
2)]+(-)([
)(2
1
=)(
h
huu
h
h
N
α
αα zzN
γ
• Conjunto de dados sem efeito proporcional (correlação entre a média e variância) 
• Localizações das amostras sem agrupamento preferencial
Semivariogramas relativos (ou padronizados)
2
+-
2
+
)(
=)(
hh
h
h
mm
γ
γRG
h-m )( _hz αu
)+( huαz
média dos valores 
média dos valores h+mAdaptado do curso do Prof. Joaquim Queiroz
61

Continue navegando