Baixe o app para aproveitar ainda mais
Prévia do material em texto
23/06/2021 1 Agredecimentos ao Prof. Joaquim Barbosa que gentilmente cedeu parte de seu curso de Geoestatística para uso nessa disciplina. Prof. Pedro Campos Adaptado do curso do Prof. Joaquim Queiroz 1 Geoestatística • Variáveis Regionalizadas • Semivariograma Experimental • Krigagem • Análise Estrutural • Isotropia e Anisotropia • Efeito Pepita, Alcance e Patamar • Validação Cruzada • Simulação Geoestatística P a l a v r a s - C h a v e 478 478.5 479 479.5 480 480.5 481 481.5 482 994 994.5 995 995.5 996 COME RCIAL HOSP ITALID ADE CENT RAL N.HOR IZONT E REMÉ DIOS NOV A BRA SÍLIA ELESB ÃO ICOMI RIO AMAZONAS CENT RAL ICOMI CENT RAL ICOMI 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Adaptado do curso do Prof. Joaquim Queiroz 2 n Estatística n Análise do inter-relacionamento entre amostras, sem considerar sua posição espacial. Estatística x Geoestatística 1. Introdução à Geoestatística n Geoestatística n Análise da distribuição espacial das amostras n Trabalha com amostras orientadas n Trabalha com amostras anisotrópicas n Somatório dos pesos n Minimiza a variância dos erros Adaptado do curso do Prof. Joaquim Queiroz 3 23/06/2021 2 • Envolve análise e inferência de variáveis distribuídas no espaço. O QUE É GEOESTATÍSTICA ? Limite da área de estudo Amostras de campo••• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •• • • • •• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •• • Inferências Ex: concentração de poluentes, variação do teor de zinco nos solos, etc. Adaptado do curso do Prof. Joaquim Queiroz 4 Análise: estudar ou descrever a variabilidade espacial do fenômeno, neste contexto denominado de análise estrutural ou modelagem do semivariograma. Inferência: conjunto de técnicas usadas para inferir valores, de uma variável distribuída no espaço, em locais não amostrados. Neste contexto denominado de Krigagem. Adaptado do curso do Prof. Joaquim Queiroz 5 ORIGEM • Estudo da variabilidade espacial de algumas características do solo: uma das preocupações de pesquisadores desde o início do século. • Smith (1910): estudou o efeito de variações do solo no rendimento de milho. • Montgomery (1913): estudou o efeito do nitrogênio no rendimento do trigo, fez um experimento em 224 parcelas, medindo o rendimento de grãos. • Waynick e Sharp (1919): também estudaram variações de nitrogênio e o carbono no solo. Adaptado do curso do Prof. Joaquim Queiroz 6 23/06/2021 3 • Os procedimentos usados com base na estatística clássica e utilizavam grandes quantidades de dados amostrais, visando caracterizar a distribuição espacial da característica em estudo. ORIGEM Daniel G. Krige (1951): trabalhando com dados de concentração de ouro na Africa do Sul, concluiu que somente a informação dada pela variância seria insuficiente para explicar o fenômeno em estudo. Para tal, seria necessário levar em consideração a distância entre as observações. Adaptado do curso do Prof. Joaquim Queiroz 7 ORIGEM • Baseado nas observações de Krige, Matheron (1961, 1971) desenvolve a Teoria das Variáveis Regionalizadas. • A partir daí surge o conceito da GeoEstatística, que leva em consideração a localização geográfica e a dependência espacial. Adaptado do curso do Prof. Joaquim Queiroz 8 Porque a Geoestatística ? Existem vários métodos de estimativas ou de interpolação, entretanto a geoestatística, dado a sua concepção, executa estimativas minimizando os erros associados. • Além dos valores estimados, são calculados os erros das estimativas, que fornecerão o grau de precisão dos mapas gerados. • Toda a análise ou interpretação dos dados é feita sobre modelos de variabilidade, que proporcionam a interação da matemática com o fenômeno natural. Adaptado do curso do Prof. Joaquim Queiroz 9 Krige.ppt Matheron.ppt 23/06/2021 4 Usos da Geoestatística • Transformação de um fenômeno físico em números (quantificação) • Mapeamento : Interpolação – Extrapolação • Estimação de distribuições espaciais • Simulação para estudos críticos • Quantificação e modelamento de incertezas • Otimização amostral • Análise de risco • Integração de dados de diferentes tipos Adaptado do curso do Prof. Joaquim Queiroz 10 Cuidados com a Geoestatística • Ela não faz: • Substituir dados adicionais • Substituir o bom entendimento e correto julgamento do problema físico em questão (interpretação do fenômeno) • Funcionar como caixa preta (uso indevido de softwares) • Reduzir o tempo de trabalho Adaptado do curso do Prof. Joaquim Queiroz 11 C E N Á R I O S ETAPAS DO PROCESSO GEOESTATÍSTICO ANÁLISE EXPLORATÓRIA ANÁLISE ESTRUTURAL REALIZAÇÃO DE INFERÊNCIAS D A D O S Adaptado do curso do Prof. Joaquim Queiroz 12 23/06/2021 5 Roteiro um estudo geoestatístico • Análise estatística preliminar – Validação do banco de dados – Análise exploratória dos dados – Identificação de populações • Análise da continuidade espacial – Semivariância (ou autocorrelação) experimental – Análise e interpretação dos variogramas – Modelamento Þ proposta de modelo teóricos • Previsões/Simulações – Estimativas (interpolação) – Avaliação de incertezas (intervalo de confiança, mapas probabilísticos) – Modelos Adaptado do curso do Prof. Joaquim Queiroz 13 Exemplo de estudo geoestatístico para avaliação de áreas contaminadas 14 • Geoeas (www.ai-geostats.com ) • GSLIB (www.gslib.com) • Variowin (www.ai-geostats.com ) • Surfer • R (GeoR, gstat) EXEMPLOS SOFTWARES GEOESTATÍSTICOS Adaptado do curso do Prof. Joaquim Queiroz 15 http://www.ai-geostats.com/ http://www.gslib.com/ http://www.ai-geostats.com/ 23/06/2021 6 Estrutura da biblioteca geoestatística GSLIB • Deutsch e Journel (1992) • Domínio Público • Fortran 77 Adaptado do curso do Prof. Joaquim Queiroz 16 Variável Aleatória (VA) – é uma variável que pode apresentar uma série de resultados de acordo com alguma distribuição de probabilidades [freqüências] (pi, i = 1,...,N). As N probabilidades de ocorrências devem satisfazer as condições : • pi ³ 0, para todo i = 1,...,N e ∑ 1= 1= N i ip 2. Conceitos básicos de (geo)estatística Representação: – VA Z – Possíveis resultados zi , i = 1,...,N • VA contínua: número de resultados possíveis é infinito. Ex. permeabilidade, porosidade, concentrações de metais, etc. • VA discreta ou categórica: número de resultados ou ocorrências é finito. Ex. tipos de solos, uso da terra, especies de fosseis, contagem de insetos, etc. • Geoestatística: – VA relacionada a alguma localização no espaço – Notação Z(u), onde u é o vetor de coordenadas da localização. – Z(u) : função aleatória (FA), indica um conjunto de VA’s definidos sobre um campo de interesse, {Z(u), u ϵ área de estudo}. – A distribuição de probabilidades de Z(u) contínua pode ser caracterizada pela função de distribuição acumulada (FDA): F(u;z) = Prob{ Z(u) £ z } z : valor de corte 17 • Propriedades da FDA : – F(u;z) é não decrescente; – F(u;z) ϵ [0,1]; – F( – ͚ ) = 0 e F( ¥ ) = 1. • A probabilidade de Z ocorrer em um intervalo [a,b], onde b > a, é dada pela diferença dos valores da FDA nos pontos a e b: Prob { Z(u) Î [a,b] } = F(b) – F(a). • A probabilidade de Z exceder um valor de corte z é escrita como: Prob { Z(u) > z } = 1 – F(u;z). • A função densidade de probabilidade (FDP) é a derivada da FDA, se esta for diferenciável, ou seja: dz zFdzzF zFzf dz );u()+;u( lim=);u('=);u( 0→ • Função de distribuição acumulada condicional (FDAC) : FDA realizada para um conjunto de n valores de dados vizinhos Z(ua) = z(ua), a = 1,...,n, : F(u;z|(n)) = Prob{Z(u) £ z|(n) }. ou F(u;k|(n)) = Prob{Z(u) = k|(n) } , Z(u) categórica – FDAC : função da localização u, do tamanho da amostra (n), da configuração geométrica (a localização dos dados em ua, a = 1,...,n) e dos valores amostrais (os n valores z(ua)´s). Conceitos básicos de (geo)estatística Adaptado do cursodo Prof. Joaquim Queiroz 18 23/06/2021 7 • Quantis – quantil-p de F(u;zp) : valor zp onde F(u; zp) = Prob{Z(u) < zp} = p Є [0,1]. É o valor zp da distribuição abaixo do qual estão uma proporção p de dados. – Pode ser expresso em uma forma inversa da FDA, ou seja: zp = F-1(u; p) com p Є [0,1]. – Quantis mais comumente usados : 1) Mediana (M): equivalente ao quantil z0.5 : M = F-1(u; 0.5). 2) Quartis inferior e superior: z0.25 = F-1(u; 0.25) e z0.75 = F-1(u; 0.75). • Comparação de duas distribuições : Q-Q plot : cruzar graficamente os quantis – Distribuições iguais: pontos sobre a linha de 45o, a partir da origem. – Deslocamento sistemático acima ou abaixo da linha de 45o : os centros ou médias das distribuições são diferentes. – Deslocamento acima da distribuição : os valores da distribuição Y são mais elevados do que os de X. – Inclinação diferente de 45º : dispersões ou variâncias das duas distribuições são diferentes. – Inclinação maior do que 1 (ou 45o): a variância de Y é maior do que a de X. – Curvatura sobre o Q-Q plot : as duas distribuições têm formas diferentes. Conceitos básicos de (geo)estatística Adaptado do curso do Prof. Joaquim Queiroz 19 Valor esperado de Z – é a média ponderada dos n possíveis resultados, em que cada resultado é ponderado por sua probabilidade de ocorrência: ∑∑ 1=1= 1 ===}{ N i i N i ii zN zpmZE – no caso contínuo, sob condições de existência das integrais: dzzfzzdFzmZE );u(.=);u(.==}{ ∫∫ ∞+ ∞ ∞+ ∞ ∑ 1= 1+ ' )];u();u([≈ K k kkk zFzFz ],]∈ 1+ ' kkk zzzcom onde F(u;z) e f(u;z) são a FDA e FDP, respectivamente. );u(.∫ ∞+ ∞ zdFz foi aproximada por K classes com respectivas freqüências [F(u;zk+1) – F(u;zk)] e é um valor dentro da k-ésima classe, por exemplo, o centro da classe. ' kz – no caso discreto: Conceitos básicos de (geo)estatística Adaptado do curso do Prof. Joaquim Queiroz 20 Variância de Z: quadrado do desvio esperado de Z em relação à sua média: Var{Z} = σ2 = E{[Z – m]2}= E[Z2] – m2 . – no caso discreto: ∑ 1= 2)-(=)( N i ii mzpZVar – no caso contínuo: dzzfmzzdFmzZVar );()-(=);()-(=)( 2 ∞+ ∞ 2∞+ ∞ ∫∫ uu • Desvio-padrão (s, ): raiz quadrada da variância • Coeficiente de Variação (CV) (desvio-padrão relativo) : CV = σ/m – CV > 1: indício de valores altos (outliers) na distribuição. Coeficiente de assimetria: medida para avaliar a assimetria da distribuição: ∑ 1= 3 3]-)([(1 = n α σ mαz n ε Distribuições simétricas : ε = 0. Assimetria positiva : longa cauda à direita Assimetria negativa : longa cauda à esquerda. Curtose (K): mede o grau de achatamento da distribuição em relação à normal. Distribuições normais (mesocúrticas): K=3 Distribuições mais achatadas (platicúrticas): K < 3 Distribuições mais afiladas (leptocúrticas) : K > 3. ∑ 1= 4 4]-)([(1 = n α σ mαz n K Conceitos básicos de (geo)estatística Adaptado do curso do Prof. Joaquim Queiroz 21 23/06/2021 8 Modelos relacionados a distribuição normal (ou Gaussiana) Modelo normal (Gaussiano) : caracterizado por 2 parâmetros, média, m, e variância, s2, com função densidade de probabilidade, FDP, definida por, - 2 1 exp 2 1 =)( 2 σ mx πσ xg 2 -exp 2 1 =)( 2 0 x π xg FDA Normal FDP Normal Modelo Normal: simétrico e permite a ocorrência de valores negativos. Conceitos básicos de (geo)estatística Adaptado do curso do Prof. Joaquim Queiroz 22 Modelo Lognormal: Uma variável aleatória, X>0, tem distribuição lognormal se seu logaritmo Y=ln X é normalmente distribuído. A Função densidade de probabilidade da variável lognormal X, é dada por, 2 2)-(ln( 2 1 2 1 =)( σ μx e πσx xf para x > 0 0=)(xf para x £ 0 μ )2σPara Y=ln X ~ N( .Nessas condições, a variável aleatória X (lognormal) tem: 2 2 +==)( σμ x eμXE 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0.14 0.16 0 4 8 12 16 20 X f(x ) )1-.(==)( 22+22 σσμ x eeσXVar Conceitos básicos de (geo)estatística Adaptado do curso do Prof. Joaquim Queiroz 23 Variáveis categóricas nααs ,...,1=),( ks )(αs • Representam um atributo categórico s de um conjunto de observações medidos sobre n objetos α, ou seja, • O conjunto de K possíveis estados ou categorias, , que qualquer valor pode assumir é indicado por • Os K estados ou categorias são mutuamente exclusivos • A distribuição (histograma) de dados categóricos é descrito por uma tabela de freqüências, que lista os K estados e sua freqüência de ocorrência. • A freqüência de ocorrência do estado sk pode ser expressa como a média aritmética de n dados indicativos: kss ,...,1 ∑ 1= );( 1 =)( n α kk sαin sf 0 =)(1 =);( contráriocaso se k k sαs sαiem que A freqüência conjunta de ocorrência, ),( 'kk vsf média aritmética de um produto de variáveis indicativas:∑ 1= '' );().;( 1 =),( n α kkkk vαisαin vsf Conceitos básicos de (geo)estatística Adaptado do curso do Prof. Joaquim Queiroz 24 23/06/2021 9 3. Análise exploratória de dados 3.1 Distribuição univariada • Banco de dados : Jura (Goovaerts, 1997) •.9 variáveis: • Concentrações (em ppm) dos metais de Cd, Cu, Pb, Co, Cr, Ni e Zn (Contínuas) • Uso da terra e tipo de rocha (Categóricas) Exemplo 1: Realizar a análise exploratória das variáveis contínuas do banco de dados Jura e analisar as estatísticas descritivas Adaptado do curso do Prof. Joaquim Queiroz 25 Estatísticas para o conjunto de dados Jura (ppm) Estatísticas Cd Co Cr Cu Ni Pb Zn Média 1.31 9.30 35.07 23.73 19.73 53.92 75.08 Mediana 1.07 9.76 34.84 17.60 20.56 46.40 73.56 Desvio padrão 0.92 3.58 10.96 20.71 8.23 29.79 29.02 Variância amostral 0.84 12.79 120.07 429.01 67.78 887.57 842.12 Curtose 2.58 -0.80 0.02 12.12 0.24 11.60 2.16 Assimetria 1.51 -0.18 0.29 2.88 0.16 2.91 1.03 Intervalo 4.99 16.17 58.88 162.44 49.00 210.60 194.12 Mínimo 0.14 1.55 8.72 3.96 4.20 18.96 25.20 Máximo 5.13 17.72 67.60 166.40 53.20 229.56 219.32 Tolerancia máxima 0.80 25.00 75.00 50.00 50.00 50.00 200.00 Contagem 259 259 259 259 259 259 259 Adaptado do curso do Prof. Joaquim Queiroz 26 Uso da Terra (Landuse) Codigo Tipo de Rocha (Rock) Codigo Floresta 1 Argoviano 1 Pastos 2 Kimeridgiano 2 Prados 3 Sequaniano 3 Lavoura 4 Portlandiano 4 Quaternario 5 Dados Jura (Variáveis categóricas) Adaptado do curso do Prof. Joaquim Queiroz 27 23/06/2021 10 Uso do programa R: Fornecem funções para análise de dados geoestatísticos usando o programa R. •Os comandos no programa R são apresentados em vermelho •As saídas no programa R são apresentadas em azul •O caractere # representa comentários, representados em preto •Símbolos ou comandos importantes •Sair do programa q() •Salva o trabalho realizado save.image() •Lista todos os objetos da área de trabalho atual ls() •Remove o objeto x rm(x) •Remove os objetos x e y rm(x,y) •Dado ausente (data missing) NA •Mostra todos os pacotes instalados library() •Carregar (p.ex.) o pacote nlme library(nlme) ou require(nlme) (neste caso, se o pacote já estiver instalado o comando não é executado) Para a execução de uma linha de comando deve-se pressionar a tecla “Enter” Adaptado do curso do Prof. Joaquim Queiroz 28 1) Arquivo de entrada: jura.txt •Procedimento comum a todos os ensaios ># Carregar os pacotes necessários(Programa R.3.1.1) >library(geoR) >library(gstat) >library(lattice) >library(sp) >#Definir a área de trabalho >setwd("C:/PPGCA/CEDGeotec/CursoR/Ensaios") >#carregar arquivo de dados >Geo <- read.table("jura.txt", head=T)#banco de dados: jura.txt >names(Geo) #mostrar o nome das variáveis do banco Geo [1] "Landuse" "Rock" "Cd" "Co" "Cr" "Cu" "Ni" [8] "Pb" "Zn" >Geo #mostrar os dados (variáveis) na area de trabalho >#Resumo do arquivo Geo >summary(Geo) Adaptado do curso do Prof. Joaquim Queiroz 29 Unidade1_1. Analise exploratoria (Unidade1.1) #Carregar pacotes library(geoR) library(gstat) library(lattice) library(sp) #Definir a area de trabalho setwd("C:/PPGCA/GeoestatisticaR") #carregar arquivo de dados Geo <- read.table("jura.txt", head=T) names(Geo) #mostrar o nome dasvariáveis do banco Geo Geo[1:5,] #mostrar 5 linha(variáveis) na area de trabalho #Resumo do arquivo Geo summary(Geo) names(Geo) Adaptado do curso do Prof. Joaquim Queiroz 30 23/06/2021 11 # Selecionar as variaveis quantitativas Cd <- as.geodata(Geo,coords.col = 1:2, data.col = 5) Co <- as.geodata(Geo,coords.col = 1:2, data.col = 6) Cr <- as.geodata(Geo,coords.col = 1:2, data.col = 7) Cu <- as.geodata(Geo,coords.col = 1:2, data.col = 8) Ni <- as.geodata(Geo,coords.col = 1:2, data.col = 9) Pb <- as.geodata(Geo,coords.col = 1:2, data.col = 10) Zn <- as.geodata(Geo,coords.col = 1:2, data.col = 11) # Principais estatísticas descritivas das variáveis summary(Cd$data) summary(Co$data) summary(Cr$data) summary(Cu$data) summary(Ni$data) summary(Pb$data) summary(Zn$data) Adaptado do curso do Prof. Joaquim Queiroz 31 #Construção das tabelas com as estatisticas descritivas tab1<-cbind(summary(Cd$data),summary(Co$data),summary(Cr$data), summary(Cu$data),summary(Ni$data),summary(Pb$data),summary (Zn$data)) colnames(tab1) <- c("Cadmio","Cobalto","Cromo", "Cobre","Niquel","Chumbo", "Zinco") #Renomeando as colunas de cada categoria #Salvando os resultados em uma tabela write.table(tab1, file = "Descritivas.txt") tab1 #exibindo os dados da tabela Cadmio Cobalto Cromo Cobre Niquel Chumbo Zinco Min. 0.1350 1.552 8.72 3.96 4.20 18.96 25.20 1st Qu. 0.6375 6.520 27.44 11.02 13.80 36.52 55.00 Median 1.0700 9.760 34.84 17.60 20.56 46.40 73.56 Mean 1.3090 9.303 35.07 23.73 19.73 53.92 75.08 3rd Qu. 1.7150 11.980 42.22 27.82 25.42 60.40 89.92 Max. 5.1290 17.720 67.60 166.40 53.20 229.60 219.30 > Adaptado do curso do Prof. Joaquim Queiroz 32 #Histogramas par(mfrow = c(2,2)) # set up the graphics hist(Cd$data, breaks = 20, main = "", xlab = "Cadmio", ylab = "Freqüência", col = 2) hist(Co$data, breaks = 20, main = "", xlab = "Cobalto", ylab = "Freqüência", col = 2) hist(Cr$data, breaks = 20, main = "", xlab = "Cromo", ylab = "Freqüência", col = 2) hist(Cu$data, breaks = 20, main = "", xlab = "Cobre", ylab = "Freqüência", col = 2) par(mfrow = c(2,2)) # set up the graphics hist(Ni$data, breaks = 20, main = "", xlab = "Niquel", ylab = "Freqüência", col = 2) hist(Pb$data, breaks = 20, main = "", xlab = "Chumbo", ylab = "Freqüência", col = 2) hist(Zn$data, breaks = 20, main = "", xlab = "Zinco", ylab = "Freqüência", col = 2)Adaptado do curso do Prof. Joaquim Queiroz 33 23/06/2021 12 Adaptado do curso do Prof. Joaquim Queiroz 34 Adaptado do curso do Prof. Joaquim Queiroz 35 #QQ PLot par(mfrow = c(2,2)) # set up the graphics qqnorm(Cd$data, main = NULL, xlab = "Cadmio", ylab = "CdVal") qqnorm(Co$data, main = NULL, xlab = "Coblato", ylab = "CoVal") qqnorm(Cr$data, main = NULL, xlab = "Cromo", ylab = "CrVal") qqnorm(Cu$data, main = NULL, xlab = "Cobre", ylab = "CuVal") par(mfrow = c(2,2)) # set up the graphics qqnorm(Ni$data, main = NULL, xlab = "Niquel", ylab = "NiVal") qqnorm(Pb$data, main = NULL, xlab = "Chumbo", ylab = "PbVal") qqnorm(Zn$data, main = NULL, xlab = "Zinco", ylab = "ZnVal") Adaptado do curso do Prof. Joaquim Queiroz 36 23/06/2021 13 Adaptado do curso do Prof. Joaquim Queiroz 37 Adaptado do curso do Prof. Joaquim Queiroz 38 • Muitas variáveis em ciências da terra : distribuição assimétrica (cádmio, cobre e chumbo) • Poucos valores muito pequenos ou muito grandes : afetam fortemente estatísticas tais como a média ou variância dos dados, o coeficiente correlação linear ou medidas de continuidade espacial. • Valores extremos podem ser analisados como: 1) Se forem declarados valores errôneos podem ser retirados; 2) Podem ser classificados em populações estatísticas separadas; 3) Usar estatísticas robustas, menos sensíveis a valores extremos; 4) Transformar os dados para reduzir a influencia de valores extremos. COMENTÁRIOS Adaptado do curso do Prof. Joaquim Queiroz 39 23/06/2021 14 3.2 Descrição espacial univariada • Dados com distribuição espacial: • Amostras mais próximas de outras apresentam-se mais correlacionadas. • A informação é dividida entre duas ou mais amostras, especialmente em dados agrupados. • Isso significa que cada uma das amostras tem alguma da mesma informação e essa informação esta sendo considerada mais de uma vez na distribuição dos dados. • Essa redundância necessariamente introduz um viés. • Para considerar esse viés, é necessário ponderar o valor de cada amostra de um modo apropriado. Adaptado do curso do Prof. Joaquim Queiroz 40 #Mapa de pontos par(mfrow = c(2,2)) # set up the graphics par(cex = .45) #definfindo o tamanho dos caracteres points(Cd, xlab = "W-E", main = "Cadmio", ylab = "N-S", cex.min = 1.2,cex.max =1.5, pt.divide = "quart", x.leg=c(0.2,1.8),y.leg=c(4.3,5.7)) points(Co, xlab = "W-E", main = "Cobalto", ylab = "N-S", cex.min = 1.2,cex.max =1.5, pt.divide = "quart", x.leg=c(0.2,1.8),y.leg=c(4.3,5.7)) points(Cr, xlab = "W-E", main = "Cromo", ylab = "N-S", cex.min = 1.2,cex.max =1.5, pt.divide = "quart", x.leg=c(0.2,1.8),y.leg=c(4.3,5.7)) points(Cu, xlab = "W-E", main = "Cobre", ylab = "N-S", cex.min = 1.2,cex.max =1.5, pt.divide = "quart", x.leg=c(0.2,1.8),y.leg=c(4.3,5.7)) par(mfrow = c(2,2)) # set up the graphics par(cex = .45) #definfindo o tamanho dos caracteres points(Ni, xlab = "W-E", main = "Niquel", ylab = "N-S", cex.min = 1.2,cex.max =1.5, pt.divide = "quart", x.leg=c(0.2,1.8),y.leg=c(4.3,5.7)) points(Pb, xlab = "W-E", main = "Chumbo", ylab = "N-S", cex.min = 1.2,cex.max =1.5, pt.divide = "quart", x.leg=c(0.2,1.8),y.leg=c(4.3,5.7)) points(Zn, xlab = "W-E", main = "Zinco", ylab = "N-S", cex.min = 1.2,cex.max =1.5, pt.divide = "quart", x.leg=c(0.2,1.8),y.leg=c(4.3,5.7))Adaptado do curso do Prof. Joaquim Queiroz 41 Adaptado do curso do Prof. Joaquim Queiroz 42 23/06/2021 15 Adaptado do curso do Prof. Joaquim Queiroz 43 Banco Jura: variáveis categóricas Freqüência (%) de ocorrência do uso da terra e tipos de rochas. Uso da Terra Freqüência (%) Tipo de Rocha Freqüência (%) Floresta(1) 12.7 Argoviano (1) 20.5 Pastos(2) 21.6 Kimeridgiano (2) 32.8 Prados(3) 63.7 Sequaniano (3) 24.3 Cultivada(4) 1.9 Portlandiano(4) 1.2 Quaternario(5) 21.2 Adaptado do curso do Prof. Joaquim Queiroz 44 Freqüência (%) conjunta de ocorrência de uso da terra e tipos de rochas Floresta Pastos Prados Cultivadas Argoviano 2.7 2.3 15.1 0.4 Kimeridgiano 8.5 6.9 17.0 0.4 Sequaniano 1.2 9.7 12.7 0.8 Portlandiano 0.4 0.4 0.4 0.0 Quaternario 0.0 2.3 18.5 0.4 Florestas : preferencialmente localizadas sobre rochas Kimeridgiano Pastos : rochas Sequaniano e Kimeridgiano Prados e Cultivadas : igualmente sobre cada formação geológica, exceto Portlandiano Adaptado do curso do Prof. Joaquim Queiroz 45 23/06/2021 16 #Variavel qualitativa Landuse # Selecionar a variavel Landuse #carregar arquivo de dados categoricos (uso da terra) land <- read.table("land.txt", head=T) land[1:5,] #mostrar os dados (variáveis) na area de trabalho names(land) land[1:5,] summary(land) #Tabelas e Figuras attach(land) #vincula os nomes das variáveis ao caminho de busca tland <- table(Landuse) #cria tabela da variavel Landuse tland <- as.data.frame(tland) #tabela com varios tipos de dados tland$Porc <- round(tland$Freq/nrow(land)*100, dig = 2) # cria variavel percentagem tland$Landuse <-c("Floresta", "Pasto", "Prado", "Lavoura“)#rótulos na variavel Landuse Adaptado do curso do Prof. Joaquim Queiroz 46 #Grafico de Pizza pie(tland$Freq, labels = paste(tland$Porc, "%"), col = c(4,5,6, 7)) legend("topleft", legend=tland$Landuse, fill = c(4,5,6,7), horiz = FALSE, bty = "n", cex=1) Adaptado do curso do Prof. Joaquim Queiroz 47 #Gráfico de Colunas barplot(tland$Freq, labels = paste(tland$Porc, "%"), col = c(4,5,6,7)) legend("topleft", legend=tland$Landuse, fill = c(4,5,6,7), horiz = FALSE, bty = "n", cex=1) abline(h=0) Adaptado do curso do Prof. Joaquim Queiroz 48 23/06/2021 17 #Criar arquivo tipo eps postscript("usopiz.eps", horizontal=F,encoding = "TeXtext.enc", family = "ComputerModern", height=7, width=5) pie(tland$Freq, labels = paste(tland$Porc, "%"), col = c(4,5,6,7)) legend("topleft", legend=tland$Landuse, fill = c(4,5,6,7), horiz = FALSE, bty = "n", cex=1) postscript("usocol.eps", horizontal=F, encoding = "TeXtext.enc", family = "ComputerModern", height=7, width=5) barplot(tland$Freq, labels = paste(tland$Porc, "%"), col = c(4,5,6,7)) legend("topleft", legend=tland$Landuse, fill = c(4,5,6,7), horiz = FALSE, bty = "n", cex=1) dev.off() Adaptado do curso do Prof. Joaquim Queiroz 49 #Exibir as frequencias e percentagens tland[6,] <- c("Total", sum(tland[,2]), sum(tland[,3])) detach(land) #desvincula os nomes das variáveis da lista de dados #Salvando os resultados em uma tabela write.table(tab1, file = “Landuse.txt") tland #exibindo os dados da tabela Landuse Freq Porc 1 Floresta 33 12.74 2 Pasto 56 21.62 3 Prado 165 63.71 4 Lavoura 5 1.93 5 <NA> <NA> <NA> 6 Total 259 100 Adaptado do curso do Prof. Joaquim Queiroz 50 #Mapa de pontos coordinates(land) = ~ X + Y summary(land) land[1:5,] plot(land) trellis.par.set(sp.theme()) spplot(land, "Landuse",key.space=list(x=0.1,y=0.9,corner =c(0,1)), scales=list(draw=T),cex = 1.5, cuts = 4) title("Landuse") Adaptado do curso do Prof. Joaquim Queiroz 51 23/06/2021 18 Adaptado do curso do Prof. Joaquim Queiroz 52 3.3 Descrição espacial bivariada • Padrão de dependência de uma variável X em relação a outra Y : relação entre pares de valores (concentrações de metais) observados na mesma localização. • Distribuição conjunta de resultados de um par de v.a. X e Y : FDA conjunta (ou bivariada) definida como: FXY (x,y) = Prob{ X £ x, e Y £ y } proporção de pares de dados conjuntamente abaixo dos respectivos valores (valores de corte) x e y Diagrama de dispersão : – grau de dependência entre X e Y – dependência perfeita (X = Y) : todos os pares experimentais (xi,yi), i = 1,..., N plotados sobre a linha de 45oAdaptado do curso do Prof. Joaquim Queiroz 53 Diagrama de dispersão para os pares (xi , yi) Descrição espacial bivariada Adaptado do curso do Prof. Joaquim Queiroz 54 23/06/2021 19 Semivariograma do conjunto N de pares ( xi , yi ) – momento de inércia do diagrama de dispersão em torno da linha de 45o : definido como a metade da média das diferenças quadráticas dos teores entre as coordenadas de cada par, ou seja: Quanto maior o valor do semivariograma, maior a dispersão e menos relacionadas (ou similares) são as duas variáveis X e Y ∑ ∑ 1= 1= 22 )-( 2 1 = 1 = N i N i iiiXY yxN d N γ Descrição espacial bivariada Adaptado do curso do Prof. Joaquim Queiroz 55 Descrição espacial bivariada ∑∑ 1=1= 1 ===}{ N i i N i iiX xN xpmXE ∫ ∫ ∫∫ ),(.=),(.=}{ ∞+ ∞ 2∞+ ∞ dxdyyxfxyyxFdxyXYE XYXY dxxfxxdFxmXE X )(.=)(.==}{ ∫∫ ∞+ ∞ ∞+ ∞ Valor Esperado de X dxdy yxFd yxf XYXY ),( =),( 2 ∑ 1= 1 =)( N i ii yxN XYE Valor Esperado de XY Função densidade de probabilidade (FDP) bivariada Covariância não centrada das duas VA’s X e Y Adaptado do curso do Prof. Joaquim Queiroz 56 Covariância centrada (na média), ou simplesmente covariância Descrição espacial bivariada [ ] [ ][ ]{ }YXXY mYmXEσYXCov --==, [ ] YX mmXYE .-= [ ] ∑ ∑ 1= 1= - 1 =)-)(-( 1 = N i N i YXiiYiXi mmyxN mymx N XYCov 0≥- 1 =}]-{[=},{=}{= ∑ 1= 2222 N i XiXX mxN mXEXXCovXVarσ Variância de X ]1+,1-[∈ }{}.{ },{ == YVarXVar YXCov σσ σ ρ YX XY XY Coeficiente de correlação linear Adaptado do curso do Prof. Joaquim Queiroz 57 23/06/2021 20 Relação experimental entre o variograma e a covariância Descrição espacial bivariada ∑ 1= 2)-( 1 =2 N i iiXY yxN γ ∑∑∑ 222222 ++2=-1+-1=2 i YXii i Yi i XiXY mmyxN my N mx N γ Variograma YXYX i YXiiYXXY mmmmmmyxN σσγ 2-++- 1 2-+=2 2222 ∑ 0≥)-(+2-+=2 222 YXXYYXXY mmσσσγ • maior 2γXY menor σXY • maior dispersão de (xi,yi) (menos similares) em torno de 45º, maior será 2γXY e menor σXY e ρXY • Variograma : medida de variabilidade (ou dissimilaridade) • Covariância e correlação : medidas de similaridade Adaptado do curso do Prof. Joaquim Queiroz 58 ]1+,1-[∈= - . - ='' XY Y Y X X YX ρσ mY σ mX Eσ Descrição espacial bivariada Relação experimental entre o semivariograma e a covariância ( ) X X σ mX X - =' ( ) Y Y σ mY Y - =' 0== '' YX mm 1== 2' 2 ' YX σσ ρXY = 1 - γX’Y’ = 0 Processo AR(1) -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 0 5 10 15 20 25 30 35 40 45 50 t Au to co rr el aç ão 0 0.2 0.4 0.6 0.8 1 1.2 1.4 Se m iv ar io gr am a Autocorrelação Semivariograma [ ]2,0∈-1='' XYYX ργ Adaptado do curso do Prof. Joaquim Queiroz 59 Descrição espacial bivariada As VA’s X e Y podem representar: (i) duas diferentes propriedades em uma mesma localização. Ex. teor de As e Mn no solo; X = ZAs(u), Y = ZMn (u) (ii) a mesma propriedade em duas diferentes localizações do espaço. Ex. teor de As nas localizações u e u + h separadas por um vetor h; X = ZAs(u), Y = ZAs(u + h); (iii) duas diferentes propriedades medidas em duas diferentes localizações. Ex. teor de arsênio na localização u e teor de manganês em u+h, sendo: X = ZAs(u), Y = ZMn(u + h). • Grau de variabilidade (ou dissimilaridade)/similaridade entre as duas VA’s X e Y σXY ou ρXYAdaptado do curso do Prof. Joaquim Queiroz 60 23/06/2021 21 Semivariograma característico (ou experimental) da variabilidade espacial em uma área A Descrição espacial bivariada ∑ )( 1= 2)]+(-)([ )(2 1 =)( h huu h h N α αα zzN γ • Conjunto de dados sem efeito proporcional (correlação entre a média e variância) • Localizações das amostras sem agrupamento preferencial Semivariogramas relativos (ou padronizados) 2 +- 2 + )( =)( hh h h mm γ γRG h-m )( _hz αu )+( huαz média dos valores média dos valores h+mAdaptado do curso do Prof. Joaquim Queiroz 61
Compartilhar