A maior rede de estudos do Brasil

Grátis
158 pág.
Análise estatística espacial de dados geológicos multivariados

Pré-visualização | Página 1 de 32

Análise estatística espacial de dados 
geológicos multivariados 
 
 
 
 
 
 
PAULO M. BARBOSA LANDIM 
Professor Emérito da Universidade Estadual Paulista 
 Professor Voluntário do Depto. Geologia Aplicada-UNESP/Rio Claro 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNESP/campus de Rio Claro 
Departamento de Geologia Aplicada - IGCE 
― Laboratório de Geomatemática ― 
Texto Didático 15 
2006 
 
 2
 
 
 
Reprodução autorizada desde que citada a fonte 
Norma 6023-2000/ABNT ( http://www.abnt.org.br): 
LANDIM, P.M.B. Análise estatística espacial de dados geológicos multivariados.. 
DGA,IGCE,UNESP/Rio Claro, Lab. Geomatemática,Texto Didático 15, 158 pp. 2006. 
Disponível em <http://www.rc.unesp.br/igce/aplicada/textodi.html>. Acesso em:.... 
 
 
SUGESTÕES 
 
Dúvidas, questões, sugestões, etc. sobre o texto deverão ser encaminhadas para o endereço 
plandim@rc.unesp.br, as quais serão sempre bem recebidas 
 3
1. INTRODUÇÃO 
 
As primeiras aplicações de métodos quantitativos em Geologia coincide 
com o seu estabelecimento como ciência moderna, e um exemplo disso é a 
subdivisão do Terciário, por Charles Lyell em 1830, baseada na presença relativa 
de espécies recentes de moluscos nos diversos estratos da Bacia de Paris, num 
procedimento estatístico. A partir desse início, porém, a Geologia permanece 
qualitativa e puramente descritiva e apenas nos anos 20 do século passado é que 
o enfoque quantitativo começa a se tornar mais presente. Assim nessa época 
William C. Krumbein propõe a amostragem geológica em bases probabilísticas e 
introduz os modelos “processo-resposta”. O entendimento das relações de 
causa-e-efeito para a explicação dos processos geológicos leva Andrei Vistelius, 
no início dos anos 40, a iniciar a formulação da chamada Geologia Matemática. 
Em que pese essas iniciativas, entre outras, a Geologia até há bem pouco tempo, 
era freqüentemente considerada uma ciência baseada em interpretações 
puramente qualitativas dos fenômenos geológicos. Nos últimos 40 anos, porém, 
tem sido notável a mudança da fase descritiva para a utilização de métodos 
quantitativos, principalmente na área da Geologia Aplicada. Na área mineral, com 
destaque para a do petróleo, onde a interpretação geológica, alem de estar 
fundamentada em conceitos científicos, precisa ter enfoque econômico, observa-
se, felizmente, uma marcante tendência quantitativa que vem possibilitando 
avanços importantes principalmente no uso de técnicas espaciais. Ver a propósito 
HOULDING (2000). 
Nas últimas décadas, graças a avanços tecnológicos tanto em termos 
computacionais como em equipamentos de laboratório e de campo mais 
refinados, tem sido intensa a obtenção de dados geológicos quantitativos. A sua 
análise, porem, esta muito aquém dessa imensa quantidade de informações 
coletadas. Basta ver os relatórios de pesquisa e mesmo os bancos de dados com 
um grande número de matrizes de informações não trabalhadas. Verbas e tempo 
são gastos com essa coleta que precisa ser devidamente manuseada e para essa 
análise dos dados o emprego de técnicas estatísticas multidimensionais torna-se 
uma ferramenta fundamental. Isto porque, como os fenômenos geológicos são 
resultantes de diversos fatores condicionantes, o seu entendimento é facilitado 
quando o estudo é submetido a um enfoque quantitativo multidimensional. Deve 
 4
ser enfatizado, porem, que a pura utilização de técnicas estatísticas, e hoje em 
dia bastante facilitada graças à vasta disposição de programas computacionais, 
não é condição suficiente se o estudo não for embasado num sólido 
conhecimento geológico. 
No caso de uma única variável ter sido medida em espécimes de uma 
amostra, no sentido estatístico, a análise de tais dados é feita por intermédio da 
estatística univariada. Se porém valores de diversas variáveis forem obtidos em 
cada um dos espécimes dessa mesma amostra, as técnicas para a análise 
desses dados são fornecidas pela estatística multivariada ou multidimensional. Tal 
análise estatística de mensurações múltiplas efetuadas sobre uma amostra 
fornece um melhor entendimento na razão direta do número de variáveis 
utilizadas e permite considerar simultaneamente a variabilidade existente nas 
diversas propriedades medidas. 
Pode-se afirmar que a análise multivariada é a área da análise estatística 
que se preocupa com as relações entre variáveis e como tal apresenta duas 
características principais: os valores das diferentes variáveis devem ser obtidos 
sobre os mesmos indivíduos e as mesmas devem ser interdependentes e 
consideradas simultaneamente (KENDAL, 1963). Entre os métodos mais utilizados 
em Geociências destacam-se a análise de agrupamentos , a análise das 
componentes principais e a análise discriminante. 
 A análise de agrupamentos é utilizada quando se deseja explorar as 
similaridades entre indivíduos (modo Q) ou entre variáveis (modo R) definindo-os 
em grupos, considerando simultaneamente, no primeiro caso, todas as variáveis 
observadas em cada indivíduo e, no segundo, todos os indivíduos nos quais 
foram feitas as mesmas medidas. Segundo esse método, procura-se por 
agrupamentos homogêneos de itens representados por pontos num espaço n-
dimensional em um número conveniente de grupos relacionando-os através de 
coeficientes de similaridade ou de distância. 
 A análise das componentes principais procura interpretar a estrutura de um 
conjunto de dados multivariados, tanto em modo “Q” como em modo “R”, a partir 
da respectiva matriz de variâncias-covariâncias ou de correlações, pela obtenção 
de “autovalores” e “autovetores”. Consiste numa transformação linear das "m" 
variáveis originais correlacionadas entre si em "m" novas variáveis ortogonais e 
não deve ser confundida com a análise fatorial, segundo a qual supõe-se que as 
 5
relações existentes dentro de um conjunto de "m" variáveis seja o reflexo das 
correlações de cada uma dessas variáveis com "p" fatores, mutuamente não 
correlacionáveis entre si, sendo "p" menor que "m". 
 A análise discriminante é aplicada quando em relação a um indivíduo, 
sobre o qual tenham sido feitas diversas medidas, é necessário decidir à qual de 
dois ou mais possíveis grupos, o mesmo pertence. A idéia básica é substituir o 
conjunto original das diversas mensurações por um único valor Di, definido como 
uma combinação linear delas. Para fornecer um único valor os termos são 
adicionados nessa função linear e esta transformação é realizada de tal modo a 
fornecer a razão mínima entre a diferença entre pares de médias multivariadas e 
a variância multivariada dentro dos dois grupos. Conhecido os Di's, estes serão 
comparados com um certo Do , ou seja, o valor situado, ao longo da linha 
expressa pela função discriminante, a meio caminho entre os centros dos grupos, 
com a finalidade de verificar a qual deles os indivíduos pertencem. 
 A utilidade dos métodos multivariados pode ser apresentada em termos 
geométricos. Assim, observações univariadas podem ser assinaladas sobre uma 
linha reta e se essa linha for dividida em intervalos de classes e contando o 
número de observações em cada intervalo, um histograma poderá ser construído. 
Esse histograma irá requerer duas dimensões para a sua representação. 
Observações bivariadas podem ser assinaladas em um sistema de dispersão a 
duas dimensões. Se o diagrama for dividido em celas, o número de observações 
em cada cela pode ser contado e o respectivo histograma construído. Esse 
histograma requer três dimensões e pode ser representado por um mapa de 
isovalores. Observações trivariadas podem ser assinaladas em um gráfico de 
dispersão a três dimensões e a configuração nos pontos no espaço definirá