Curso - Análise Espacial e Interpolação de Dados no R (07 a 11/07)
Curso de Geoestatística Aplicada
Análise e Interpolação de Dados Geoespaciais no R
Introdução e Fundamentos
Este curso foi desenhado para profissionais e estudantes que desejam dominar a análise de dados espaciais utilizando a linguagem R. A Geoestatística vai além da interpolação convencional, permitindo quantificar a incerteza e compreender a estrutura de continuidade espacial de fenômenos naturais.
Objetivos do Curso
Compreender a estrutura de dados espaciais no R (sf e terra).
Realizar análise exploratória focada em normalidade e tendências.
Quantificar a dependência espacial através do variograma.
Implementar diferentes métodos de Krigagem.
Validar modelos e gerar mapas de alta qualidade.
Instalação e Configuração
Iniciaremos carregando os pacotes indispensáveis. A modernização do código utiliza o pacote sf para dados vetoriais, substituindo o antigo sp, e o pacote terra para dados de grade, substituindo o raster.
Dataset de Estudo: Bacia do Rio Meuse
Utilizaremos o dataset meuse, que faz parte do ecossistema geoestatístico do R. Ele representa concentrações de metais pesados coletadas em uma planície de inundação.
Estrutura das amostras:
x
y
cadmium
copper
lead
zinc
elev
dist
om
ffreq
soil
lime
landuse
dist.m
181072
333611
11.7
85
299
1022
7.909
0.0013580
13.6
1
1
1
Ah
50
181025
333558
8.6
81
277
1141
6.983
0.0122243
14.0
1
1
1
Ah
30
181165
333537
6.5
68
199
640
7.800
0.1030290
13.0
1
1
1
Ah
150
181298
333484
2.6
81
116
257
7.655
0.1900940
8.0
1
2
0
Ga
270
181307
333330
2.8
48
117
269
7.480
0.2770900
8.7
1
2
0
Ah
380
Análise Exploratória de Dados (EDA) Avançada
Na estatística espacial, a distribuição dos valores é tão importante quanto sua localização. A maioria dos métodos de Krigagem pressupõe uma distribuição próxima à normalidade para que as variâncias de estimativa sejam válidas.
Estatísticas de Forma: Assimetria e Curtose
A Assimetria (Skewness) e a Curtose (Kurtosis) descrevem o desvio da normalidade.
Estatísticas para Zinco:
Media Mediana Variancia Assimetria Curtose
469.716 326.000 134743.166 1.472 4.888
Uma assimetria superior a 1 ou 2 indica a necessidade de transformação. O Zinco, neste caso, apresenta forte assimetria positiva.
Diagnóstico Visual e QQ-Plots
O gráfico Quantis-Quantis (QQ-Plot) é a ferramenta definitiva para checar a normalidade. Se os pontos seguem a reta vermelha, os dados são normais.
Transformações de Dados
Logarítmica e Box-Cox
Quando os dados são assimétricos, aplicamos transformações. A Logarítmica é rápida, mas a Box-Cox é mais flexível ao encontrar o melhor \(\lambda\).
Lambda ótimo para Box-Cox: -0.3
Assimetria Original: 1.472038
Assimetria Log: 0.3258816
Assimetria Box-Cox: 0.05411839
Autocorrelação Espacial e Análise de Clusters
Índice de Moran Global e Local
O Índice de Moran mede quão correlacionada espacialmente está a variável.
Moran I test under randomisation
data: meuse_sf$zinc
weights: lw
Moran I statistic standard deviate = 10.067, p-value <
0.00000000000000022
alternative hypothesis: greater
sample estimates:
Moran I statistic Expectation Variance
0.465278101 -0.006493506 0.002195975
Modelagem de Continuidade: O Variograma
Variograma Experimental e Ajuste Omnidirecional
O variograma é a base do Kriging. Ele descreve como a variabilidade entre pontos aumenta com o aumento da distância.
Mapa de Variograma e Anisotropia
A anisotropia ocorre quando a continuidade espacial não é a mesma em todas as direções. O Mapa de Variograma (ou variogram cloud map) permite visualizar tendências direcionais.
Variogramas Direcionais
Para confirmar a anisotropia, geramos variogramas em direções específicas (0°, 45°, 90°, 135°).
Métodos de Interpolação Geoestatística
Krigagem Ordinária (OK)
Consideramos a média constante mas desconhecida.
[using ordinary kriging]
Krigagem Universal (UK) e Deriva de Distância
Se houver uma tendência clara (deriva), como o efeito da distância ao rio, usamos UK.
[using universal kriging]
Cokrigagem (Co-Kriging)
Usa uma variável secundária bem correlacionada (ex: Cobre) para melhorar a predição da variável primária (Zinco).
Linear Model of Coregionalization found. Good.
[using ordinary cokriging]
Validação e Conclusão
A validação cruzada \(k-fold\) é usada para medir o erro de predição.
Métricas de Validação Cruzada (OK):
RMSE: 0.402
MAE: 0.3014
Resumo do Fluxo de Trabalho
EDA: Analisar assimetria e normalidade.
Transformação: Aplicar Log ou Box-Cox se necessário.
Variografia: Explorar anisotropia via mapa de variograma e ajustar modelos direcionais.
Interpolação: Escolher entre OK, UK ou Cokrigagem baseando-se em covariáveis.
Validação: Verificar RMSE.
Este material foi produzido para o curso de Geoestatística Aplicada por Sidney Schaberle Goveia.