Geosaber
  • Potenciometrico
  • Visualização 3D
  • Viz3D
  • GeoBR
  • Superfície de Tendência
  • Curso

Curso - Análise Espacial e Interpolação de Dados no R (07 a 11/07)

Curso de Geoestatística Aplicada

Análise e Interpolação de Dados Geoespaciais no R

Conteúdo

  • Introdução e Fundamentos
    • Objetivos do Curso
    • Instalação e Configuração
    • Dataset de Estudo: Bacia do Rio Meuse
  • Análise Exploratória de Dados (EDA) Avançada
    • Estatísticas de Forma: Assimetria e Curtose
    • Diagnóstico Visual e QQ-Plots
  • Transformações de Dados
    • Logarítmica e Box-Cox
  • Autocorrelação Espacial e Análise de Clusters
    • Índice de Moran Global e Local
  • Modelagem de Continuidade: O Variograma
    • Variograma Experimental e Ajuste Omnidirecional
    • Mapa de Variograma e Anisotropia
    • Variogramas Direcionais
  • Métodos de Interpolação Geoestatística
    • Krigagem Ordinária (OK)
    • Krigagem Universal (UK) e Deriva de Distância
    • Cokrigagem (Co-Kriging)
  • Validação e Conclusão
  • Resumo do Fluxo de Trabalho

Introdução e Fundamentos

Este curso foi desenhado para profissionais e estudantes que desejam dominar a análise de dados espaciais utilizando a linguagem R. A Geoestatística vai além da interpolação convencional, permitindo quantificar a incerteza e compreender a estrutura de continuidade espacial de fenômenos naturais.

Objetivos do Curso

  • Compreender a estrutura de dados espaciais no R (sf e terra).
  • Realizar análise exploratória focada em normalidade e tendências.
  • Quantificar a dependência espacial através do variograma.
  • Implementar diferentes métodos de Krigagem.
  • Validar modelos e gerar mapas de alta qualidade.

Instalação e Configuração

Iniciaremos carregando os pacotes indispensáveis. A modernização do código utiliza o pacote sf para dados vetoriais, substituindo o antigo sp, e o pacote terra para dados de grade, substituindo o raster.

Dataset de Estudo: Bacia do Rio Meuse

Utilizaremos o dataset meuse, que faz parte do ecossistema geoestatístico do R. Ele representa concentrações de metais pesados coletadas em uma planície de inundação.

Estrutura das amostras:
x y cadmium copper lead zinc elev dist om ffreq soil lime landuse dist.m
181072 333611 11.7 85 299 1022 7.909 0.0013580 13.6 1 1 1 Ah 50
181025 333558 8.6 81 277 1141 6.983 0.0122243 14.0 1 1 1 Ah 30
181165 333537 6.5 68 199 640 7.800 0.1030290 13.0 1 1 1 Ah 150
181298 333484 2.6 81 116 257 7.655 0.1900940 8.0 1 2 0 Ga 270
181307 333330 2.8 48 117 269 7.480 0.2770900 8.7 1 2 0 Ah 380

Análise Exploratória de Dados (EDA) Avançada

Na estatística espacial, a distribuição dos valores é tão importante quanto sua localização. A maioria dos métodos de Krigagem pressupõe uma distribuição próxima à normalidade para que as variâncias de estimativa sejam válidas.

Estatísticas de Forma: Assimetria e Curtose

A Assimetria (Skewness) e a Curtose (Kurtosis) descrevem o desvio da normalidade.

Estatísticas para Zinco:
     Media    Mediana  Variancia Assimetria    Curtose 
   469.716    326.000 134743.166      1.472      4.888 

Uma assimetria superior a 1 ou 2 indica a necessidade de transformação. O Zinco, neste caso, apresenta forte assimetria positiva.

Diagnóstico Visual e QQ-Plots

O gráfico Quantis-Quantis (QQ-Plot) é a ferramenta definitiva para checar a normalidade. Se os pontos seguem a reta vermelha, os dados são normais.

Transformações de Dados

Logarítmica e Box-Cox

Quando os dados são assimétricos, aplicamos transformações. A Logarítmica é rápida, mas a Box-Cox é mais flexível ao encontrar o melhor \(\lambda\).

Lambda ótimo para Box-Cox: -0.3 
Assimetria Original: 1.472038 
Assimetria Log: 0.3258816 
Assimetria Box-Cox: 0.05411839 

Autocorrelação Espacial e Análise de Clusters

Índice de Moran Global e Local

O Índice de Moran mede quão correlacionada espacialmente está a variável.


    Moran I test under randomisation

data:  meuse_sf$zinc  
weights: lw    

Moran I statistic standard deviate = 10.067, p-value <
0.00000000000000022
alternative hypothesis: greater
sample estimates:
Moran I statistic       Expectation          Variance 
      0.465278101      -0.006493506       0.002195975 

Modelagem de Continuidade: O Variograma

Variograma Experimental e Ajuste Omnidirecional

O variograma é a base do Kriging. Ele descreve como a variabilidade entre pontos aumenta com o aumento da distância.

Mapa de Variograma e Anisotropia

A anisotropia ocorre quando a continuidade espacial não é a mesma em todas as direções. O Mapa de Variograma (ou variogram cloud map) permite visualizar tendências direcionais.

Variogramas Direcionais

Para confirmar a anisotropia, geramos variogramas em direções específicas (0°, 45°, 90°, 135°).

Métodos de Interpolação Geoestatística

Krigagem Ordinária (OK)

Consideramos a média constante mas desconhecida.

[using ordinary kriging]

Krigagem Universal (UK) e Deriva de Distância

Se houver uma tendência clara (deriva), como o efeito da distância ao rio, usamos UK.

[using universal kriging]

Cokrigagem (Co-Kriging)

Usa uma variável secundária bem correlacionada (ex: Cobre) para melhorar a predição da variável primária (Zinco).

Linear Model of Coregionalization found. Good.
[using ordinary cokriging]

Validação e Conclusão

A validação cruzada \(k-fold\) é usada para medir o erro de predição.

Métricas de Validação Cruzada (OK):
RMSE: 0.402 
MAE:  0.3014 

Resumo do Fluxo de Trabalho

  1. EDA: Analisar assimetria e normalidade.
  2. Transformação: Aplicar Log ou Box-Cox se necessário.
  3. Variografia: Explorar anisotropia via mapa de variograma e ajustar modelos direcionais.
  4. Interpolação: Escolher entre OK, UK ou Cokrigagem baseando-se em covariáveis.
  5. Validação: Verificar RMSE.

Este material foi produzido para o curso de Geoestatística Aplicada por Sidney Schaberle Goveia.

Copyright

Geosaber₢2025
 
  • https://geosaber.com.br