introduÇÃo À estatÍstica...
TRANSCRIPT
INTRODUÇÃO À ESTATÍSTICA ESPACIAL
Prof. Anderson Rodrigo da [email protected]
Métodos
• Índices de agregação
• Métodos de quantificação da dependência especial– Correlograma
– Variograma
• Métodos de interpolação (mapas)– Determinísticos
– Estocásticos
21:04 Geoestatística 2
Amostragem espacial
21:04 Estatística Espacial 3
10 15 20 25 30
30
40
50
60
70
Aleatória
Coord. x
Coord
. y
10 15 20 25 30
30
40
50
60
70
Aleatória Estratificada
Coord. x
Coord
. y
10 15 20 25 30
30
40
50
60
70
Sistemática
Coord. x
Coord
. y
Referenciamento vs Georreferenciamento
21:04 Geoestatística 4
• Estudos em áreas experimentais ou pequenas áreas podem ser apenas referenciados em relação a um ponto de referência.
• A distância euclidiana pode ser utilizada como medida de distância.
• Georreferenciamento significa referenciar os pontos amostrais em relação a algum sistema geográfico de informação, como:– Sistema UTM
– Sistema Lat-Long.
Exemplo 1Densidade populacional
Pratylenchus brachyurus (1000 x nematóides/dm³ solo) em área
de produção de soja
21:04 Geoestatística 5
Coord. x Coord. y Dens.74 123 272 93 372 62 172 31 172 0 248 0 248 31 348 62 448 93 348 123 424 123 424 93 524 62 324 31 324 0 40 0 60 31 70 62 70 93 80 123 6
0 20 40 60
02
04
06
08
01
00
12
0
x
y
Índice de agregação de Morisita
21:04 Geoestatística 6
==
==
−
−
=n
i
i
n
i
i
n
i
i
n
i
i
yy
yy
nI
1
2
1
11
2
em que: n é o número de pontos amostrais e yi
é o valor observado no i-ésimo ponto. De
acordo com Morisita (1962), Ia = 1 indica
distribuição aleatória, Ia < 1 indica distribuição
regular e Ia > 1 indica distribuição agregada.
Obs.: índices de agregação não consideram a dependência espacial dos dados.
Teste e Correlograma de Mantel
21:04 Geoestatística 7
.
30 40 50 60 70 80-0
.3-0
.2-0
.10
.00
.10
.2
Distance class index
Ma
nte
l co
rre
latio
n
Baseia-se na correlação entre a matriz A de distâncias geográficas e a
matriz B de distânciasecológicas/biológicas.
O TESTE de Mantel (1967) baseia-se na aleatorização dos elementos da
matriz B.
O correlograma é construído atravésde lags de distância.
Interpolação pelo método IQD
21:04 Geoestatística 8
.
Grid amostral vs Grid de predição.
IQD: Inverso do Quadrado das Distâncias.
Método determinístico: não quantifica a incerteza das predições.
0 20 40 60
02
04
06
08
01
00
12
0
x
y
𝑌 𝒙 =
𝑖=1
𝑛Τ𝑌𝑖 𝑑𝑖
2
1
𝑑𝑖2
INTRODUÇÃO À GEOESTATÍSTICA
Exemplo de Introdução
Num estudo sobre compactaçãodo solo de uma área de cerca de3500 m², foram coletados dadosde resistência do solo àpenetração (MPa), de acordocom o grid semi-regular ao lado.
• Valores de resistência à penetração espacialmente próximos são semelhantes?
• Até que distância podemos afirmar isso?
• É possível predizer valores em locais não amostrados?
21:04 10Geoestatística
0 20 40 60 80
0
10
20
30
40
50
60
Coord. X (m)
Coord
. Y
(m
)
EN
W S
17º29'23'' S, 48º13'02'' W
Como é feita uma análise geoestatística?
21:04 11Geoestatística
Preparação do data set
• estatísticadescritiva
• Detecção de outliers
Estrutura de dependênciaespacial
• Correlogramas
• Semivariogramas
Prediçãoespacial
• Krigagem
Análise da dependência espacial
21:04 12Geoestatística
• Usualmente feita através de variogramas ou semivariogramas– Semivariância = variância / 2
• A idéia é identificar a dependênciapela variabilidade dos dados em umadeterminada distância ou classe de distância.
• Se há dependência espacial, pontosmais próximos apresentam maiorcorrelação ou covariância, ou menorvariabilidade
• Dizemos então que a covariância é função da distância apenas
0 20 40 60 80
0
5
10
15
0 - 20 cm
Distância (m)S
em
ivariância
0 20 40 60 80
0
1
2
3
4
5
20 - 40 cm
Distância (m)
Sem
ivariância
Como obter um semivariograma?
21:04 13Geoestatística
0 20 40 60 80
0
5
10
15
0 - 20 cm
Distância (m)S
em
ivariância
0 20 40 60 80
0
1
2
3
4
5
20 - 40 cm
Distância (m)
Sem
ivariância
A semivariância de um conjunto de pontosseparados por uma distância d é calculadapor meio de:
=
+−=)(
1
2)()(
)(2
1)(
dN
i
ii dszszdN
d
Como obter um semivariograma?
23:48 14Geoestatística
Exemplo prático:
Dados de teor de potássio no solo (mmolc/dm³)
0.5 1.0 1.5 2.0 2.5 3.0 3.5
0.5
1.0
1.5
2.0
2.5
3.0
3.5
x
y1.5 1.1 0.9
1 0.8 0.7
0.8 0.7 0.85
Pressuposições
21:04 15Geoestatística
• Considere z(x) a realização da variável Z indexada pelo vetor de coordenadas x (2 ou 3D).
• z(x) é considerada uma variável contínua
• Há n realizações (observações)
• Vamos assumir:
– Estacionariedade: a variabilidade é (praticamente) a mesma em qualquerparte da área amostrada
– Isotropia: o grau de dependência espacial entre os valores z(x) é (praticamente) o mesmo em qualquer direção da área
– z(x) tem distribuição normal
Análise da dependência espacial
23:00 16Geoestatística
Dizemos que dois pontos, zi e zj, separados pela distância d apresentam a seguinte variância:
Dois modelos usuais para a correlação espacial são o exponencial e o gaussiano:
Var 𝑧𝑖 , 𝑧𝑗 = 2𝜏2 + 2𝜎2{1 − 𝐶𝑜𝑟 𝑧𝑖 , 𝑧𝑗 }
1
2𝑉𝑎𝑟 𝑧𝑖 , 𝑧𝑗 = 𝛾, 𝑎 𝒔𝒆𝒎𝒊𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎
𝐶𝑜𝑟 𝑧𝑖 , 𝑧𝑗 = exp(−𝑑ϕ)
𝐶𝑜𝑟 𝑧𝑖 , 𝑧𝑗 = exp(− 𝑑ϕ
2
)
Análise da dependência espacial
21:04 17Geoestatística
Temos, então, os seguintes parâmetros para o modelo de semivariância:
Os modelos de semivariância são ajustados
a partir da estimação dos três parâmetros.
Dentre os métodos de estimação, destaca-se o
método da máxima verossimilhança.
Uma vez ajustado o modelo, é possível
realizar predição espacial.
𝜏2: efeito pepita ou variação ao acaso
Φ: parâmetro de alcance
𝜎2: variação espacial
0 20 40 60 80
0
5
10
15
0 - 20 cm
Distância (m)
Sem
ivariância
0 20 40 60 80
0
1
2
3
4
5
20 - 40 cm
Distância (m)
Sem
ivariância
Grau de aleatoriedade
22:38 18Geoestatística
GA < 0,15: Baixa aleatoriedade
0,15 ≤ GA ≤ 0,30: Aleatoriedade significativa
GA > 0,3: Aleatoriedade muito significative
O extremo da aleatoriedade é o “efeito pepita puro”.
GA=𝜏2
𝜎2
Krigagem
23:07 19Geoestatística
• É o método de predição espacial, isto é, o processo de interpolação de dados.
• Nada mais é do que um modelo de regressão. Uma combinação linear ponderada de valores.
• Alguns tipos de krigagem são:– Ordinária
– Simples
– Universal
– Co-krigagem
መ𝑍(𝒙)𝐾𝑂 =
𝑖=1
𝑛
𝜔𝑖 𝑍𝑖(𝒙)
Em que wi são pesos ótimos obtidosde acordo com o modelo de variograma.
Exercícios
21:04 20Geoestatística
1. Consulte o site do Inmet Goiás e construa um banco de dados deprecipitação (mm), temperatura máx, umidade do ar (%) fornecidos pelasestações automáticas de todas as cidades, e dados de lat/long. Construaum mapa de predição especial para cada variável pelo método IQD.
2. Tente ajustar um modelo de variograma para os dados de nematóidesapresentados como exemplo. Interprete os valores do modelo devariograma. Calcule o grau de aleatoriedade. Construa um mapa atravésda krigagem ordinária.
3. (Para nota da disciplina) Faça uma resenha (max. 1 página) sobre aanálise estatística realizada no artigo: Ribeiro Jr. et al. (2009) SPATIALPATTERN DETECTION MODELING OF THRIPS (Thrips tabaci) ON ONIONFIELDS. Sci. Agric., v.66, n.1, p.90-99.
Bibliografia
Legendre, P.; Legendre, L. (2012) Numerical Ecology. 3rd ed. Elsevier.
Yamamoto, J.K.; Landim, P.M.B. (2013) Geoestatística: conceitose aplicações. Oficina de Textos.
21:04 Geoestatística 21