GEOSTATYSTYKAWykład dla III roku Geografii
specjalność - geoinformacja
Alfred StachInstytut Paleogeografii i Geoekologii
Wydział Nauk Geograficznych i Geologicznych UAM
Analiza struktury przestrzennej dwóch zmiennych
zi(u)
zi(u+h)
„ogon”tail
„głowa”head
h
Wartość cechy w punktach u i u + h dotyczy jednej zmiennej zi.
zi(u)
zj(u+h)
„ogon”tail
„głowa”head
h
Wartość cechy w punktach u i u + h dotyczy dwóch zmiennych zi i zj.
Wykresy rozrzutu dwóch zmiennych z przesunięciem (cross h-scattergram)
Dane z punktów odległych od siebie o 0-22,5mŚrednia odległość 17,645m
Ilość par punktów: 74kowariancja: 62,033korelacja: 0,5063
Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat
280 300 320 340 360 380 400220
240
260
280
300
320
b1_03b (x)
b3
n_
03
b (
x+h
)
Wykresy rozrzutu dwóch zmiennych z przesunięciem (cross h-scattergram)
Dane z punktów odległych od siebie o 22,5-67,5mŚrednia odległość 51,381m
Ilość par punktów: 640kowariancja: 63,051korelacja: 0,4165
Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat
280 300 320 340 360 380 400220
240
260
280
300
320
b1_03b (x)
b3
n_
03
b (
x+h
)
Wykresy rozrzutu dwóch zmiennych z przesunięciem (cross h-scattergram)
Dane z punktów odległych od siebie o 67,5-112,5mŚrednia odległość 92,41m
Ilość par punktów: 1048kowariancja: 49,056korelacja: 0,29181
Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat
280 300 320 340 360 380 400220
240
260
280
300
320
b1_03b (x)
b3
n_
03
b (
x+h
)
Wykresy rozrzutu dwóch zmiennych z przesunięciem (cross h-scattergram)
Dane z punktów odległych od siebie o 112,5-157,5mŚrednia odległość 136,27m
Ilość par punktów: 1472kowariancja: 36,042korelacja: 0,2139
Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat
280 300 320 340 360 380 400220
240
260
280
300
320
b1_03b (x)
b3
n_
03
b (
x+h
)
Wykresy rozrzutu dwóch zmiennych z przesunięciem (cross h-scattergram)
Dane z punktów odległych od siebie o 157,5-202.5mŚrednia odległość 181,33m
Ilość par punktów: 1930kowariancja: 21,321korelacja: 0,1293
Dane cech b1_03b i b3n_03b ze zbioru Horbye3.dat
280 300 320 340 360 380 400220
240
260
280
300
320
b1_03b (x)
b3
n_
03
b (
x+h
)
Wykresy rozrzutu dwóch zmiennych z przesunięciem (cross h-scattergram)
h (m) – ij0 – 0,80717,6 – 0,50651,4 – 0,41692,4 – 0,292136,3 – 0,214181,3 – 0,129
280 300 320 340 360 380 400220
240
260
280
300
320
b1_03b (x)
b3
n_
03
b (
x+h
)
280 300 320 340 360 380 400220
240
260
280
300
320
b1_03b (x)
b3
n_
03
b (
x+h
)
280 300 320 340 360 380 400220
240
260
280
300
320
b1_03b (x)
b3
n_
03
b (
x+h
)
280 300 320 340 360 380 400220
240
260
280
300
320
b1_03b (x)
b3
n_
03
b (
x+h
)
280 300 320 340 360 380 400220
240
260
280
300
320
b1_03b (x)
b3
n_
03
b (
x+h
)
Funkcja kros kowariancji
( )
1
1( ) ( ) ( )
( )
N
ij i j i jC z z m mN
h
-h +hh u u h
h
( )
1
1( )
( )
N
i im zN
h
-hu
h
( )
1
1( )
( )
N
j jm zN
h
+hu h
h
Kowariancja między wartościami cech zi i zj odległymi o wektor h jest obliczona według wzoru:
gdzie:N(h) to ilość par punktów odległych o wektor h, a
mi-h i mj+h
to średnie
wartości zi „ogona”, i wartości zj „głowy”.
Powierzchnia kros kowariancji zmiennych b1_03b i b3n_03b
-400 -300 -200 -100 0 100 200 300 400
X (W – E) - m
-400
-300
-200
-100
0
100
200
300
400Y
(S
– N
) -
m
-60
-40
-20
0
20
40
60
80
100
120
Funkcja kros kowariancji zmiennych b1_03b i b3n_03b
0 100 200 300 400 500 600Odstęp - h (m )
-40
-20
0
20
40
60
80
100
Kro
s k
ow
ari
an
cja
– C
ij(h
)
K roskowariancjekierunkowe
bezkierunkow a
0°
45°
90°
320°
Uporządkowany zbiór kroskowariancji Cij(h1),
Cij (h2), … jest zwany eksperymentalną funkcją
kros kowariancji
Kros korelogram
2 2
( )( ) [ 1, 1]ij
ij
i j
C
-h +h
hh
2( )
2
1- -
1
( )
N
i i iz mN
h
h hu
h
2( )
2
1+ +
1
( )
N
j j jz mN
h
h hu h
h
Wariancja wartości „ogona” (zi)
Wariancja wartości „głowy” (zj)
Powierzchnia kros korelogramu zmiennych b1_03b i b3n_03b
-400 -300 -200 -100 0 100 200 300 400
X (W – E) - m
-400
-300
-200
-100
0
100
200
300
400
Y (
S –
N)
- m
-0.4
-0.2
0
0.2
0.4
0.6
Kros korelogramy zmiennych b1_03bi b3n_03b
0 100 200 300 400 500 600Odstęp - h (m)
0
0.2
0.4
0.6
0.8
Kro
s k
ow
aria
ncj
a –
ij(h
)
K ros kore logram ykierunkowe
bezkierunkow y
0°
45°
90°
320°
ij=0,910h=20,7mN=7
Efekt przesunięcia (lag effect)
• Kros kowariancja obliczana w przeciwnych kierunkach jest zazwyczaj odmienna: Cij(h) Cij(-h)
• Znacząca różnica pomiędzy Cij(h) i Cij(-h) może oznaczać, że jedna wartość jednej cechy zmienia się w przestrzeni z pewnym opóźnieniem w stosunku do zmian drugiej cechy. Zjawisko to nazywane jest efektem przesunięcia.
• Jeśli brak jest klarownej fizycznej interpretacji tego zjawiska, lepiej je zignorować, gdyż może być skutkiem przypadkowej fluktuacji związanej z małą ilością par danych z których wyliczono kowariancję.
Efekt przesunięcia - przykładBadamy skażenie gleb wokół zakładu przemysłowego. Jest ono związane z emisjami gazów i pyłów z komina zakładu. Składnik A zanieczyszczeń związany jest z emisjami pyłowymi, a składnik B – gazowymi. Składnik A będzie zatem „wypadał” z chmury zanieczyszczeń szybciej niż składnik B. Zmiany przestrzenne obu składników będą miały podobną strukturę przestrzenną (bo są efektem tego samego zjawiska), ale z przesunięciem.
Czy nasze zmienne b1_03b i b3n_03b wykazują efekt przesunięcia?
0 100 200 300 400 500 600Odstęp - h (m)
-20
0
20
40
60
80
100
Kro
s k
ow
ari
an
cja
– C
ij(h
)
Kros kowariancjeC ij(h ) i C ij(-h )
140°
320°
Rozrzut gradientów zmian par punktów dwóch zmiennych• Kros kowariancja (kros korelacja) określa jak wygląda
relacja wartości cechy zi w jednej lokalizacji w stosunku do wartości innej cechy zj w lokalizacji odległej o wektor h.
• Zamiast porównywać parę danych (zi(u), zj(u+h)) możemy rozważyć porównanie pary przyrostów na dystansie h ([zi(u), zi(u+h)], [zj(u), zj(u+h)]), które pokazują wspólną zmianę gradientów wartości zi- i zj- przy zmianie położenia o wektor h.
• Jeśli obie cechy są skorelowane dodatnio, to przyrost (spadek) wartości zi- od punktu u do punktu u+h będzie związany ze wzrostem (spadkiem) wartości zj-.
• A jeśli obie cechy są skorelowane ujemnie, to ….
Różnice wartości par punktów dwóch cech (h-increments)
zi(u)
zi(u+h)
„ogon”tail
„głowa”head
h
zj(u)
zj(u+h)
„ogon”tail
„głowa”head
h
Analiza wspólnej zmienności cech zi i zj przy przemieszczeniu o dystans h
Wykresy rozrzutu z przesunięciem dla różnic (h-increments scatergrams)
-60 -40 -20 0 20 40 60
b1_03b (u) - b1_03b (u + h )
-60
-40
-20
0
20
40
60
b3n_
03b(
u
) -
b3n_
03b(
u
+ h
)
-60 -40 -20 0 20 40 60
b1_03b (u) - b1_03b (u + h )
-60
-40
-20
0
20
40
60
b3n_
03b(
u
) -
b3n_
03b(
u
+ h
)
Cechy b1_03b i b3n_3b. Kierunek = 130°; tolerancja kierunku = 22,5°; szerokość pasa tolerancji = 100 m; odstęp = 45 m; tolerancja odstępu = 22,5 m
h = 50,8 mh = 21,8 m
Wykresy rozrzutu z przesunięciem dla różnic (h-increments scatergrams)
-60 -40 -20 0 20 40 60
b1_03b (u) - b1_03b (u + h )
-60
-40
-20
0
20
40
60
b3n_
03b(
u
) -
b3n_
03b(
u
+ h
)
Cechy b1_03b i b3n_3b. Kierunek = 130°; tolerancja kierunku = 22,5°; szerokość pasa tolerancji = 100 m; odstęp = 45 m; tolerancja odstępu = 22,5 m
h = 134,4 mh = 90,7 m
-60 -40 -20 0 20 40 60
b1_03b (u) - b1_03b (u + h )
-60
-40
-20
0
20
40
60
b3n_
03b(
u
) -
b3n_
03b(
u
+ h
)
-60 -40 -20 0 20 40 60
b1_03b (u) - b1_03b (u + h )
-60
-40
-20
0
20
40
60
b3n_
03b(
u
) -
b3n_
03b(
u
+ h
)
Wykresy rozrzutu z przesunięciem dla różnic (h-increments scatergrams)
-60 -40 -20 0 20 40 60
b1_03b (u) - b1_03b (u + h )
-60
-40
-20
0
20
40
60
b3n_
03b(
u
) -
b3n_
03b(
u
+ h
)
Cechy b1_03b i b3n_3b. Kierunek = 130°; tolerancja kierunku = 22,5°; szerokość pasa tolerancji = 100 m; odstęp = 45 m; tolerancja odstępu = 22,5 m
h = 226,0 mh = 181,0 m
Kros semiwariogram
( )
1
1( ) ( ) ( ) ( ) ( )
2 ( )
N
ij i i j jz z z zN
h
h u u h u u hh
Kros semiwariogram jest definiowany jako „połowa nie scentralizowanej kowariancji pomiędzy różnicami na dystansie h”.W przeciwieństwie do kros kowariancji i kros korelogramu kros semiwariogram jest symetryczny w stosunku do cech i wektora przesunięcia to jest zamiana ij na ji, oraz (h) na (-h) nie wpływa na jego wartość. Kros semiwariogram nie może zatem pomagać w wykrywaniu efektu „przesunięcia”.Poza tym kros semiwariogram może być obliczany jedynie dla takich lokalizacji, w których zmierzono obie cechy.
Powierzchnia kros semiwariancji zmiennych b1_03b i b3n_03b
-400 -300 -200 -100 0 100 200 300 400
X (W – E) - m
-400
-300
-200
-100
0
100
200
300
400
Y (
S –
N)
- m
20
60
100
140
180
220
260
300
Kros semiwariogram zmiennych b1_03b i b3n_03b
0 100 200 300 400 500 600Odstęp - h (m)
0
40
80
120
160
200
Kro
s k
ow
ari
an
cja
–
ij(h
)
K ros sem iwariogram ykierunkowe
bezkierunkow y
0°
45°
90°
320°
Funkcja kodyspersji
( )( ) 1, 1
( ) ( )ij
ij
ii jj
hh
h h
Uporządkowany zbiór współczynników kodyspersji ij(h1), ij(h2), ... jest zwany eksperymentalną funkcją kodyspersji.Współczynnik kodyspersji można interpretować jako współczynnik korelacji pomiędzy zmianami cech na dystansie h, kiedy wykres rozrzutu rysowany jest w postaci symetrycznej, tj. każda para lokalizacji (u, u+h) pojawia się dwukrotnie, raz jako punkt o współrzędnych ([zi(u), zi(u+h)], [zj(u), zj(u+h)]), a drugi raz jako punkt ([zi(u+h), zi(u)], [zj(u+h), zj(u)]).
Funkcja kodyspersji cechb1_03b i b3n_03b
0 100 200 300 400 500 600
Odstęp - h (m)
0.2
0.4
0.6
0.8
Ko
dy
sp
ers
ja
Funkcja kros kowariancji kodówTak samo jak w przypadku analizy struktury przestrzennej
jednej zmiennej, charakter i siła relacji między dwoma zmiennymi może zależeć o skali natężenia porównywanych cech: niskiej, średniej, czy wysokiej.
Często wysokie wartości skorelowanych przestrzennie cech będące efektem tego samego zjawiska mogą wykazywać większe podobieństwo niż średnie i niskie, mające odmienną genezę.
Przykładem może być zawartość toksycznych metali ciężkich w glebach. Ich niskie lub średnie stężenia mają najczęściej genezę naturalną, związaną z procesami wietrzeniowymi skał macierzystych. Wysokie koncentracje natomiast są zazwyczaj związane z antropogenicznymi emisjami.
Funkcja kros kowariancji kodów
( )
' '1
'
' '
1( ; , ) ; ;
( )
( ) ( )
( ; , ) ( ) ( )
NIij i k j k i k j k
i i k j j k
ij i k j k i i k j j k
C z z i z i zN
F z F z
F z z F z F z
h
-h +h
-h +h
h u u hh
h
Gdzie: Fi-h(zik) i Fj+h
(zjk') to proporcje wartości ogona zi i głowy
zj, które nie przekraczają poziomów progowych zik i zjk'.
Kros kowariancja jest miarą wspólnej dwu-punktowej
skumulowaną frekwencji Fij(h;zik, zjk'), określającej jak często
wartości zi i zj oddalone o wektor h są jednocześnie nie większe
od określonych wartości progowych (zik, zjk').
Kros korelogram kodów
'
'2 2
'
; ,( ; , )
Iij i k j kI
ij i k j k
i i k i j k
C z zz z
z z
-h +h
hh
Standaryzowaną postacią kros kowariancji kodów jest kros korelogram kodów:
Gdzie wariancja wartości kodów ogona i(u;zik) jest równa:
2 ( )i ikz-h
- -
1i ik i ikF z F z h h
Kros semiwariogram kodów
( )
'1
' '
1; , ; ;
2 ( )
; ;
N hIij i k j k i k i k
j k j k
z z i u z i u h zN h
i u z i u h z
h
Niezerowy udział w kros semiwariogramie kodów mają jedynie te pary danych, w których wartości obu cech zi, i zj są po przeciwnych stronach ich wartości progowych (zik, zjk').
Udział pary danych w może być pozytywny (+1) lub negatywny (-1), w zależności od tego czy wartości zi i zj wspólnie rosną (maleją) przy przejściu od u do u + h, lub też zmieniają się w sposób przeciwny.
'; ,Iij i k j kz z h
Strukturę przestrzenną danych kodowanych dwóch cech badać można także w innych przypadkach:
• i(u;zk) i i(u;zk') mogą dotyczyć tej samej ciągłej (ilościowej) cechy z, ale dla dwóch różnych wartości progowych zk i zk'
• i(u;sk) i i(u;sk') odnoszących się do dwóch różnych kategorii sk i sk'
• i(u;zk) i i(u;sk) odnoszących się cechy ilościowej i jakościowej (kategorii)
Standaryzowane kros semiwariogramy bezkierunkowe kodów b1_03b i b3n_03b
0 100 200 300 400 500 600Odstęp - h (m)
0
0.2
0.4
0.6
Kro
s s
emiw
ario
gra
m –
ij(h
)
Kros semiwariogramy kodów10 percentyl
25 percentyl
50 percentyl
75 percentyl
90 percentyl
Efekt proporcjonalności: relacja między lokalną średnią, a lokalną wariancją
Próbka preferencyjna, zmienna b1_03b
Próbka preferencyjna, zmienna b3n_03b
300 310 320 330 340 350 360Lokalna średnia
0
100
200
300
400
Lo
kaln
a w
ari
an
cja
250 260 270 280 290 300Lokalna średnia
0
200
400
600
Lo
kaln
a w
ari
an
cja
Semiwariogramy względne 1
ˆˆ
ˆGR f m
hh
h
1
1ˆ
2 2
N m mm z z
N
hh hh u u h
h
Ogólny semiwariogram względny skaluje wartości semiwariogramu za pomocą funkcji średniej odstępu h
Średnia wszystkich wartości danych dla odstępu h, czyli średnia ze średnich dla danych ogona i głowy.
Funkcję f można określić na podstawie wykresu rozrzutu lokalnych średnich w stosunku do lokalnych wariancji.
Dla rozkładów prawoskośnych funkcję tę zazwyczaj przyjmuje się jak kwadrat średniej odstępu: 2
m̂ h
Semiwariogramy względne 2
2
21
1ˆ
2
2
N
PR
z z
N z z
h u u h
hh u u h
Porównawczy semiwariogram względny skaluje wartości semiwariogramu dla każdej różnicy w parze za pomocą podniesionej do kwadratu średniej wartości ogona i głowy.
Miara ta bezpośrednio redukuje wpływ poszczególnych wysokich wartości danych w obliczeniach semiwariogramu.
Ze względu na matematyczny charakter (ułamki) zastosowanie semiwariogramów względnych jest ograniczone do danych o wartościach dodatnich
0 100 200 300 400 500 600Odstęp - h (m )
0
50
100
150
200
250
Se
miw
ari
an
cja
–
(h)
Sem iwariogram ykierunkowe – 50°
populacja
próbka losow a
próbkapreferencyjna
0 100 200 300 400 500 600Odstęp - h (m )
0
50
100
150
200
Se
miw
ari
an
cja
–
(h)
Sem iwariogram ykierunkowe – 320°
populacja
próbka losow a
próbkapreferencyjna
Wpływ preferencyjnego próbkowania na semiwariogram empiryczny b1_03b
Wpływ preferencyjnego próbkowania na semiwariogram empiryczny b1_03b
0 100 200 300 400 500 600Odstęp - h (m )
0
40
80
120
160
Se
miw
ari
an
cja
–
(h)
Sem iwariogram ykierunkowe – 320°
populacja
próbka losow a
próbkapreferencyjna – G R
próbkapreferencyjna – PR
0
0.001
0.002
0.003
0 100 200 300 400 500 600Odstęp - h (m )
0
50
100
150
Se
miw
ari
an
cja
–
(h)
Sem iwariogram ykierunkowe – 50°
populacja
próbka losow a
próbkapreferencyjna – G R
próbkapreferencyjna – PR
0
0.001
0.002
0.003
0.004