bevezetés az esri arcview gis asztali …laci/kepfeldolgozas/phare_tananyag... · web viewtitle...

Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás

Képfeldolgozás

Dr. Mucsi LászlóSZTE Természeti Földrajzi és Geoinformatikai Tanszék

A jegyzet megismertet a digitális képfeldolgozás fogalmaival, legfontosabb műveleteivel, többek között a képi állományok importjával, korrekciójával, a korrigált képek mozaikolásával, a képfinomítás módszereivel, a többsávú képek osztályozásával, stb. A tananyag az ERDAS programra épül, ezért további kiegészítéseket talál az angol nyelvű Field Guide-ban. Az ismeretek további bővítéséhez ajánlott irodalomként használható a szerző Műholdas távérzékelés és digitális képfeldolgozás c. egyetemi jegyzete.

Tartalom

Fogalmak 2Transzformáció 5Képfinomítás 27Főkomponens analízis 41Osztályozás 44

1


Fogalmak

A digitális képfeldolgozás során használt képek alatt olyan digitális állományokat értünk, melyek valamilyen képkezelő, képfeldolgozó szoftver segítségével bemutatnak egy tárgyat, vagy a földfelszín egy részét. A digitális képek adatállományokban, más néven képfile-okban találhatók, s valamilyen adathordozón, mágnesszalagon, CD-n, mágneslemezen, stb. tárolják őket. A háló alapú képfeldolgozó rendszerekben a kép legkisebb önálló eleme a pixel, vagy raszter, melynek helye és értéke van. A helyet az oszlop és sor koordináták, descartesi x, y koordináták, vagy földrajzi koordináták is meghatározhatják, míg a pixel értéke egy szám, mely valamilyen módon reprezentálja az adott terület egy tulajdonságát, vagy a mérés eredményét (pl. reflektancia, tengerszint feletti magasság, stb.). A különböző tulajdonságok mérési eredményeit önálló sávokban tároljuk, így pl. a különböző spektrális tartományokban mért reflektancia értékek általában1 egy képfileban, de más-más sávban találhatók. A képfeldolgozó rendszerekben gyakran párhuzamosan használják a sáv és a réteg fogalmát. Mindkét fogalom használható azzal a megjegyzéssel, hogy a digitális kép egy sávja és egy űrfelvétel egy adott spektrális tartományra (sávra) vonatkozó adatai közötti kapcsolatot pontosan meg kell határozni2, másrészt ha a digitális, többsávú képek sávjait egy térinformatikai rendszerben (GIS) használjuk fel, akkor ott már csak rétegekről beszélhetünk. A képfeldolgozás során új képek készülnek, melyek lehetnek raszter vagy vektor alapúak, ezért érdemes az eredeti kép sávjaitól megkülönböztetve ezeket már csak rétegeknek nevezni, pl. annotációs réteg.

A numerikus adatok feldolgozása során nem közömbös, hogy a pixelértékek milyen típusúak, valamint milyen formátumban tároljuk azokat. A pixelértékek egy raszterfileban lehetnek nominális, rend, intervallum és arány típusúak. Az első két típust tartalmazó rétegeket tematikus állományoknak nevezik. Az intervallum vagy arány típusú változókkal többnyire folyamatosan változó jelenségeket írunk le, pl. domborzat magassága, hőmérséklet, stb., ezért az ilyen adattípusokat tartalmazó rétegeket folyamatos rétegeknek nevezzük.

Koordináta rendszerek

A raszter alapú rendszerekben a pixel helyét többféleképpen megadhatjuk. Természetesen alapkövetelmény, hogy egy adott képelem helyzetét egy meghatározott koordináta rendszerben egy és csak egy módon adhatjuk meg, egy képelemhez csak egy koordináta pár tartozhat. A képelem helyét megadhatjuk file, térképi, és földrajzi koordinátákkal.

A file koordináták leírják a pixel adatfileban elfoglalt helyét az oszlop és a sor koordináták megadásával. A legismertebb képfeldolgozó rendszerekben a file koordináták számozása a bal felső sarokban kezdődik a 0. oszlop 0. sorában lévő pixellel.

1 Az ERDAS IMAGINE egy képfileban tárolja az összes sávot, míg az IDRISI minden sávot egy-egy önálló fileban tárolja.2 Egy nem teljes (nem mind a 7 sávot tartalmazó) Landsat TM felvétel képfilejának első sávjában lehet, hogy a 2. spektrális tartomány (látható fény zöld sávja) adatai helyezkednek el. Ez gondokat okozhat a beépített függvények, pl. NDVI alkalmazásánál.

2


1.ábra Tipikus file koordináták

A térképi koordináták egy jól definiált koordináta rendszer (pl. Descartes-féle) szerint adják meg az adott hely pozícióját a koordináta rendszer mértékegységében (általában m, vagy km). Az origó (kezdőpont) a kép bal alsó sarkában helyezkedik el. A pixelt a középpontjának koordinátái reprezentálják. A térképi koordináták megadhatók valamilyen vetületi rendszer szerint is, pl. a geometriai korrekció során, emiatt a képelemek koordinátái lehetnek földrajzi (szélesség - , hosszúság - ) koordináták is. Lehetséges, hogy a térképi és a földrajzi koordináták átszámíthatók egymásba (pl. EOV koordináták UTM-be), valamint két földrajzi koordináta rendszer között is létezhet átszámítási mód (pl. UTM-WGS84).

Adattárolás

A digitális képek, űrfelvételek sokfajta adathordozón, médián – mágnesszalagon, CD-ROM-on, mágneslemezen – tárolhatók. Legtöbbször nem is az a kérdés, hogy min tárolják az adatokat, hanem az, hogy hogyan, milyen szerkezetet szerint rendezték el az adatokat a tárolón.

A digitális adatokat bináris formátumban tárolják. A bináris adat alapegysége a bit, melynek két lehetséges értéke van: 0 vagy 1. Az adatfile méretét byte-okban adják meg (1 byte 8 bit). A tároló médián a képi adatokat különböző módon tárolhatják. A legtöbbször használt formátumok:

BIL - sávok soronkénti összefésülése,BSQ - sávok egymás utáni, szekvenciális összefűzése,BIP - sávok pixelenkénti összefésülése.

Ha a kép egyetlen sávot tartalmaz, akkor a három tárolási mód között nincs különbség.

BIL - sávok soronkénti összefésülése

Az adatfile háromféle rekordtípusból állhat: elő (header), adat, utó (trailer) rekordból. Az elő, és az utó rekord nem létezik, általában csak az eredeti adatfileokban találjuk meg ezeket, míg a pixelértékeket az adatrekordok tartalmazzák.

A soronként összefésült tárolási mód (BIL) esetén az adatrekordok egy sáv egy sorát tartalmazzák, oly módon, hogy ha m számú sorból és n számú oszlopból áll egy kép, akkor az első n byte hosszúságú adatrekord hordozza az első sáv első sorának adatértékeit, majd a következő rekordban a második sáv első sorát találjuk. Az m+1. rekordban van az első sáv 2. sora, stb. (ábra A része).

3


2.ábra BIL (balra)és a BSQ (jobbra) tárolási módszer

BSQ - sávok egymás utáni, szekvenciális összefűzése,

A sávszekvenciális tárolás (ábra B) minden sáv önállóan, a többi filetól elválasztva kerül az adatfileba. Emiatt e tárolási módnak számos előnye van:

a, egy sávot könnyen lehet olvasni és megjeleníteni,b, több sávot különböző sorrendben is beolvashatunk.

A Landsat TM sávokat BSQ formátumban tárolják, minden sávot EOF (end of file) jel választ el. Szalagos tárolás esetén a szalag végét három EOF jel jelzi, minden szalag elején van egy elő file, az adatrekordok elején nincsen elő rekord.

BIP - sávok pixelenkénti összefésülése

A sávok pixelenkénti összefésülése esetén a pixelek a sávok szerinti rendben követik egymást, vagyis az első sáv első sorának első pixelének az értékét a második sáv első sorának első pixelének az értéke követi

4


Rectification - Képtranszformálás

A képtranszformálás a digitális műholdfelvételek vagy a légifotók a szabálytalan földfelszín leképezései egy síkfelületre. Még a látszólag sík területekről készített felvételek is torzulnak a Föld görbülete és a szenzor fizikai tulajdonságai miatt. Ebben a fejezetben bemutatásra kerülnek azok a műveletek, melyekkel elvégezhető a kép geometriai korrekciója, a különböző időpontokban készített felvételek összevetése és a képek térképi tartalommal való feltöltése.

A térképi vetületek a gömb, ill. szferoid (pl. a Föld) felszínének síkvetületei. A gömb síkba fejtése mindig valamilyen torzulást eredményez. Ezért minden térképi vetületi rendszert a vetület torzulási sajátosságai szerint csoportosítva beszélhetünk távolságtartó, szögtartó és területtartó vetületről. Például a területtartó vetületeken adott területű körök mindig azonos területű felszíni területeket jelölnek. Bár a területek itt egyenlők, a területek alakjai, a szögek torzulhatnak.A vetületeken az adott hely pozícióját koordinátákkal adjuk meg. Minden vetületi koordináta rendszer átalakítható olyan hálózattá, amelyben a helyet X,Y (oszlop, sor) koordináták fejezik ki.

A rektifikáció, vagy képtranszformáció olyan folyamat, melyben az egyik hálózat adatát, elemét áttranszformáljuk egy másik hálózatba, valamilyen n-ed fokú polinom segítségével. Az átalakítás során legtöbbször az új képelem (pixel) nem illeszkedik tökéletesen az eredeti hálózatra, az új pixelértéket egy egyértelmű hozzárendelési szabály alapján kell kiszámítani. Ezt a folyamatot átmintázásnak (resampling) nevezik.

Gyakran előfordul, hogy egy területről több különböző műszerrel készített kép áll rendelkezésünkre. A pixelenkénti összehasonlításhoz a képeket azonos hálózatba kell vinni. A képek átfedetéséhez nem mindig szükséges a térképi koordináta rendszer. Ezt a kép a képhez (image to image) átalakítást hozzáillesztésnek (registration) nevezzük.

Ha a képi adatokat vetületi rendszerhez illesztjük, és vetületi koordinátákkal látjuk el, akkor a folyamatot geokódolásnak (georeferencing) nevezzük. A képtranszformáció definíció szerint tartalmazza a geokódolást is. A kép a képhez átalakítás csak akkor lesz geokódolás, ha az a kép rendelkezik térképi koordinátákkal, amelyhez a többi képet illesztjük. Mikor alkalmazzuk a képtranszformációt?

A képtranszformáció elkerülhetetlen azokban az esetekben, amelyekben a kép pixelhálózatát egy térképi vetületi rendszerhez, avagy egy másik képhez akarjuk illeszteni. A képillesztésnek több oka is lehet:

* pixelenkénti változás vizsgálat* GIS adatbázis-fejlesztés* tanulóterületek kijelölése térképi koordináták alapján* méretarányos fotótérkép készítés* vektoradatok (pl. ARC/INFO) alkalmazása* különböző méretarányú képek összehasonlítása

5


* távolság és területmérés* képek összeillesztése (mozaikolás)

Az adatok transzformációja előtt ki kell választani az optimális vetületi és térképi koordináta rendszert az adatbázis elsődleges felhasználási céljának megfelelően. A választás előtt vegyük figyelembe a következőket:

* Mekkora a térképezendő terület nagysága? * Hol helyezkedik el a földgömbön?* Milyen a kiterjedése a területnek?

Más és más vetületi rendszert kell alkalmazni eltérő nagyságú, alakú területek esetén, valamint lényeges figyelembe venni, hogy pl. poláris, vagy ekvatoriális régióval dolgozunk-e?

Mikor elégséges csak a geokódolás?

A képtranszformációt nem szükséges elvégezni, ha a felvételen nincs torzulás, pl. ha a .img file olyan térképlapról készült (letapogatóval, vagy digitalizálással), amelynek a vetületi rendszere megfelelő. Ebben az esetben csak a megfelelő térképi koordinátákat kell a felvétel header-én (Image info) feltüntetni.

A képtranszformáció hátrányai

A képtranszformálás folyamán a transzformált pixel-értékeket át kell mintázni, hogy illeszteni tudjuk az új pixel-hálózatra. Bár az új értékeket kiszámító algoritmusok megbízhatóak, a transzformálás folyamán elveszhetnek bizonyos spektrális adatok. Ha az alkalmazás során nincs szükség a térképi koordinátákra és egységekre, akkor helyesebb elkerülni a képtranszformációt.

Klasszifikáció és a transzformáció

Egyes szerzők szerint érdemesebb a klasszifikációt a transzformálás előtt elvégezni, hiszen ebben az esetben az eredeti értékeken alapul a klasszifikáció. Másrészről ha GPS adatokat használunk illesztőpontoknak (GCP-nak), először elvégezhetjük a képtranszformálást, mivel ezek az adatok nagyon pontosak. Tematikus térképek transzformálásakor csak a "legközelebbi szomszéd" eljárás alkalmas az átmintázására, és ez problémát jelenthet néhány alkalmazásnál.

A képtranszformálás lépései

Általában vonatkoztatási rendszer-nek nevezzük azt a hálózati- ill. koordináta-rendszert, amelyhez illesztjük az eredeti adatfile koordinátáit a képtranszformáció során. A képtranszformáció és a hozzáillesztés eljárásának általános lépései a következők:

1. A GCP-ok kiválasztása.2. A transzformáció mátrixának kiszámítása és tesztelése.3. Az output .img file létrehozása. A pixeleket át kell mintázni az új hálózathoz való illesztéshez.

6


Felszíni illesztési pontok (GCP)

A felszíni illesztési pontok (GCP) egy olyan felvétel meghatározott pixelei, amelyhez a megfelelő térképi koordináták - és egyéb output koordináták - ismertek. A GCP két (X,Y) koordináta párból állnak:

* forrás koordináták - a transzformált felvétel adat file koordinátái

* vonatkoztatási koordináták - azon térkép, vagy felvétel koordinátái, amelyhez a forrás felvételt hozzáillesztettük.

A GCP megadása

A helyes képtranszformáláshoz elengedhetetlen a GCP pontos megadása, mivel a transzformált kép összes többi pontja a GCP-ből extrapolálással áll elő. A képtranszformáció annál megbízhatóbb lesz, minél több szétszórt helyzetű pontot választunk a teljes felületről. A nagy méretarányú felvételeken választhatjuk GCP-nak pl. az útkereszteződéseket, repülőterek kifutópályáit, tornyokat, épületeket. Kis méretarányú képeken a nagyobb objektumok használhatók, mint pl. lakott területek, vagy geológiai formák, tereptárgyak. Ne használjunk fel olyan felszíni jegyeket, amelyek idővel megváltozhatnak, mint pl. tavak partvonalát, egyéb vízfelszíneket, növényzetet, stb.

A következő lehetőségek állnak rendelkezésre a forrás és a vonatkoztatási GCP megadásához:

* Ha a priori ismerjük a GCP-kat, akkor begépelhetjük a billentyűzetről.* Használhatjuk az egeret a kép a képhez illesztés során a forrás és a vonatkoztatási

koordináták megadásához.

* A digitalizáló tábla is felhasználható egy felvétel és a megfelelő eredeti térkép illesztéséhez.

Digitalizáló táblaAmennyiben a GCP-at eredeti térképlapról digitalizáljuk pontos alaptérképeket kell használnunk. Különböző felbontású felvételekhez különböző méretarányú és vetítési rendszerű térképeket használunk. Pl. 1:25000 térképek megfelelő alaptérképek a Landsat TM és a SPOT felvételek transzformálásához. Az 1:250000-nél kisebb méretarányú térképek használatát lehetőség szerint kerüljük el, ezek a durvább térképek a kevésbé finom felbontású felvételekhez használhatók (pl. AVHRR).

EgérAz egérrel megadott GCP esetén finomabb felbontású felvételeket illeszthetünk egymáshoz, mint pl. Landsat TM-et SPOT-hoz, viszont elkerülendő a Landsat MSS SPOT-hoz, illetve a Landsat TM légifelvételhez való illesztése.

7


A transzformáció szabályai

A forrás file koordinátáinak transzformációjához polinomokat használunk. A felvétel torzultságától, a GCP számától és egymáshoz viszonyított elhelyezkedésétől függően összetett polinomok szükségesek a kellő transzformáció végrehajtásához. A kifejezések bonyolultságát a polinomok foka mutatja. A többtagú kifejezés legmagasabb kitevője adja meg a polinom fokát és a transzformáció fokát, pedig a polinom foka. Általában első- és másodfokú transzformációkat alkalmazunk.

A transzformáció mátrixa

A transzformáció mátrixát a GCP-ból számítjuk ki. A mátrix a koordináták konvertálásához használt polinom együtthatóiból áll. A mátrix mérete a transzformáció fokától függ. A transzformációs mátrix elemeinek - azaz a polinom együtthatóinak - kiszámításánál az a célunk, hogy a lehető legkisebb legyen a hiba a GCP vonatkoztatási koordinátáinak a forrás koordinátákba való transzformációjakor. Nem mindig lehetséges az együtthatókat úgy származtatni, hogy a hiba zérus legyen. Pl. az 1. ábra szerint a GCP-at derékszögű koordináta-rendszerben ábrázolva összehasonlíthatjuk a polinom alapján rajzolt görbe pontjaival.

1. ábra Polinomiális görbe a forrás és a referencia koordinátarendszerben (X koordinátákra)

Az összes GCP befolyásolja az együtthatókat, még ha nem is illeszkedik minden egyes GCP a polinom-görbére. A GCP vonatkoztatási koordináta és a görbe távolságát RMS hibának nevezzük. A transzformációs mátrix kiszámításához a legkisebb négyzetek regressziós módszert használják, amely ismert statisztikai eljárás.

Lineáris transzformációk

Az első fokú transzformációt nevezzük lineáris transzformációnak. A lineáris transzformáció megváltoztathatja:

* X és/vagy Y koordináta helyét* X és/vagy Y tengely mentén a méretarányt* eltolást X,Y* rotációt

8


Az elsőfokú transzformációkat a következő esetekben használjuk: nyers felvételek vet1tése térképi vetületre; térképi síkvetület konvertálása más síkvetületbe és amikor viszonylag kis méretű képterületet transzformálunk. A lineáris transzformációt még a GCP kijelölése előtt végezzük el. A Landsat TM felvételt újratájolhatjuk, a deklináció szögének megfelelően elforgathatjuk a letapogatott négyzet alakú területet és beállíthatjuk a felvételt úgy, hogy az északi irány függőlegesen felfelé mutasson.

A elsőfokú transzformációt síkra vetített adatok transzformálására is használhatjuk. Pl. a SPOT és a Landsat Level 1B adatai már síkba transzformáltak, de még nem a kívánt vetületi rendszerbe. Amikor ezt a fajta transzformációt végezzük, és elsőre magas az RMS hiba, akkor nem tanácsos a transzformáció fokát növelni. Ilyen esetben először vizsgáljuk meg a GCP-et és ezek eloszlását, majd szisztematikusan küszöböljük ki a hibát.

A 2. ábrán tanulmányozhatjuk, hogy miként változtatja meg a lineáris transzformáció az adatainkat.

2. ábra Lineáris transzformációk eredményei

Az elsőfokú transzformáció mátrixa hat együtthatót tartalmaz - mindkét (X,Y) koordinátához három tartozik:

a1 a2 a3

b1 b2 b3

amelyekkel az elsőfokú polinom a következőképpen áll elő:

x0=b1+b2xi+b3yi

y0=a1+a2xi+a3yi

9


ahol:xi és yi a forrás koordináták (input)x0 és y0 a transzformált koordináták (output)

Nemlineáris transzformációk

A másod- vagy magasabb fokú transzformációk nemlineáris transzformációk. Ezekkel a transzformációkkal korrigálhatjuk a nemlineáris torzulásokat. A 3. ábra néhány nemlineáris transzformáció hatását mutatja.

3. ábra Nem-lineáris transzformációk eredményei

A másodfokú transzformációkkal lehet nagy kiterjedésű területek szélességi/hosszúsági adatait síkvetülethez konvertálni (a kamera lencséjének torzítása eredményezi a torzult adatokat). Harmadfokú transzformációval torzult légifényképeket, radarfelvételeket korrigálnak. Negyedfokú transzformációk erősen torzult légifényképek esetén használatosak.

A t-ed-fokú transzformáció mátrixa elemeinek számát a következő összefüggés adja meg:

t+12Σ i i=1

Egyszerűbben kifejezve: (t+1) x (t+2)

Magasabb fokú polinomok

A t-ed-fokú transzformációt általánosan a következő egyenlet adja meg:

10


ahol:

ak és bk együtthatókt a polinom fokai és j kitevők,k értékét pedig a következőképpen számíthatjuk ki:

Az egyenlet y0-ra ugyanilyen alakú, csak az együtthatók különböznek. A következő példa egy harmadfokú transzformáció egyenleteit adja meg:

x0=5+4x-6y+10x2-5xy+1y2+3x3+7x2y-11xy2+4y3

y0=13+12x+4y+1x2-21xy+11y2-1x3+2x2y+5xy2+12y3

E két egyenlet összesen 20 együtthatót használ, azaz

(3+1) x (3+2)=20

A transzformáció fokának következményei

A magasabb fokú polinomokkal bonyolultabb képtranszformációkat hajthatunk végre. A különböző fokú transzformációk hatásának jobb megértése érdekében vizsgáljuk meg néhány eltérő fokú egyenlet eredményét. Az alábbi példákban csak az egyik koordinátát (X) számoljuk ki, és kevesebb GCP-t használunk, mint a gyakorlati alkalmazásoknál!

A példában szereplő együtthatók a legkisebb négyzetek módszerével számíthatók. Feltételezzük, hogy a GCP X koordinátái a következők:

11


Forrás X (input) Ref. X(output)

1 17

2 9

3 1

Ezen GCP X koordinátájára az elsőfokú transzformáció egyenlete:

xr=(25)+(-8)xi

ahol:

xr = ref. koordinátaxi = forrás koordináta

A 4. ábrán látható e lineáris kapcsolat grafikus ábrázolása.

4. ábra 1-fokú transzformáció, a forrás és a referencia koordináták kapcsolata 1-fokú

Mi történik, ha a második értéket a következőképpen változtatjuk meg?


1 17

2 7

3 1

12


5. ábra 1-fokú transzformáció, a forrás és a referencia koordináták kapcsolata 1-fokú, a 2. GCP megváltozott

Ez a pont nem illeszkedik az egyenesre, a kapcsolat nem fejezhető ki elsőfokú polinommal. Másodfokú polinomra van szükség:

xr=(31)+(-16)xi+(2)xi2

A 6. ábrán látható a kapott görbe grafikonja.


Vegyünk számításba még egy GCP-t:


1 17

2 7

3 1

4 5

13


Látható, hogy a negyedik GCP nem illeszkedik a másodfokú görbe grafikonjára. Ahhoz, hogy minden a négy pont illeszkedjen egy grafikonra, a transzformáció harmadfokú kell legyen (7. ábra).

7. ábra 2-fokú transzformáció, a forrás és a referencia koordináták kapcsolata 2-fokú, 4. GCP-t adtunk hozzá

Ez a harmadfokú transzformáció már szükségtelen bonyodalmakat okozhat. Elvégezve a koordináta transzformációkat, az összes GCP tökéletes illeszkedése érdekében megkövetelt nagy pontosság viszont váratlan torzulásokat eredményezhet az output felvételen. Ebben a példában a harmadfokú transzformáció túl magas lenne, mert az X irányú output pixelek átrendeződnének az input pixelekhez képest.



1 x0(1)=17

2 x0(2)=7

3 x0(3)=1

4 x0(4)=5

x0(1)>x0(2)>x0(4)>x0(3)

14


17 > 7 > 5 > 1

Ebben az esetben a magasabb fokú transzformáció nem a kívánt eredményt adná.

9. ábra 3-ad fokú transzformáció hatása a képelemekre

Hány GCP-re van legalább szükség?

A magasabb fokú transzformációkkal bonyolultabb torzulási problémák küszöbölhetők ki. Magasabb fokú transzformációkhoz azonban több GCP-re van szükség. Pl. három pont határoz meg egy síkot, ezért egy elsőfokú transzformációhoz - amelyet egy sík egyenletével fejezünk ki - legalább három GCP-re van szükség. Ugyanígy, egy harmadfokú transzformációt a paraboloid egyenlete ad meg, tehát legalább hat GCP-t kell kiválasztanunk. A t-ed-fokú transzformációhoz szükséges legkevesebb pont számát a következő formula adja meg:

((t+1)(t+2)) 2

Amennyiben lehetséges több, jól szétszórt GCP-t használjunk, mint ez a minimum érték! Az alábbi táblázat a minimálisan szükséges GCP-ok számát mutatja:

Transzformáció foka Minimum GCP száma

1 3

2 6

3 10

4 15

5 21

6 28

7 36

8 45

9 55

10 66

15


GCP előrejelzés és illesztés

Az automatikus GCP előrejelzéssel bármely koordináta rendszerben GCP-kat jelölhetünk ki, és automatikusan elhelyezhetjük őket egy másik rendszerben a kívánt transzformációs paraméterek alapján.

Az automatikus GCP illesztés a kép a képhez transzformációt segíti. Az adatok spektrális karakterisztikáját és a transzformációs mátrixot felhasználva a felvételen kiválasztott GCP-t precízen illeszthetjük a transzformált képéhez egy másik felvételen.

Az RMS hiba

A legtöbb esetben az összes GCP nagyon pontos illesztése szükségtelenül magas fokú transzformációt követelne. A fokszám növelése helyett megengedhetünk egy bizonyos nagyságú hibát. A kiszámolt transzformációs mátrix inverze visszatranszformálja a GCP referencia koordinátáit a forrás koordináta rendszerbe. Amennyiben a transzformáció fokát nem növeltük addig, hogy tökéletes legyen a pontok illeszkedése, a visszatranszformálás során kapott koordináták és a forrás koordináták között eltérés lesz tapasztalható.

Az RMS hiba (root mean square) a GCP input helyének és a visszatranszformálás utáni helyének távolságát fejezi ki:

ahol:

xi és yi az input forrás koordinátákxr és yr a visszatranszformált koordináták

Amennyiben a forrás koordináták az adat file koordinátái, akkor az RMS hiba pixel szélességben mért távolságot jelent. Pl. 2 RMS hiba azt jelenti, hogy a referencia pixel 2 pixel távolságra van a visszatranszformált pixeltől.

Maradékok és RMS hiba GCP-kre

A maradékok a forrás és az visszatranszformált koordináták közötti távolságokat jelentik valamely (X vagy Y) irányban. Minden GCP-re kiszámítandók.

RMS hiba GCP-onkéntA pontonként kiszámolt RMS hiba a GCP-ok értékelését segíti. Kiszámítása ugyancsak egy távolság összefüggéssel történik:

Ri = a GCPi RMS hibája

i i2

i2R = XR + YR

ahol:

16


XRi= a GCPi X reziduumaYRi= a GCPi Y reziduuma

A 10. ábra az RMS hiba és a maradék közötti kapcsolatot mutatja.

10. ábra Maradékok és az RMS pontonként

Az összesített RMS hiba

A következő formulák adják meg az összesített RMS hibát, az X RMS, és az Y RMS hibát:

ahol:

Rx = X irányú RMS hibaRy = Y irányú RMS hibaT = összesített RMS hiban = GCP-ok számaXRi = GCPi X irányú maradékYRi = GCPi Yirányú maradékAz RMS hiba toleranciája

A legtöbb esetben a magasabb fokú transzformáció helyett egy bizonyos nagyságú hibát még a tűréshatáron belülinek veszünk. A tolerált RMS hiba nagysága egy a forrás koordináta körüli tartományként képzelhető el, amelyen belül a visszatranszformált koordinátát még jónak fogadjuk el. A 11. ábra 2 toleranciájú RMS hiba-tartományt mutat be.

17


11. ábra RMS hiba toleranciájának vizsgálata

Az eltűrhető RMS hibát meghatározza, hogy milyen célra használjuk fel az adatállományunkat, a felhasznált adatok típusától, a GCP-ok pontosságától, és a kiegészítő adatok pontosságától. Pl. a GPS 10 m-es pontosságú adatot szolgáltat a GCP-ok kijelöléséhez, míg a 1:25000-es térkép-ről csak 20 m-es pontossággal vehetjük le a GCP-kat.

Lényeges, hogy az RMS hiba pixelben van kifejezve, így ha egy Landsat TM felvétel képtranszformációjának pontosságát 30 m-re választjuk, akkor az RMS hiba nem haladhatja meg a 0.50 értéket. AVHRR adatok transzformációjánál 1.50 lehet a hiba.

Az RMS hiba kiértékelése

A felvétel ill. térkép torzulása alapján a szükséges transzformáció foka meghatározható. Általában elsőfokú transzformációval érdemes kezdeni, és a transzformációs mátrixot addig kell újra és újra kiszámolni, amíg az RMS tűrési hibahatáron belülre nem kerülünk.

A legtöbb képtranszformációs eljárás első- vagy másodfokú. Minél magasabb fokú a transzformáció, annál komplikáltabb az egyenletünk, és annál kevésbé szabályszerű és megjósolható az eljárás végeredménye!

A transzformációs mátrix és az RMS hiba kiszámítása után minden esetben négy lehetőségünk van a továbblépésre:

* A legnagyobb RMS hibával bíró GCP-ot - feltételezve, hogy ez a legkevésbé pontos - iktassuk ki, és a maradék GCP-okból számoljuk újra a transzformációs mátrixot. Az illeszkedés pontosabb lehet, kivéve ha ez a kimaradó GCP a felvétel egy speciális részterületének csak egyetlen GCP-ja, mert egy ilyen pontnak a kihagyása akár nagyobb hibát is eredményezhet.

* Vegyük nagyobbra a hibahatárt, ha még lehetséges.* Növeljük a transzformáció fokát, amellyel összetettebb geometriai átalakítást

végzünk a felvételen.* Csak azokat a pontokat választjuk ki, amelyek a legmegbízhatóbbak.

Átmintázási (újramintavételezési) módszerek

18


A képtranszformációs/hozzáillesztési folyamat következő lépése az output file létrehozása. Mivel az input felvétel pixel-hálózata ritkán illeszkedik a referencia kép hálózatára, így ki kell számolni, hogy milyen intenzitás értéket kapjon az output felvétel megfelelő pixele. Ezt az eljárást nevezzük átmintázásnak.

12. ábra Átmintázás lépései

Általában a következő átmintázási módszerek használatosak:

* Legközelebbi szomszéd (nearest neighbor) - Az output pixel értékének a legközelebbi pixel intenzitás értékét választjuk.

* Bilineáris interpoláció - a környező négy pixel intenzitás értékeiből bilineáris interpolációval számítjuk az output értéket.

* Köbös konvolúció (cubic convolution) - kétváltozós, harmadfokú polinomot illesztünk a pont 4x4-es környezetére.

Legközelebbi szomszéd (nearest neighbor)

Egy output pixel legközelebbi szomszédjának meghatározásához a pixel transzformált (x0,y0) koordinátáit a transzformációs mátrix inverzének felhasználásával visszatranszformáljuk az eredeti (forrás) koordináta rendszerbe (xr,yr).Az a pixel lesz a legközelebbi szomszéd,

19


amelynek a távolsága a legkisebb a visszatranszformált (xr,yr) koordinátától. E pixel intenzitás értéke lesz az output felvétel képpontjának keresett értéke.

13. ábra A Legközelebbi szomszéd hozzárendelés

Legközelebbi szomszéd átmintázás

Előnyök Hátrányok

Az eredeti értékek átlagolása nélkül történik az átvitel, így nem vesznek el az extrém és finom értékek. Ez lényeges pl.a vegetációtípusok elkülönítésénél; határok, élek kijelölésénél; vagy egy tó eltérő hőmérsékletű ill. átlátszóságú területeinek meghatározásánál.

Amennyiben ezt a módszert alkalmazzuk nagyobb hálózat kisebbre történő átmintázásához, a ferde vonalak és a görbék általában kissé lépcsősen eltolódva jelennek meg.

A klasszifikáció előtt használható. Bizonyos adatok elveszhetnek, ill. mások megduplázódhatnak.

A legkönnyebben és leggyorsabban kiszámolható a három módszer közül.

Folyamatos lineáris objektumok (utak, vízfolyások) töredezetten, szakaszosan jelenhetnek meg.

A legközelebbi szomszéd módszer további előnye, hogy alkalmazható kvalitatív (nominális, ordinális) adatokra is a kvantitatív (intervallum, hányados) típusúakon túl, míg a másik két módszer átlagoló eljárása csak kvalitatív értékekre működik.

Bilineáris interpoláció

A bilineáris interpoláció végrehajtásánál a transzformált pixel intenzitás értéke a visszatranszformált koordinátához legközelebb eső négy input pixelértékből számítható ki. A

20


14. ábrán látható példában a szomszéd pixeleket az 1,2,3 és 4 számok jelzik, amelyek értékei az adatfile-ben adottak, kiszámolandó az r koordináta intenzitás értéke (Vr).

14. ábra A bilineáris interpoláció hozzárendelési elve

Vr kiszámításához először határozzuk meg lineáris interpolációval Vm-et és Vn-et (14. ábra). Az m pontban a Vm intenzitás érték függvénye a 3 és 1 pixelek intenzitás értéke megváltozásának, azaz (V3-V1)-nek.

15. ábra Lineáris interpolációA Vm kiszámolható a következő összefüggésből:

21


ahol:Yi = az i-edik pixel Y koordinátájaVi = az i-edik pixel intenzitás értékedy = az input koordináta rendszer Y1 és Ym koordinátáinak távolságaD = az input koordináta rendszer Y1 és Y3 koordinátáinak távolsága

Vegyük észre, hogy a (V3-V1/D) az ábra egyenesének meredeksége, azaz a fenti egyenlőség y=mx+b alakú (az egyenes általános egyenlete).

Hasonlóan Vn-re:

A visszatranszformált koordináta r(xr,yr) intenzitás értéke a Vn és Vm értékekből ugyanígy meghatározható:

A legtöbb esetben D=1, mivel az

adat file koordinátáinak növekménye 1.

A bilineáris interpoláció kifejezésére gyakran használják az alábbi egyenletet:ahol:

wi = súlyfaktor

A fenti egyenlőség kifejezhető a következő formában is, ahol a wi kifejtve látható:ahol:

Dxi = az i-edik pixel (xr,yr) koordinátáinak X irányú változásaDyi = az i-edik pixel (xr,yr) koordinátáinak Y irányú változásaVi = az i-edik pixel értékeD = az input koordináta rendszer pixeleinek távolságaA négy pixel közül az szerepel nagyobb súllyal, amelyik közelebb van (xr,yr)-hez.

Bilineáris interpoláció átmintázás


n4 2

2V = [ V -VD

]xdy +V

rn m

mV = [ V -VD

]xdx +V

r i iV = w V

r1

4i i

2 iV = (D - x )(D - y )D

xV

22


Az output képen simítást eredményez a módszer, a vonalak nem törnek meg.

Mivel a pixel értékeket átlagolja az algoritmus, az élek és határok kevésbé kivehetőek, néhány extrém érték elveszhet, s így a kontrasztjából veszíthet a kép.

Térbeli hatásában pontosabb, mint a legközelebbi szomszéd.

Gyakorta használatos ez a módszer, amikor a cellák méretét változtatjuk, pl. SPOT/TM egyesítésnél, 2x2-es átmintázási határon belül.

Köbös konvolúció

A köbös konvolúció hasonló a bilineáris interpolációs módszerhez, az eltérés csak annyi, hogy:

* 16 pixelt 4x4-es elrendezésben használ az output intenzitás érték meghatározásához, és

* harmadfokú polinomot illeszt a visszatranszformált pont 4x4-es környezetére.

A visszatranszformált (xr,yr) koordináta környező 16 pixelének (16. ábra) kijelöléséhez a (i,j) pixelt használjuk:

i=int(xr)j=int(yr)

16. ábra A köbös konvolúció

23


Mivel harmadfokú függvényt illesztünk a 16 input pixelre, az (xr,yr) ponttól távolabb eső pixeleknek exponenciálisan kisebb a súlyuk az output érték kialakításában, mint a közelebb eső pixeleknek. Az alkalmazott függvény megtalálható: Atkinson 1985.

Köbös konvolúció átmintázás


Az output pixel értékek átlaga és szórása közelebb van az input pixel értékek átlagához és szórásához, mint a másik két módszernél.

Az értékek módosulhatnak.

Az eljárás egyszerre képes élesíteni a felvételt és kiszűrni a zavaró értékeket. az aktuális hatás mindig az adott értékektől függ.

A leginkább számításigényes átmintázási módszer, s így a leglassabb is.

A módszer főként akkor ajánlott, ha az elemi cellák méretét lényegesen meg kell változtatnunk, pl. TM/légifénykép illesztésnél (4x4-es ablakkal pontosabb az illesztés, mint egy 2x2-es ablakkal).

Koordináta transzformáció térkép a térképhez illesztés esetén

*A térképek síkvetületi rendszerének megváltoztatása többféle ok miatt szükségessé válhat:

* Ha két különböző vetületi rendszerű térképet fedetünk egymásra.* Ha az alapadat file vetítése nem a kívánt tulajdonságú térképet eredményezi.* Ha egynél több vetületi zónából származó adatokkal kell dolgoznunk. Pl. UTM,

vagy State Plane.

A vetület megváltoztatása geometriai átalakítás - távolság, terület, méretarány különböző lehet -, ezért a konverziós eljárásnál a pixelek átmintázása elkerülhetetlen. Az átmintázással azonban az adatok spektrális integritása sérülhet. Így nem mindig célravezető a már átmintázott adatokat újramintázni, ha az alkalmazásnál az intenzitás értékek pontossága elengedhetetlen. Ha az eredeti transzformálatlan adatokkal dolgozunk, általában jobban tesszük, ha már eleve a kívánt (másodlagos) térképi vetülethez transzformáljuk az adatainkat,

24


minthogy a transzformált adatok újabb (második) átmintázásával az adatok egy "generációját" elveszítsük.

Vektor adatokA vektoros térképi koordináták transzformációja lényegesen egyszerűbb, mint a raszteres adatoké, mivel a vektoradatok pontkoordinátáit a megfelelő formula segítségével egyszerűen transzformálhatjuk.

Mozaik

Az azonos vetületi rendszerbe korrigált képeket összeilleszthetjük. A tetszőlegesen kiválasztott referenciaképhez viszonyítva elhelyezkedik el a többi kép. A képek összeillesztésénél az alábbi problémákra kell megoldást találni:

a, az új hálózatban a pixelértékek kiszámítási módjának megadása,b, a közös, átfedett területek pixelértékeinek számítása a korábbi értékekből,c, kontraszt kiegyenlítés a teljes képre, vagy csak a közös területekre

3.ábra 3 db összemozaikolt kép egy ERDAS Viewer-ben

a, Az új képen, az egyedi kép korrekciójához hasonlóan, a korábbitól eltérő négyzethálót kell kialakítani, hiszen az összeillesztéskor felhasznált képek oszlop-sor hálórendszerei nagyon ritkán illeszkednek pontosan egymáshoz, és új képen viszont csak egyfajta, egységes háló létezhet. Az új pixelérték kiszámítási módja lehet (1) a legközelebbi

25


szomszéd módszere, (2) bilineáris interpoláció, és (3) köbös konvolúció. Ezek részletes ismertetésére a geometriai korrekció c. fejezetben került sor. b, A közös, átfedett területek pixelértékeinek számítása a korábbi értékekből többféleképpen történhet. Két vagy több kép közös, átfedett területén belül az új pixelérték lehet a pixelértékek maximuma, minimuma, átlaga. Az egymást fedő képek esetén választhatjuk az utoljára sorra kerülő, - legfelső - , kép pixelértékét. Az új pixelértéket úgy is kiszámíthatjuk, hogy figyelembe vesszük azt, hogy az eredeti pixelek milyen területi arányban képviseltetik magukat az új pixel kialakításakor, és ezekkel a súlyokkal számított súlyozott átlagból képezzük az új pixelértéket.

c, A kapcsolódó képek eltérő kontrasztúak lehetnek. A kontrasztkülönbségek jelentősek lehetnek légifelvételek esetén a sugárzás eltérő visszaverődése miatt a képek szélein vagy a teljes képen. Ezért az éles határok kiküszöbölése érdekében alkalmazhatjuk a hisztogramok illesztésének módszerét a teljes képre vagy csak az átfedett területekre.

Képfinomítás

Amíg a radiometrikus finomítás minden pixelt önállóan kezelt, addig a térbeli finomítás a pixel értékét aszerint változtatja meg, hogy milyen értéket vesznek fel a szomszédos pixelek. A térbeli finomítás során nagy szerepet kap az un. térbeli gyakoriság, mely kifejezi, hogy mekkora a különbség a legkisebb és a legnagyobb pixelérték között a pixelek egy halmazára vonatkoztatva. Jensen (1986) szerint a térbeli gyakoriság a „fényességi értékek adott távolságon belüli különbségét jelenti a kép bármely részletére kiszámítva”.

Eszerinta, nulla térbeli gyakoriság- olyan kép, amelyben minden pixelérték egyforma,b, alacsony térbeli gyakoriság - a pixelértékek folyamatosan változnak,c, nagy térbeli gyakoriság - a kép sakktáblaszerűen tartalmaz alacsony és magas értékű pixeleket.

Konvolúciós szűrő

A konvolúciós szűrés a pixelek általában kis halmazára értelmezett kép-átalakítási folyamat, mely megváltoztatja a térbeli gyakorisági tulajdonságait. A konvolúciós szűrést egy konvolúciós kernel, mátrix végzi. Az általában páratlan számú oszlopot és sort tartalmazó (2k+1 * 2k+1) mátrix elemeit koefficienseknek, együtthatóknak nevezzük. A konvolúciós kernelt úgy használjuk a szűrés során, hogy a kép minden egyes pixele egyszer a kernel közepére kerül és ennek a pixelnek az új értéke az önmaga és a szomszédos pixelek értékeiből a mátrix együtthatóival képzett súlyozott átlaga lesz.

A konvolúciós formula

26


A következő formula határozza meg általános értelemben a kimenő adatfile értékét a szűrés után a bemenő, a kernel közepén elhelyezkedő pixelre vonatkozóan:

ahol

fij = a konvolúciós kernel i sorának j oszlopában lévő együtthatódij = a pixel értékeq = a kernel mérete, négyzet alakú kernelt feltételezveF = vagy az együtthatók összege, vagy 1, ha az összeg 0V = a kimenő pixel érték

Amennyiben a kimenő pixelérték nullánál kisebb, akkor a V értéke 0 definíció szerint.

Nulla-összegű kernelek

Nulla-összegűnek nevezünk egy kernelt, ha a benne lévő együtthatók összege nulla. Amennyiben nulla összegű kernelt használunk az együtthatók összegét nem használhatjuk a konvolúciós formulában. A nullával való osztás miatt az F értéke ebben az esetben 1 lesz.Emiatt a kimenő érték:

0 olyan területen, ahol minden bemenő érték azonos, kicsi, ha a térbeli gyakoriság alacsony, nagy, ha a térbeli gyakoriság magas.

Ezért a nulla-összegű kerneleket élkiemelőknek nevezzük. Alacsony térbeli gyakoriságú területeken a pixelértékeket kisimítja vagy nullává változtatja, és éles határt jelöl ki ott, ahol a térbeli gyakoriság magas, vagyis két homogén pixelhalmaz közé.

A nulla-összegű kerneleket megadhatjuk úgy, hogy bizonyos irányú határokat jelöljenek ki. A következő 3x3-as kernel a déli határt jelzi:

-1 -1 -11 -2 11 1 1

High frequency kernelek

A high frequency kernelek, vagy a high pass kernelek hatására megnő a térbeli gyakoriság. A high frequency kernelek mint edge enhancer megerősítik a homogén területek

27


közötti határokat. Amíg az élkiemelő (mint a nulla-összegű) kernelek úgy emelik ki a határt, hogy a többi formát eltüntetik, addig a high pass kernelek meghagyják azokat.

Pl.

-1 -1 -1-1 16 -1-1 -1 -1

Ez a kernel a környezetéhez képest alacsony értékű pixelt tovább csökkenti, illetve a környezetéhez képest magas pixelértékű pixel még nagyobb lesz, vagyis a térbeli gyakoriság tovább nő.

204 200 197 204 200 197201 100 209 201 9 209198 200 210 198 200 210 előtte utána

64 60 57 64 60 5761 125 69 61 187 6958 60 70 58 60 70 előtte utána

Low-frequency kernelek

A low-frequency kernelek, vagy low-pass kernelek csökkentik a térbeli gyakoriságot.

1 1 11 1 11 1 1

A fenti kernel átlagolja a pixelértékeket, így a térbeli különbségek csökkennek, a térbeli homogenitás nő. A kép finomabb lesz.

A folyamatos rétegek konvolúciós szűréséhez hasonló a tematikus rétegek filterezése. A szűrés itt is a középen elhelyezkedő pixelt körülvevő szomszédos pixelek értékei alapján történik, ezért nevezik szomszédsági elemzésnek is. A szomszédos pixelek halmazát egy pásztázó ablak alapján adhatjuk meg, mely lehet kör, ellipszis, négyzet vagy akár szabálytalan alakú is. A pixelértékeken végrehajtott műveletet focal operationnak nevezzük.

28


A tematikus rétegből új tematikus réteg jön létre az alábbi műveletek szerint:

a, határ - kijelöli az osztályok közötti határokat. A kimenő réteg csak a határon lévő pixeleket tartalmazza.

b, sűrűség - a kimenő pixelérték jelzi, hogy a középen elhelyezkedő pixel értéke hányszor fordul elő a pásztázó ablakon belül. Méri a homogenitást az elemzett pixel szerint. Gyakran használják a vegetáció korona zártságának becslésére.

c, diverzitás - a kimenő pixelérték megadja a pásztázó ablakon belüli különböző osztályok számát. A diverzitás méri a heterogenitást.

d, majoritás - a kimenő pixelérték megadja a pásztázó ablakon belül legtöbbször jelenlévő osztály értékét. A művelet valójában egy low-frequency filter, amely kiszűri a „sószórás” szerű foltokat a képről.

e, maximum - a kimenő pixelérték a pásztázó ablakon belüli legnagyobb osztály értéke lesz. Ezzel a módszerrel lehet emphasize classes with the higher class values, vagy a lineáris alakzatokat és a határokat el lehet tüntetni.

f, átlag - átlagolja a pixelértékeket. Amennyiben a pixelértékek mennyiségi adatokat jelentenek, akkor ez a szűrő egy konvolúciós szűrő. Minőségi adatokra (nominális és rang típusokra) nem alkalmazható.

g, médián - az ablakon belüli pixelek statisztikus e rendeli a középső pixelhez. Használható kvantitatív és kvalitatív adatokra is.

h, minoritás - a kimenő pixelérték megadja a pásztázó ablakon belül legkisebb számban jelenlévő osztály értékét. Ez a módszer alkalmas a legritkábban előforduló osztályok azonosítására, valamint a különálló lineáris alakzatok kijelölésére.

i, rang - megadja a középső pixel értékénél kisebb pixelértékű pixelek számát.

j, szórás - az ablakon belüli pixelek értékeinek a szórását határozza meg és rendeli a középső pixelhez.

k, összeg - a középső elem értéke az ablakon belüli pixelek értékeinek összege lesz. Amennyiben az osztályok közötti sorrend megállapítható, akkor az összegzés a pixelek további rangsorolását teszi lehetővé. Vonal felismerés

Lineáris vonalfelismerés

29


Vonalszerű alakzatok, mint pl. folyók vagy utak a műholdfelvételeken két éles határvonallal lehatárolhatók, ha egy pixelnél szélesebben, de egy pixel széles alakzatok is felismerhetők a következő kernelek segítségével:

-1 2 -1 -1 -1 -1 -1 -1 2 2 -1 -1-1 2 -1 2 2 2 -1 2 -1 -1 2 -1-1 2 -1 -1 -1 -1 2 -1 -1 -1 -1 2

függőleges vízszintes átlós átlós

A megfelelő vonalfelismerő kernel választásához szükséges tudnunk, hogy milyen típusú vonalak vannak a képen és általában ismerni kell ezen típusok sajátosságait. A digitális képeken megkülönböztetünk: lejtős határvonalat, éles (lépcsős) határt, széles vonalat, keskeny vonalat.

lejtős határvonal - a két homogén, de különböző értékű terület között fokozatos az átmenet, alacsony értékű terület felől a pixelértékek fokozatosan nőnek a nagyobb pixelértékű terület irányában. A lejtőszerű alakzat leírásakor megadható a „lejtő magassága” - a pixelértékek változásának mértéke, a lejtő szélessége pixelekben, és a lejtő középpontja.

éles (lépcsős) határ - olyan lejtős határ, ahol a lejtő meredeksége 90°.

széles vonal - a vonal mindkét oldalán enyhe vagy meredekebb lejtővel rendelkezik, a vonal szélessége kisebb mint a kernel oldalhossza.

keskeny (tetőszerű) vonal - a vonal egy-két pixel szélességű.

A modellek az elméleti, ideális határvonalakat mutatják be. A valós adatok esetében a határátmenetek nem ilyen finomak, ill. élesek, a pixelértékek kisebb-nagyobb ingadozásokkal érik el a másik területre jellemző értéket.

30


Az élfelismerő algoritmusok között vannak első- és másodrendű derivált műveletek. A következő ábra mutatja a lejtős határvonal és a keskeny vonal intenzitásgörbéit, valamint a hozzájuk rendelhető első- és második deriváltakat.

Az elsőrendű derivált kernel az egyszerű Prewitt kernelből származik:

A másodrendű derivált kernel a Laplace operátorból származik:

31


Nem-lineáris és szemilineáris vonalfelismerés

A fenti vonalfelismerő kerneleket lineárisnak neveztük, mert lineáris matematikai operációval végezte a képi adatok konvolúcióját. Számos nemlineáris felismerő kernel készíthető. 3x3-as kernelben az általános leírásuk:

A1 A2 A3

B1 B2 B3

C1 C2 C3

Egy nemlineáris vonalfelismerő algoritmus (Rosenfeld-Thurston, 1971) felismeri a B2 pixelt, mint egy függőleges, sötét vonal részét, ha

Ai, Ci Bi.

Hasonló definíciókkal megadhatunk más irányú vonalfelismerőket, amelyek környezetükhöz képest nagyobb pixelértékű vonalakat ismerik fel.

Vandenburg (1976) definiálta az általa szemilineárisnak nevezett felismerőket. B2 egy függőleges sötét vonal része, ha

3 3 3

ΣAi és ΣCi > ΣBi

i=1 i=1 i=1

Gurney (1980) megjegyezte, hogy a szemilineáris felismerők hatékonyabbak, mint a nemlineáris felismerők. További feltételek adásával a szemilineáris felismerők hiányosságai (vonalelvékonyítás, hosszabb számolás) megszüntethetők:

A2 B2 és C2 B2 .

Általános konvolúciós szűrők

A simító, az él és a vonal kiemelő szűrők együttes alkalmazásával további általános térbeli szűrőt tudunk definiálni.

A kernel méretének a növelésével nemcsak a 4 fő irány szerinti vonalas alakzatokat ismerhetjük fel hanem egyéb irányúakat is.

32


Térképi műveletek - térképi algebrák

Térképi algebráknak nevezzük általános értelemben a két vagy több bemenő kép megfelelő pixeleivel végrehajtható matematikai műveleteket, melyek eredménye egy újabb kép lesz. Pl.

(infravörös sáv) - (vörös sáv), másképpen DNir(x,y) - DNr(x,y)

művelet alkalmas a vegetáció jelenlétének kimutatására. Bonyolultabb kifejezéseket is értelmezhetünk, mint pl. a Tasseled Cap számítás, mely a Landsat TM 6 sávját is felhasználja a számításban.

Hányados is képezhető, pl.

TM5/TM7 (agyagásvány index)

A normalizált vegetációs index (NDVI) kivonás, összeadás, és osztás után jön létre:

(IR-R)/(IR+R)

Egyszerű trigonometrikus függvények is használhatók, pl. a következő számítással a pixelértékeket egy 0-255 intervallumba transzformálhatjuk:

DN out : 162.34(atan(DN1xy)/(DN2xy))

Tasseled Cap számítás

A multispektrális űr- és légifelvételek különböző sávjait megjeleníthetjük, ha definiálunk egy N-dimenziós teret, ahol N a sávok száma. Az N-dimenziós teret, ha a sávok a különböző spektrális tartományokat jelentik, N-dimenziós spektrális (adat)térnek nevezzük. Minden pixelt a sávok szerinti pixelérték alapján (N db koordináta) pozícionálhatunk ebben a térben. A pixelek spektrális térbeli pozícióját a pixel által reprezentált földrajzi területegység reflektancia, abszorpciós tulajdonságai határozzák meg. Az adatok ebben az N-dimenziós térben elemezhetők, struktúrájuk vizsgálható (lásd a Klasszifikáció c. fejezetben).

Az adatstruktúra térbeli határait többféleképpen meghatározhatjuk, a befoglaló test lehet téglatest, gömb, ellipszoid, mind természetesen ebben az N-dimenziós térben értelmezve (pl. hiperellipszoid).

Ezen testek főátlói nem szükségszerűen illeszkednek az adattér tengelyeire. E sajátosság jobb megjelenítése érdekében előnyösebb, ha az N-dimenziós teret kifeszítő tengelyeket forgatjuk úgy, hogy egy vagy két adatstruktúra tengely illeszkedjen a képi megjelenítő X és Y tengelyére. Így láthatóvá válhat az a tengely, ahol az abszorpciós csúcsok legjobban kifejezik a speciális vizsgálat szempontjából fontos tulajdonságokat. Pl. geológiai, növénytani szempontból érdekesek lehetnek a különböző abszorpciós tulajdonságok.

Tasseled Cap transzformáció megadja a lehetőséget az adatok jobb megjelenítésére, pl. a vegetáció vizsgálata érdekében. Az első ilyen transzformációt Landsat MSS négysávú

33


képekre alkalmazták (Kauth-Thomas, 1976). A négydimenziós spektrális térben az általuk vizsgált terület „talajait” reprezentáló pixelek egy hosszan elnyújtott ellipszoidban helyezkedtek el. Ha kiválasztottak két sávot, akkor az ellipszoid képe a sávok által kifeszített síkra vetült és az ellipszoid tengelyei a vetítés miatt jelentősen lerövidültek. Az alkalmazott transzformációval (elforgatás, skálázás) az adatszerkezetről sokkal jobb képet kaptak. Ők nevezték el a transzformációt Tasseled Cap transzformációnak, ami magyarul bojtos sapkát jelent, mert a vegetációt reprezentáló pixelek által meghatározott adatstruktúra formája a növekedési fázis különböző szakaszaiban egy bojtos sapkához volt hasonló. A kutatások során (Kauth-Thomas, 1976,Crist et al 1986, Crist et Kauth 1986) három adatstruktúra tengelyt határoztak meg, melyek háromféle vegetációval kapcsolatos tulajdonságot adnak meg.

Brigthness (visszaverő, fényességi index) - a hat TM sáv súlyozott összege, a talaj-reflektancia változását mutatja

Greenness (zöld index) - merőleges a brightness tengelyre, a közeli infravörös és a vörös sávok közötti kontrasztot mutatja. Szoros kapcsolatban van a képen található zöldfelületek összterületével.

Wetness (nedvességi) - kapcsolatban van a lombkorona és a talaj nedvességtartalmával (Lillesand and Kiefer 1987).

Az eredeti tengelyelnevezések (Kauth-Thomas, 1976) a Brightness, Greenness, Yellowness, és a Nonesuch voltak. Az MSS képeknél használt brightness index nem korrelált a TM szenzorra bevezetett brightness értékkel, míg a greenness index jól korrelált az új szenzor greenness index értékével.

Ezek a tengelyelforgatások mind szenzorfüggők, de a legtöbb szenzorra már meghatározták korábban, pl. Landsat 4 TM, 5 TM. Ugyanazokat a forgatásokat alkalmazhatjuk ugyanazzal a szenzorral készített különböző képek esetén. A Landsat MSS 4 sávjára kidolgozott módszert a TM 7 sávja miatt ki lehetett egészíteni (nőtt a dimenzió száma) újabb tengelyekkel. Ezek sorrendben Haze (homályosság), Ötödik, Hatodik tengely. Laurin (1986) a homályossági paramétert alkalmazta egy algoritmusban a Landsat felvételek homályosságának csökkentésére.

A Landsat MSS, TM4 és TM5 szenzorokra alkalmazott együtthatók és műveletek rendszere:

Brightness = 0.3037(TM1) + 0.2793(TM2) + 0.4743(TM3) + 0.5585(TM4) + 0.5082(TM5) + 0.1863(TM7) az érték lehet, hogy 0.4343????

Greenness = -0.2848(TM1) - 0.2435(TM2) - 0.5436(TM3) + 0.7243(TM4) + 0.0840(TM5) - 0.1800(TM7)

Wetness = 0.1509(TM1) + 0.1973(TM2) + 0.3279(TM3) + 0.3406(TM4) - 0.7112(TM5) - 0.4572(TM7) az érték lehet, hogy 0.1793 és 0.3299

34


Haze = 0.8832(TM1) - 0.8190(TM2) - 0.4580(TM3) - 0.0032(TM4) - 0.0563(TM5) + 0.0130(TM7)

A brightness érték a hat sáv súlyozott értékeinek függvénye, a greenness érték a látható vörös és az infravörös kontrasztjától és egy kissé a 5. és a 7. sáv értékétől függ. A wetness értékét legjobban a közepes infravörös sávok közötti kontraszt befolyásolja, valamint kevésbé a vörös és a közeli infravörös sáv értéke. A három első Tassalled Cap paraméter alapján definiálhatunk egy 3-dimenziós teret, amelyben a térbeli pozíciót a megfelelő együtthatók segítségével kiszámított Br, Gr, We értékek, mint koordináták határozzák meg.

A Br és a Gr értékekkel meghatározott síkot Crist és Cicone (1984) után a „vegetáció síkjának”, míg a Br és a We értékekkel meghatározott síkot a „talajok síkjának” nevezzük.

A Tassalled Cap alkalmazásakor nem szabad megfeledkezni néhány problémáról.Bár a transzformáció együtthatói a priori értékek, ellentétben a főkomponens analízis

együtthatóival, az értékek kívül esnek a 0-255 intervallumon. A probléma olyan módszer találása, amely elvégzi az értékek ezen intervallumba való transzformálását anélkül, hogy a képek összehasonlításának a lehetőségét elveszítenénk. Crist szerint mezőgazdasági területeken a Br értéke 0-350, a Gr -100,125, a We -150, 75 között változik. Ha képek közötti összehasonlítás fontos, akkor az értékeket skálázhatjuk ezen határokkal.

A másik probléma a különböző időpontban készített felvételek TC képeinek az összehasonlításának a korlátja a változó besugárzási feltételek és az atmoszféra összetételének változása miatt.

A harmadik probléma, hogy a TC transzformációban a Br tengely (talaj tengely a PVI terminológiában) meghatározásakor szükséges együtthatókat empirikus adatok szerint adták meg. Ezek az adatok az MSS képek esetén kis számú mintából származnak egy Illinois állambeli megye területéről (Fayette County), míg a TM-re megadott TC együtthatókat szintén észak-amerikai talajok reflektancia tulajdonsága alapján adták meg. Ezért a TC együtthatók alkalmazása a Föld más területén lévő talajtípusokra vonatkozóan nem biztos, hogy sikeres lesz, mert az együtthatókkal meghatározott Br tengely pozíciója nem biztos, hogy illeszkedik a vizsgált terület talajainak reflektancia-tulajdonságai alapján számítható Br tengellyel.

Perpendicular Vegetation Index

A Tassalled Cap transzformációhoz hasonló elvet követ a PVI-nek nevezett transzformáció, melyet szintén a Landsat MSS képek vizsgálatakor alakítottak ki. A négydimenziós spektrális térben a talajokat reprezentáló pixelek egy határozott vonal mentén helyezkednek el. A tengelyen megtalálhatjuk az alacsony és a magas reflektanciájú talajokat is.

A látható fény vörös sávja és az infravörös sáv által kifeszített síkban a pixeleket e két sávban felvett értékeik alapján helyezhetjük el. A növényzet nélküli, csupasz talajok az S1-S2 tengely mentén helyezkednek el, a nagyobb nedvességtartalmú talajok az S1 pont közelében (a víz magas infravörös abszorbanciája miatt a pixelértékek kisebbek), míg a szárazabb talajok az S2 pont közelében találhatók. A vegetációt reprezentáló pixelek a talaj tengely alatt, attól jobbra helyezkednek el, és a tengelytől való távolság (pontból a tengelyre merőleges szakasz hossza) Richardson és Wiegand (1977) szerint arányos a levélborítottsági

35


index-szel (green leaf index) és a biomassza tömeggel. Az általuk használt Perpendikuláris (merőleges) Vegetációs Index (PVI) meghatározható a Landsat MSS 7. és a 6. sávja alapján (itt a sávsorrendbe beleszámították a Landsat RBV szenzorának sávjait is) a következő képletekkel:

PVI 7 = SQRT((0.355 MSS7 - 0.149 MSS5)2 + (0.355 MSS5 - 0.852 MSS7)2)

PVI 6 = SQRT((0.498 MSS6 - 0.457 MSS5 - 2.507)2 + (2.734 + 0.498 MSS5 - 0.543 MSS6)2)

Ez a formula egy olyan talajtengelyre érvényes, amelyet Richardson és Wiegand 16 pont alapján határozott meg, amely nem túlságosan sok egy univerzális képlet megadására. Ezért érdemes a gondolatot mindig a saját területünkön meglévő talajokra vonatkoztatni. Másrészről figyelembe kell venni, hogy ebben a képletben az MSS 7 bites (4, 5, 6 sávja), valamint 6 bites (7.sáv) radiometrikus felbontással szerepel, és sok MSS adatot átskáláztak a 0-255-ös intervallumra. Jackson és munkatársai (1983) a PVI alkalmas a csapadék hatásának kimutatására ott, ahol a vegetáció-borítás nem összefüggő, de nem igazán eredményes a növényzetet károsító hatások elemzésekor. Az atmoszféra nedvességtartalma, a légáramlások is kedvezőtlenül befolyásolják a PVI értékét.

RGB - IHS kapcsolat

A képfeldolgozó rendszerekben a színes monitorokkal megjelenített színes képeket három szín keverésével állíthatjuk elő. Ezek a vörös, zöld, és a kék (angol rövidítéssel R,G,B), a három additív főszín. Ha egy multispektrális felvétel 3 sávját kiválasztjuk, és együtt megjelenítjük egy színes monitoron, akkor úgymond elhelyeztük a képet az R,G,B térbe.

A „színtér” modellje abból az elméletből származtatható, amely leírja a színek kialakulását a vörös, zöld és kék színek különböző mértékű összeadásával.

A koordináta rendszer origójában van a fekete szín, és a tengelyek a fekete-vörös, a fekete-zöld és a fekete-kék tengely. Egy szint a három tengelyen megadott koordináta hármassal definiálhatunk. A fehér szín maximális vörös, zöld és kék szín keverésével jön létre. A kocka fekete és fehér csúcsait összekötő átlón vannak azok a színek, amelyekben a három fő szín egyenlő mértékben van jelen, ezek a szürke különböző árnyalatai. A színes televíziók ezt a modellt használják a színek előállításakor.

Másféleképpen is meg lehet határozni ehhez hasonló színteret, amely az Intenzitást (I), a Hue (H), és a Telítettség (S-saturation) alkalmazza, mint három pozícionált paramétert

36


az R,G,B helyett. Ez a rendszer előnyösebb a tekintetben, hogy az így létrehozott színek közelebb vannak az emberi szem által felismert, a természetben létező színekhez.

Intenzitás (I) - egy szín fényességének a mértéke, a képernyő teljes fényességi tartománya (hasonló a PC-1-hez) és 0-tól (fekete) 1-ig (fehér) terjed.

Saturation (S) (telítettség) - a szín telítettségét reprezentálja és értéke szintén 0-tól 1-ig terjed.

a Hue (H) - Értéke a 0-tól (vörös középső értékétől) a zöldön és a kéken keresztül vissza a vörösig, 360-ig terjed.

A fenti ábra a IHS modell egy-egy geometriai modelljét mutatja.

A következő algoritmusokat használhatjuk az RGB színek IHS-be való átalakításakor (Conrac, 1980):

R=(M-R)/(M-m), G=(M-G)/(M-m), B=(M-B)/(M-m),

aholR,G,B= mindegyike 0 és 1 közé esikM = a legnagyobb értékm = a legkisebb érték

Az intenzitás (0-1) számítása:

I = (M+m)/2

a telítettség számítására:

37


ha M=m, akkor S=0,ha 0.5 I, akkor S = (M-m)/(2-M-m),ha I 0.5, akkor S = (M-m)/(2-M-m).

A hue értékének kiszámítása a 0-360 tartományban:

ha M = m, akkor H = 0ha R = M, akkor H = 60(2+b-g),ha G = M, akkor H = 60(4+r-b),ha B = M, akkor H = 60(6+g-r),

ahol

R,G,B= mindegyike 0 és 1 közé esikM = a legnagyobb értékm = a legkisebb érték

IHS átalakítása RGB-vé

Az IHS értékek átalakítása RGB értékekké komplementere az előbb tárgyalt RGB-IHS átalakításnak. Az IHS-RGS algoritmusban egy minimum-maximum széthúzás történik mind az Intenzitás, mind a telítettség értékeire, vagy mindkettőre. A széthúzás után a teljes IHS képet visszaalakítjuk az eredeti RGB térbe. Ha a Hue értéke nem módosult, az eredménykép nagyon hasonló lesz, mint a bemenő kép.

Nem szükségszerű, hogy ebben a transzformációban a bemenő (IHS) paraméterek egy RGB-IHS átalakításból származzanak. Az I és/vagy az S értékek lehetnek más paraméterek, csak be kell állítani a H értékét 0-360-as intervallumra, és utána végre lehet hajtani a transzformálást. Ezt a módszert más adatállományok színkódolásának nevezzük.

A H és az I értékeit helyettesítették (Daily, 1983) alacsony és magas frekvenciájú radarképekkel. Szintén helyettesíthető az I értéke a radarintezitási értékekkel az IHS-RGB átalakítás előtt (Holcomb, 1993). A módszer alkalmazható Landsat és SPOT pankromatikus képek felbontási összefésülésekor (Chavez, 1991).

Az ERDAS IMAGINE a következő algoritmust használja az IHS-RGB átalakításkor:

Adott H (0-360 intervallum), I és S a 0-1 intervallumon.Ha 0.5 I, akkor M = I (1+S)Ha 0.5 I, akkor M = I +S-I(S)m = 21 - M

Az R értékeinek számítására alkalmazott módszer:

Ha H 60, akkor R = m + (M-m)(H/60)Ha H 180, akkor R = MHa H 240, akkor R = m + (M-m)((240-H)/60)Ha H 360, akkor R = m

38


A G értékeinek számítására alkalmazott módszer:

Ha H 120, akkor G = mHa H 180, akkor G = MHa H 240, akkor G = m + (M-m)((H-120)/60)Ha H 300, akkor G = MHa H 360, akkor R = m + (M-m)((360-H)/60)

A B értékeinek számítására alkalmazott módszer:

Ha H 60, akkor B = MHa H 120, akkor B = m + (M-m)((H-120)/60)Ha H 240, akkor B = mHa H 300, akkor B = m + (M-m)((H-240)/60)Ha H 360, akkor B = M

Indexek

Az indexek olyan matematikai képlettel megadható térképi műveletek, amelyeket különböző bemenő sávokra értelmezünk, s eredménye a vizsgált terület jellemző tulajdonságát fejezi ki.

Ilyenek pl. sáv1 - sáv2, a (sáv1-sáv2)/(sáv1+sáv2), vagy a sáv1/sáv2.

A különböző spektrális tartományokban mért reflektancia értéke összefüggésben van tárgy vagy a felszín molekuláris összetevőivel, ezért ezek az indexek gyakran információval szolgálnak a tárgyak kémiai összetételéről.

Alkalmazások

a, Különböző indexeket alkalmaznak az ásványi előfordulások, valamint a vegetáció elemzésekor, a vegetációs osztályok és a kőzettípusok közötti kis differenciák kijelölésére. Az indexértékek megfelelő színkódolása esetén olyan különbségeket is kimutathatunk, melyek az eredeti színes képen nem voltak láthatók.

b, Az indexek csökkenthetik a légi- és űrfelvételeken jelentkező árnyék hatását.

c, Bizonyos TM sávokból képzett hányadosok kombinációit már rutinszerűen alkalmazzák a geológiai térképek készítésekor: R-TM5/7, G-TM5/4, B-TM3/1.

A kimenő értékek a hányados-képzés miatt többnyire nem egész racionális számok, melyeket lebegőpontos tárolással tudunk nagy pontossággal tárolni. Ez nagyobb tárhelyet igényel és a tematikus térképeknél alkalmazott műveleteket sem lehet végrehajtani. Ezért felmerül az igény az eredmény egész számokkal való reprezentálására. Ezzel az lehet a probléma, ha a számlálóban lévő szám sokkal nagyobb, mint a nevező, akkor az egész típusú

39


változó lehetséges tartományán (-32000, 32000) túlcsordul az érték, vagy ha nincs nagy különbség a két sáv értékei között, akkor a kimenő értékek a 0,2, vagy a 0,3 intervallumba esnek. Ebben az esetben az egész intervallumokra bontás nagyon kicsi különbséget (kontrasztot) ad. A kerekítés alkalmazása veszélyes lehet, mert szűk intervallum esetén elveszítjük a különbségeket hordozó törtrészeket. A szorzás sem segít, hiszen a 0,1 közé eső pixelértékek továbbra is törtek maradnak.Egy módszer van a teljes racionális intervallum kezelésére:

ratio = arctg(A/B)

Ez adja a legjobb reprezentációt mind a A/B 1, mind a A/B 1 számokra (Faust, 1992).

Néhány indexet gyakori használatuk miatt beépítettek a képfeldolgozó programokba. Az ERDAS Imagine-ben szereplő indexek a következők:

IR/R - biomassza produkcióSQRT(IR/R)IR-R - vegetációs index(IR-R)/(IR+R) - normalizált vegetációs index (NDVI)SQRT(NDVI+0.5) - transzformált NDVI (TNDVI)TM 5/7 - agyagásvány indexTM 5/4 - vastartalmú ásványokTM 5/7, 5/4, 3/1 - ásványi összetételTM 5/7, 3/1, 4/3 - hidrotermális összetétel

Néhány szenzor infravörös (IR) és vörös ( R ) sávja a sávok sorrendje szerint:

Landsat MSS 7 5SPOT XS 3 2Landsat TM 4 3NOAA AVHRR 2 1

Főkomponens analízis (Principal Component Analysis)

A főkomponens analízist gyakran használják, mint az adattömörítés módszerét. Ezzel lehetővé válik a redundáns adatok összetömörítése kevesebb sávba, amely azt jelenti, hogy az adatok dimenzionalitása csökken. A PCA sávok nem-korrelálnak, függetlenek, és gyakran könnyebb azokat ábrázolni, mint az eredeti forrásadatokat.

A módszer lényege grafikusan, két sávra alkalmazott példán keresztül könnyen elmagyarázható. Egy descartesi koordináta rendszerben ábrázoljuk azt a síkot, amelyet a két sáv feszit ki, benne a pixelek a két sávban felvett pixelértékek alapján, mint megfelelő koordináták szerint helyezkednek el. Ha mindkét sávban a pixelértékek normális eloszlásúak, akkor a kialakuló eloszlási kép (scatterplot) ellipszis alakú.

40


Ellipszis diagram

2-dimenzióban ellipszis, 3-dimenzióban ellipszoid, n-dimenzióban (n3) hiperellipszoid jön létre, ha minden bemenő sáv normális, vagy közel normális eloszlású.

A főkomponens analízis során a spektrális tér tengelyeit elforgatjuk, minden pixel spektrális térbeli koordinátáját, és az adatfile értékeit is megváltoztatjuk. Az új tengelyek párhuzamosak lesznek az ellipszis tengelyeivel.

Az első főkomponens

Az ellipszis leghosszabb átmérőjének (tengelyének) a hosszát és az irányát számítjuk ki először mátrix algebrai fogalmakat, definíciókat alkalmazva. Az átmérőt, amely megfelel az ellipszis főtengelyének (leghosszabb) az adatok első főkomponensének nevezzük. Az első főkomponens iránya az első sajátvektor, a vektor hossza az első sajátérték (Taylor, 1977).

A spektrális tér új tengelyét az első főkomponens határozza meg. A kétdimenziós hisztogramban ábrázolt pontoknak most új koordináta lesz, amely ezen új tengelyhez illeszkedik. Miután a spektrális térben a pontkoordináták az adatfile értékei voltak, az új adatfile értékeit ezen művelet alapján kell meghatározni. Ezek az értékeket az ún. első főkomponens sávban tároljuk.

Miután az első főkomponens mutatja az ellipszis tengelyének a hosszát és irányát, a spektrális térbeli tengelyként ez mutatja az adatok legnagyobb varianciáját. Az alábbi ábrán jól látható, hogy az első sajátérték mindig nagyobb, mint a bemenő sávok adatértékeinek intervallumhossza, ahogyan a Pitagorasz-tétel szerint a derékszögű háromszög átmérője mindig hosszabb, mint a háromszög befogói.

41


A további főkomponensek

A második főkomponens az ellipszis második leghosszabb tengelye, amely merőleges az első főkomponensre. Ezért a második főkomponens megadja az adatoknak azt a legnagyobb varianciáját, amelyet még nem irtunk le az első főkomponenssel. Kétdimenziós elemzés során a második főkomponens az ellipszis kistengelye.

N-dimenzióban n főkomponens van. Mindegyik további főkomponens:a, a leghosszabb ellipszoid átmérő, mely merőleges az előző komponensre az n-dimenziós térben (Faust, 1989), b, az adatok varianciája csökken (Taylor, 1977).

Bár a főkomponens analízis eredményeként n kimenő sáv jön létre, az első néhány sáv tartalmazza a teljes adatfile információtartalmának 100 %-át az adatok nagy varianciája miatt. Ezért a főkomponens analízis alkalmas az adatok néhány sávba való összetömörítésére. Másrészről a főkomponensek elemzése után megtalálhatjuk azt a

42


képsávot, amely a legnagyobb kontrasztú azt eredeti képben, és ennek oka lehet a szenzor hibájából származó zaj, pl. régi MSS adatoknál a fekete csíkok jelenléte.

A főkomponensek számítása

A főkomponens transzformáció megadása annyit jelent, hogy egy lineáris transzformációval (lineáris egyenletrendszerrel) a spektrális térbeli pixelkoordinátákat átszámítjuk egy új koordinátarendszerbeli koordinátákká. A transzformáció eredménye, hogy az n-dimenziós spektrális tér tengelyeit elmozgatjuk és elforgatjuk az ellipszoid tengelyeinek megfelelően.

A lineáris transzformációhoz meg kell adni az n főkomponens sajátvektorait és sajátértékeit a kovariancia mátrixból a következő egyenlettel:

v1 v2 v3 ..... vn

ahol

Cov = a kovariancia mátrix,E = a sajátvektorok mátrixa,T = a transzpozíció függvényV = a sajátértékek diagonális mátrixa, minden nem-diagonális elem 0.

Osztályozás

Unsupervised training

Az ún. unsupervised classification, nem irányított osztályozás csak minimális beavatkozást igényel a felhasználó részéről, de az osztályozás eredményét, az osztályokat megjelenítő térképet a felhasználónak kell értelmeznie, és az osztályoknak nevet adni, összevonni ha szükséges, stb.

A nem irányított osztályozást, klaszterezésnek (clustering) is nevezik, mert a módszer a spektrális térben lehatárolható pixelcsoportok kialakítására törekszik. Ezeket a pixelcsoportokat, amelyek a statisztikai értelemben hasonló pixeleket tartalmazzák, klasztereknek hívják. Az osztályozás után kialakuló csoportokat térképi műveletekkel, GIS funkciókkal összevonhatjuk, elemezhetjük, illetve felhasználhatjuk a supervised osztályozásban mint a tanulóterületek.

43


Klaszterek

A klasztereket a klaszterező algoritmus határozza meg, amely vagy az összes, vagy majdnem az összes pixelt felhasználja az elemzéskor. Az algoritmust az alábbi tulajdonságok jellemzik:

a, az ISODATA klaszterezési módszer a spektrális távolságot használja a csoportok elkülönítésekor, de iteratív módon osztályozza a pixeleket, vagyis újraértelmezi a kritériumokat minden osztályra és eszerint osztályozza újra a pixelek, így a spektrális távolságon alapuló csoportok egyre finomodnak.

b, az RGB klaszterezési módszer sokkal speciálisabb, mint az ISODATA módszer. Az RGB módszer 3 sáv 8 bites adatait használja fel az osztályokra bontásnál, úgy hogy a 3-dimenziós spektrális térben meghatározza a pixeleket befoglaló térrészleteket, s ezek lesznek az osztályok.

Ebben a fejezetben mindkét módszer részletes elemzésre kerül, bemutatva előnyeiket és hátrányaikat.

ISODATA klaszterezés

Az ISODATA osztályozás neve a Iterative Self-Organizing Data Analysis Technique (Gonzalez és Tou, 1974) kifejezés rövidítése, jelentése: Ismétlődő önszervező adatelemző módszer. Ismétlődő (iteratív), mert a teljes klasszifikációt megismétli, amíg az eredmény meg nem felel a követelményeknek, és létrehozza a tematikus raszterréteget, s újraszámítja annak statisztikáját. Önszervező, mert minimális felhasználói segédlet szükséges a klaszterek kijelöléséhez.

Az ISODATA módszer a minimális spektrális távolságok módszerét alkalmazza a pixelek osztályba sorolásakor. Az osztályozás meghatározott számú klaszter átlagértékének a megadásával kezdődik (beleértve a már létező tanulóterületek alapján számított osztályközepeket is), és ez ismétlődik, úgy hogy a klaszterközepek folyamatosan módosulnak egy új pixel osztályba sorolása után.

ISODATA klaszterezés paraméterei

N a klaszterek maximális száma. Minden klaszter a későbbi osztályt fogja meghatározni, így a klaszterek száma megadja az osztályok maximális számát is. Minden ISODATA osztályozási folyamat N klaszterközép meghatározásával kezdődik. Kevés pixelt tartalmazó klaszterek megszűnhetnek, ezért kevesebb mint N klaszter marad.

T - konvergencia küszöb, amely megadja, hogy maximálisan a pixelek hány százaléka maradhat változatlan az iterációk között.

M - az iterációk maximális száma.

Kezdő osztályközepek

Az ISODATA algoritmus első iterációban az N klaszter átlagértékét határozza meg. Minden egyes iteráció után, az új klaszterközepeket határozza meg az aktuális klaszterbeli pixelek

44


szerint. Ezeket a klaszterközepeket használja a következő iterációban a klaszterek meghatározásához. Ez a folyamat addig folytatódik, amíg az iterációk között nagyon kicsi különbség nincs (Swain, 1973).

A kezdő klaszterközepek a spektrális térben egy vektor mentén helyezkednek el, mely két végpontjának spektrális térbeli koordinátái az N-dimenziós térben:

(1-s1, 2-s2, ... , n-sn), ill. (1+s1, 2+s2, ... , n+sn).

Kétdimenzióban a kezdő klaszterközepek az A(1-s1, 2-s2) és B(1+s1, 2+s2) pontok között helyezkednek el.

Pixel elemzés

A pixeleket egyenként soroljuk valamelyik osztályba a bal-felső sarokban lévő pixellel kezdve, majd soronként sorra kerül minden pixel. A pixel és a klaszterközepek térbeli távolságait kiszámítja az algoritmus és a pixelt ahhoz a klaszterhez rendeli, mely közepéhez a pixel legközelebb van a spektrális térben. Az ISODATA osztályozás eredménye egy tematikus raszterréteg és/vagy egy tanulóterület file. Az első iteráció eredménye hasonló a következő képhez.

A második iteráció során minden klaszter átlagértékét újraszámítja az algoritmus. Minden pixel összemért az új klaszterközepekkel és hozzárendeli a legközelebbihez.

45


Mindegyik iteráció után az ugyanabban a klaszterben maradó pixel százalékos aránya alapján indul el az újabb iteráció vagy, ha ez az arány eléri a konvergencia küszöböt, az algoritmus befejeződik.

Lehetséges, hogy a változatlan pixelek százalékos aránya sohasem éri el ezt a küszöbértéket, ezért az iterációk számának (M) rögzítésével megakadályozható, hogy a program a végtelenségig fusson.

ISODATA klaszterezéselőnyök hátrányok

Iteratív A klaszterezés sokszor ismételhető ezért időigényes művelet.

Ez az algoritmus nagyon alkalmas az egynemű adatokat tartalmazó spektrális klaszterek megtalálására. Nincs jelentősége, hogy a kezdő klaszterközepek hol helyezkednek el, ha elég sok iteráció engedélyezett

Nem veszi figyelembe a pixel térbeli homogenitást.

A kimenő tematikus raszterréteg hasonló a tanulóterületek alapján, a minimális távolságok módszerét alkalmazó osztályozás eredményéhez. Ezt a tematikus raszterréteget elemezhetjük és kezelhetjük a tanulóterületek szerint mielőtt az aktuális klasszifikációt végrehajtanánk.

Döntéshozási módszer

Bár az ISODATA algoritmus legjobban a minimális távolságok módszerét alkalmazó döntéshozási módszerre hasonlít, a kialakuló tanulóterületek jó eredménnyel használhatók bármely döntéshozási típusban.

Az iteratív optimalizáló, vagy más néven (vándorló közepek) klaszterező algoritmus – lényegében az ISODATA algoritmus – Ball és Hall (1965) munkájában jelent meg először.

A klaszterezés során a multispektrális térben alakítunk ki pixelcsoportokat, klasztereket. Pixelek akkor tartoznak egy csoportba, ha spektrálisan hasonlók. Ehhez szükség

46


van arra, hogy a hasonlóság fogalmát definiáljuk és mérhetővé tegyük. Bár sokfajta hasonlóság mérési módot kifejlesztettek, de mindegyik hasonlít egymásra abban a tekintetben, hogy mindegyik a spektrális térben való távolságmérésen alapul. A leggyakrabban használt távolságfogalom az Euklideszi-távolság és az L1 (interpoint - pontközi) távolság. Ha x1 és x2 két pixel a multispektrális térben, akkor a közöttük mérhető Euklideszi-távolság a következőképpen számítható:

d(x1,x2) = x1 - x2 = (x1 - x2)t (x1 - x2)1/2 = (x1i - x2i) 2 1/2 ,

ahol i megy 1-től N-ig, N a spektrális összetevők száma.

Szavakkal kifejezve, két N-dimenziós térbeli pont Euklideszi-távolságát megadhatjuk a megfelelő koordináták különbségének négyzetösszegének a négyzetgyökével.

Az L1-távolság két pixel között az alábbi képlet szerint számítható:

d(x1,x2) = x1i - x2i ,

ahol i megy 1-től N-ig, N a spektrális összetevők száma.

Általános klaszterezési kritérium vagy minőségi mutató a négyzetes hiba összege (sum of squarred error - SSE), melynek definíciója:

SSE = (x - mi)t (x - mi) = x - mi 2 ,

ahol x Ci és mi az i-dik klaszter közepe. A külső szumma az összes klaszterre vonatkozó összegzést jelzi.

Vagyis az SSE megadja az összegzett távolságot minden képelemre vonatkozóan az ő klaszterközepétől mérve minden egyedi klaszterre, majd összegzi ezeket a részösszegeket az összes klaszterre.

Ha az SSE értéke elég kicsi, akkor a klaszterezés eredménye elfogadható.

Más klaszterezési minőségvizsgálatok is léteznek, pl. a „klaszteren belüli eloszlás mérése”, mely a klaszterek átlagos kovariancia mátrixát határozza meg, vagy a „klaszter eloszlás vizsgálata”, mely a klaszterek átlagát hasonlítja össze a teljes adathalmaz átlagával. Mindkét módszer (Duda és Hart, 1973, Coleman és Andrews, 1979) alapvetően ugyanaz mint a SSE feltétel.

Elméletben lehetséges, hogy az SSE értéke nulla legyen, de ez azt jelenti, hogy minden klaszter egyetlen pixelt tartalmaz. Az SSE számítása egyébként elég időigényes feladat, mert P pixel elhelyezése C klaszterbe CP/C! (Duda és Hart, 1973) módon lehetséges, és az SSE értékét ennyiszer ki kell számítani a klaszterezés minden egyes stádiumában a minimális érték megadásához. Ezért ennél a szigorú és számításigényes módszernél egyszerűbbeket alkalmaznak a gyakorlatban.

47


48


RGB klaszterezés

Az RGB klaszterezés egy egyszerű osztályozási és adattömörítési technika 3 sávra vonatkoztatva, 8 bites adatokon. Egyszerű és gyors algoritmus, amelyet akkor használunk, ha gyors osztályozási eredményre van szükség, de nem lényeges minden részlet teljes körű osztályozása. Alkalmas továbbá a 24 bites színes képek 8 bites színes képpé tömörítésére.

Az algoritmus minden pixelt a 3 dimenziós spektrális térben helyez el, és utána egy térbeli háló szerint hozza létre a klasztereket. Minden klaszter egy osztály lesz a kimenő tematikus raszterrétegen.3 dimenziós tengely mentén a bemenő adatok szerinti hisztogramokat skálázza, majd a hisztogram alapján szétdarabolja az intervallumot, pl. a az átlaghoz képest valamilyen szórástávolságon belüli pixeleket, vagy a minimum és maximum értékek között.

A sávonkénti osztályok száma alapértelmezésben:

Vörös (Red) - 7 db, Zöld (Green) - 6 db, Kék (Blue) - 6 db,

Definiálható, hogy a három sávot egyenként mennyi részre bontsa az algoritmus aszerint, hogy milyenek a sávok szerinti hisztogramok. A szélesebb hisztogram több szeletre, a keskenyebb hisztogram kevesebb szeletre bontható.

Az IDRISI Composit parancsa a 3 bemenő sávot felbontja 6-6 intervallumra és a kimenő színes kép pixelértéke a következő képlettel számítható ki:

pixelérték= B + 6*G + 36*R

49


RGB klaszterezéselőnyök hátrányok

A leggyorsabb osztályozási módszer. A tervezésekor arra törekedtek, hogy gyors és egyszerű osztályozást adjon olyan alkalmazásokhoz, melyek nem igényelnek speciális osztályokat.

Pontosan három sávot használ az algoritmus, így nem lehetséges mindenféle alkalmazás.

Nem biased a felső vagy az alsó részét az adatfilenek. A pixelek vizsgálati sorrendje nem befolyásolja a kimenő adatokat.

Nem mindig hoz létre olyan tematikus filet, amely alkalmas a későbbi elemzésre.

Erősen interaktív funkció, iteratív módon változtathatjuk a paramétereket, amíg a klaszterek száma és a küszöb megfelel az analízis szempontjából.

Irányított osztályozás

Bevezetés

A multispektrális klasszifikáció során a képalkotó elemeket, a pixeleket, a pixelértékek alapján besoroljuk a véges számú osztályok egyikébe. Ha a pixel megfelel bizonyos kritériumoknak, akkor abba a tematikus osztályba fog tartozni, melyet a kritériumok szerint határoztunk meg. A fenti folyamatot a kép szegmentációjának is nevezik.

A klasszifikáció folyamata

Mintázat felismerés

Az emberi szem felismer bizonyos szerkezeteket és a színeket kategóriákba csoportosítja a színes képeken. A multispektrális, digitális képek esetén a számítástechnika és a matematika eszközeivel lehetőség van a spektrális mintázatok tudományos elven történő felismerésére. Statisztikák készíthetők a pixelek spektrális tulajdonságai szerint, és a pixelek osztályozhatók matematikai feltételek alapján. Ezt a folyamatot két jól elkülönülő részre, a betanításra (tréning) és a döntéshozási módszereket használó osztályozásra bontjuk.

Tréning

A számítógépet fel kell készíteni, be kell tanítani arra, hogy felismerje az adatokon belüli csoportokat. A tréning az a folyamat, melyben meghatározunk feltételeket, amelyekkel ezek a csoportok felismerhetők. A tréning vagy a felhasználó által irányított, un. supervised, vagy minimálisan irányított, un. unsupervised módszer lehet.

50


Irányított betanítás

Ezt a módszert az jellemzi, hogy végig a felhasználó irányítása alatt áll. Először a felhasználó kiválasztja azokat a pixeleket, amelyek reprezentálni fogják az adott osztályt. A pixelek kiválasztásakor használhatunk különböző forrásokat, légifelvételeket, térképeket, helyszíni megfigyelési adatokat, stb. A pixelértékek elemzése és a tematikus térkép osztályainak előzetes ismerete szükséges ehhez a módszerhez. A pattern azonosítása készíti fel a számítógépet a hasonló tulajdonságú pixelek azonosítására.

Nem irányított betanítás

A nem irányított betanítás sokkal inkább automatizált folyamat. A képfeldolgozó program felismeri a hasonló tulajdonságú pixeleket, de ezek nem szükségszerűen illeszkednek a kép folyamatos, könnyen felismerhető területeihez, mint pl. a talajtípusokhoz, vagy területhasznosítási osztályokhoz. Ezek csak egyszerű pixel klaszterek, melyek a hasonló spektrális tulajdonságú pixeleket gyűjtik össze. Ezt a módszert általában akkor alkalmazzuk, ha kevés információnk van a klasszifikáció előtt a területről. A klasszifikáció után a felhasználónak kell értelmeznie a létrejött osztályokat.

Tanulók - signatures

A tréning eredménye a tanulók egy halmaza, amely tartalmazza a tanulóterületeket, vagy a klasztereket. Minden tanuló egy osztályt ír le, és a döntéshozási szabállyal együtt a képfile minden egyes pixele egy osztályhoz rendelhető.

A tanulók aszerint csoportosíthatók, hogy hogyan és hol jelöltük ki azokat. A statisztikai paramétereken (pl. középértéke, szórás, kovariancia mátrix, stb.) alapuló pixelhalmazt parametrikus tanulónak nevezi az ERDAS. A parametrikus pixelhalmazt kijelölhetjük a földrajzi térben egy terület lehatárolásával, mely a benne lévő pixelek értékei szerint jellemezhető statisztikus paraméterekkel. A tanulóterület kijelölése többféle módon is történhet. Parametrikus adatokkal jelölhetünk ki egy klasztert a spektrális térben, ha kijelölünk egy n-dimenziós pontot3, mint klaszterközepet és meghatározzuk a klaszterbe tartozó, pl. egy bizonyos szórástartományon belül lévő pixeleket4. A parametrikus tanulók a statisztikus osztályozási módszereknél, pl. a maximum likelihood, használhatók az osztályok meghatározására.

A nem-parametrikus tanulókat nem statisztikai módszerekkel jelöljük ki. Ilyen lehet egy spektrális térben megadott diszkrét alakzat5. Ezekkel az alakzatokkal az osztályok térbeli határait adjuk meg. A nem-parametrikus osztályozások fogják használni a nem-parametrikus tanulókat. Az osztályba soroláskor azt vizsgáljuk, hogy az adott pixel kívül vagy belül van a spektrális térben lokalizált osztályokon. A supervised tréning során hozhatunk létre nem-parametrikus tanulókat (Kloer, 1994).

A tanulók értékelése3 a megfelelő koordináták a sávonkénti pixelértékek xi = (x1, x2, ....., xn)4 n-dimenzióban ez egy hiperellipszoid lesz5 két-dimenzióban valamilyen szabályos vagy szabálytalan síkidom, pl. a (min x i, max xi) és a (min xj, max xj) határokkal adott, téglalap alakú spektrális térben lévő pixelek adnak egy klasztert

51


Alarm réteg

Az alarm értékelés lehetővé teszi, hogy összehasonlítsuk egy vagy több tanulóra a tervezett osztályozás eredményét az eredeti adatokkal.. A parallelepipedon döntési szabály alapján azok a pixelek kapnak új színt a megjelenített űrfelvétel feletti rétegben, amelyek megfelelnek az osztályozás kritériumának.

Ellipszis vizsgálat a spektrális térben

Az ellipszisek a tanulókban lévő pixelek osztályközepei, a szórás alapján rajzolhatók ki, de lehetséges parallelepipedon határokat, az osztályközepet és a osztály nevét is megjeleníteni a 2-dimenziós spektrális térben.

Ha jelentős az ellipszisek átlapolása, akkor a megjelenített két sávban (a spektrális tér 2 dimenziójában) a pixeleket nem lehet teljesen elkülöníteni a tanulók alapján. A legjobb, ha nincs átlapolás, de átlapolás a legtöbb esetben várható.

ábra Ellipszis vizsgálat a spektrális térben

Kontingencia mátrix

A tanulóterület pixelei nem mindig homogének, ami azt jelenti, hogy az osztályozáskor nem minden pixel kerül abba az osztályba, amit az a tanulóterületen belüli többi pixellel együtt reprezentál. Minden pixel csak súly abban a statisztikában, amely meghatározza az osztályt. Ha a tanuló statisztikája jelentősen eltér a többi tanuló statisztikáitól, akkor a tanulón belüli pixelek jelentős része úgy osztályozódik, ahogy azt várjuk.Ez a kiértékelés, gyors osztályozás használja a minimum távolság, a maximum likelihood vagy a Mahalanobis távolság döntési szabályt. A kontingencia mátrix mutatja százalékosan vagy számszerűen, hogy a tanulók pixelei hogyan osztályozódtak.Szeparabilitás vizsgálat

52


A tanulók szeparabilitása a tanuló között mért statisztikus távolság. A szeparabilitást bármely két tanuló között megmérhetjük bármely sávokban, ezáltal kizárhatók azok a sávok, amelyek nem segítik az osztályozást (a tanulók nem különíthetők el egymástól megfelelően).Ha távolság, spektrális euklideszi távolság, két tanuló osztályközepe között nem elég nagy akkor az osztályozás sem lesz sikeres.

Döntési szabály

A tanulók meghatározása után a kép pixeleit egyenként elemezve osztályozzuk és soroljuk be egy-egy osztályba (vagy marad osztályozatlan) a döntési szabály szerint. A döntési szabály egy matematikai algoritmus, mely a tanulók adatai alapján végzi el a pixelek osztályba sorolását.

Parametrikus döntési szabály

A parametrikus döntési szabály parametrikus tanulókat használ, melyek legfontosabb statisztikai paramétere az átlagvektor és a kovariancia mátrix. Amikor parametrikus döntési szabály szerint osztályozzuk a pixeleket, akkor minden pixelt besorolunk valamilyen osztályba, mert a parametrikus döntési tér folyamatos.

Nem-parametrikus döntési szabály

A nem-parametrikus döntési szabály nem statisztikákon alapul, így független az adatok tulajdonságaitól. Ha egy pixel egy nem-parametrikus tanuló határán belül van, akkor ez a döntési szabály a tanuló által meghatározott osztályhoz rendeli. Vagyis a nem-parametrikus döntési szabály azt vizsgálja, hogy a pixel a tanuló határán belül vagy kívül helyezkedik-e el.

Az iteratív klasszifikáció

A klasszifikáció részlépéseit és a végeredmény is értékelni kell, s az esetleges hibákat javítani lehet, majd megismételhetjük vagy a részfolyamatot vagy az egész osztályozást. A megismételhető folyamatokat iteratívnak nevezzük.

Supervised klasszifikáció

A supervised tréning a priori (már ismert) információkon alapul. Ehhez ismerni kell pl. a területhasznosítási típusok bizonyos tulajdonságait, melyeket felszíni mérések biztosítanak. E méréseket legjobb, ha a kép felvételezés időpontjában végzünk el.

A tanulók kijelölése

53


A tanuló reprezentál egy osztályt

vektorréteg alapján poligon definiálásával a képen hasonló spektrális tulajdonságú szomszédos pixelek kijelölésével adott területen belüli pixelek kijelölésével, melyek nem szükségszerűen hasonló

spektrális tulajdonságúak tematikus raszterréteg egy osztályát felhasználva

A tanulók attribútumai

A tanulókat többféle attribútummal látjuk el, amelyek egyrészt befolyásolják a döntéshozás eredményét, pl. a rang értéke, másrészt a kimenő tematikus raszterréteg paramétereit határozzák meg, pl. az osztályok színei, értékei, nevei, stb.

A következő attribútumok minden tanulóra (parametrikus és nem-parametrikus) általánosan érvényesek:

név - azonosítja a tanulót, és az osztály neve lesz a kimenő tematikus raszterrétegen

szín - a tanuló színe és az osztály színe a kimenő tematikus raszterrétegen érték - a kimenő osztály értéke és a tanuló értéke nem szükségszerű, hogy

megegyező legyen, legjobb, ha pozitív egész. rang - a rang értéke a rangfüggő műveletekben játszik szerepet, mint pl. a tanuló

gyorsértékelése (alarm) vagy a parallelepipedon osztályozás parallelepipedon határok - a határokat6 a parallelepipedon osztályozásban

használjuk.

A parametrikus tanuló további attribútumai lehetnek:

sávok száma - a bemenő kép sávjainak a száma szélsőértékek - a klaszter vagy a tanuló minimum és maximum vektora átlagértek - a klaszter vagy a tanuló átlagvektora a klaszter vagy a tanuló kovariancia mátrixa a klaszter vagy a tanuló pixeleinek a száma

A nem- parametrikus tanuló spektrális térben, nem statisztikai paraméterek alapján, kijelölt térrészletbe eső pixelek értékeit rögzíti.

A tanulók vizsgálata, értékelése

tanuló gyorsértékelése (alarm) - ellipszis - kontingencia mátrix - divergencia -

6 a parallelepipedon határok a sávonkénti minimális és maximális pixelértékek

54


statisztikák és hisztogramok -

A klasszifikáció döntési szabályai

Ha a tanulókat összegyűjtöttük és értékeltük, a következő lépés a döntéshozáson alapuló osztályozás elindítása. Az osztályozáskor minden egyes pixelt önállóan értékelünk. A döntési szabályban vagy algoritmusban meghatározó szerepe van a pixel helyét az n-dimenziós vektortérben kijelölő vektornak.

Az alábbi ábra az ERDAS döntéshozási mechanizmusának folyamatábráját ábrázolja

Eszerint, ha nem-parametrikus tanulók nem szerepelnek, akkor a pixeleket csak parametrikus szabályok szerint osztályozzuk. Ha nem-parametrikus tanulók is vannak a tanulók között, akkor minden pixelt úgy osztályozunk, hogy minden tanulót nem-parametrikusnak tekintünk. Ekkor a következők szerint járunk el:

ha a nem-parametrikus teszt eredménye egy egyedi osztály, akkor a pixelt besoroljuk ebbe az osztályba

55


ha a nem-parametrikus teszt eredménye egy üres osztály (pl. a pixel kívül esik minden nem-parametrikus döntési határon), akkor az osztályozatlansági szabályt alkalmazzuk. Ezzel a szabállyal a pixelt vagy tovább osztályozzuk a parametrikus szabállyal vagy marad osztályozatlan.

ha a pixel több mint egy osztályhoz is tartozhat, akkor az átlapolási szabályt alkalmazzuk. Eszerint a pixelt vagy tovább osztályozzuk a parametrikus szabállyal, vagy figyelembe vesszük a rangot, vagy marad osztályozatlan.

A nem-parametrikus szabályok közül a parallelepipedon és a térbeli alakzat szabályt, a parametrikus szabályok közül a minimális távolságok, a Mahalanobis távolság, és a maximum likelihood módszert elemezzük részletesen.

Parallelepipedon szabály (nem-parametrikus)

A parallelepipedon döntési szabályban a vizsgált pixel értékeit összehasonlítjuk az alsó és a felső határokkal. Az alsó és a felső határok lehetnek:

a tanulón belüli pixelek értékeinek minimális és maximális értéke minden sávban, minden sáv szerint az átlag és annak valamilyen skalárral szorzott szórású

környezete, bármilyen határ, amit a felhasználó definiál az adatok, vagy a tanuló ismerete

szerint. Ezek az ismeretek származhatnak a korábban tárgyalt tanulóértékelési technikák alapján.

Az alábbi ábra egy kétdimenziós példát ad a parallelepipedon osztályozásra.

56


A sávpáronként értelmezett és a sávonként vett minimális és maximális értékekkel lehatárolható téglalapok adják a 3-dimenziós térben értelmezett téglatest határoló felületeit, míg n-dimenzióban egy n-dimenziós parallelepipedont definiálhatunk.

Az osztályozás lépései

Ha a pixel egyetlen tanulóhoz tartozó parallelepipedonba esik, akkor a tanuló által kijelölt osztályba soroljuk.

Ha kettő vagy több parallelepipedon közös térrészébe, átlapoló területébe helyezhető el a vizsgált pixel, akkor osztályozhatjuk a tanulók rangja, vagy parametrikus szabály szerint.

A pixelt a magasabb rangú (alacsonyabb értékű) tanuló által reprezentált osztályba soroljuk.

Ha rangot nem vehetjük figyelembe, akkor a pixelt csak az átlapoló tanulókra alkalmazott parametrikus szabály szerint osztályozzuk. Ha egyik tanuló sem parametrikus, akkor a pixel osztályozatlan marad, ha csak az egyik tanuló parametrikus, akkor a pixelt automatikusan ehhez az tanulóhoz, ill. az általa reprezentált osztályhoz soroljuk.

a pixel osztályozatlan marad

Ha a pixel nem esik egyik parallelepipedonba sem, akkor definiálni kell az osztályozást

a pixelt az összes tanulóra alkalmazott parametrikus szabály szerint osztályozzuk. Ha egyik tanuló sem parametrikus, akkor a pixel osztályozatlan marad.

a pixel osztályozatlan marad

PARALLELEPIPEDON döntési szabályelőnyök hátrányok

Gyors és egyszerű, miután a pixelértékeket olyan határokhoz hasonlítjuk, amelyek változatlanok maradnak az osztályozás során mindegyik tanulóra vonatkozóan.

Miután a parallelepipedonoknak sarkai vannak, olyan pixel is osztályozható, amely távol van az átlagértéktől.

Gyakran használható egy első szintű, kiterjedt osztályozás elvégzésére. A döntési szabállyal gyorsan csökkenthető a lehetséges osztályok száma, mielőtt valamilyen időigényes (minimális távolság, Mahalanobis távolság, maximum likelihood) módszert alkalmaznánk.Nem függ az adatok normális eloszlásától.

57


Feature space

Ugyanaz, mint a parallelepipedon, csak a spektrális térben kijelölt pixelhalmaz határai tetszőlegesek lehetnek.

Minimális távolság döntési szabály

A minimális távolság döntéshozási módszere, vagy más néven a spektrális távolság módszere az osztályozni kívánt pixel és mindegyik tanuló átlagos értéke közötti n darab lehetséges spektrális távolság mérésén alapul.

A fenti ábrán a spektrális távolságokat a kétdimenziós vektortérben vastag szakaszok jelzik a pixel és a tanulók átlagértékei között. A pixelt ahhoz az osztályhoz rendeljük, melyet reprezentáló tanuló átlagértékéhez a legközelebb van, vagyis amelyre az alábbi kifejezés minimális

58


aholn = a sávok száma (dimenzió)i = az adott sáv indexec = az adott osztály indexXxyi =az i sáv x,y pixelének az értékeSD xyc = az x,y pixel és a c osztály közötti távolság

MINIMUM TÁVOLSÁG döntési szabályelőnyök hátrányok

A véges számú távolság között mindig van legalább egy legkisebb, így nem lesz osztályozatlan pixel7.

Azok a pixelek, amelyek más feltételek esetén osztályozatlanok maradnának, osztályozottak lesznek. A küszöbérték térképen, amely megmutatja a pixel és az osztályközép távolságát, a túl távol lévő pixelek kiszűrhetők.

A parallelepipedon módszer után a leggyorsabb döntéshozó módszer.

a, Nem veszi figyelembe az osztály variabilitását. Például egy városi területet reprezentáló osztály esetén, melynek nagy a varianciája, a középtől távol lévő pixelek, más osztályközepek közelsége miatt, más osztályhoz sorolódnak, vagyis az osztály alulreprezentált lesz. b, Fordítva, a kis varianciájú, homogén osztályok esetén, mint pl. egy vízfelület, a nem az osztályhoz tartozó pixelek, más osztályközepek relatíve nagyobb távolsága miatt a vízfelületként osztályozódnak. A vízfelület túlreprezentált lesz.

Ha a nagy varianciájú tanuló jól elkülöníthető résztanulókra bontható, akkor ezek egy tanulóként való kezelése azt eredményezi, hogy az átlagvektor a két tanulórész közé mutat, ahol lehet, hogy nincs is pixel, vagy egy másik tanuló van. Ez különösen a minimális távolság módszerénél okoz látványos hibát. Ezt úgy javíthatjuk ki, hogy a tanulót felbontjuk alkotó részeire. Ez viszont azt eredményezi, hogy megszűnhetnek olyan osztályok, mint a városi beépítés, mert felbomlik útfelületre, zöldfelületre, vízfelületre, stb. Nagy varianciájú tanulókat a fentiek szerint csak akkor alkalmazhatunk osztályok reprezentálására, ha

nem bontható homogén, elkülönülő résztanulókra,

7 a minimum távolság módszerénél, ha két vagy több osztálytól mért távolság egyenlő és minimális, akkor az osztályok rangja alapján döntünk, ha a rangot nem definiáltuk, akkor a felvétel sorrendjében első osztályhoz rendeljük a pixelt. Egyes szoftverekben definiálható egy küszöbérték, vagy maximális távolság, amelynél nagyobb minimális távolság esetén a pixel osztályozatlan marad.

59


a legközelebbi tanuló átlagvektora és a nagy varianciájú tanuló átlagvektorának a távolsága legalább kétszerese az utóbbi a tanulón belül mérhető legnagyobb spektrális távolságnak.

Mahalanobis távolság

A Mahalanobis távolság hasonló a minimális spektrális távolsághoz, csak a kovariancia mátrixot használja az egyenletben. A mátrixban szereplő varianciák és kovarianciák értékei továbbviszik a tanulóban lévő nagy változékonyságú pixelek tulajdonságait az osztályra. Például, ha városi területet osztályozunk, amely tipikusan nagy varianciájú pixeleket tartalmazhat, a jól osztályozott pixel messzebb lehet az osztályközéptől, mint esetleg egy nem nagy varianciájú osztály, pl. a vízfelület esetén.

ahol

D = Mahalanobis távolságc = adott osztályX = pixel vektoraMc = osztály tanulójának átlagvektoraCov c = a c osztály tanulójában lévő pixelek alapján számított kovariancia mátrixCov c -1 = Cov c inverzeT = transzponált függvény

MAHALANOBIS TÁVOLSÁG döntési szabályElőnyök hátrányok

A tanulók variabilitását is figyelembe veszi, nem úgy mint a minimális távolság vagy a parallelepipedon módszer.

A kovariancia mátrixban szereplő nagy értékek szereplése esetén túlosztályozott lehetnek egyes osztályok. Ez akkor fordul elő, ha a klaszterben vagy a tanulón belül a pixelek nagyon elszórva helyezkednek el (a spektrális térben)..

Sokkal használhatóbb lehet mint a minimális távolság módszere, ha a statisztikai paramétereket (amelyeket kifejezünk a kovariancia mátrixban) figyelembe kell venni, de a maximum likelihood módszernél alkalmazható súlyfaktorok nem álnak rendelkezésre.

Lassabb, mint a parallelepipedon vagy a minimális távolság módszere.A Mahalanobis távolság módszere parametrikus, ami azt jelenti, hogy szükséges minden sáv adatainak normális eloszlása.

60


Maximum likelihood módszer

A Maximum likelihood módszer alkalmazhatóságához szükséges, hogy a sávonkénti adatok normális eloszlásúak legyenek. Ha ez nem áll fenn jobb eredményt kapunk a parallelepipedon vagy a minimális távolság módszerrel.

A Maximum likelihood módszer azon alapul, hogy egy pixel milyen valószínűséggel tartozik egy adott osztályba. Az alapegyenlet feltételezi, hogy ezen valószínűségek egyenlők minden osztályra vonatkozóan és hogy a bemenő sávoknak normális az eloszlása.

Bayes osztályozó

Ha van előzetes, a priori információnk arról, hogy a valószínűségek nem egyenlők minden osztályra, akkor súlyokat adhatunk az egyes osztályoknak. A Maximum likelihood módszer ezt a változatát Bayes-féle döntési módszernek nevezik (Hord, 1982). Ha nincs előzetes információ a valószínűségekről, akkor a súlyok értéke 1.0 az egyenletben.

A Maximum likelihood és a Bayes-féle döntési módszer egyenlete:

MAXIMUM LIKELIHOOD/BAYES döntési szabályelőnyök Hátrányok

A legpontosabb osztályozási módszer, ha a bemenő sávok adatai normális eloszlásúak, mert ez veszi figyelembe a legtöbb változót.

A bonyolult egyenlet miatt a számítás sok időt vesz igénybe. Az idő a sávok számának növekedésével egyenesen arányos.

A Mahalanobis távolság módszerhez hasonlóan a Maximum likelihood is a kovariancia mátrixot használja az osztályok variabilitásának jellemzésére.

A Maximum likelihood parametrikus módszer. amely azt jelenti, hogy erősen függ az egyes sávok adatainak normális eloszlásától. A kovariancia mátrixban szereplő nagy értékek szereplése esetén túlosztályozott lehetnek egyes osztályok. Ez akkor fordul elő, ha a klaszterben vagy a tanulón belül a pixelek nagyon elszórva helyezkednek el a spektrális térben.

Az osztályozás eredményének értékelése

Az osztályozás pontosságának, eredményének az értékelésére több módszer is létezik: küszöbérték vizsgálat - a túlosztályozott osztályokban lévő kritikus pixelek

kiszűrésére alkalmazott módszer pontosság becslés - a klasszifikáció eredményének és földi vagy más meglévő

adatok összehasonlításának módszere.

61


Küszöbérték vizsgálat

A küszöbérték vizsgálattal azonosíthatjuk azokat a pixeleket, amelyeket valószínűleg (most likely) rosszul osztályoztunk. Ezeket a pixeleket egy másik osztályba, általában az nulla osztályba, a nem osztályozottak közé sorolunk át. Ezeket a pixeleket a döntési szabályban használt távolságmérés alapján azonosítjuk.

Távolság file

Ha minimális távolság, a Mahalanobis távolság, a Maximum likelihood osztályozási módszert alkalmazzuk, mindannyiszor létrehozható egy-egy távolság file a kimenő raszterréteg mellett. A távolság file egy egysávos file, az adatok 32 bites tárolásban folyamatos raszterréteget alkotnak, amelyben minden pixelérték az alkalmazott távolságmérés eredményét mutatja.

A minimum távolság osztályozásnál minden távolságérték Euklideszi spektrális távolság a pixel és az osztály átlagértéke között.

Mahalanobis távolság, vagy a Maximum likelihood osztályozási módszert alkalmazva a távolságérték a pixel vektora és az osztály átlagvektora közötti Mahalanobis távolság.

.ábra A távolság file hisztogramja

Ez az eloszlási görbe a Chi2 eloszlási függvényéhez hasonló.

A valószínűleg rosszul osztályozott pixelek távolságértékeik szerint a grafikon jobb oldalán helyezkednek el, melyek matematikai módszerekkel pontosan definiálhatók és levághatók a hisztogramról. A levágás helye a küszöbérték.

A küszöbérték meghatározható: interaktív módon a hisztogramon, bemenő adatként, chi2 paraméterként.

62


Mindként esetben az eredmény az lesz, hogy a legnagyobb távolságértékű pixelek egy tematikus osztályba kerülnek, amely maszkként használható az osztályozás eredményeként létrejött tematikus raszterrétegen.

Pontosság becslés - Accuracy assessement

A pontosság becslése véletlenszerűen kiválasztott referencia pixelek és a tematikus raszterréteg összehasonlítását jelenti. A kiválasztott pixelek számának 250-nél nagyobbnak kell lenni ahhoz, hogy egy osztály átlagos pontosságát 5 %-kon belül megadhassuk. A referencia pixelek véletlenszerű kiválasztása történhet:

random módon - semmilyen szabályt nem használva, stratégiai random módon - a referencia pixelek a tematikus osztályok területi

arányának megfelelően oszlanak el véletlenszerűen az osztályokban, kiegyenlített random módon - a referencia pixelek a tematikus osztályokban

egyenlő számban oszlanak el véletlenszerűen.

A pontosság mérésének az eredménye vagy egy c x c méretű hibamátrixban jelenik meg, ahol c az osztályok száma, vagy egy egyszerű pontosság fileban, mely egy ASCII-file, tartalma a pontosság százalékos statisztikája a hibamátrix alapján.

63

bevezetés az esri arcview gis asztali …laci/kepfeldolgozas/phare_tananyag... · web viewtitle...

Documents