mta térképészeti és térinformatikai kutatócsoport...

Post on 03-Oct-2020

0 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

MTA Térképészeti és TérinformatikaiKutatócsoport beszámoló jelentése

A jelentést összeállította: Elek István

2006

Tartalomjegyzék

1. Adatbányászati eljárások a vektoros a térinformatikában 31.1. A klaszterezésr�ol általában . . . . . . . . . . . . . . . . . . . . . 4

1.1.1. A távolság mátrix . . . . . . . . . . . . . . . . . . . . . . 41.1.2. Particionáló eljárások . . . . . . . . . . . . . . . . . . . . 61.1.3. Hierarchikus eljárások . . . . . . . . . . . . . . . . . . . 6

1.2. Dimenzió csökkentés . . . . . . . . . . . . . . . . . . . . . . . . 61.2.1. A korrelációs mátrix és sajátértékei . . . . . . . . . . . . 71.2.2. A f�okomponensek geometriai jelentése . . . . . . . . . . 8

1.3. A tematikus térkép, mint egy klaszterezési eljárás eredménye . . . 81.4. Konklúzió . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2. Az automatikus raszter-vektor konverzió problémája 132.1. A fejlesztés vázlatos terve . . . . . . . . . . . . . . . . . . . . . 132.2. Az IRIS rendszer . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2.1. Processzek, work�owk, pluginek . . . . . . . . . . . . . . 162.2.2. El�ofeldolgozó eljárások . . . . . . . . . . . . . . . . . . 172.2.3. Nyers vektorizáló eljárások . . . . . . . . . . . . . . . . . 242.2.4. Térképi tudásbázis kidolgozása . . . . . . . . . . . . . . 252.2.5. Szoftver prototípus kidolgozása . . . . . . . . . . . . . . 282.2.6. A projekt tervezett el�orehaladása . . . . . . . . . . . . . . 28

2.3. A képi tudás digitális reprezentációja (probléma felvetés) . . . . . 292.3.1. Alapfogalmak és kérdések . . . . . . . . . . . . . . . . . 302.3.2. Három gyakorlati példa . . . . . . . . . . . . . . . . . . . 312.3.3. Néhány fontos kérdés . . . . . . . . . . . . . . . . . . . . 33

3. Egyetemi Digitális Térképtár (EDIT) 363.1. Az EDIT rendszer . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.1.1. F�obb funkciókörök . . . . . . . . . . . . . . . . . . . . . 363.1.2. F�obb adatkörök . . . . . . . . . . . . . . . . . . . . . . . 363.1.3. Részletesebb funkciókörök . . . . . . . . . . . . . . . . . 373.1.4. Szerviz funkciók . . . . . . . . . . . . . . . . . . . . . . 373.1.5. Szoftvermodulok . . . . . . . . . . . . . . . . . . . . . . 383.1.6. A továbbfejlesztés iránya . . . . . . . . . . . . . . . . . . 38

1

3.2. Szemelvények a rendszer m�uködéséb�ol . . . . . . . . . . . . . . 383.2.1. Hasznos funkciók . . . . . . . . . . . . . . . . . . . . . . 393.2.2. Az adatbázis struktúrája . . . . . . . . . . . . . . . . . . 40

3.3. Az EDIT lekérdez�o, keres�o verziója (EDITKE) . . . . . . . . . . 443.4. Az EDIT rendszer internetes változata (WEBEDIT) . . . . . . . . 45

3.4.1. A használt technológiák . . . . . . . . . . . . . . . . . . 453.4.2. A háttér . . . . . . . . . . . . . . . . . . . . . . . . . . . 463.4.3. A webszerver . . . . . . . . . . . . . . . . . . . . . . . . 463.4.4. Az adatbázis . . . . . . . . . . . . . . . . . . . . . . . . 463.4.5. A leíró adatok . . . . . . . . . . . . . . . . . . . . . . . . 473.4.6. Digitális állományok . . . . . . . . . . . . . . . . . . . . 473.4.7. A felhasználói felület . . . . . . . . . . . . . . . . . . . . 47

2

1. fejezet

Adatbányászati eljárások avektoros a térinformatikában

A tematikus térkép attributum adatokból levezethet�o csoportosítás eredményét je-leníti meg. A legtöbb esetben éppen az a cél, hogy egy kiválasztott objektumcso-port (layer, feature class) egy speciális adatféleség valamely tulajdonsága alapjánlegyen osztályozva (pl. el�ore megadott csoportszám, megadott vagy számított ér-tékhatárok, stb).

Vegyünk egy egyszer�u példát. Tegyük fel, hogy rendelkezünk egy olyan adat-bázissal, amely a magyarországi településekr�ol 50 adatot tartalmaz, mint pél-dául lakosságszám, munkanélküliség, elvándorlás, odavándorlás, ipari létesítmé-nyek száma, ezek árbevétele (nyeresége), helyi adóbevétel, kulturális létesítményekszáma, legalább egy idegen nyelvet beszél�ok száma, diplomások száma, funkcioná-lis analfabéták száma, stb. Egy ilyen értékes adatbázisból sokféle tematikus osz-tályozás és térkép készítése lehetséges, pontosabban ahány adatféleség, annyiféletematikus térkép, annyiféle osztály. Ez a funkcionalitás a legtöbb esetben elegen-d�onek mondható.

Felmerülhet a kérdés, hogy mi van akkor, ha olyan osztályozási eljárást szeret-nénk végrehajtani az adatsorunkon, amely minden adatot �gyelembe vesz. Gon-doljuk meg, hogy amikor egyetlen adatféleség (mint például a lakosság szám) alap-ján osztályozunk, akkor önkényesen elhagyjuk a többi adatot, vagyis az osztályo-zást nagyon jelent�os adatvesztés után hajtjuk csak végre. Ezáltal akár elvileg megis lenne kérd�ojelezhet�o az eljárás korrektsége. A gyakorlati példánál maradva, atelepülések várossá nyilvánítása sem csak egyetlen ismérv alapján történik, hanemtöbb adat egyidej�u �gyelembe vétele által.

A következ�okben megvizsgáljuk, hogy hogyan állíthatnánk el�o a térinforma-tikai szoftverek jelenlegi adottságai mellett egy minden adatot �gyelembe venniképes tematikus osztályozást és térképet.

3

1.1. A klaszterezésr�ol általábanA nagy tömeg�u adathalmazokban való eligazodás meglehet�osen bonyolult feladat,hiszen soha nem látott méret�u adatbázisok jöttek létre, és folyamatosan jönneklétre. Az adatok keresése, legy�ujtése mögött gyakran valamilyen interpretációsszándék húzódik meg, amelyre az adatok szegmentálása, (tematikus) csoportokbafoglalása teremti meg a lehet�oséget. Mint tudjuk, az adat a gondolkodó ember fejé-ben válik információvá, és ezt a folyamatot nagymértékben el�osegítheti az adatokcsoportosítása, tekintve, hogy javítja az áttekinthet�oséget. Az informatika egyikmodern ága az adatbányászat, amely nem kisebb feladatot t�uzött ki, mint a nagyméret�u adatbázisokban való eligazodást. A geoinformatikát a szakmiai zsargonnem sorolja az adatbányászat témakörébe, pedig az adatbázisok mérete, az adatoksokfélesége, és a gra�ka teremtette nehézségek ezt akár indokolhatnák is. Nemvéletlen, hogy a térinformatikában, különösen a raszteres adatmodellt követ�o ese-tekben, mint amilyen az �urfotók feldolgozása, az adatbányászatban kiemelked�oenfontos eljárás, a klaszter analízis, fontos szerepet játszik. Röviden összefoglal-juk a klaszter analízis f�obb ismérveit, a dimenziócsökkentés lehet�oségeit, valamintösszehasonlítjuk a vektoros térinformatikában elterjedt tematikus kartográ�ai mo-dell és a többdimenziós osztályozások közötti hasonlóságot.

Egy adathalmaz pontjainak az adatrekordok hasonlósága alapján történ�o disz-junkt csoportokba sorolását klaszterezésnek nevezzük. A csoportosítás jósága alap-vet�oen két dolgon múlik: a jó hasonlóság de�nición és egy jó algoritmuson, amelya hasonlóságon alapulva valamilyen kritériumok alapján megállapítja a klasztere-ket.

Sokszor használjuk az osztályozás kifejezést is, ami majdnem ugyanazt jelenti,mint a klaszterezés. Míg a klaszterezés nem felügyelt csoportosítás, addig az osz-tályozás felügyelt. Ebben az összefüggésben a felügyelt jelz�o azt jelenti, hogy acsoportok min�oségi paraméterei el�ore de�niáltak, míg a nem felügyelt esetben nemtudjuk, hogy milyen min�oségi osztályba fognak tartozni az el�oálló csoportok, s�otezek határai sem tudhatók el�ore.

Kétdimenziós esetben ábrázolva az adatpontokat, már szemrevételezéssel is eltudunk különíteni csoportokat az adatok s�ur�usödése alapján (1.1. ábra). Látható,hogy az egy csoportba sorolt pontok egymáshoz közel vannak, illetve saját cso-portjuk közepéhez közelebb, mint bármelyik másik csoport közepéhez.

Több dimenzióban természetesen az effajta szemrevételezéses módszerek márnem használhatók. A korrekt osztályozás csakis klaszterezési algoritmusok révénvalósítható meg. Itt terjedelmi korlátok okán csak két f�o algoritmus csoportot em-lítünk, mert egyébként sokféle eljárás létezik.

1.1.1. A távolság mátrixA hasonlóság de�niálásának egy kézenfekv�o módja az euklideszi távolság foga-lom. Jelölje ai(u, v) az i-edik adatpontot, és di j az i-edik és j-edik adatpontok kö-zötti távolságot. (Természetesen dii = 0.) Írjuk fel az összes lehetséges távolságot

4

1.1. ábra. Szemrevételezéssel is elvégezhet�o az osztályozás egyszer�ubb esetekben. Jól látható, hogyaz A, B,C jel�uek nagyobb, míg a d, e jel�u csoportok kisebb jelent�oség�uek. Az is látható azonban,hogy a szemrevételezéses eljárás nem egzakt.

egy mátrixban:

D =

d11 d12 . . . d1nd21 d22 . . . d2n...

.... . .

dn1 dn2 . . . dnn

Az Euklideszi-távolság a

d(u, v) =

d∑

i=1[ui − vi]2

1/2

formula alapján de�niálható. A hasonlóság a távolság mintájára de�niálható,hiszen az attributum adatokból valamilyen függvény szerint hasonlósági mutatókképezhet�ok. Az n adat attributum hasonlóságát de�niáló mutatókat mátrixba ren-dezve kapjuk meg a hasonlósági mátrixot. A függvény ismeretében a hasonlóságimátrix tehát kiszámolható, de n nagy száma esetén el�ofordulhat olyan nagy méret�umátrix, amely lehetetlenné teszi a klasztereszés gyakorlati végrehajtását. Ilyenkoralkalmazzuk a dimenziócsökkent�o eljárásokat, de err�ol a problémáról majd kés�obbszólunk.

Lényeges, hogy képesek legyünk megállapítani egy klaszterez�o eljárás jósá-gát. Egyik jósági mutató lehet egy el�ore megállapított, minta klaszter állományel�oállításának képessége (vagyis hányszor téved az eljárás). Egy másik lényegesmin�oségi mutató a kiugró, kívülálló pontok meghatározásának képessége. Ez azértfontos, mert ha a kiugró pontok mérési hibából erednek, akkor felismerésük eseténki tudjuk hagyni �oket a számításokból, de az is lehet, hogy a pontok kívülállásaéppen egy fontos jelenségre hívja fel a �gyelmet, tehát külön klasztereben történ�okezelésük különösen fontos.

5

1.1.2. Particionáló eljárásokA particionáló eljárások iterációs elven m�uködnek, vagyis úgy érik el a megfelel�oklaszterek megállapítását, hogy a folyamatosan kapott újabb és újabb kasztere-ket pontosítják. Egy pillanatnyilag kialakult klasztert valamilyen módon tömörenreprezentálunk (pl. súlypont), a klaszterek és az adatpontok közti távolságokatkiszámítjuk. Az adatpontokat újra particionáljuk és a pontokat a hozzájuk legkö-zelebb es�o klaszterhez rendeljük. Az eljárás akkor áll le, amikor a soron következ�oiteráció után a partíció egy megadott értéknél kisebb mértékben változik.

1.1.3. Hierarchikus eljárásokA hierarchikus eljárások az adatelemeket fába rendezik el. Az adatok a fák leve-leiben helyezkednek el, míg a fa minden bels�o pontja megfelel egy klaszternek.Ezek a klaszterek a fában alattuk lév�o lév�o pontokat tartalmazzák. Egyes eljárásokabból indulnak, hogy kezdetben minden adat egy külön klaszter, és az eljárás el�o-rehaladása során a klaszterek csökkenéstése révén találja meg megfelel�o felosztást.Más eljárások éppen fordítva, abból indulnak ki, hogy kezdetben egyetlen klasz-ter van, amely valamennyi adatpontot tartalmazza. Az eljárás el�orehaladása során,valamely leállási kritérium szerint, megáll, és az így kapott klaszterek jelentik avégeredményt.

Akár a felhalmozó, akár a lebontó jelleg�u algoritmusokat nézzük, számos eljá-rás létezik az adatok klaszterekbe történ�o beosztásához.

1.2. Dimenzió csökkentésAz ismertetett eljárások valamennyi rendelkezésre álló adatot �gyelembe veszneka csoportosítás elvégzéséhez. Az algoritusok m�uködési mechanizmusából látható,hogy a távolságok és a klaszter középpontok állandó számítása rendkívüli számításiigényt támaszt, különösen olyankor, amikor sokdimenziós az adatrendszer. Nemritka, hogy több tíz adatféleség áll rendelkezésünkre objektumonként, amely el-fogadhatatlan mértékben megnövelheti a számítási id�ot. Ilyen esetekben alkalma-zunk dimenzió csökkent�o eljárásokat.

A dimenzió csökkentés egyik lehetséges módja a f�okomponens analízis, amelya többváltozós matematikai statisztika egy széleskörben elterjedt eljárásaa.

Legyen p számú meg�gyelési egységünk, amelyek egyenként n számú adatottartalmaznak (p számú meg�gyelési vektorunk van).

x1 x2 . . . xp

x11 x2

1 . . . xp1

x12 x2

2 . . . xp2

......

x1n x2

n . . . xpn

6

Tekintsük az x j vektorokat valószín�uségi változóknak, a vektorok elemeit avalószín�uségi változók realizációinak. Standardizáljuk a változókat:

x̃ ji =

x ji − x j

s j

ahol x j a j-edik vektor elemeinek átlaga (a várható érték becslése), és s̃ j az em-pirikus szórása. Így tehát 0 várható érték�uvé, és 1 szórásúvá tettük a valószín�uségiváltozóinkat.

1.2.1. A korrelációs mátrix és sajátértékeiEzek után számítsuk ki az adatrendszerünk korrelációs mátrixát:

R =

r11 r12 . . . r1pr21 r22 . . . r2p...

.... . .

rp1 rp2 . . . rpp

ahol ri j az i és j-edik meg�gyelési egységek korrelációs együtthatója.Határozzuk meg a korrelációs mátrix sajátértékeit és sajátvektorait, vagyis old-

juk meg a következ�o sajátérték egyenletet:

Rv = λvA kapott sajátértékek λ1 < λ2 < · · · < λp, a sajátvektorok v1, v2, · · · vp.Számítsuk ki a f�okomponenseket a következ�o módon, legyen a j-edig f�okom-

ponens a következ�o:

C ji =

pxp

i v jp

ahol i = 1, n és j = 1, p.A f�okomponensek ortogonális rendszert alkotnak, vagyis korrelálatlanok, azaz

korrelációs mátrixuk

RC =

λ1 0λ2

. . .

0 λp

A RC fontos tulajdonsága, hogy a f�okomponensek és a standardizált változókösszvarianciája azonos:

p∑

j=1λ j =

p∑

i=1s̃2

i =

p∑

j=1s2

j = p

7

Amint látható, a f�okomponensek kiszámításával nagymértékben átrendeztüka varianciákat, mivel, ha ez lehetséges volt, összevontuk �oket az els�o (néhány)f�okomponensben. Az eljárás f�obb mozzanatainak geometria jelentését a 1.2. ábramutatja.

1.2.2. A f�okomponensek geometriai jelentése

1.2. ábra. A folyamat geometria jelentése: a standardizálás 0 várható érték�uvé és 1 empirikus szórá-súvá teszi a változókat

Abban az esetben, ha például az els�o f�okomponens képes magába s�urítenia meg�gyelési egységek varianciáinak nagy részét, akkor megtehetjük, hogy azegész adatrendszert csak az els�o f�okomponensével helyettesítjük. Ezzel végül isnem követünk el túl nagy hibát, viszont jelent�os mértékben csökkentjük az adat-rendszer dimenziószámát, ezzel adatszámát, és így meggyorsítottuk, megkönnyí-tettük egy soron következ�o eljárás, például a klaszter analízis m�uködését.

Felmerülhet a kérdés, hogy mikor nem használható az els�o f�okomponens ateljes adatrendszer helyettesítésére? Ha a korrelációs mátrix diagonális, vagyis aváltozók korrelálatlanok, akkor biztosan nem. Ebben az esetben minden továbbiszámítás értelmetlen.

Egy másik kézenfekv�o kérdés, hogy ha például a meg�gyelési egységeink mé-rési értékek (pl. digitális képek, �zikai mennyiségek), akkor miért tekintjük �oketvalószín�uségi változóknak. Ennek pusztán az az oka, hogy el�oször a többválto-zós matematikai statisztika használta ezt az eljárást dimenziószám csökkentésre.A probléma leírható algebrai módszerekkel is, és így a valószín�uségi megközelítésmell�ozhet�o.

1.3. A tematikus térkép, mint egy klaszterezési eljáráseredménye

Az el�obbi matematikai okfejtések célja az volt, hogy belássuk, a klaszterképzésrévén megkönnyítjük, el�okészítjük adataink értelmezését, és mindezt olyan esz-közökkel tesszük, amelyeknek tulajdonságait el�ore meg tudjuk mondani, vagyisjóságukat képesek vagyunk min�osíteni.

8

Az adatok osztályozásának hétköznapi módja a térinformatikában a tematikustérkép készítése. Ilyenkor a csoportosítás eredményét tematikus térképen jelenít-jük meg, vagyis a csoportok állapotát szimbolizáló értékeket (�zikai mennyiségek,kategória változók, stb.) valamilyen gra�kus szimbólum vagy stilus (vonaltipus,kitöltési mintázat, szín) formájában mutatjuk meg a térképen. A geoinformatikagyakorlati alkalmazói - statisztikusok, elemz�ok, szociológusok, stb. - jól ismerikaz adatok láttatásának ezt a módját. Az informatikai piacon elérhet�o szoftverek kí-váló tematikus térkép készít�o képességekkel rendelkeznek, de az objektumok többdimenziós leírásából származó nehézségeket általában úgy oldják meg, hogy csakegyetlen változó értékeit jelenítik meg, ami persze dimenziócsökkentés, de egyál-talán nem optimális módon, hiszen az adatrendszer varanciáira nincs tekintettel,önkényesen hagy �gyelmen kívül adatokat. Nyilvánvalóan megbízhatóbb az a cso-portosítás, amely a tematikus felosztást nem egy önkényesen kiragadott adatféle-ség alapján végzi, hanem optimális adatvesztés révén hoz létre egy "szintetikus"adatsort, és ez alapján hozza létre a hagyományos tematikus térképet.

Hasonlítsuk össze a csak egyetlen meg�gyelési egység adataiból származó kü-lönböz�o tematikus csoportosítások eredményét (1.3. és 1.4. ábrák) egy az els�of�okomponensen alapulóval (1.5. ábra).

1.3. ábra. Az állandó népesség területi megoszlását mutató tematikus térkép.

9

1.4. ábra. A településenkénti vendégéjszakák számát mutató tematikus térkép.

1.5. ábra. A települések statisztikai adataiból számított els�o f�okomponens szerinti tematikus térkép.Érdekes, hogy az így kapott tematikus térkép megegyezik a települések jogállását mutató térképpel.

10

1.4. KonklúzióMinden olyan esetben, amikor sokdimenziós adatrendszerrel dolgozunk (bárme-lyik térinformatikai szoftverplatformon), és olyan osztályozásra van szükségünk,amely lehet�oleg minden adatot �gyelembe vesz, olyankor alkalmazzuk a f�okom-ponens analízist. Ennek menete a következ�o:

• jelöljük ki a f�okomonens analízisbe bevonni kívánt adatok körét (oszlopokat)

• exportáljuk a kijelölt adatbázis/tábla részt olyan formátumba, amit a rendel-kezésünkre álló statisztikai szoftverünk képes beolvasni

• Hajtsuk végre a számításokat, tároljuk új oszlopként az els�o f�okomponenst(vagy, ha úgy gondoljuk többet is)

• Importáljuk az els�o f�okomponenssel b�ovített adatbázist

• Készítsünk az adott GIS szoftverre jellemz�o tematikus térképet az els�o f�o-komponens alapján

Amint a f�okomonens analízist ismertet�o részben látható volt, a f�okomonen-sek dimenziótlan számok, emiatt �zikai jelentésük sem nyilvánvaló. Egyes ese-tekben hipotézist állíthatunk fel arra vonatkozóan, hogy az els�o f�okomonens azadatok hátterében meghúzódó valamilyen �zikailag is azonosítható, közös ok vál-tozó. Máskor meg kell elégednünk az els�o f�okomponens variancia tartalmára épül�oel�onyökkel anélkül, hogy azonosítani tudnánk a háttérben lév�o hatókat.

11

Irodalomjegyzék

[1] Iványi A. (szerk) �Informatikai algoritmusok 1-2.�, ELTE Eötvös Kiadó,2005

[2] A. Stein � F. Meer � B. Gorte (edited): Spatial Statistics for Remote Sen-sing, Kluwer Academic Publishers, 1999

[3] I. Elek: �Fast Porosity Estimation by Principal Component Analysis�, GE-OBYTE, june 1990, Tulsa, Oklahoma

[4] I. Elek: �Some Applications of Principal Component Analysis: Well-to-Well Correlation, Zonation�, GEOBYTE, may 1988, Tulsa, Oklahoma

[5] J. F. Richards: �Remote sensing Digital image analysis�, Springer-Verlag,1986, Australia

[6] Vincze István: �Matematikai statisztika�, Tankönyvkiadó, Budapest, 1980

[7] J. Davis: �Statistics and Data Analysis in Geology�, John Wiley & Sons,Inc., 1973

12

2. fejezet

Az automatikus raszter-vektorkonverzió problémája

A tavaly megkezdett kutatás idei eredményeit kívánjuk összefoglalni ebben a feje-zetben. Hangsúlyozni szeretnénk azonban a projekt kutatási jellegét, vagyis el�ofor-dulhat, hogy egyes elképzelések zsákutcába vezetnek és ezért menet közben korri-gálnunk kell �oket. Az is el�ofordulhat továbbá, hogy olyan részproblémához jutunk,amely önálló kutatási témává n�oheti ki magát (pl. a gra�kus tudás reprezentációja).A kutatási projektet IRIS-nek neveztük el, az angol Intelligens Rasterimage Inter-pretation System szavak kezd�obet�ui alapján.

2.1. A fejlesztés vázlatos terveCélunk egy olyan programrendszer létrehozása, amely els�o menetben a hagyomá-nyos képfeldolgozó technikák segítségével automatikus raszter-vektor konverzióraképes. A kutatási projekt vázlatát a 2.1. ábra mutatja.

1. A kutatási projekt els�o fázisában kidolgoznánk azokat az el�ofeldolgozó eljá-rásokat, amelyeknek az alapjait az �urfotók elemzésekor rakták le az el�odeink(mint pl. élmeg�orz�o sz�urési eljárások, alul- és felülvágás, klaszter analízis,f�okomponens analízis, diszkriminancia analízis, stb). Ezen eljárásoknak ajelent�osége abban van, hogy segitségükkel a térkép gra�kus tartalma letisz-tultabbá tehet�o, bel�ole könnyebben kiemelhet�ok a számunkra érdekes részek.A tipizálás, mint olyan, az összetett halmazokat igyekszik egyszer�ubb össze-tev�okre bontani, de úgy is fogalmazhatnánk, hogy a struktúrálatlan adattö-megb�ol egyre struktúráltabb részhalmazokat hoz létre.Várható futamid�o: 1.5 év

2. A kutatási projekt második fázisában kidolgoznánk egy olyan �tudásbázist�,amely a gépi intelligencia alaptudása, vele született ismeretanyaga lenne. Ezközelebbr�ol azt jelenti, hogy de�niálni kell azokat a gra�kus �szituációkat�,

13

2.1. ábra. Az IRIS projekt fejlesztési vázlata.

amik egy térképen el�ofordulhatnak. Nyilvánvaló, hogy ennek a tudásbázis-nak a min�oségén fog múlni a jövend�o szoftver vektorizáló képessége. Felté-telezhet�o például, hogy egészen más tudásbázist kell létrehoznunk a földmé-rési alaptérkép vektorizálásához, vagy egy egyesített közm�utérkép automa-tikus digitalizáláshoz, mint egy topográ�ai térképhez. S�ot biztosra vehet�o,hogy ez a tudásbázis országonként (vagy akár iskolánként) más és más lehet.Ennek pontos mibenlétét a projekt során kellene tisztázni.Várható futamid�o: 1.5 év

3. A projekt harmadik fázisában dolgoznánk ki azokat az eljárásokat, amelyekaz AI kutatások legfrissebb eredményei alapján a gra�kus szituációk felis-merését végeznék. Ezek volnának a technológia legbonyolultabb részei, mi-vel az egyszer�u vonalkövetést is magába foglaló algoritmusoktól, a bonyo-lult alakfelismerési procedurákig mindent magukba kell, hogy integráljanak,vagyis át kell vegyék az intelligens ember térképolvasási képességeit. Ez ígytalán illuzórikusan hathat, pedig ha ki tudjuk dolgozni a térképi tudás repre-zentációjának megfelel�o módját, akkor lehetséges egy valóban intelligenstérkép vektorizáló rendszer kidolgozása.Várható futamid�o: 2 év

4. A projekt utolsó és egyben legkritikusabb része a negyedik fázis, ami azt cé-

14

lozná, hogy olyan eseteket is képes legyen kezelni a rendszerünk, amivel ed-dig nem találkozott, vagyis képes legyen az önálló tanulásra. Azért nevezemkritikusnak, mert itt látható el�ore a legkevésbé a kutatás kimenetele. Míg azel�oz�o három stáció kimenetele nagyjából el�ore belátható, jó min�oség�u m�ukö-dése viszonylagos biztonsággal prognosztizálható. Ez sajnos erre a fázisranem mondható el. Valószín�usíthet�o, hogy ennek a stációnak kevésbé gya-korlati, mint inkább elméleti eredményei várhatók. Ett�ol természetesen nemtartjuk kevésbé fontosnak jelen fázist, hiszen, ha elméletileg sikerül alátá-masztani egy tanuló rendszert, akkor az el�obb utóbb megvalósíthatóvá válik.Várható futamid�o: 2 év

2.2. Az IRIS rendszerEbben a részben összefoglaljuk a szükségesnek vélt alapelveket és részfeladatokat.A jelenlegi helyzeteben még számos kérdés nem tisztázott, így a tervezet semegyenszilárdságú. Egyes részei már jobban ismertek (pl. digitális sz�urések, atavalyi jelentésben is írtunk róluk), másokról csak kezdeti elképzeléseink vannak(pl. tudásbázis).

A gondolkodásunk a következ�o logika szerint történik:

• Áttekintettük a térképet olvasó ember tevékenységeit, és arra megállapításrajutottunk, hogy a látás során el�oször nagyobb területeket tekintünk át, mint-egy felmérjük a térképen meg�gyelhet�o legnagyobb felületeket. Ezek a na-gyobb objektumok már eleve orientálnak minket, hogy milyen f�obb objek-tumcsoportok várhatók.

• A következ�okben már ezeken a nagyobb egységeken belül tárjuk fel az ob-jektumokat, de ezek a m�uveletek is felületi elemek felismerését jelentik. Afelületszer�u elemek feltárása egyben megadja a térkép drótvázát, hiszen min-den, ami a felületek között marad, az vonalszer�u elem.

• Itt véget is ér a feldolgozásnak az a szintje, ami a geometria egyszer�u meg-állapítására épül. A továbbiakban létre kell hozni egy olyan �tudásbázist�,amely az elképzelhet�o összes gra�kus szituációt tipizálva tartalmazza. Szá-mos olyan térképészeti konvenció létezik, amely évtizedek alatt fejl�odött ki,és speciális ábrázolási elemként van jelen a térképen (számos jelkulcsi elem,szimbólumok, stb.) Ezek geometria alapon történ�o értelmezése helyteleneredményre vezetne. Ha helyesen akarjuk értelmezni e speciális objektum-csoportokat a térképen, akkor ezeket, mint lehetséges realizációkat kell tárol-nunk a tudásbázisban. A valóságos helyzet és a tudásbázisbeli etalon hely-zetek egymáshoz hasonlításával kell megfejtenünk a térképi szituációkat.

15

2.2.1. Processzek, work�owk, pluginekNevezzük ezen elemi eljárásokat processzeknek. A bemutatott példák alapján ké-zenfekv�oen adódik a következtetés: hozzunk létre egy olyan eljárás, processz ar-zenált, könyvtárat, amelyb�ol tetsz�oleges feldolgozási folyamatok, work�ow-k ál-líthatók össze. Ez azt jelenti, hogy ugyanazon processztárból teljesen különböz�owork�ow-k is összeállíthatók. Ez nemcsak azért jó, mert rugalmas, hanem mert aszoftvert használó egyén szakértelme is képes befolyásolni a folyamatokat, vagyisa szoftver nemcsak önmagától okos, hanem a használója tapasztalatait is magábaolvasztja. Egy-egy jól sikerült work�ow elmenthet�o lesz valamilyen néven, és ké-s�obb is felhasználható lesz, esetleg nemcsak a kitalálója számára. Tervezünk u.n.plugin készítési lehet�oséget is, amivel küls�o programok is beiktathatók az IRISrendszer eljárásai közé.

1. A rendszert a fenti említett work�ow logikájúnak képzeljük el képzelünk el(2.2. ábra).

2.2. ábra. Egy work�ow összeállítása elemi processzekb�ol.

Ez nemcsak azért jó, mert rugalmas, hanem mert a használó egyén szakér-telme is képes befolyásolni a folyamatokat, vagyis a szoftver nem önmagátólokos, hanem a használója ruházza fel �ésszel�, saját tapasztalataival. Egy-egy jól sikerült work�ow elmenthet�o lesz valamilyen néven, és kés�obb isfelhasználható lesz, esetleg nemcsak a kitalálója számára. (2.3. ábra).

2. Tervezünk u.n. plugin készítési lehet�oséget is, amivel küls�o eljárások is be-iktathatók az IRIS rendszer eljárásai közé. Ezzel biztosítható a rendszer to-vábbfejlesztése a programozni tudó felhasználók által. A programozni nemtudó felhasználó csak a rendelkezésre álló processzek közül választva állít-hat össze tetsz�oleges work�owkat. Ez is adhat elég jelent�os szabadságot aképfeldolgozás számára.

3. Elemi folyamatok, processzek. Nézzünk néhány elemi folyamatot.

• Bitmap fájl betöltése képvezérl�obe, kép megmutatása és mozgatása• Kép mentése fájlba (SaveAs)

16

2.3. ábra. Az IRIS kisérleti rendszerének work�ow assembler tooljával összeállított work�ow. Kö-zépen láthatók az elérhet�o processzeket szimbolizáló ikonok, míg az ábra bal alsó részében lév�oeszközsorban az összeállított work�ow és összetev�oi.

• Bitmap tartalmának betöltése egy n × m-es mátrixba, tömbbe (GetBit-mapPixels)

• Egy n × m-es mátrix betöltése egy bitmapba (SetBitmapPixels)• Képkivonás: a work�ow valamelyik fázisának eredményét kivonjuk

(vagy hozzáadjuk) egy másik fázis eredményéb�ol• Színkivonás: valamely szín�u pixelek kivonása a képb�ol, és színük átál-

lítása a környezet színére• Egy adott szín átde�niálása egy másik színre

A különböz�o processzek kombinációiból összeállított work�ow-k segitségé-vel elvégezhet�ok azok az el�ofeldolgozó eljárások, amelykre végül ráenged-hetjük a nyers vektorizáló algoritmusokat. Ezen fejlesztési fázis célja teháta processz könyvtár, és a tetsz�oleges work�ow-k összeállítására alkalmasszoftverkomponensek létrehozása.

2.2.2. El�ofeldolgozó eljárásokEzen eljárások kidolgozása az IRIS keretrendszer megírását jelenti, valamint olyangyakorta használt szoftverkomponensek elkészítését, amelyek várhatóan mindenfejlesztési fázisban szükségesek lesznek.

17

A kutatási projekt els�o fázisában kidolgoznánk azokat az el�ofeldolgozó eljárá-sokat, amelyeknek az alapjait az �urfotók elemzésekor rakták le az el�odeink (mintpl. élmegörz�o sz�urési eljárások, Median és Laplace sz�ur�ok, alul- és felülvágás,cluster analízis, f�okomponens analízis, diszkriminancia analízis, stb). Ezen eljá-rásoknak a jelent�osége abban van, hogy segitségükkel a térkép gra�kus tartalmaletisztultabbá tehet�o, bel�ole könnyebben kiemelhet�ok a számunkra érdekes részek.A letisztultabb képekb�ol már könnyebb homogén területeket, kvázi tipizált felüle-teket létrehozni. A tipizálás, mint olyan, az összetett halmazokat igyekszik egy-szer�ubb összetev�okre bontani, de úgy is fogalmazhatnánk, hogy a struktúrálatlanadattömegb�ol egyre struktúráltabb részhalmazokat hoz létre. Ezen az el�ofeldolgo-zott képen már m�uködtethet�ok a vektorizáló algoritmusok, de az eredmények csakels�o közelítésnek tekinthet�ok. Lássunk el�oször, hogy milyen a nyers szkennelt tér-kép (2.4. ábra, 24 bit color depth):

2.4. ábra. Egy 24 bites színmélységben szkennel, de papír nyersanyagon csak 6 színb�ol álló térképeredeti, még sz�uretlen állapotban.

Sz�urési eljárások

A következ�okben áttekintjük a lehetséges sz�urési eljárásokat, de csak a képre gya-korolt hatásukat. M�uködési elveik megtalálhatók számos szakkönyvben (pl. [1],[3]). A bemutatandó sz�urések inkább csak ízelit�oül szolgálnak, de semmiképpensem tekintend�ok az IRIS rendszerbe beépítend�o összes sz�ur�o eljárás számbavételé-nek. Számuk feltételezhet�oen b�ovülni fog a munkák el�orehaladtával. A bemutatott

18

2.5. ábra. Az alulvágó sz�urés eredménye.

és a jöv�oben elkészítend�o eljárások kombinációjával e hatások kombinálhatók, amiegyben azt is jelenti, hogy szinte tetsz�oleges hatást érhetünk el a képek átalakításá-ban.

Alulvágó sz�ur�o. Az alulvágó sz�urés eredménye a 2.5. ábrán látható. A nyersképre alkalmazva lavágta az alcsonyfrekvenciás komponenseket, és kiemelte anagyfrekvenciát. Ezzel hangsúlyozta azokat a képrészeket, ahol szín vagy intenzi-tás változás van.

Laplace sz�ur�o. A Laplace sz�urés eredménye a 2.6. ábrán látható. Ez a sz�ur�o egybevált élkiemel�o sz�ur�o, amely minden homogén intenzitású, szín�u területet feke-tévé tesz, és minden változó helyet kiemel, vagyis az éleket hangsúlyozza a képen.Csoportképz�o eljárásokkal kombinálva (cluster), vagy csak el�ore de�niált számúszint megengedve a kép két állapotúvá tehet�o (fekete vagy fehér a két állapot),amely már alkalmas felületi elemek felépítésére, mivel az azonos állapotú (fekete)pixelekb�ol konstruáljuk meg a poligonokat. Az éleken lév�o pixelek, tekintettel másszinükre (fehér), nem kerülnek a fekete poligonokba. Az �egész világ�-ból kivonvaa poligonokat megkapjuk a vonalas elemeket.

Rank sz�ur�o. A rank sz�urés eredménye a 2.7. ábrán látható. A rank sz�ur�ok in-tenzitás szerint sorbarendezett kernelb�ol választják ki a sz�urés eredményeképpen

19

2.6. ábra. A Laplace sz�urés eredménye.

el�oálló színt, ebb�ol következ�oen eleve simitó hatásúak, miközben az éleket meg-örzik. Egy speciális fajtájuk a medián sz�ur�o, amely az intenzitás szerint középs�oelemet tekinti a sz�urés ereményének. Csoportképz�o eljárásokkal kombinálva (clus-ter), vagy csak el�ore de�niált számú szint megengedve, a kép sokkal letisztultabbátehet�o. Vékony vonalakat, kisebb pontokat egyszer�uen eltüntet a képr�ol, vagyis al-kalmas a kép nagy egységekre történ�o bontására. Egy-egy homogén egység azonosállapotú pixeleinek összevonásával felületi elemek, vagyis poligonok építhet�ok föl.

Tompító sz�ur�o. A tompító sz�urés eredménye a 2.8. ábrán látható. A tompítósz�ur�o nevéhez híven er�oteljes �lebutítást� hajt végre a képen. Több hasonló színtösszevon, ezáltal kiemeli a nagy szín egységeket. Önmagában nem, de más pro-cesszek eredményeivel kombinálva igen el�onyös élkiemel�o és felület hagsúlyozószerepe lehet.

Képkivonás. A képkivonás eredménye a 2.9. ábrán látható. A képkivonás egyolyan sz�urés, amikor az azonos területet lefed�o, de különböz�o képeket kivonjukegymásból. Ennek egy speciális esete, amikor egy adott képet egy pixellel eltolva,kivonunk önmagából. Jelen esetben egy már sz�urt képre, a tompító sz�urés eredmé-nyére alkalmaztuk a képkivonási eljárást. A hatása a kép drámai skeletonizációja.Világosabb vonalakra és sötét felületekre esett szét, ami a számunkra kívánatoseredmény.

20

2.7. ábra. A rank sz�urés eredménye.

2.8. ábra. A tompító sz�ur�o eredménye.

21

2.9. ábra. A képkivonás eredménye.

Egyéb képmanipuláló eljárások

A sz�urési eljárásokon kívül szükség van olyan eljárásokra is, amik a képek automa-tikus manipulálását végzik, de mégsem esnek a digitális sz�ur�ok hatáskörébe. Ezeka következ�ok:

Automatikus színszám megállapítás. Ez az eljárás arra hivatott, hogy meg-mondja hány színb�ol áll a térkép. A szkennelés 24 bites nmélységben történik,viszont a térkép nyilvánvalóan nem 24 bites színmélységben készült, hanem 4, 6vagy 8 színben. A eljárás eredménye egy olyan 24 bites színmélység�u kép, amely-ben csak 4,6 vagy 8 nyolc színérték van jelen.

Színszám megadása. Ez az eljárás a 24 bites képet átalakítja egy el�ore megadottszámú színt tartalmazó képpé, de a 24 bites színmélységet megtartja. Ha tetszik ezolyan osztályozó eljárás, ahol megadjuk az osztályok számát, valamint az egy-egyszínhez, tartozó, vagyis az osztályba sorolást de�niáló szín intervallumokat. Ezzelkil�ojük a szkenneléssel belevitt többlet színeket.

Klaszterez�o. Hasznos lehet egy klaszterez�o eljárás, amely valamilyen szempontszerint osztályozza szkennelt képet. Alkalmas lehet arra, hogy minden el�ozetesismeret nélkül meghatározzuk a szkennelt térképen lév�o színek számát.

22

2.10. ábra. Alapszínenkénti cross-plottok.

Kontraszt fokozás. Egyszer�u, színenkénti (RGB)) hisztogram kiegyenlítésenalapuló kontrasztnövel�o eljárás.

Szín átde�niálás. Ezzel az eljárással egy a képen látható színt egy másikkal he-lyettesítünk.

Képösszegz�o. Ez az eljárás tetsz�oleges számú n × m-es képet összead (átlagol).Ezzel több képmanipulációs eljárás eredménye válik kombinálhatóvá. (A m�uveletlehet kivonás is.)

Interaktív képeditor. Ezzel az eljárással kézzel is beavatkozhatunk a kép tar-talmába. Legfeljebb egy-egy pixel átírása jöhet csak szóba, mert rajzoló programfunkciókra lehet szükségünk.

Szín szerinti vágó. Valamilyen szín, színintervallum eltüntetése a képr�ol.

Színhelyettesítés. A szín szerinti vágó által felszabadított területek kitöltése akörnyez�o pixelek színével.

Hough-transzformáció. Ez egy olyan algoritmus, ami az egyenes vonalakat fel-ismeri (fokhálózat). Ezek kisz�urése kívánatos. Ha az így kapott pixeleket valamelyspeciális szinre átírjuk, akkor például a színhelyettesít�o eljárással eltüntethetjük atérképr�ol.

Vonalvastagság megadása. A képek különböz�o felbontása miatt szükséges leheta vonalvastagság pixelekben történ�o megadására.

Interaktív színosztályozás. Úgy gondolom, hogy hasznos lehet egy olyan eljá-rás, amely a cross-plot technika segítségével gra�kusan megjeleníti a különböz�oszíneket, és így felismerhetünk olyan osztályokat is, amelyekre eddig nem jöttünkrá (2.10. ábra).

23

2.11. ábra. Egy poligonrészlet és a poligont alkotó nodeok.

2.2.3. Nyers vektorizáló eljárásokA kutatási projekt második fázisát az els�o fázis eredményeire építjük. Támasz-kodni fogunk a a jól el�ofeldolgozott szkennel képekre, amelyek ugyan még raszte-resek, de teljes mértékben vektorosnak látszanak. Csoportképz�o eljárásokkal kom-binálva (cluster), vagy csak el�ore de�niált számú szint megengedve a képeket márteljesen letisztítottuk. Az azonos állapotú pixelekb�ol konstruáljuk meg a poligono-kat oly módon, hogy az azonos szín�u vagy intenzitású pixeleket összevonjuk egypoligonná. Az összevonást mindaddig végezzük, amíg eltér�o szín�u pixel nem kö-vetkezik, mint például az éleken lév�o pixelek. Tekintettel más szinükre, ezek nemkerülnek a poligonokba. Az azonos állapotú, de diszjunkt pixelek külön poligonbakerülnek Tekintsük "egész világnak" a teljes térkép lapot. Ez azért fontos, mert ateret ezen lap mérete de�niálja. A poligonok ebben a térben (síkban) léteznek. Azindividuális poligonok között fennmaradó tér de�niálja a térképen látható vonala-kat, amik szintén poligon természet�uek lesznek.

A szkennelés felbontásától függ�oen el�ofordulhat, hogy igen sok pixelb�ol kellfelépíteni egy-egy poligont. A vektoros adatmodell szerint a poligonokat node-ok (csomópontok, vertexek) sorozata építi fel, amiket úgy kell megállapítanunk,hogy a legjobban illeszkedjenek a pixelekb�ol felépített alakzathoz. A legjobb il-leszkedést az jelentené, ha minden, az alakzat szélen lév�o pixel egyben node islenne. Ezzel azonban az a probléma, hogy feleslegesen sok node-ot hoznánk létre.Inkább a görbületi sugártól tegyük függ�ové, hogy mikor, hány node létrehozásátengedjük meg. Ezt látjuk a 2.11 ábrán.

A görbületi sugár megadásával optimalizálhatjuk a homogén pixelek által kije-lölt területek vektoros leírásának pontszámát, és pontosságát.

Az így kapott vektoros ábrák már igen jól leírják a térkép által lefedett terü-letet, bár még mindig számos probléma �gyelhet�o meg a vektorizált állományon.Mivel a térkép számos olyan jelenséget is tartalmaz, amely nem az objektumokgeometriai elhelyezkedésére jellemz�o, hanem valami mást jelöl (mint pl. temati-kus szimbólumok, jelkulcsi elemek, ábrázolási konvenciók, stb.). Ezek az eddigimódon nem kezelhet�ok, mert ábrázolásukhoz "értelmezni" kellene a jelentésüket.Erre a digitális sz�urési eljárások nem alkalmasak.

24

Vektoros manipuláló eljárások

• A vektorizálás alapelve a poligonképzés. Minden felület, semmi nem vonal.Csak kés�obb lesz vonal az extrém vékony poligonokból.

vonalak = egesz vilag − f eluletek.

• Az azonos optikai állapotú (szín�u), érintkez�o, vagyis szomszédos felülete-lemek egyesítése egy poligonná. Az azonos állapotú, de diszjunk pixelekkülön poligonba kerülnek.

• A görbületi sugár �gyelése, és ez alapján node ritkitás. Enélkül is már vek-toros lehet a térkép, de sok a redundáns node.

Pixel egyesítés, poligon növesztés. Az eljárás az azonos szín�u pixelek összevo-nását végezné, ezáltal egyre nagyobb poligonok jönnének létre. Diszjunkt poligo-nok azonban különálló poligonokba fognak leképezni. Legalább annyi poligonakkell lenni, ahány szín�u a térkép. Nyilván ennél azért több lesz, mert nem valószín�u,hogy minden azonos szín�u poligon összatartozik. Kérdés, hogy a poligonokat min-den új pixel hozzáadásakor updateteljük, vagy csak jelüljük meg az összetartozást,és a folyamat végén végezzük a tényleges poligonépítést. Ha a végére marad azegyesítése folyamat, akkor jelezni kell azt is, hogy egy pixel bels�o vagy széls�opont.

Vonal kezelés. Mivel azt mondtuk, hogy minden poligon, ezért a vonalak is poli-gonként fognak megjelenni. Jó lenne azonban észrevenni, hogy egy poligon olyanvékony, hogy vonalat kell jelentsen. Ezért szükséges el�ore megadni a lehetségesvonalvastagságokat színekre vonatkozóan is. Nem vonal lesz ugyanis az a poligon,aminek vastagsága meghaladja az adott színhez tartozó vonalvastagságot.

Poligon egyesítés a vonalak �gyelembe vételével. Az olyan poligonokat, ame-lyek azonos színüek, de vonal választja el �oket, tekinthetjük összetartozónak. Le-gyünk képesek ezek egyesítésére. Poligonok lesznek a jelkulcsi elemek is, amik-nek egyébként semmi közük a valódi poligonokhoz. Ezek kisz�urése csak a tudás-bázis segítségével lehetséges.

2.2.4. Térképi tudásbázis kidolgozásaCsak el�ozetes ismeretek alapján ismerhet�o fel, hogy egy jelkulcsi elem mit szim-bolizál, vagy egy-egy tematikus szimbólum mit jelent. Ennek a problémának amegoldását t�uzte ki célul a projekt harmadik kutatási fázisa. Ehhez létre kell hoz-nunk egy térképi tudásbázist, amely tartalmazza a térképészeti konvenciókat, azelképzelhet�o szituációkat, vonaltalálkozásokat, szabványos jelkulcsokat, stb. Nyil-vánvaló, hogy ennek a tudásbázisnak a min�oségén fog múlni a jövend�o szoftver

25

2.12. ábra. Egy térkép a Dunakanyar egy részletér�ol.

vektorizáló képessége, mivel a nyers vektorizálási eredmények �nomítását fog-juk ez alapján végezni. Feltételezhet�o például, hogy egészen más tudásbázist kelllétrehoznunk a földmérési alaptérkép vektorizálásához, vagy egy egyesített köz-m�utérkép automatikus digitalizáláshoz, mint egy topográ�ai térképhez, vagy egyLANDSAT m�uhold képéhez. S�ot biztosra vehet�o, hogy ez a tudásbázis országon-ként (vagy akár iskolánként) más és más lehet. Ennek pontos mibenléte még tisztá-zandó. Az biztos, hogy a három kutatási fázis, amely egyben a feldolgozás háromf�o fázisa is, az intelligens ember térképolvasási képességeit hivatott szimulálni.

A tudásbázis felépítése kulcskérdés, mert struktúrája, bels�o kapcsolatai fogjákmegszabni, hogy mennyire hatékonyan fogunk tudni benne keresni. Az egyik f�ostruktúrális eleme a geometria � gra�kus szituáció megfeleltetés. Ez annyit jelent,hogy a térképen látható objektumok (a gra�kus szituációs) nem mindig a valóságosobjektumok geometriailag arányos leképezései. Világítsuk ezt meg egy példával(2.12. ábra).

A térképen láthatunk három jelet, amely az útszámokat mutatja. A valóságbanez nincs ott az úton, szeepe csak annyi, hogy jelezze az utak számát, vagyis a gra-�kus objektumnak, ami alatta van, egy attributum adatát mutatja. Ezt fel kell tudniismerni, mivel ez egy jelkulcsi elem, és az alatt lév�o vonaldarabbal kell helyette-síteni a vektorizált ábrán. Nagy kérdés, hogy értelmezzük-e az ilyen és hasonlóattributum adatokat, és letegyük-e értéküket egy adatbázisba. Elvben hasznos le-het, hiszen kiválthatja a szintén fáradságos adatbeviteli munka egy részét.

Hasonlóan összetett probléma, hogy a térképen nagyon sokszor jogi vonalak isvannak, amelyek a földfelszinen nem láthatók (megyehatár, külterület határ, nem-zeti park határa, kistérség határa, stb). Számos esetben el�ofordul, hogy ezek avonalak együtt haladnak, mert éppen a megyehatáron fut a nemzeti park határa ésa kistérség határa is. Ilyen esetekben a nyomtatott papirtérkép olvashatatlanul zsu-folt lenne, ha az összes vonal látszana, ezért bizonyos szabályok szerint elhagyunka vonalak közül néhányat. Egy térképet olvasni tudó ember felismeri, és értelmezi

26

az ilyen eseteket, vagyis rájön, hogy itt töb vonal fut egymáson. Ebb�ol követke-zik, hogy csak akkor fogjuk megfelel�on felépíteni a térképen ábrázolt vagy kódoltpoligonstruktúrát, ha a programunk képes lesz �értelmezni� az adott helyzezet. Azértelmezés alapja a beépített tudás lesz, amit a tudásbázis tárol.

Ez eddig teljesen világos. A tudábázis bels�o szerkezete, bels�o kapcsolatai alap-vet�o fontosságuak a tudás tárolása, és a keresés hatékonysága szempontjából. Atipikus, tárolandó szituációk ábrázolásának elemeit jelenlegi véleményünk szerintsem hierarchikus sem relációs adatbázisban nem célszer�u tárolni. A megoldást akomplex hálózatok Barabási-Albert-féle skálafüggetlen modelljével leírható mó-don keressük, de egyel�ore olyan a nagy a bizonytalanság ezen a téren, hogy csakfeltételezzük, hogy a megoldást itt kell keresni. Remélhet�oleg a projekt során sike-rül kidolgoznunk olyan hatékony keres�o algoritmusokat, amelyek valóban megta-lálják a geometria és a gra�kus szituáció kapcsolatát leíró tudás-elemet, ha tetszikrekordot.

Tudábázis létrehozása

A típus adatbázis, vagy tudásbázis létrehozása nélkül a vektorizálás egy bizonyosmin�oségi kritérium fölött lehetetlen. A jelkulcsi geometria elemek felismerésealapvet�oen fontos, ezért ezek tárolása a gra�kus elemtípusok között nagyon fon-tos. A gra�kus elemtípusok ismerete azért fontos, mert a poligonok küzük ki kellsz�urnünk a nem valódi poligonokat, mint például a jelkulcsi elemek.

A tudábázis másik összetev�oje a térképen el�oforduló gra�kus szituációk, a le-hetséges vonaltalálkozások, az ún. archetipusok tárolása. Ezek segítségével gon-doljuk felismerni a nem intelligens algoritmusok eredményeként létrejött poligo-nokból a valósághoz közelebb álló térképi szituációk felismerését, és ennek meg-felel�on a helyzethez illeszked�o valóságos szituáció felismerését.

Az elképzelhet�o szituációk nagymértékben függnek az adott térképm�u termé-szetét�ol (pl. kataszteri térkép, topográ�ai térkép), de függhetnek nemzeti térkép-szeti szabványoktól is. Ez utóbbival egyel�ore nem foglalkozunk. A tudásbázistel�oször a kazaszteri térképekre majd a topográ�ai térképekre fogjuk felépíteni.

Összehasonlító algoritmusok kidolgozása

A tipus adatbázis elemeit össze kell hasonlítani a térképen lév�o gra�kus helyzettek,és ez alapján meg kell tudnunk keresni a térképi helyzethez legjobban hasonlítóarchetipust.

Poligonok korrekciója az elemtípusokkal

A nyers poligonegyesítés után a poligonokat korrigálni kell a felismert helyzet-nek megfelel�oen. Így számos poligon törlése várható, vagy esetleg több poligonösszevonása, kettévágása, stb.

27

2.13. ábra. A projekt el�orehaladásának vázlata.

2.2.5. Szoftver prototípus kidolgozásaA fejlesztés utolsó fázisa a kidolgozott technológia szoftveres megvalósítása. Amunkák során az ISO 9001-nek megfelel�on kidolgozzuk az egész fejlesztés mi-n�oségügyi kézikönyvét, amely alapján fogjuk végezni a szoftver fejlesztését. Aszoftverfejlesztés magában foglalja a fejlesztés különböz�o természet�u részfelada-tait. Egyrészt az egyes eljárások kidolgozásakor el�oállítandó kísérleti fejlesztéseketjelenti, amelyek helyességét csak önmagukban vizsgáljuk, hiszen céljuk egy-egyprocess kidolgozása. Másrészt viszont lesznek olyan részfeladatok, amelyek azegyes szoftverkomponensek helyes együttm�uködését hivatottak biztosítani.

Végezetül ki kell jelenteni, hogy a projekt végeredménye egy szoftver proto-típus lesz, amely még nem feltétlenül alkalmas piaci bevezetésre. El�ofordulhat,hogy sikerül olyan min�oségben kidolgozni, hogy azonnal alkalmas lesz piaci ter-mékként való megjelenésre, de sajnos nem zárható ki az sem, hogy a projekt soránolyan, még elméletileg sem megoldott problémába botlunk (pl. a Barabási-féleskálafüggetlen hálózati modell alkalmazása), amely meggátolja a piacra dobható-ságot.

2.2.6. A projekt tervezett el�orehaladásaA projekt teljes futamideje három év. Ez alatt az id�o alatt ki kell gondolnunk és megkell valósítanunk a már létez�o, vagy ezután létrehozandó el�ofeldolgozó eljárásokat,mint processzeket, továbbá ki kell dolgozni az el�ofeldolgozott képek vektorizálá-sának algoritmusait, valamint létre kell hoznunk a tudásbázist, és a keres�o motort.Mindezek �gyelembe vételével létre kell hoznunk egy olyan programot, amelymindezen folyamatokat képes magas min�oségben végrehajtani. A 2.13. ábra aprojekt el�orehaladását mutatja az id�oben.

28

2.3. A képi tudás digitális reprezentációja (probléma fel-vetés)

Ez az írás nem cikk, hanem egy felvetés gy�ujtemény, amelyben intuiciók, ötle-tek, meg nem alapozott elképzelések vannak összegy�ujtve. A végcél egy olyaneljárás kidolgozása, amely raszteres állományokból (szkennelt térképek, �urfotók,légifényképek, hétköznapi digitális fényképek) képes vektoros állományokat ké-szíteni. A raszter-vektor konverzióhoz számos el�ofeldolgozó eljárás (éldetektálás,szegmentálás, poligonizálás, stb.) végrehajtása után egy a kapott képet értelmez�o,tudásalapú rendszer is szükséges. Ennek a háttértudás-bázisnak az alapelveit fog-lalom össze a következ�okben.

El�oször próbáljuk meg tisztázni, hogy mi az ismeret/tudás, csak úgy egyáltalánnem precízen megfogalmazva.

• az els�o lépés az ismeret, mint olyan tulajdonságainak és törvényszer�uségei-nek megállapítása

• mi az elemi ismeret?

• de�niálni kellene a �tudás fáját� (2.14. ábra), és megállapítani bejárásánakaz emberi gondolkodáshoz hasonlatos módját

• hol lépünk be a tudás fájába, a tudásbázisba? Nyilvánvaló, hogy az a pont alegalapvet�obb belépési pont. Itt nincs semmiféle apriori ismeretünk. Mi vanakkor, ha már vannak el�ozetes ismereteink? Ilyenkor magasabb pontokbanlépünk be a fába (el�oítéletek)

• el�oítéletes döntések, amik lerövidítik az utat a belépést�ol az ismeret megta-lálásáig

• beléphetünk bárhol a fába?

• van-e értelme ismeret-algebráról beszélni? legyen a és b két független/önállóismeret. Mi lehet a c = a + b ismeret?

• Egyáltalán mi az, hogy önálló/független ismeret. (pl. a = �A labda kerek�,b = �Az ég kék�. Ezek egymástól függetlennek látszanak. Az összegükmellérendelt viszonyt mutat.)

• a pont a semmit tudás szintje (2.14. ábra.)

• van-e értelme beszélni az D[a, f ] távolságról? Igen, de van-e értelme be-szélni az D[u, f ] távolságról? (Nem tudom.). Az euklideszi távolság szerintu és f pontok közel vannak egymáshoz, de jó távolságde�nició-e az eukli-deszi távolság a mi esetünkben?

29

2.14. ábra. A tudás fája

• átléphetünk-e egyik ágról a másikra? Segítheti-e az egyik ágon lév�o ismereta másik ágon lév�ot (pl. analógiák)? Lehet, hogy az analógiák egymáshozeuklideszi értelemben közel vannak?

• A jó távolságde�nició az ágak mentén értelmezhet�o, vagyis D[b, f ] >

D[c, e], és D[b, u] > D[x, z]

• van-e értelme tudásszintekr�ol beszélni, amelyet a hirarchiában elfoglalt po-zíció mutatna? (kezd�o szint, aki az a pont szintjén van, haladó, aki a hie-rarchiában a c vagy az x pont felett van, szakért�o, aki z vagy az e szintenvan.)

• az ágak mentén haladva mit jelent, ha például a d pontban vagyunk? Ezazt jelenti, hogy egy adott ismerethalmazban vagyunk valahol. Nevezzükkontextusnak azt, ha valamelyik ágon valahol vagyunk. (Legyen például avilág az a pont. A megismerés a szaktudományok által lehetséges. Ha a bpont négyfelé ágazik, akkor az egyes ágak lehetnek például �zika, kémia,biológia, geológia. Az egyes fogalomkörök tovább ágaztathatók. Pl, �zika:mechanika, atom�zika, termodinamika, stb). Ilyen értelemben tehát a kon-textus fogalma értelmezhet�o.

2.3.1. Alapfogalmak és kérdések• Mi az ismeret: egy kijelentés valamir�ol, egy állítás (�Az ég kék.� vagy �A

labda gömb alakú�. Ezek a kiejelentések feltételezik, hogy el�oismeretkénttudjuk, hogy mi az ég, mi a kék, a gömb, az alak, stb.)

• mi a viszonya egymáshoz két ismeretnek?

30

• milyen m�uveletek de�niálhatók az elemi ismeretek között?

• De�niálni kellene az ismeret elemi entitásait, az atomokat. Legyen az atomolyan ismeret, ami nem vezethet�o vissza más atomokra, kontextusbeli isme-retekre.

• Ha sikerül de�niálni az ismeretek közötti m�uveleteket, akkor legyen az is-meret más ismeretek összege. A más ismeret lehet atom is. Legyen példáula és b atomi ismeret. De�niáljuk a c tudást a és b összegeként: c = a + begyazon kontextuson belül.

• Lehet-e, értelmes-e a tudásra térelméleti fogalmakat használni, mint pl.összeg, távolság, háromszög egyenl�otlenség, mérték, stb.?

• De�niáljuk a kontextus fogalmát, amelyet összefüggésbe hozhatunk a tudásfájában elfoglalt pozícióval. Legyen a K(c) kontextus, amely a tudás fájánaka c jel�u vertex feletti rendszerét jelenti (2.15. ábra). A kontextusban lév�otudást az atomjainak az összege jelenti. Legyen K kontextus ai atomokkal.Legyen a K-ban lév�o tudás k j =

∑i ai.

• Mikor jön létre új ismeret? Ha létrejön egy új atom (egy meglév�o kontextus-ban), vagy létrejön egy új kontextus bármilyen atomokkal. (A kontextusoklehetnek egymást átfed�ok, nem szükséges diszjunktaknak lenniük.)

Vegyünk egy egyszer�u példát. Milyen elemekb�ol áll egy térkép?pontok: P1, P2, . . . Pnvonalak: L1(P1, P2), L2(P3, P4), . . . Li(Pn, Pm)poligonok: Pg1(L1, L2, . . . L j), Pg2, · · · Pgkfelület (Pg1, Pg2, . . . Pgn)Ebben a példában a pontok képviselik az atomi min�oséget a vonal kontextus-

ban. A poligonok atomjai a vonalak, a felület atomjai a poligonok.

2.3.2. Három gyakorlati példa1. Földhivatal

A földügy elemei a telkek, épületek (poligonok). Jó lenne, ha ezeket te-kinthetnénk atomoknak (más kontextusban persze �ok nem atomok). Hozzuklétre a Földügy nev�u kontextust. Ennek atomjai legyenek a telkek és az épü-letek, vagyis az atom, mint olyan ne abszolút értelemben legyen használatos,hanem értelmezzük az atomokat kontextuson belül. Ebb�ol következik, hogyegy adott kontextus atomjai lehetnek egy másik kontextus ismeretei, vagyisa tudás gráf levelei kontextustól függ�oen tartalmaznak ismereteket (levelek)vagy további elágazásokat.Valószínüleg nincs abszolút ismeret és nincsenek abszolút atomok sem. Az,hogy mi atom és mi nem, kontextusfügg�o. Minden bizonnyal minden kon-textusnak megvannak a maga atomjai, amik viszont egy másik kontextusban

31

2.15. ábra. A tudás fája skálafüggetlen tulajdonágai

2.16. ábra. A térkép kontextus és atomjai (FAT, TOPO)

számítanak ismeretnek, és ennek a kontextusnak mások az atomjai, és ígytovább.

2. TérképLegyen a Térkép nev�u kontextus T (FAT, TOPO) (2.16. ábra), FAT ésTOPO atomokkal. Legyen továbbá F(a1, a2, . . . an) a FAT kontextus, atom-jai a1, a2, . . . an, és T (b1, b2, . . . bm) a TOPO kontextus, atomjai b1, b2, . . . bm.Amint látható, a kontextust az atomjai de�niálják. Elmondhatjuk, hogy azegy kontextusra vonatkozó tudást az atomok összege adja.

3. TudományokA szaktudományok is jól példázzák a kontextusok és tudás fájának vi-szonyát (2.17. ábra). A tudomány atomjai a �zika, kémia, biológia,geológia. K(tudomany) = f iz + kem + bio + geo. A szaktudomá-nyok, mint kontextusok: K( f izika) = mechanika + termodinamika +

elektrodinamika + kvantummechanika, K(kemia) = analitikaikemia +

32

2.17. ábra. A tudomány atomjai a �zika, kémia, biológia, geológia. A szaktudományok, mint kon-textusok, további tudományterületekre (atomokra) bomlanak.

szerveskemia + kvantumkemia + f izikaikemia, K(biologia) = novenytan +

allattan + genetika Kézenfekv�o az átfed�o kontextusok de�niálása.

2.3.3. Néhány fontos kérdésKérdés.

• Lehet-e K vektortér (Hilbert-tér)? Felfoghatók az atomok bázisvektorok-nak? (Azt hiszem nem). Ha igen, akkor ezek lineáris kombinációjából atudástér bármely pontja el�oállítható. Így a távolság is de�niálható és értel-mes. Mi az értelme két ismeret közötti távolság meghatározásának? Vanennek valamilyen értelmes jelentése?

• Felmerül a következ�o kérdés: ha egy K(c) kontextus ai atomja reprezentál-hat egy L kontextust, aminek az atomjai b j-k, akkor az így kapott strukturamutathat fraktál tulajdonságokat. Ebb�ol tehát az látszik, hogy bármit tekint-hetünk atomnak vagy kontextusnak. Mit�ol függ, hogy melyik melyik? (2.15.ábra)

• Vajon �xek-e a gráf ágai? Elképzelhet�o-e ugyanazokkal az atomokkal egykülönböz�o gráf? Igen, de ez mire jó? El�ofordulhat, hogy ugyanazokbólaz atomokból egy teljesen más gráf épül föl. Ha más a gráf, más lesz a�gondolkozás� eredménye is. Ismer�os hétköznapi tapasztalat: ugyanazokbóla tényekb�ol teljesen más következtetés származik.

Feltételezés: A tudást reprezentáló gráf fraktál jelleg�u. Ennek a gráfnak a ter-mészetét kell megállapítani ahhoz, hogy a tudás leírására használató legyen. Ér-dekes távolság de�níció lehet, amely megmondja, hogy hány lépésre van egyikvertex a másiktól az ágakon haladva. Ez nyilván nem euklideszi távolság, de akkorez milyen tér? Nem hiszem, hogy Hilbert-tér lenne.

33

Kérdés. Itt jön egy kérdés a semmib�ol. Hogyan fogom megválaszolni? Be kelllépnem valahol a fába. Mi mondja meg, hogy hol? A kontextus ismerete fogjamegmondani. Tudhatom a kontextust? Igen, mert vannak el�oismereteim, el�oitéle-teim. Ezek alapján kell megtalálnom a megfelel�o kontextust.

Nézzünk egy példát. �Mi ez a kis piros négyszög a képen?� � szól a kérdés.Más lesz a válasz, ha az óvodában kérdezi egy kisgyerek, mintha egy topográ�aitérképet nézeget�o, digitalizáló, tanult feln�ott ember. Mivel a kontextus jól ismert(topográ�ai térkép, 1:10000 méretarány) a válasz �Épület, mivel a jelkulcs szerinta kis piros négyszög épületeket jelöl.�

Következtetés: a kérdés csak a kontextussal együtt értelmezhet�o, anélkül állan-dóan vissza kell kérdezni, hogy kiderüljön a kontextus. Vagyis a tudástér K j(ai, c j)az ai atomokból és a c j kontextusból áll.

Kérdés. Újabb kérdés. Függ-e a kérdez�ot�ol, hogy milyen a válasz? Igen. Álljonitt egy példa: el�ofordulhat, hogy egy óvodás ül egy térkép el�ott, és megkérdezi,hogy �Mi ez a kis piros négyszög?� A kontextus világos: a térkép problémakör.A gyerek azonban semmiféle térképolvasási el�oismerettel nem rendelkezik, teháta térkép kontextusban megfogalmazott válasz nem lesz értelmezhet�o a számára,vagyis a válasz nem jó. El�obb el kell neki magyarázni, hogy mi a térkép (vagyismás lesz a belépési pont a �tudás fájába�). A szakmai kontextus tehát nem hatá-rozza meg eléggé a �belépési pontot� a tudás fájába.

Következtetés: A teljes problématér három összetev�ob�ol áll:

K(a, c, q)

ahol a (atom) az atomokat, c (context) a kontextust és q (quali�cation) a kérdez�ofelkészültségét jelenti.

A formalizmus korrekt megalkotásához a Kolmogorov-féle valószín�uségi mez�oaxiomatikus felépítését kellene mintának tekinteni.

34

Irodalomjegyzék

[1] R. Allen � D. Mills: �Signal Analysis, Time, Frequency, Scale and Struc-ture�, IEEE Press, Wiley-Interscience, 2004

[2] Iványi A. �Informatikai algoritmusok�, ELTE Eötvös Kiadó, 2004

[3] S. Smith: �Digital Signal Processing�, Elsevier Science, 2003

[4] Barabási � Albert � Jeong: �Mean-�eld theory for scale-free random net-works�, Preprint submitted to Elsevier Preprint, 5 July 2002.

[5] Albert, Barabási: �Statistical mechanics of complex networks�, Reviews ofmodern physics, VOLUME 74, January 2002

[6] S. Russel � P. Norvig: �Mesterséges intelligencia, modern megközelítés-ben�, Panem � Prentice Hall, 2000

[7] J. Gleick: �Chaos, Making a New Science�

[8] M. Nitzberg, D. Mumford, T. Shiota �Filtering, Segmentation and Depth�,Lecture Notes in Computer Science 662, 1993

[9] G. Kanizsa �Organization in Vision� New York: Preager, 1979, Ch.1-2.

35

3. fejezet

Egyetemi Digitális Térképtár(EDIT)

3.1. Az EDIT rendszerAz EDIT rendszer nem tipikus térinformatikai rendszer, annak ellenére, hogy él�okapcsolat áll fenn a térképek és az �oket leíró relációs adatok között. F�o cél a Tér-képtudományi és Geoinformatikai Tanszék térképtára teljes térkép állományánakszámbavétele, kezelése.

3.1.1. F�obb funkciókörökA meglév�o térkép állomány számbavétele, leírása, jellemz�o paramétereinek rögzí-tése oktatók, kutatók, diákok szakmai céljainak támogatása, archiválás, a papírtér-képek megkímélése

3.1.2. F�obb adatkörökA térképeket leíró adatok körét egyrészt saját tapasztalataink, másrész egy nemzet-közi ajánlás, a DUBLINCORE alapján határoztuk meg. Ezekb�ol épül fel a törzsa-dattár:

• azonosító (egyedi), régi leltári szám, stb.

• a térkép szakmai azonosítója (pl. szelvényszám szerinti beosztás, vagy bármimás)

• vetület, méretarány

• a szkennelt térkép fájl neve, helye (path)

• szkennelés paraméterei (dpi, bpp)

• térkép �zikai méretei, állapota

36

• speciális tematikus tartalma, célja (pl. erdészeti, természetvédelmi térkép,árvízvédelmi, stb.)

• készít�ok neve

• kiadó, kiadás éve

• megjegyzés: bármi más jellemz�o, amit fontosnak gondolunk a térképr�ol rög-zíteni

3.1.3. Részletesebb funkciókörökTörzsadattáron végzett m�uveletek:

• új térkép bevitele

• meglév�o térkép törlése

• meglév�o térkép adatainak szerkesztése

• meglév�o térképek nézegetése

• sorba rendezés valamely szempont szerint

• leválogatás valamely el�ore tisztázott feltétel szerint (pl. csak a kataszteritérképek érdekelnek)

• listakészítés, összesítés

• egy konkrét térkép keresése azonosító szerint

• fel-le bolyongás a térképtárban

• nagy lépésekben mászkálás, ugrálás a térképtárban

• leválogatás tetsz�oleges szempont szerint (SQL parancs sor szerkesztés)

• a legy�ujtés eredményének elmentése

3.1.4. Szerviz funkciók1. Adatbázis struktúra módosítás

• új adatmez�o hozzáadása• meglév�o mez�o törlése• meglév�o mez�o típusának megváltoztatása• meglév�o mez�o hosszának módosítása• meglév�o mez�o átnevezése

37

• indexelés

2. Adatbázis karbantartás

• tömörítés,• üres helyek kiszedése,• packelés

3. Paraméter beállítások

• megjelenési paraméterek beállítása• user beállítás: rendszergazda (mindent csinálhat),• felhasználó (szakmai m�uködtet�o, feltölt�o, kezel�o: adatot felvihet, tö-

rölhet, de adatbázis struktúrát nem módosíthat)• archiválás beállító• az archiválás rendszerességének szabályozása itt

3.1.5. SzoftvermodulokA szoftver törzsadatbázist kezel�o része az EDIT modul, amely a térképtár teljesjogú (szerkeszt�o funkciók, adatbázis építés, legy�ujtés, adatbázis struktúra módosí-tás, stb.) használatát biztosítja.

A tanszéki helyi hálózatban lév�o gépekr�ol elérhet�o szoftver verzió az EDITKE,amely csak keres�o, lekérdez�o funkciókkal lett felszerelve, tehát módosítani nemlehet az adatbázis tartalmát.

Webes böngészésre kifejlesztett szoftver komponens a WEBEDIT. A korláto-zott sávszélesség miatt ez a változat nem enged hozzáférést a nagyfelbontású tér-képekhez.

3.1.6. A továbbfejlesztés irányaFel kellene tölteni egy olyan település név adatbázist, amely alapján megállapít-ható, hogy melyik szkennelt térképen van rajta a keresett település. Tervezzükhogy a térképeket koordináta alapján is kereshet�ové tesszük (ez nem is olyan egy-szer�u, mivel a régi térképr�ol ilyen információ javarészt nem olvasható le). Vektorostérképek rendszerbe integrálása is elképzelhet�o a jöv�oben.

3.2. Szemelvények a rendszer m�uködéséb�olA program célja szkennelt térképek nyilvántartása, kezelése, digitális térképtár lét-rehozása. A nyilvántartás nemcsak a térképek számbavételét jelenti, hanem azoknézegetését, bizonyos szöveges, leíró adatok hozzákapcsolását is, valamint a tér-képek rendezését, és bizonyos feltételek szerinti legy�ujtését, sz�urését. A térképek

38

szemrevételezése mellett a hozzájuk kapcsolódó szöveges adatokat is olvashatjuk(a DUBLINCORE ajánlás szerinti adatokat), szerkeszthetjük.

A program használata egyszer�u, nem igényel alapfokú számítástechnikai is-merteken kívül semmi más ismeretet, kivéve, hogy tisztában legyünk azzal, mit isakarunk. A keletkezett digitális térképtár egy relációs adatbázisba kerül be. A táb-lázatok minden egyes sora megfelel egy-egy térképnek, míg az oszlopok az egyestérképek leíró adatait tartalmazzák.

A térképtárba betenni kívánt térkép bárhol lehet, CD-n, valahol a winchesteren,a hálózaton. A térképkeres�ovel megtalált térképre csak rámutatunk, és az bekerül atérképtárba. Ugyanilyen egyszer�uen törölhetünk is a térképtárból egy térképet, harákattintunk a törl�o ikonra. Ekkor kitörl�odik az aktuális rekord a hozzá kapcsolódóadatokkal együtt. A sz�ur�o ikonra kattintva a térképtárból leválogathatunk valamelyfeltételnek megfelel�o térképeket.

A gyorsabb tájékozódás érdekében mozaikszer�uen is elrendezhetjük a térké-peket, vagyis egyszerre több térképet is szemlélhetünk, miközben változatlanulnézhetjük is a térképekhez tartotó leíró adatokat, ha rákattintunk a mozaik ikonra.

A térképtár adatbázis szerkezete meglehet�osen egyszer�u. Formátuma MS Ac-cess 2000 (mdb), vagyis küls�o adatbázis kezel�ovel is hozzáférhet�o. A programotpro� adatbázis szakért�ok is eredményesen használhatják, mivel egy SQL parancssor is rendelkezésre áll. Ezzel a legösszetettebb leválogatások is elvégezhet�ok.

3.2.1. Hasznos funkciókA f�omenüb�ol vagy az adattár ikonnal nyitjuk meg a térképtárat. Ezután megjelenika Adatablak, ahol a Rendelkezésre álló tematikák-ból ki kell választanunk a meg-nézni kívánt tematikus táblát (pl. topográ�ai térképek, régi-térképek, stb.). Ha eztkiválasztottuk, akkor megnyílik a Térkép ablak, ahol megnézhetjük a bármelyiktérképet 3.1. ábra).

Segíti az eligazodást, ha a navigációs ablak ikonra klikkelünk, aminek hatásáramegnyílik a navigációs ablak. A rajta kijelölt területet a térképablakon fogjuk látni,míg a térkép ablak kiterjedését kis piros négyzet mutatja a navigációs ablakban(3.2. ábra).

A rekordléptet�o eszköz megfelel�o helyére klikkelve el�ore vagy hátra léphetünka térképtárban. Tetsz�olegesen nagyot léphetünk, ha az Törzsadattár adatablak al-ján lév�o csúszkát használjuk.

Ha egyszerre több képet szeretnénk látni, akkor klikkeljünk a mozaik ikonra,aminek hatására megnyílik a Mozaik ablak (3.3. ábra). Bármelyik kis képre kat-tintva kiválasztjuk az adott képet, melyet egy fehér keret jelez.

Ha új térképet szeretnénk beemelni az adattárba klikkeljünk a térképkeres�oikonra, aminek hatására megjelenik a Térkép keres�o ablak. Segítségével bárhon-nan beemelhetünk egy térképet az adattárba. Az így létrejött új rekord szövegesadatokkal is feltölthet�o (3.4. ábra).

A térképek nagyon egyszer�uen rendezhet�ok sorba. Jelöljük valamelyik oszlo-pot úgy, hogy a fejlécére klikkelünk, majd az egér jobb gombjára kattintva megje-

39

3.1. ábra. Az EDIT adat- és térképablaka.

lenik egy a rendezést felkínáló úszómenü.Legy�ujthetjük térképeinket valamely feltétel alapján is. Így például választhat-

juk csak azokat a térképeket, amelyek készítési ideje 1980 utáni, vagy csak olyano-kat, amelyek EOV vetületi rendszer�uek. A legy�ujtéshez szükséges paramétereket aprogram összeállítja, ha a megfelel�o sorrendben kattintunk az egyes mez�okre. Havétettünk, akkor a Parancs törlés gombra kattintva vagy gyalog javíthatunk. Akiismeri az SQL-t, az tetsz�oleges összetett kérdést is föltehet, ha begépeli a parancsáta parancs-sorba. Ezt a m�uveletet csak haladóknak ajánljuk. Akit jobban érdekelaz SQL, az klikkeljen az Segítség menüre, ahol b�ovebben talál ismereteket az SQLhasználatáról. Az Törzsadattár adatablak státusz sorában olvashatjuk a legutoljárakiadott SQL parancsot (3.5. ábra).

3.2.2. Az adatbázis struktúrájaA adatbázis egy mdb fájlban van, amely tetsz�oleges tematikus táblákból állhat.Bármilyen neve lehet a tábláknak, de nem tartalmazhat szóköz karaktert. A táblák-ban tetsz�oleges számú oszlop van, amely a térképekr�ol tárolt leíró adatokat tartal-mazza. Természetesen új oszlopokkal is b�ovíthetjük a táblázatot, de ki is törölhe-tünk felesleges oszlopokat, kivéve az els�ot, amely a térkép fájl nevét tartalmazza.Ez az oszlop nem törölhet�o, mert ezeken nyugszik az egész program logikája. (3.6.ábra)

Az adatbázis struktúráját egy nemzetközi szabvány, a DUBLINCORE adja,

40

3.2. ábra. Az EDIT adat- és térképablaka, valamint a navigációs ablak.

3.3. ábra. Az EDIT adat- és térképablaka, valamint a mozaik ablak.

41

3.4. ábra. Az EDIT adat- és térképablaka, valamint a térképkeres�o ablak.

3.5. ábra. A legy�ujtésre szolgáló ablak az SQL parancssorral.

42

3.6. ábra. Az adatbázis struktúra módosítására szolgáló ablak.

amely el�oírja, hogy mit kell nyilvántartanunk egy térképr�ol. Ennek következté-ben számos mez�o üresen marad, mivel nincs mód az adattartalom megállapítására.Mégis úgy gondoltuk, hogy kompatibilitási okokból igazodunk a DUBLINCORE-hoz, azonban megengedjük a struktúra b�ovítését saját kutatóink igényei szerint.

Tetsz�oleges számú tematikus táblát hozhatunk létre, de az adatbázis m�uveletekmindig csak egy táblán belül érvényesek. A tárolt térképek, fájlok nem épülnekbe az adatbázisba, hanem csak a térképtár helyén, az azt tartalmazó direktoribanlesznek összegy�ujtve. A szoftver az adatbázis hivatkozások alapján jeleníti mega képeket. Ilyen módon az adatbázisba bekerült térképek még a kés�obbiekben isszerkeszthet�ok, ha erre szükség volna.

Ha olyan adatbázis m�uveletet akarunk elvégezni, amely nem része az EDITfunkciókészletének, akkor használjuk a MS Access adatbáziskezel�ot. Legyünk te-kintettel azonban arra, hogy az adatbázis struktúrájának átalakítása tönkretehetia rendszer m�uködését. Azt javasoljuk tehát, hogy küls�o adatbáziskezel�ovel tör-tén�o beavatkozás el�ott készítsünk biztonsági másolatot az adatbázisáról, és alapo-san gondoljuk meg, hogy mit csinálunk.

43

3.3. Az EDIT lekérdez�o, keres�o verziója (EDITKE)Az egyetem kutatói, oktatói és diákjai számára nem mellékes, hogy régi korok,vagy mai térképek digitális változataihoz mennyire könnyen férhetnek hozzá. AzEDITKE nev�u szoftver (Egyetemi Digitális Térképtár Keres�o) hozzáférést biztosíta helyi hálózaton az EDIT adatbázisához. A hozzáférés csak lekérdezést, nézege-tés, legy�ujtést jelent, de semmiféle szerkeszt�o, adatmódosító funkciót nem kínál afelhasználóinak. Az editáló feladatokat csak az EDIT szoftver kínálja, amely vi-szont csak az erre a célra létrehozott munkaállomáson végezhet�o. A helyi hálózatihozzáférés el�onye a web böngész�ovel szemben, hogy a nagy felbontású térképekis megfelel�o sebességgel jeleníthet�ok meg.

3.7. ábra. Az EDITKE felhasználói felülete. Amint látható a navigációs ablak alatt csak az adatokatmegjelenít�o táblázat van, az adatok editálásra való mez�ok nincsenek.

A 3.7és 3.8 ábra az EDITKE néhány lehet�oségét mutatja. Támogatja a megje-lenítésen kívül a navigálást, a mozaikos megjelenítést és a lekérdezést. Az egysze-r�ubb lekérdezések elkészítését egy gra�kus felület segíti, de rendelkezésre áll egySQL parancssor is, ami tetsz�oleges SQL utasítás kiadását is megengedi.

Lehet�oség van még egyes térképek megkeresésére is, amely m�uvelet nem hozlétre új legy�ujtést, hanem a meglév�on belül megmutatja a kérdéses rekordot, tér-képpel és leíró adatokkal együtt.

44

3.8. ábra. Az EDITKE felhasználói felülete. Amozaik ablaktól balra a lekérdez�o ablak is látható.

3.4. Az EDIT rendszer internetes változata (WEBEDIT)A WEBEDIT az Egyetemi Digitális Térképtár internetes változata. Segítségével avilágháló bármely részér�ol betekintést nyerhetünk a térképtár anyagaiba, böngész-hetünk, kereshetünk azokban. A rendszer úgy lett kialakítva, hogy a kis sebesség�uhálózatokon sem okoz fennakadást használata, mivel a nagyméret�u képeknek csakkis részletei tölt�odnek le a kliens gépre.

3.4.1. A használt technológiákA WEBEDIT rendszer PHP alapú, melynek nagy el�onye a platformfüggetlenség,illetve a szabad felhasználhatóság. Emiatt bármilyen más, hasonló célú rendszerkönnyen kialakítható bel�ole. A rendszer háttéradatbázisa jelen esetben egy ODBC-n keresztül elérhet�o MDB �le, mivel az eredeti EDIT rendszer is ebben a formá-tumban dolgozik, így nem kell konverziós problémákkal foglalkozni. A háttéradat-bázis típusából adódóan a kiszolgáló számítógép egy PC, melyen Windows 2000operációs rendszer fut. A webszerver Apache, mellyel könnyen kontrollálható ahozzáférés, és szintén ingyenesen használható. Kliens oldalon nincsen szükségsemmilyen speciális szoftverre, elég egy egyszer�u web-böngész�o program, ami mamár minden gra�kus operációs rendszerbe be van építve. A rendszer elemei

45

3.9. ábra. A Webalizer által generált statisztika.

3.4.2. A háttérA kiszolgáló hardver egy szélessávú (gigabites) Internet-kapcsolattal rendelkez�onagy memóriájú és nagy disk kapacitású PC. Az operációs rendszer Windows2000. Ezt a választást az adatbázis formátuma indokolja, mivel az eredeti EDITrendszer MDB �le-formátummal dolgozik, és ezt legegyszer�ubben ODBC felüle-ten keresztül lehet kezelni, melyhez Windows rendszerre van szükség.

3.4.3. A webszerverA webszerver (Apache 2) el�onyei:

• Biztonságos, stabil m�uködés

• Szelektív hozzáférés lehet�osége: meghatározható azon IP-címek, illetve tar-tományok köre, melyek a webtartalomhoz hozzáférhetnek.

• Szabadon használható szoftver

A felhasználói felület interaktivitásához a webszerver alá PHP 5-ös parancs-feldolgozó nyelv lett telepítve. A webszerver használati statisztikáját a Webalizernev�u program végzi, mely negyedóránként automatikusan lefut. A készült statisz-tika megtekinthet�o a http://elek2.elte.hu/webalizer oldalon (3.9. ábra)

3.4.4. Az adatbázisAz adatbázisnak két része van:

• a térképekhez tartozó leíró adatok, amelyek egy MDB �le-ban találhatók

46

• maguk a beszkennelt térképek

Biztonsági okokból az WEBEDIT adatbázisa függetlenítve van az EDIT adat-bázistól. A feltöltés folyamán megfelel�o id�oközönként szinkronizálva van a kétadatbázis. (Mivel az adatbázis a normál m�uködése során alig változik, ezért nyu-godtan megtehet�o ez az �off line� m�uködési mód).

3.4.5. A leíró adatokA térképek különböz�o kategóriákba vannak sorolva (régi térképek, topográ�ai tér-képek, stb.). Minden egyes kategóriához tartozik egy adatbázistábla. Ezekneka tábláknak a szerkezete megegyezik, az egyes rekordokban a térkép címe, ke-letkezési ideje, kiadója, és egyéb adatai találhatók, valamint a digitális állományneve, elérési útja. Ezeken a táblákon kívül van még egy tábla, mely tartalmazza azel�obb említett táblák nevét, valamint a hozzájuk tartozó hozzáférési jogosultságo-kat (nyílt, csak az ELTE hálózatán belül, csak tanszéki felhasználásra).

3.4.6. Digitális állományokA webes felület részére a digitális állományok az eredetinél kisebb, 150 dpi-s fel-bontásban, JPEG formátumban vannak eltárolva. Ennek oka, hogy a nagyméret�u,kevéssé tömörített állományok meglehet�osen leterhelnék a hálózatot, illetve na-gyon nagy háttértár-kapacitást igényelnének. A 150 dpi-s felbontás b�oven elégahhoz, hogy a felhasználó eldönthesse, az adott térkép tartalmazza-e azokat azinformációkat, amikre szüksége van, és ha igen, megrendelheti az eredeti, nagyfel-bontású állományt. A különböz�o kategóriákba tartozó térképek a kategória nevévelmegegyez�o könyvtárban kerülnek elhelyezésre.

3.4.7. A felhasználói felületA kliens oldali felhasználói felület egy tetsz�oleges web-böngész�on keresztül érhet�oel, a megfelel�o Internet-cím beírásával (jelenleg http://elek2.elte.hu/edit, de rövide-sen új szerver, és feltehet�oleg egy végleges cím lesz üzembe állítva). A megjelen�ooldal (3.10. ábra) négy részre van osztva:

• keresési kritériumok � itt lehet meghatározni a témakört, valamint ezen be-lül sz�ukíteni a találatok körét a címben szerepl�o kifejezések megadásával, améretarány, és a kiadási id�o meghatározásával. A cím mez�obe beírt kifeje-zés többféle lehet: megadhatjuk az egész címet, vagy annak egy részletét, ezutóbbi esetben azt % jelek közé zárva. Pl. % Kolozs% beírásával mindenolyan térkép megjelenik, amelynek címében szerepel a Kolozs karakterlánc.A sorrend mez�o beállításával a találatok rendezési elve határozható meg:nincs rendezés, vagy név, illetve dátum szerint növekv�o vagy csökken�o sor-rend.

47

3.10. ábra. A kliens oldali felhasználói felület.

• találatok � a keresési kritériumok megadása után itt jelennek meg a megfe-lel�o találatok egy legördül�o dobozban. Ezek közül kell kiválasztani a meg-jeleníteni kívánt térképet. Ha túl sok a találat, akkor a keresési kritériumoksegítségével tovább is lehet sz�ukíteni a kört. el�onézet,

• adatok � a kiválasztott térkép kisméret�u képe, illetve a hozzá tartozó legfon-tosabb adatok jelennek meg itt. A részletek gombra kattintva egy új ablakbanmegjelenik az adott térképhez tartozó rekord összes mezeje.

• térkép ablak � az el�onézeti kép tetsz�oleges részére kattintva itt jelenik meg atérkép megfelel�o része kinagyítva. Az ablak átméretezése esetén a képrészletis automatikusan átméretez�odik.

48

Irodalomjegyzék

[1] J. Celko: �SQL fels�ofokon�,Kiskapu, 2002

[2] Hatvany B.Cs. �Bitképek feldolgozása Visual Basic programokból�, Com-puterbooks, 2003

[3] S. Holzner: �Visual Basic Black Book�, Coriolis, 1998

[4] R. Stephens: �Visual Basic Graphics Programming�, Wiley, 2000

[5] C. Williams: �Professional Visual Basic 6 Databases�, Wrox, 1999

49

top related