geofizikai adatrendszerek …geofizika.uni-miskolc.hu/1_3_sores_tezis.pdf · adatrendszerek alapos...

Download GEOFIZIKAI ADATRENDSZEREK …geofizika.uni-miskolc.hu/1_3_sores_tezis.pdf · adatrendszerek alapos ismeretét. A tervező munka során felhasználtam az UML (Unified Modelling Language)

If you can't read please download the document

Upload: hoanghanh

Post on 06-Feb-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

  • MIKOVINY SMUEL FLDTUDOMNYI DOKTORI ISKOLA

    Doktori rtekezs tzisei

    GEOFIZIKAI ADATRENDSZEREK

    SZABVNYOSTSA, EGYSGES GEOFIZIKAI

    LERNYELV S ADATBZIS NAGYTMEG

    ADATRENDSZEREK KEZELSHEZ

    rta: SRS LSZL

    Tudomnyos vezet: DR. TURAI ENDRE

    egyetemi docens a mszaki tudomny kandidtusa

    Miskolci Egyetem Geofizikai Tanszk

    Miskolc 2011.

  • Absztrakt A geofizika vilgban szmos adatszabvny ltezik, de a mrsi s feldolgozsi adatrendszerek tfog lersra alkalmas adatmodell a mai napig nem szletett. A legismertebb szabvnyok fleg az olajiparban alkalmazott legfontosabb mdszerekre lettek kidolgozva. tfog adatmodellek helyett trtneti hagyomnyokra, s mdszer-specifikus elvekre plnek. A GeoSciML (Geoscience Markup Language) az els olyan rendszer, amely a fldtudomnyokban bevezette a mrsek, szlelsek szabatos lerst megvalst, geometriai alapelvekre pl lersi mdot. Jelen llapotban a GeoSciML geofizikai adatok s adatrendszerek lersra mg nem hasznlhat. Dolgozatomban bemutatok kt klnbz szint adatmodellt, amely erre a clra alkalmasnak bizonyult. Egyik a GEOMIND profil, msik az ltalnos Geofizikai Adatmodell (General Geophysical Data Model, GGDM). Az els egy geofizikai metaadat szabvny, amely az elmlt vekben elindtott kt internetes geofizikai portl (GEOMIND: http://www.geomind.eu, KINGA: http://kinga.elgi.hu) adatforgalmnak alapjt kpezi. A msodik egy olyan modell, amely szaktva a geofizikai mdszer hagyomnyos fogalmval a mrt, feldolgozott adatok, s inverzis modellek ltalnos, mdszerfggetlen lersra alkalmas. E modellek hatkonyan cskkentik a geofizikai adatokra jellemz diverzitst egysges elvekre pl geofizikai adatbzisok s informcis rendszerek ltrehozst teszik lehetv. A geofizikai objektum, objektumcsoport s riport fogalmnak bevezetsvel bonyolult adatrendszerek (projektek, mrsi s feldolgozsi kampnyok) s dokumentcis rendszerek (jelentstrak, archvumok) kpezhetk le szabvnyos metaadat rekordok halmazra. A GGDM olyan XML (Extendable Markup Language) nyelv, mellyel a legbonyolultabb geofizikai mrsi rendszerek is egyszeren lerhatk a mrsek sorn hasznlt szenzorok s forrsok jellemzinek pontos lersval. Az ltalnos Geofizikai Adatmodellre pl adatbzis megvalstsra kt, gyakorlatban is kiprblt implementcit mutatok be. Az XML dokumentumtr egy keres motor ltal generlt specilis indexllomny rvn rugalmasan kezelhet, hagyomnyos fjl archvum, amely viszonylag knnyen megvalsthat. A msik a Hibrid adatbzis egy olyan relcis rendszer, amely a gyakran keresett vezr attribtumokat hagyomnyos mezkben, az nll egysgknt kezelhet, mly struktrkat pedig XML tpus mezkben trolja. Ezzel egyszer adatbzis szerkezet mellett nagyfok flexibilitst biztost. A hibrid rendszer fejlesztsi ignye jval nagyobb. A trinformatikai funkcik tmogatsa mindkt rendszer esetben knnyen megoldhat a nylt forrskd geoserver rendszer hasznlatval. Az XML technolgia alkalmazsval lehetsg nylik j geofizikai web szolgltatsok kialaktsra is, melyek eddig elkpzelhetetlen interoperabilitst s az egymstl elklnlt rendszerek magasabb szint integrcijt teszik lehetv.

    Abstract Several national and industrial standards exist in geophysics. However, there is no general data model that can be used to describe all kinds of measurement, interpretation data and large geophysical datasets. Well known industrial standards cover the most important geophysical methods used in petroleum industry. Instead of uniform concepts they are based on traditions, and method specific principles. The first system that introduces real data modeling in geo-scientific data exchange is the GeoSciML markup language. It uses fundamental geometric concepts to build up entities related to observations, measurements. In its present state

  • 3

    GeoSciML it is not ready for geophysical applications. In my theses I present two data models that are proved to be useful for such purposes. They are the GEOMIND Profile, and the General Geophysical Data Model (GGDM). The first one is the geophysical extension of the ISO 19115 metadata standard that supports the data storage and data transfer of two brand new web portals (GEOMIND: http://www.geomind.eu, KINGA: http://kinga.elgi.hu). The second one is a data model for measurement, processing and interpretation data that ignores the traditional method specific way of describing geophysical data. These models efficiently reduce the diversity of geophysical information and make it easier to create uniform databases and information systems. By introducing the concepts of geophysical object, geophysical object set and report large data systems (projects, campaigns) and documentation systems (report archives, libraries) can be represented by a set of standard metadata records. Using the XML (Extendable Markup Language) based GGDM markup language complicated geophysical measurements are easily described by a uniform set of layouts composed by sources and sensors. Two different implementations of the GGDM based geophysical database are also presented. The XML depot is a simple archive of XML records that is associated with a special index file generated by a search engine. It provides moderate flexibility and requires low development resources. The other implementation is the Hybrid database. Instead of extracting all XML elements to relational tables that would yield a huge, and probably too slow system, important attributes are kept traditional database fields, while independent deep structures are stored as XML. The result is a relatively simple structure, and a high level of flexibility. This solution requires higher development resources. Due to the open source geoserver application both systems can easily support GIS functionalities. The XML technology makes it possible to set up new geophysical web services providing more interoperability and a much higher level of integration between independent systems.

    I. Az rtekezs clkitzsei A geofizikai adatrendszerek heterogenitsa nagyon megnehezti az egysges elvek szerint mkd informcis rendszerek kialaktst. Az alapvet problmt leginkbb az jelenti, hogy hinyzik a mrsi mdszerek s a hierarchikus adatrendszerek egysges lersra alkalmas ltalnos adatmodell. Az elterjedt ipari adatszabvnyok tlsgosan specifikusak, fleg az olajiparban hasznlt mdszerekre korltozdnak (szeizmika, mlyfrs-geofizika), s hinyzik bellk az ltalnos megkzelts ignye. Jelents vltozs kezddtt el a GeoSciML fldtudomnyi lernyelv fejlesztsvel, amely az alapokrl indulva, szabatosan pti fel a mrseket, megfigyelseket (OM, Observations & Measurements) (OGC 2007a), szenzorokat (SensorML) (OGC 2007b) reprezentl modelleket. Jelenleg a geofizika mg nem esik a nyelvet fejleszt team rdekldsi krbe. Doktori rtekezsem alapvet clja egy ltalnos geofizikai adatmodell (GGDM, General Geophysical Data Model) megalkotsa, s egy egysges elven felpl geofizikai informcis rendszer alapjainak leraksa. Egy ilyen rendszerrel szemben tmasztott kvetelmnyek a kvetkezk:

    Adjon keretet a rendkvl polimorf geofizikai adatrendszerek minl tfogbb lershoz

    Tegye lehetv az adatrendszerek hierarchijnak lekpezst A metaadatok kiterjedt hasznlata rvn javtsa az adatok fellelhetsgt, tmogassa

    az internetes keres szolgltatsokat Az ltalnos elvekre pl adatmodell s az XML technolgia rvn knnytse meg az

    adatcsert s az elterjedt ipari formtumok kztti a konverzikat

  • 4

    Biztostsa a ler, mrsi s eredmny adatok hatkony trolst s a rugalmas lekrdezseket

    Segtse a magas szinten integrlt elosztott adatbzisok ltrehozst Tmogassa a klnbz geofizikai mdszerek egyttes inverzijbl szrmaz tbb

    paramteres modellek lerst Ezek az elvrsok megkvetelik egy ltalnos geofizikai adatmodell megalkotst, amelyben helye van a ler informciknak, mrsi, feldolgozsi adatoknak, s az rtelmez munka sorn megszlet fldtani modelleknek. Egy nemzetkzi s egy hazai metaadat projekt eredmnyein keresztl bemutatom a geofizikai metaadatok hasznlatt. Clom volt megvizsglni az ltalnos adatmodellre pl adatbzis megvalstsnak lehetsgeit, s bemutatni annak klnbz mdjait. Ezen elvekbl kiindulva, az Etvs Lornd Geofizikai Intzet adatrendszereihez s ignyeihez igazodva egy konkrt adatbzis alkalmazs megvalstsval szndkozom bemutatni a felvzolt rendszerben rejl lehetsgeket.

    II. Tudomnyos elzmnyek A GAIA A geoinformatika tern vgzett munkm hajtereje az 1984 ta geofizikusknt gyjttt adatkezeli s adatfeldolgozi tapasztalatom volt. A dolgozatomhoz kapcsold kutats kzvetlen elzmnye az Etvs Lornd Geofizikai Intzetben kifejlesztett GAIA informcis rendszer kiptse volt. Ez egy VESZ s tranziens adatok trolst, feldolgozst s megjelentst segt rendszer, amely jelenleg az Orszgos Geoelektromos Adatbzis (OGA) szoftveres bzisa. A GAIA fejleszts 1997-ben kezddtt, 1998-tl kezdve fogadta az adatokat. Mra 42000 VESZ s 5500 tranziens szondzst tartalmaz informatikai rendszerr tereblyesedett. A GAIA rendszer hrom szervesen egymsra pl szintbl ll. Ezek a sajt fejleszts adatbzis motor, az adatbzis kezel kztes alkalmazsok, s a grafikus felhasznli felletek. A modulris felpts rendszer nagyfok rugalmassgot s hatkony feldolgozi munkt tesz lehetv. A GAIA kiterjedt hasznlata sorn krvonalazdtak annak korltai, s egyben a tovbblps irnya. A trinformatikai funkcik bvtse, a hlzati elrhetsg javtsa, az egyb geofizikai mdszerek bevonsa s az adatstruktrk szabvnyostsa olyan elvrsok voltak, amelyek tlmutattak a GAIA keretein. A WEB technolgik fejldse, a trinformatikai szabvnyok terjedse, az XML alap lernyelvek sora egy sokkal ltalnosabban megfogalmazott rendszer irnyba mutatott. 2006-ban indult el a GEOMIND projekt, amely alapvet fordulatot hozott a dolgozatomban felvzolt adatmodell s geofizikai informcis rendszer megalkotsa szempontjbl. Egy kulcsfontossg munkacsomag vezetjeknt lehetsgem volt rszt venni egy nemzetkzi egyttmkdsben ltrehozott geofizikai metaadat portl kialaktsban. Metaadat szabvnyok fejldse A metaadatok fogalma a knyvtrakkal egyids. A digitlis knyvtrak s az internetes keresrendszerek megjelensvel a metaadat fogalma az informatikai kztudatba is berobbant. A trinformatikai rendszerek rvn, fleg a trkpi adatrendszerek jellemzsre a fldtudomnyok krben is terjed a hasznlatuk. Szmos nemzetkzi szabvny jtt ltre, melyek hasznlata fleg az ket tmogat szoftverek npszersgtl fgg. A valsznleg leggyakrabban hasznlt szabvny az amerikai Szvetsgi Fldrajzi Adat Trsasg nevvel fmjelzett FGDC (Federal Geographic Data Comittee, 1998). Szabatossgt, s ltalnossgt

  • 5

    tekintve a szabvnyok sorbl kiemelkedik az ISO 19115 (ISO/TC 211 2003). XML implementcija, az ISO 19139 az OGC (Open Geospatial Consortium) ltal tmogatott rendszereknek alapvet komponensv vlt. Dolgozatomban ezrt vlasztottam a geofizikai adatrendszerek magas szint lersnak eszkzl. A trinformatikai szabvnyok, WEB szolgltatsok fejldse A vilghln elrhet trkpi informcik nylt megosztsnak ignye kiknyszertette a trinformatikai szabvnyok terjedst. Az OGC ltal tmogatott szabvnyok hasznlata minden eddiginl magasabb szint integrcit tesz lehetv. A trinformatikai WEB szolgltatsok s az ezekhez kapcsold alapszabvnyok fejldse az elmlt vtizedben tretlen volt. Ezek ma az Eurpai Uni INSPIRE direktviban lefektetett clok megvalstsnak alapjt jelentik. A gomba mdra szaporod WEB szolgltatsok krbl a tma szempontjbl legfontosabb a WMS s a WFS. A WMS (Web Mapping Service) szabvnyos protokoll trkpi informcik Interneten keresztl trtn tovbbtsra. Els verzijt az OGC 2000-ben publiklta. (Open Geospatial Consortium Inc. 2006) A WMS-re pl trkp megjelents lnyegesen klnbzik a megszokottl. A felhasznl kapcsolata a GIS adatbzissal egy http csatornn folytatott kliens szerver kommunkcira pl. A WFS (Web Feature Service) a trkpi objektumok mgtt lv adatbzis informci lekrdezsre szolgl. Szintn az OGC ltal tmogatott szabvny, amely prhuzamosan fejldtt a WMS-sel. ( Open Geospatial Consortium Inc. 2005a) A WFS sma lehetv teszi, hogy a trkpi adatbzisokbl az objektumok attribtumainak, illetve geometrijuknak, klcsns trbeli helyzetknek alapjn bonyolult szrseket vgezznk. A nagy trinformatikai szoftver gyrtk, mint az ESRI, vagy az InterGraph is felismertk az internetes trkpi szolgltatsokban rejl lehetsgeket, s elksztettk sajt szerver s kliens moduljaikat, melyek kapcsoldnak a meglv rendszerekhez (ArcIMS WMS / GeoMedia WebMap). A legismertebb s legsikeresebb nylt forrskd, platform fggetlen rendszer a GeoServer. A kitn, szintn ingyenes s platform fggetlen QuantumGIS rendszer komoly vetlytrsa a kereskedelmi programoknak. Az OGC szintn tmogatja az ingyenes kliens alkalmazsok ltrehozst. GeoSciML A GeoSciML lernyelv ltvnyos fejldse a disszertciban tbbszr emltett GEOMIND projekttel nagyjbl prhozamosan indult el. A fleg GML-re (Geopgraphy Markup Language) pl nyelv fokozatosan terjeszkedik a fldtudomnyok klnbz terletein (Sen, M., Duffyb, T., 2005). Tl az alapok ltrehozsn megtrtnt a geolgiai objektumok s frsok struktrinak kialaktsa. Az INSPIRE tmacsoportokhoz kapcsold adatszerkezetek kidolgozsval foglalkoz team-ek a termszetes s mestersges krnyezet szmos elemnek szabatos lersra trekednek. Nem vits, hogy a GeoSciML elbb-utbb a geofizikban is megjelenik. Az ltalam felvzolt adatmodell a GeoSciML-hez hasonl elvekre pl, s tfog keretet adhat a geofizikai objektumok s objektumcsoportok GML alap lershoz.

  • 6

    III. Az elvgzett vizsglatok, az alkalmazott mdszerek A dolgozatban trgyalt adatmodell s a felvzolt informcis rendszer az informatika s a geofizika szmos eredmnyeinek egyttes felhasznlsval jtt ltre. Az informatika terletrl ide tartozik az adatbzisok elmlete, s gyakorlata, klnsen az adatmodellezs, adatbzis kezels. A megfelel adatmodellek kidolgozsa megkvnja a modellezett krnyezet, jelen esetben a geofizikai mrsek, feldolgozsi, inverzis mdszerek s adatrendszerek alapos ismerett. A tervez munka sorn felhasznltam az UML (Unified Modelling Language) nyelv eszkzeit. A GGDM (General Geophysical Data Model) specifikcijt XSD smadefincis csomag formjban ksztettem el. A mr realizlt adatbzisokban az adatok trolsnak, elrsnek, a keressek vgrehajtsnak eszkze az SQL (Sequence Query Language), a relcis adatbzisok nyelve. Mivel a geofizikai adatok trbeli adatrendszerek, ahol a mrt s szrmaztatott paramterek trkpi megjelentse fontos, ezrt az adatmodelleknek s az adatbzisoknak tmogatniuk kell a trinformatikai rendszerekhez val kapcsoldst. Nlklzhetetlen az OGC ltal tmogatott alapszabvnyok tanulmnyozsa. Ezek kzl legfontosabbak a GML (Geography Markup Language) (Open Geospatial Consortium Inc. 2005b), a tr- s idbeli objektumok egzakt lersra szolgl nyelv, s az ISO 19115, amely fldrajzi adatrendszerek metaadat szint lersrnak a szabvnya. Mindkett XSD smadefincikra pl rendszer, amely szmos tovbbi szabvnyt (ISO 19107, ISO 19108, ISO 19117, ISO 19123) integrl magba. Felfel ezek jabb, mg magasabb szint rendszerek, a trinformatikai webszolgltatsok rszt kpezik (WMS, WFS). Az ptmny aljn az Internetes technolgik alapkve, az XML foglal helyet, annak szmos eszkzvel s lehetsgvel (XPATH, XQUERY, XLINK, XSLT, stb) Mindezen eszkzket munkm sorn nemcsak megismerni, de a megfelel helyen alkalmazni is kellett. A programozsi feladatokhoz az objektumorientlt JAVA (Java EE) programozsi nyelvet hasznltam, amelyet tmogatja az XML llomnyok kezelst, az adatbzisok hasznlatt, webalkalmazsok fejlesztst, gy kivl eszkz a komplex alkalmazsok fejlesztshez. Munkm sorn amikor csak lehetett a Unix opercis rendszer alapelemeire tmaszkod eszkztelen munkastlust kvettem, s trekedtem a minsgi, nylt forrskd, platform fggetlen megoldsok hasznlatra. Ugyanakkor kiemelek kt szoftvert, amely fejleszt munkmban nagy segtsgemre volt: az Altova XMLSpy Professional Edition 2008-as verzijt, amelyet az XML llomnyok kezelshez, s az XSD smk tervezshez, finomtshoz hasznltam, valamint a SUN NetBeans 6.1-es programfejleszt rendszert, amelyet a Java alkalmazsok fejlesztsben alkalmaztam. Az adatbziskezel rendszerekkel kapcsolatos ksrleteimet kezdetben MySQL-lel vgeztem, majd ttrtem a PostgreSQL hasznlatra, amely az SQL szabvny implementcijban, az XML s geometriai tpus mezk kezelsben jval fejlettebbnek tekinthet. A WMS-el s WFS-el kapcsolatos munkkban a GeoServer rendszerre hagyatkoztam, amely kivlan egyttmkdik a PostgreSQL-lel. A trinformatikai tesztek QuantumGIS rendszerrel trtntek. Az XML dokumentumtr indexllomnyainak ellltshoz az Apache Lucene keresmotort s az Apache SolR web alkalmazst hasznltam.

  • 7

    V. j tudomnyos eredmnyek (tzisek)

    1. Heterogn geofizikai adatrendszerek lersra szolgl egysges szabvny kidolgozsa az ISO 19115 metaadat szabvny alapjn A fldrajzi adatokra vonatkoz metaadat szabvny hasznlata a klnbz trinformatikai adatrendszerek esetben elterjedt. A metaadatok leginkbb a nyilvnossgnak sznt analg s digitlis trkpek tartalmval, elrhetsgvel kapcsolatos informcikat tartalmazzk. Emellett helyet kapnak a trkpi adatrendszereket jellemz legfontosabb tudnivalk is, pl. az adatok elksztsnek mdja, minsge, a feldolgozottsg foka stb. A gondolat, hogy geofizikai adatrendszerekre is alkalmazzuk az ISO 19115 metaadat szabvnyt a GEOMIND projekt els koordintortl, Tomasz Mardaltl a Lengyel Geolgiai Szolglat munkatrstl szrmazik. A geofizikai adatrendszerek sokflesge miatt azonban mr a kezdet kezdetn nehezen megvlaszolhat krdsek merltek fel. Hogyan feleltethetk meg a szabvny trinformatikai ihlets fogalmai a geofizikban hasznlt fogalmaknak? Hogyan lehet thidalni a klnbz mrsi mdszerek kztti alapvet klnbsgeket (pontszer, szondz, szelvnymenti, trkpez mrsek)? Hogyan kezeljk a geofizikai kutats eredmnyeit megjelent, nem trkpi adatokat (szelvnyek, 1D 2D 3D modellek)? Egyltaln, mit tekintsnk a geofizikai metaadatok alapegysgnek? A feltett krdsekre az ltalam megalkotott fogalmak bevezetsvel adahat meg a vlasz. Munkm sorn ltrehoztam az ezek mgtt lv logikai struktrkat s ezeket XML smadefincikba fektettem le.

    1. tzis A heterogn geofizikai adatrendszerek egysges lersra j fogalmi rendszert s adatmodellt dolgoztam ki. Ez magba foglalja a geofizikai objektum, geofizikai objektum csoport s a riport fogalmt, valamint ezek adatmodelljt.

    a) A geofizikai objektum fogalma, s adatmodellje A szabvny alaprtelmezs szerint minden adatszethez (dataset) rendel egy metaadat rekordot. Ez a trinformatikban ltalban trkpi adatrendszert jelent. A trkpek a hagyomnyos GIS hierarchia szerint alakzatokbl (feature) llnak, amelyekhez attribtumok formjban mgttes adatbzis tartalom tartozik. A geofizika trkpi alakzatai a mrsi s feldolgozsi folyamatok klnbz szintjeit kpviselik. Egy pont alakzat egy geofizikai trkpen lehet egy nll gravitcis mrs, de lehet egy szeizmikus szelvny egyetlen pontja is, mely nmagban nem ll meg. A kett nem azonos hierarchiaszintet kpvisel. A krds ltalnos kezelse rdekben bevezettem a geofizikai objektum fogalmt s meghatroztam a hozz tartoz rszletes logikai struktrt (adatmodell). A geofizikai objektum olyan egyszer trkpi alakzatknt megjelenthet nll egysg, amelyhez metaadat rekord kapcsoldik. Ez a gyakorlatias meghatrozs sszecseng a hagyomnyos mrs fogalommal, amely klnbz komplexits dolgokat egyarnt mrsknt kezel. Az egyedi mrsek fontossguknak megfelelen ksr informcikkal lthatk el, a trkpeken nll alakzatknt jelennek meg, bels tulajdonsgaikat attribtumaik adjk meg. A meghatrozs magba foglalja a geofizikai modelleket is. Egy rtegmodell, egy 2D szelvny, vagy egy geofizikval lehatrolt 3D test szintn lehet geofizikai objektum. A mrsi mdszert a geofizikai objektum egy attribtuma, az objektumtpus adja meg. A metaadatok szintjn az eltr tpus objektumok azonos struktrval jellemezhetk, csak a fejlc adatokban klnbznek. A fejlc (header) a metaadat rekord rsze, szerkezett az XSD sma hatrozza meg.

  • 8

    b) A geofizikai objektumcsoport fogalma s adatmodellje A geofizikai objektumcsoport defincim, s az azt lekpez adatmodell rtelmben sszetartoz objektumok halmaza. Az sszetartozs minsge szerint beszlnk elsdleges s msodlagos csoportokrl. Elsdleges csoportok azok, amelyek a hozzjuk tartoz objektumokkal kizrlagos szli viszonyban vannak. A mrsi kampnyok tipikus elsdleges csoportok. Egy adott mrs egy s csakis egy mrsi kampnyhoz tartozhat, ahhoz, amelyben ltrejtt. A msodlagos csoportok olyan halmazok, amelyek nem kizr kapcsolatban vannak a tag objektumokkal. Egy terleti adatrendszerbl szerkesztett szelvny msodlagos objektumcsoport, mivel minden pontja tartozhat ms szelvnyekhez is. Az objektumcsoportok magasabb egysgekbe szervezhetk. Pl. a mrsi projektek tipikus csoport aggregcik, amelyek mrsi kampnyokbl llnak. Az objektumcsoportok csompontok az objektum hierarchiban s sokszor tisztn metaadatokbl llnak. Kivtelt kpeznek a geofizikai fedvnyek, amelyek a szabvny terminolgijnak megfelelen szintn adatszeteknek (geophysical object set) tekintendk. Ezek mgtt a metaadatokon tl analg, vagy digitlis trkpek, adatrcsok, vektor alakzatok llnak. c) A riport szrmaztatott metaadat osztly A geofizikai objektumok s objektumcsoportok bevezetsvel komplex adatrendszerek lekpezhetk, dokumentlhatk. Egy harmadik fogalom bevezetsvel a fldtani dokumentci (jelentsek, cikkek, kziratok, terepi jegyzknyvek) szintn a metaadat rendszer rszv tehet, s azzal analg mdon kezelhet. Ez a fogalom a riport. A riport, mint szrmaztatott metaadat osztly a hagyomnyos metaadatoktl kt dologban tr el: fldrajzilag meghatrozott, s hozzkapcsolhat a mrsi adatokhoz. A riport osztlyra pl metaadatbzis egyik legizgalmasabb alkalmazsa a nylt, internetes publikcis portl, amely kzvetlenl kapcsoldik a mrsi adatokhoz s modellekhez.

    2. tzis Kidolgoztam a fldrajzi adatokra vonatkoz ISO 19115 metaadat szabvny geofizikai kiterjesztst. d) A fldrajzi adatokra vonatkoz metaadat szabvny geofizikai kiterjesztsnek megalkotsa A fent lert fogalmak felhasznlsval a GEOMIND projekt keretben elkszlt a geofizikai metaadat szabvny adatmodellje, s az erre pl XML nyelv, az XSD smval definilt GEOMIND Profil. Az adatmodell kialaktsa a vezetsem alatt ll nemzetkzi munkacsoportban trtnt (Srs et al., 2007a). Az XSD sma kialaktsa szoros egyttmkds keretben a Dnia s Grnland Geolgiai Szolglatnak (GEUS) feladata volt. A GEOMIND Profil lnyege, hogy az ISO 19115 szabvny alapelembl az a, b s c pontban lertaknak megfelelen hrom szrmaztatott osztlyt hozunk ltre. Ezek (GE_GeophObject, GE_GeophObjectSet, GE_Report) rklik a szabvny magjnak sszes elemt, s kiterjesztik azt a geofizika szempontjbl fontos tovbbi elemekkel. Lehetsget adnak a mrsek krlmnyeinek, a mszerezettsgnek lersra, s kibvtik az alapszabvnyban rendelkezsre ll kdlistkat. A geofizikai metainformcik a GE_GeophysicalInfo nev elemben kaptak helyet, amely hrom f rszbl ll. Ezek a mrsek krlmnyeit rszletez

  • 9

    GG_MeasuringConditions, a mszerezettsget ler GG_Instrumentation, s a legfontosabb mrstechnikai paramtereket tartalmaz GG_Header.

    2. Az ltalnos Geofizikai Adatmodell s lernyelv megalkotsa. A GEOMIND projekt msik fontos clkitzse volt az ipari szabvnyok krbl kies legkeresettebb geofizikai mdszerek mrsi adatainak cserjt tmogat szabvny kialaktsa. Ez a feladat szintn az ltalam felgyelt munkacsomag rsze volt. A mdszerenknt eltr szabvnyok kialaktsa helyett egy jval ltalnosabb megolds szletett. A projekt sorn elksztettem az ltalnos geofizikai adatmodell els verzijt. Vgleges kidolgozsra s tesztelsre a GEOMIND projekt zrsa utn, az ELGI adatbzis fejlesztsi programjnak keretben kerlt sor.

    3. tzis A geofizikai mrsek s inverzis modellek egysges lershoz kidolgoztam az ltalnos Geofizikai Adatmodellt. Bevezettem a forrs, szenzor, tertsi komponens, terts, rtegmodell, rcsmodell s ltalnos modell fogalmt. E fogalmakra ptve kidolgoztam a geofizikai mrs, a geofizikai modell s az inverzi adatmodelljt. a) A geofizikai mrs adatmodellje Az ltalnos Geofizikai Adatmodell (General Geophysical Data Model, GGDM) szakt a mrsi mdszer hagyomnyos koncepcijval, amely klnbz struktrkban definilja a klnbz mrseket. Eltekint a rgi szmtstechnikai korltok miatt hasznlt knyszer egyszerstsektl, s a mrsi elrendezsek rszletes dokumentcijra trekszik. A mrseket mozaikszer kiraks jtknak tekinti, ahol az ptkezs alapelemei a forrs s a szenzor. A mrsi elrendezsek egyszeren forrs-szenzor konfigurcik, s ezek egyttese adja a magt a mrst. Egy mrs teht tertsek (layout) sszessge. A tertsek tertsi komponensekbl (layout component) llnak. Tpusuk lehet forrs (source) vagy szenzor (sensor). A komponensek geometrijnak s a hozzjuk kapcsold technikai paramtereknek, mrsi adatoknak megadsval brmilyen szlels (nem csak geofizikai mrs) tkletesen lerhat. Az adatok trolsa a GML nyelvben hasznlt rtk tartomny (domain set) s rtk kszlet (range set ) objektumok mintjra trtnik. Ez a gondolatmenet rokon a GeoSciML felfogsval, amely szintn GML alapokra pti a fel a szenzorokat, mrseket s megfigyelseket ler adatszerkezeteket. Ez biztostja a majdani knny tjrst a GGDM s a GeoSciML kztt. b) Geofizikai modell s inverzi adatmodellje Geofizikai modellen a numerikus modellezssel, vagy inverzival kapott digitlis modelleket rtem. Ezek a mrsektl elklnl, nll objektumok, br gyakran a mrsi adatokkal egytt kezelik ket. A mrs s modell kzti egy-egy rtelm megfeleltets nem kielgt, hiszen egy mrsbl tbb modell is szrmaztathat (klnbz feldolgozsi verzik), s egy modell szmos klnbz mrs egyttes inverzijnak (joint inversion) eredmnye is lehet. A mrsek s modellek N:N egyed-relci kapcsolatt realizl kztes objektum maga az inverzi. Az inverzi nll adatbzis objektumknt val szerepeltetse lehetv teszi a feldolgozsi folyamatot jellemz technikai paramterek, vektorok, mtrixot trolst, utlagos vizsglatt. A geofizikai modellnek hrom tpust klnbztetjk meg. Rtegmodell (layer model), rcsmodell (grid model), s ltalnos modell (general model). A rtegmodell olyan

  • 10

    1D modellnek felel meg, amely tetszleges szm rteggel s rtegenknt tetszleges szm fizikai tulajdonsggal jellemezhet. A rteg attribtum szveges rtk is lehet, ezrt frsi adatbzis kialaktsra is hasznlhat. A rcsmodell a 2D, 3D, 4D inverzik lersra szolgl, tetszleges szm cellval, s cellnknt tetszleges szm fizikai tulajdonsggal. Az ltalnos geofizikai modell GML-ben lerhat ltalnos geometrij komponensek sszessge. A modell komponensek homogn testeknek tekintendk.

    4. tzis Az ltalnos Geofizikai Adatmodell alapjn elksztettem az XML sma defincikra pl geofizikai lernyelvet. c) A GGDM geofizikai lernyelv Az ltalnos geofizikai adatmodell implementcijt a GGDM XSD sma hatrozza meg. A sma olyan XML szveg, amely elrja a hasznlhat elemek nevt, azok szerkezett, sorrendjt. Az XML technolgia hasznlatnak egyik nagy elnye az rvnyests (validci) lehetsge. Ennek sorn a validcit vgz program az XML szveget sszeveti a smval, s szrl szra ellenrzi az egymsnak val megfelelst. Az XML rvnyests biztostja, hogy a feldolgozsra, adatcserre sznt szvegek megfelelnek a ler nyelv ltal szabott formai kvetelmnyeknek. Az XSD sma az adatmodellt ler adatsztrbl (data dictionary) egy szvegfeldolgoz rutin segtsgvel automatikusan ll el. A GGDM hasznlatt bemutat plda llomnyok a http://geomind.elgi.hu cmen tallhatk.

    3. Az ltalnos Geofizikai Adatmodellre pl adatbzis megvalstsa, s alkalmazsa A fent vzolt adatmodellre ptve az ltalnos geofizikai adatbzis fizikai megvalstsnak szmos mdja van. Dolgozatomban kt lehetsges vltozatot mutatok be. Az egyik egy egyszer s gyorsan megvalsthat, de kevsb ltalnos, a msik egy munkaignyesebb, de hatkony, s rugalmas megolds.

    5. tzis Az ltalnos Geofizikai Adatmodellre pl adatbzis gyakorlati megvalstsra kt ksrleti rendszert kszitettem: az XML dokumentumtrat, amely egy hagyomnyos fjl archvum s az Apache Lucene keresmotor sszekapcsolsra pl, valamint egy hibrid adatbzist, amely a hagyomnyos relcis adatbzist az XML alap adatkezelssel tvzi. a) XML dokumentumtr Az XML dokumentumtr rvnyestett XML fjlok rendezett halmaza, amelyben egy specilis index llomny segtsgvel hatkony keressek hajthatk vgre. A fjlok trolsa trtnhet egyszer adatbzis tblban, vagy akr hagyomnyos knyvtrszerkezetben. Az adatok trolsakor a rendszer megadott adatmezkbl egy index llomnyt kszt. Az indexek a mezrtkeket a fjlok elrsi tvonalhoz kapcsoljk. A keress eredmnye lehet valamely mezrtk, vagy az elrsi tvonal, amelynek ismeretben a felhasznl a keresett teljes rekordot kapja meg a rendszertl. Alkalmas XSL transzformcik segtsgvel az adatok tetszleges formban megjelenthetk. A keressek hatkonysga az indexllomny szerkezettl fgg. Az XML dokumentumtr megvalstsa az Apache Lucene keresmotor

  • 11

    s az Apache SolR webalkalmazs sszekapcsolsval viszonylag egyszeren megoldhat. Ez az implementci elssorban archivlsi s adatszolgltatsi clra sznt rendszerekben javasolt. A KINGA portl, amely az informatikai kivitelezst vgz InterComp Kft. ltal fejlesztett dokumentum szerver alkalmazsra pl, hasonl elven mkdik. b) Hibrid adatbzis A teljes GGDM adatmodell lekpezse tisztn relcis adatbzisba tbb szz tbls rendszert eredmnyezne. A hibrid megolds egyesti a relcis adatbzis, s az XML adattrols elnyeit. A gyakran hasznlt keres paramterek hagyomnyos attribtumokknt, a zrt egysgnek tekinthet mly adatstruktrk XML mezkben vannak trolva. Ez a megolds viszonylag egyszer szerkezet mellett nagyfok hatkonysgot biztost. Az nllan hasznlhat elemek nmagukban is elrhetk, ami egyrszt megknnyti a nagy adattmeget tartalmaz mrsek kezelst, msrszt rugalmasabb keresseket tesz lehetv. A modern adatbzis-kezel rendszerek tmogatjk az XML szvegeken vgzett, SQL-be gyazott XPATH alap keresseket. Ezek a mveletek persze viszonylag lassak, ezrt mindig ajnlatos hagyomnyos mezk hasznlatval cskkenteni a tallati halmazok mrett. Az adatok trolsa eltt az XML fjlok n. faktorizcin esnek t. Ennek sorn a kln tblban troland elemek a szlbl trldnek, s helykre egy egyedi azonostval elltott hivatkozsok kerlnek. Az adatok lekrdezsekor a faktorizcival ellenttes folyamat, az sszeolvaszts zajlik. A hivatkozssal megadott XML fragmentumok a megfelel tblbl visszakerlnek a szl elembe. Mind a faktorizci, mind pedig az sszeolvaszts a tbbszrs begyazsok miatt rekurzv eljrs. Az adatbzis optimlis szerkezetnek kialaktsa a teszt adatbzisok hasznlata kzben gyjttt tapasztalatoknak megfelelen tbb lpcsben trtnt. A hibrid adatbzis implementcija olyan rendszereknl javasolt, ahol a napi feldolgozs sorn az adatok intenzv hasznlata s a rsz struktrkat rint, kifinomult lekrdezsek irnti igny a jellemz.

    VI. Az eredmnyek hasznostsa A dolgozatomban lert geofizikai metaadat modell fontos komponense az Eurpai Uni eContentplus programjnak tmogatsval megvalsult nemzetkzi GEOMIND projekt ltal ltrehozott internetes, nemzetkzi informcis rendszernek. A metaadatok cserje a GEOMIND profilnak megfelel XML llomnyokon keresztl zajlik. A GGDM adatmodell s lernyelv a GVOP ltal tmogatott KINGA projektben kszlt geofizikai metaadat portl mkdsben kapott jelents szerepet. A metaadatok a nyilvnos adatrendszerekhez val hozzfrs javtsban alapvet fontossgak. Az adatok interneten keresztl trtn keresst a metaadatok felhasznlsa jelentsen megknnyti. A nyilvnos publikcis rendszerekben elterjedten hasznlt metaadat katalgusok lehetv teszik, hogy az adatforrsokat a szerzk, az elkszts ideje, vagy az adatokhoz kapcsold kulcsszavak, egyb informcik alapjn knnyebben megtalljuk, a millinyi adatrekord kzl kivlaszthassuk azt, amire szksgnk van. A geofizikai adatrendszerek publiklsban a metaadatok szerepe mg viszonylag kicsi. E tekintetben a nemzetkzi sszefogssal kszlt tbbnyelv GEOMIND metaadat portl s a hazai KINGA portl fontos elrelpst jelent. Br az adatszolgltatk s a portlok kezel felletei mg kornt sem hasznljk ki a metaadat szabvnyban rejl lehetsgeket, ktsgtelenl rzkeltetik azokat. Kln hangslyozand a nyilvnos fldtudomnyi dokumentumok (jelentsek, esettanulmnyok, oktatsi anyagok) egysges trinformatikai rendszerbe foglalsnak lehetsge, amely mindkt rendszer esetben adott. A KINGA rendszer pl.

  • 12

    kiindulsi alapja lehetne egy intzmnyek kztti nemzeti tudsbzisnak, melyhez tetszleges szm adatszolgltat csatlakozhat. Ehhez csak a fldtani dokumentcit ismertet szabvnyos metaadatokat kell elkszteni s feltlteni a jelenleg mr mkd rendszerbe. Az ltalnos geofizikai adatmodellre pl XML alap adatcsere s adattrols lehetsgeit ma mg nehz megtlni. Az ad hoc fjlformtumok koszban a GGDM hidat jelent az adatgyjt s adatfeldolgoz alkalmazsok kztt. Lehetsget teremt az egymstl elszigetelt adatrendszerek egysges kezelsre, az internetes technolgik szlesebb kr kihasznlsra. A dolgozatomban bemutatott hibrid adatbzis, amely a jvben fokozatosan kivlt nhny ELGI-ben kezelt heterogn felpts mdszertani adatbzist, e technolgia els alkalmazsa. Az egysges elvekre pl geofizikai web szolgltatsok kiptsvel lehetv vlik tvoli adatszolgltatk adatainak nagy kzponti adatbzis szervereken trtn trolsa, illetve kis, elklnl adatbzisok egysges, osztott rendszerbe integrlsa.

  • 13

    VII. Az rtekezs tmakrbl kszlt sajt publikcik jegyzke

    GEOMIND Consortium 2007a. Data Dictionary for GEOMIND ISO19115 extension classes. http://geomind.elgi.hu/doc/GEOMIND-extensions-1.3.xml, http://geomind.elgi.hu/doc/GEOMIND-extensions-1.3.pdf GEOMIND Consortium 2007b.GEOMIND Profile Schema Definition Package. http://www.geomind.eu/portal/public_files/schema/geomind/geomind/2007

    Srs L., 1999: An other GIS: Geoelectric Information System. EEGS'1999 Extended Abstr, Budapest. Srs L., 2000: Az Orszgos Geoelektromos s Elektromgneses Adatbzis cm projekt eredmnyei 2000 december 31-ig. ELGI jelents, Budapest. Srs L., 2003: Zrjelents az Orszgos Geoelektromos s Elektromgneses Adatbzis tma 2001 s 2003 kztt szletett eredmnyeirl. ELGI jelents, Budapest. Srs L., Prcser E, Gulys , Kiss J., 2004: The Hungarian National Geoelectric Database. EAGE2004 Extended Abstr, Paris. Srs L., Pedersen M., Rapsevicius V., Khne K., Kuder J. 2007a. Specification of standards for digital geophysical content, http://geomind.elgi.hu/doc/D6_2.pdf Srs L., Pedersen M., Rapsevicius V., Khne K., Kuder J. 2007b. Specification of standards for digital geophysical content, Annex A, Data dictionary http://geomind.elgi.hu/doc/D6_2_A.pdf Srs L., Pedersen M., Rapsevicius V., Khne K., Kuder J. 2007c. Specification of standards for digital geophysical content, Annex B, Implementation & examples http://geomind.elgi.hu/doc/D6_2_B.pdf

    VIII. A tzisfzetben hivatkozott publikcik jegyzke

    Federal Geographic Data Comittee, 1998: Content Standard for Digital Geospatial Metadata ISO/TC 211 2003: ISO/FDIS 19115 Geographic Information Metadata Open Geospatial Consortium Inc. 2006: OpenGIS Web Map Service (WMS) Implementation Specification http://www.opengeospatial.org/standards/wms Open Geospatial Consortium Inc. 2005a: Web Feature Service Implementation Specification http://www.opengeospatial.org/standards/wfs Open Geospatial Consortium Inc. 2005b: OpenGIS Geography Markup Language (GML) Encoding Standard http://schemas.liquid-technologies.com/OpenGis/gml/3.1.1/

  • 14

    Open Geospatial Consortium Inc. 2007a: Observations and Measurements http://schemas.liquid-technologies.com/OpenGis/om/1.0.0/ Open Geospatial Consortium Inc. 2007b: OpenGIS Sensor Model Language (SensorML) http://schemas.liquid-technologies.com/OpenGis/sensorML/1.0.1/ Sen, M., Duffyb, T., 2005: GeoSciML: Development of a generic GeoScience Markup Language. Computers & Geosciences 31(9) 1095-1103 Srs L., Pedersen M., Rapsevicius V., Khne K., Kuder J. 2007a. Specification of standards for digital geophysical content, http://geomind.elgi.hu/doc/D6_2.pdf