專題 生態後設資料之進階應用系統 論述...

4
林業研究專訊 Vol.13 No.6 2006 20 ⊙森林保護組/生態資訊研究小組‧蕭其文 前言 生態學研究所含蓋的層面繁多,而其間 影響的各項生態過程的因子複雜,使得資料 整合困難,因此在研究上常常面臨資料分散 的問題,難以單向片段的個別資料解釋複雜 的生態現象,對於長期性所蒐集的生態資料 而言,若無法整合實在非常可惜。所幸現在 資訊技術的快速發展與應用,提供解決這方 面難題的一個絕佳管道。透過生態後設資料 語言(EML,詳見本期第14頁『生態後設資料 語言的層級內容』一文)作為生態資料聯結與 整合的共同標準,使得多樣複雜的生態資料 有共同的規格與語法,可促進不同的生態資 料之整合與分享,讓生態研究的尺度與領域 更為擴大。而再配合一個穩定的資料庫儲存 系統來進行生態資料的保存與交換,並利用 已發展成熟的網站服務技術來達成資料的即 時整合、管理與分享,則國際合作便可如同 在地研究般的便利。在具備了一個完善的研 究資料目錄系統後,如何運用這些資料來進 行更進一步的分析與應用,將是本文所著重 的課題。 EML應用之系統架構 林試所生態資訊研究小組基於上述的理 念與架構,近年來持續與國外的生態資訊專 家與學者們互相進行交流,進而發展出一套 適合亞洲各國使用的多語系生態資訊管理系 統。該系統具有EML文件編輯、儲存與資料 分析應用等功能,系統由三層輸入與輸出作 業架構而成,第一層為研究資料之管理層, 第二層為研究後設資料之編輯、儲存與管理 作業層,第三層為網頁型態之產出層。圖1 為該系統之系統架構圖,目前共完成兩個主 要的作業模組,分別為生態後設資料語言之 文件模組(Metacat Module) 和以此文件為基 礎的分析模組(the Processing Techniques for Automated Harmonization ModulePTAH)而後者則更進一步發展了統計分析與地理資 訊系統兩個次模組,茲分別介紹如後。 EML之統計分析模組 研究資料的分析與應用有許多層面, 但大部份都與統計有著密切的關係。本統計 生態後設資料之進階應用系統 生態資訊管理系統之系統架構圖(林朝欽 ) XML 文件 Dataset 資料集 Project Information 計畫資訊 EML 資料庫 EML 編輯器 3 r e i T e c a f r e t n I r e s U 2 r e i T d n a g n i t i d e a t a D g n i s s e c o r p 1 r e i T d n a e g a r o t s a t a D t n e m e g a n a m 資料文件 系統 DOM / XSLT 樣式表 統計分析 模組 PTAH Metacat HTML 文件 統計分析 表格/繪圖 地理資訊系統 地圖 地理資訊系統 模組 XML Dataset Project Information EML EML 3 r e i T e c a f r e t n I r e s U 使用者介面層 2 r e i T d n a g n i t i d e a t a D g n i s s e c o r p 資料編輯與處理層 1 r e i T d n a e g a r o t s a t a D t n e m e g a n a m 資料儲存與管理層 DOM / XSLT PTAH 模組 Metacat 模組 HTML HTML /

Upload: others

Post on 15-Oct-2019

6 views

Category:

Documents


0 download

TRANSCRIPT

林業研究專訊 Vol.13 No.6 200620

⊙森林保護組/生態資訊研究小組‧蕭其文

前言

生態學研究所含蓋的層面繁多,而其間

影響的各項生態過程的因子複雜,使得資料

整合困難,因此在研究上常常面臨資料分散

的問題,難以單向片段的個別資料解釋複雜

的生態現象,對於長期性所蒐集的生態資料

而言,若無法整合實在非常可惜。所幸現在

資訊技術的快速發展與應用,提供解決這方

面難題的一個絕佳管道。透過生態後設資料

語言(EML,詳見本期第14頁『生態後設資料

語言的層級內容』一文)作為生態資料聯結與

整合的共同標準,使得多樣複雜的生態資料

有共同的規格與語法,可促進不同的生態資

料之整合與分享,讓生態研究的尺度與領域

更為擴大。而再配合一個穩定的資料庫儲存

系統來進行生態資料的保存與交換,並利用

已發展成熟的網站服務技術來達成資料的即

時整合、管理與分享,則國際合作便可如同

在地研究般的便利。在具備了一個完善的研

究資料目錄系統後,如何運用這些資料來進

行更進一步的分析與應用,將是本文所著重

的課題。

EML應用之系統架構

林試所生態資訊研究小組基於上述的理

念與架構,近年來持續與國外的生態資訊專

家與學者們互相進行交流,進而發展出一套

適合亞洲各國使用的多語系生態資訊管理系

統。該系統具有EML文件編輯、儲存與資料

分析應用等功能,系統由三層輸入與輸出作

業架構而成,第一層為研究資料之管理層,

第二層為研究後設資料之編輯、儲存與管理

作業層,第三層為網頁型態之產出層。圖1

為該系統之系統架構圖,目前共完成兩個主

要的作業模組,分別為生態後設資料語言之

文件模組(Metacat Module)和以此文件為基

礎的分析模組(the Processing Techniques for

Automated Harmonization Module,PTAH),

而後者則更進一步發展了統計分析與地理資

訊系統兩個次模組,茲分別介紹如後。

EML之統計分析模組

研究資料的分析與應用有許多層面,

但大部份都與統計有著密切的關係。本統計

生態後設資料之進階應用系統

生態資訊管理系統之系統架構圖(林朝欽 製)

XML文件

Dataset資料集

ProjectInformation計畫資訊

EML資料庫

EML編輯器

3 rei Tec af ret nI res

U

2 rei T dna g nitide at a

Dg ni ssec or p

1 r e iT d n a eg aro ts at a

Dtne

me ga nam

資料文件系統

DOM / XSLT

樣式表

統計分析模組

PTAH

Metacat

HTML文件

統計分析表格/繪圖

地理資訊系統地圖

地理資訊系統模組

XML

Dataset ProjectInformation

EML

EML

3 rei Tec af ret nI res

U 使用者介面層

2 rei T dna g nitide at a

Dg ni ssec or p

資料編輯與處理層

1 r e iT d n a eg aro ts at a

Dtne

me ga nam資料儲存與管理層

DOM / XSLT

PTAH 模組

Metacat模組

HTMLHTML

/

專題論述

林業研究專訊 Vol.13 No.6 2006 21

分析模組是將已建立的生態資料的EML文件

與統計分析作一整合性的應用,它是參考美

國維吉尼亞大學John H. Porter博士所發展的

EML應用系統,並再做進一步的延伸,目的

是要讓使用者在使用上更加方便。本模組區

分為兩部分,一個是XSLT,一個是R-PHP。

XSLT是可延伸樣式表語言轉換(eXten-

sible Stylesheet Language Transformations)的縮

寫,主要是用來擷取XML(eXtensible Markup

Language,可擴充標記語言)文件中的資料,

並依設定來重新排列組合這些擷取出的資

料,並予以轉換成另一個檔案。目前XSLT 可

支援轉為另一個XML文件、HTML(HyperText

Markup Language,超文件標示語言)文件或

純文字(Text)的文件。在本系統裡則是利用它

將EML文件轉換成網頁形態呈現,並讓使用

者可以暸解其內容,然後銜接統計分析的步

驟。

R是一種免費的統計軟體,可以執行

絕大多數SAS或SPSS等商業統計軟體可以

做到的統計分析與繪圖,而R-PHP是義大利

Palermo大學所發展出來的一套免費的線上統

計處理介面,以R做為統計分析的工具,結合

PHP(Hypertext Preprocessor)程式語言應用,

將所有的統計分析步驟都可以在網頁上操作

執行。R與PHP均是免費與跨平台,適用於

UNIX、Machintosh與Windows等系統,故其

未來擴展性非常高。

統計分析模組的目標是希望以網際網路

為橋樑,讓生態資料與統計分析相結合,不

管您身在何方,只要能接上網路,就可以執

行機率與統計計算,擺脫商用統計軟體的時

空限制,而且不用擔心版權問題。本系統在

網頁上已提供寫好的各項簡單功能,讓使用

者不必知道R的程式語法,也能運用R的超強

統計分析功能,同時,輸出畫面為R的指令與

分析結果並列,讓對R有興趣的使用者可以同

時學習簡單的R指令。以下是統計分析模組之

架構圖及使用介面︰

EML的地理資訊系統模組

生態研究與地理環境因素是脫離不了關

係的,所以掌握並分析生態資料相關的地理

特性尤為重要。本GIS模組之架構圖如圖所

示,分為兩個部份,一個是Google Map電子

地圖系統,一個是Google Earth立體影像地圖

系統。

Google Map是一個透過網際網路的二維

電子地圖搜尋系統,其操作介面以瀏覽器為

主,包含三部分:(一)地圖資訊,包括手繪

地圖(Map)、衛星影像(Satellite)與混合式地

圖(Hybrid)等三種;(二)位置搜尋提供定址服

務,只要使用者鍵入某一地址(可以是一個完

整的地址、地名或是一郵遞區號等)就可得到

統計分析模組架構圖(蕭其文 製)

網頁使用者介面

XSLT ( 可延伸樣式表語言轉換 )

原始資料

R – PHP 統計分析

資料庫

網頁輸出

生態後設資料

( )EML

專題論述

林業研究專訊 Vol.13 No.6 200622

該地址或是該城市的完整地圖資訊;(三)圖台

操控,藉此可將取得的地圖進行放大、縮小

及平移等功能。因為Google Map提供了一個

良好且快速的使用介面,且其基本功能是免

費的,再加上系統管理者無需費心維護地圖

伺服器(這部份的工作已由Google公司承接),

當然也不用購買商業GIS軟體,因此極適合做

為GIS模組的使用平台。

而為整合EML與Google Map,本模組應

用了文件物件模型(Document Object Model,

DOM)的技術,它是透過程式來動態存取及

更動EML文件的內容及結構,使EML文件相

關的地理屬性能被處理並呈現在Google Map

的網頁上。雖然Google Map在台灣地區衛

星影像上的解析度不錯,但是道路、河川等

相關手繪地圖卻付之闕如,還好台灣尚有其

他資訊公司利用類似技術已開發出一個名為

UrMap的電子地圖搜尋系統,提供了良好的

手繪地圖支援,因此本模組亦發展出可同時

支援兩地圖系統的使用介面,以提供使用者

對照參考。

我們使用的另一個系統是Google Earth,

它與Google Map的不同在於它具有3D立體瀏

覽的功能;此外Google Earth是一個獨立的程

式套裝軟體,而Google Map則是建構在瀏覽

器上。Google Earth的3D瀏覽與獨立程式的特

性,使它的功能更為強大,可以提供地形、

高程及其他一些額外的道路建物等的地圖資

訊,不過必需要先行安裝在個人電腦上才可

使用。

當執行GIS模組時,會將EML中相關的

地理屬性呈現在Google Map上,同時也會自

動產生一個或數個副檔名為KML的檔案。

KML檔案是Google Earth 以XML格式建立的

一種檔案格式,裡面記載各點位資料的相關

地理屬性及說明(KML與Google Earth詳細介

紹請參考本期第51頁“你家座標是多少”一

文)。因此在Google Map中的每一個點位資料

都包含一個Google Earth的超鏈結,點選此連

結即可啟動Google Earth,而Google Earth則會

自動Zoom in並呈現該點位的地理座標。就目

前而言,林試所IM小組所開發的GIS模組是第

一個將EML應用在Google Map及Google Earth

上的例子。

結語

目前林試所生態資訊研究小組在EML所

發展出來的統計分析作業模組已有敘述統計

及繪圖等功能,未來則將繼續增加繪圖功能

的種類,並且將結合EML開發更複雜的統計

功能介面,如迴歸分析、主成分分析及叢集

分析等等。而GIS模組目前只可以一次處理一

份EML文件,未來將朝整合多份EML文件的

方向來發展。

經由以上應用分析的實例,可以讓我們

更加明暸,利用EML將生態研究資料與資訊GIS模組架構圖(蕭其文 製)

網頁使用者介面

DOM( 文件物件模型 )

Google Map API ( 應用程式介面 )

Google Map

生態後設資料

(EML)

Google Earth KML、ツfile

( 本機端 ) ( 網頁端 )

專題論述

林業研究專訊 Vol.13 No.6 2006 23

管理技術整合在一起後,再應用資料庫系統

設計,讓所有研究人員共享資料,擴大研究

層面,這個理念是可行的。接下來如何讓資

料活化,使得資料的生命獲得永續使用,進

而讓資料的整合分析變得更加容易,甚至是

開創出新的科學研究方法,是我們要積極面

對的下一個課題。希望經由本文對於EML實

際應用的介紹,能夠達到拋磚引玉的效果,

激發大家對EML應用發展的興趣。

GIS模組使用介面,使用者在網頁上輸入EML文件路徑,系統同樣透過程式捉取文件中的點位資料,將位置標示在Google Map上,再透過Google Map上的超連結,啟動使用者電腦裡的Google Earth應用軟體,將其地理座標顯示在Google Earth立

體影像上(蕭其文 製)

專題論述