gbif 發布生物多樣性資料 darwin core archive 格式與 ipt2 資料發布平台介紹

100
GBIF 發發發發發發發發發 Darwin Core Archive 發發發 IPT2 發發發發發發發發 發發發 發發發發發發發發發發發發發發 2013/11/21

Upload: tobit

Post on 23-Feb-2016

141 views

Category:

Documents


0 download

DESCRIPTION

GBIF 發布生物多樣性資料 Darwin Core Archive 格式與 IPT2 資料發布平台介紹. 賴昆祺 中央研究院生物多樣性研究中心. 2013/11/21. 大綱. 四個 資料分享流程 六個 非用 Darwin core 的理由 十分鐘 教你看懂 Darwin core 八個 使用 Darwin core archive 要注意的事情 一個 好工具分享 --IPT 介紹 一個 用 DwC -A 經典範例 --Data paper 投稿範例. 先別說這個了 , 你 聽 過 Darwin core 嗎 ?. 是. 否. - PowerPoint PPT Presentation

TRANSCRIPT

GBIF 發布生物多樣性資料 Darwin Core Archive 格式與 IPT2 資料發布平台介紹

賴昆祺中央研究院生物多樣性研究中心

2013/11/21

大綱• 四個資料分享流程• 六個非用 Darwin core 的理由• 十分鐘教你看懂 Darwin core• 八個使用 Darwin core archive 要注意的事情• 一個好工具分享 --IPT 介紹• 一個用 DwC-A 經典範例 --Data paper 投稿範例

先別說這個了,你聽過 Darwin core 嗎?是 否

你聽過 Darwin core Archive 嗎?

是 否

您認為這麼辛苦整理資料,是為了?給其他有需要的人看,方便閱讀給機器看,加速資料分享計畫要求

學名檢查工具

輸入學名 同物異名 分類位階 錯字檢查 正確學名

http://taibif.tw/BDTools

地理座標檢核

• 上傳 EXCEL 檔案,檔案中包含三個欄位資訊,分別為 loc( 地點文字說明 ) 、 x( 經度 ) 、 y( 緯度 )

資料發佈流程

52 country participants, 38 international organizations; 417,529,910 indexed records, 10,004 datasets, 464 publishers

Darwin core Archive

資料分享工具

利用 IPT 上傳研究成果中名錄資料 / 出現記錄

從 Word/Excel 檔整理

利用 EXCEL建檔 參考 Darwin core 定義與說明

利用 IPT 上傳研究成果中名錄資料 / 出現記錄

工具的檢查

輸入學名 同物異名 分類位階 錯字檢查 正確學名

利用 IPT 上傳研究成果中名錄資料 / 出現記錄

IPT資料發佈

利用 IPT 上傳研究成果中名錄資料 / 出現記錄

Darwin core Archive 的重要性• 1. 生物多樣性資料分享的國際標準

– ABCD • > 1200 詞彙(欄位)• Shared via BioCase

– Darwin core (v 1.2)• 48 詞彙(欄位)• Shared via by DiGIR

– Darwin Core (v. 1.4) • 46 詞彙(欄位)• Shared via Tapir

– Darwin Core (TDWG Standard, since 2009) • 172 詞彙(欄位 )

BY Kyle Braak

Darwin core Archive 的重要性• 1. 生物多樣性資料分享的國際標準

By GBIF Annual Report 2012

有哪些組織在用 Darwin core

• 美國生物多樣性典藏數位化計畫(Advancing Digitization of Biodiversity Collections)

• 澳洲生物地圖集( Atlas of Living Australia, ALA)

• 台灣數位典藏國家型計畫

Darwin core Archive 的重要性• 1. 生物多樣性資料分享的國際標準• 2. 結構化資料

台灣石珊瑚誌

Darwin core Archive 的重要性• 1. 生物多樣性資料分享的國際標準• 2. 結構化資料

台灣真菌誌

Darwin core Archive 的重要性• 1. 生物多樣性資料分享的國際標準• 2. 結構化資料

台灣蝽象誌

學名中文名科名同物異名標本採集號描述分布文獻

學名 圖檔名稱描述分布棲地文獻註解

學名 圖檔名稱中文名文獻描述分布棲地

Darwin core Archive 的重要性• 1. 生物多樣性資料分享的國際標準• 2. 結構化資料

ScientificName vernacularName taxonRank scientificNameAuthorship

locality threatStatus

Cycas taitungensis 臺東蘇鐵 species C. F. Shen Taiwan

Hemimyzon taitungensis 臺東間爬岩鰍 species Tzeng &

Shen, 1981Tachia River

VU

Pocillopora damicornis 細枝鹿角珊瑚 species Linnaeus,

1758Widely distributed Indo-Pacific

…….. ……….. ……… …………. ………. ………….

Darwin core Archive 的重要性• 1. 生物多樣性資料分享的國際標準• 2. 結構化資料• 3. 回傳一致的搜尋結果

Darwin core Archive 的重要性• 1. 生物多樣性資料分享的國際標準• 2. 結構化資料• 3. 回傳一致的搜尋結果• 4. 學術出版

Darwin core Archive 的重要性• 1. 生物多樣性資料分享的國際標準• 2. 結構化資料• 3. 回傳一致的搜尋結果• 4. 學術出版• 5. 資料備份

Time

Info

rmat

ion

Con

tent

Time of publication

Specific details

General details

Retirement orcareer change

DeathAccident

after Michener et al., 1997

Time

Info

rmat

ion

Con

tent

Time of publication

Specific details

General details

Retirement orcareer change

DeathAccident

Time

Info

rmat

ion

Con

tent

Time of publication

Specific details

General details

Retirement orcareer change

DeathAccident

after Michener et al., 1997

生物多樣性面臨的危機• 環境破壞、物種滅絕• 累積的資料知識失落

Darwin core Archive 的重要性• 1. 生物多樣性資料分享的國際標準• 2. 結構化資料• 3. 回傳一致的搜尋結果• 4. 學術出版• 5. 資料備份6. 資料可再利用與分析, Ecological Niche Model

Analysis / Applications

Darwin core archive

Darwin core archive

Darwin Core

Darwin core archive

物種出現紀錄( Primary Biodiversity Data )• 物種出現紀錄包含博物館動物標本、植物標本、生態調查與物種觀察等資料。

10 分鐘看懂 Darwin core類別 說明 詞彙Record-level terms 關於採集或觀測資

料的收藏紀錄Modified 、 Language 、 institutionCode 、collectionCode( 館藏代碼 ) 等

Occurrence 關於物種在自然、館藏、或資料集中的出現紀錄資訊

catalogNumber( 編目號 ) 、 recordedBy 、 individualCount 、 Preparations( 製備過程 ) 等

Event 關於某次採集或觀測行為的事件紀錄

eventDate( 事件日期 ) 、 Habitat( 採集環境描述 ) 等

Location 地理與位置資訊 Country 、 County 、 locality 、 minimumElevationInMeters 、 minimumDepthInMeters 、 decimalLatitude 、 decimalLongitude、 coordinateUncertaintyInMeters 等

Identification 關於採集或觀測資

料的鑑定資訊identifiedBy 、 dateIdentified 等

Taxon 關於採集或觀測資料的分類資訊

scientificName 、 kingdom 、 Phylum 、 Class 、 Order 、 Family 、 genus 、 specificEpithet 、 infraspecificEpithet 等

Darwin core is divided into classes and terms

• http://rs.tdwg.org/dwc/terms/index.htm

dcterms:modified :最後修正日期資料中的任何欄位修正完成時的日期及時間。使用 ISO-8601 格式,如: 1994-11-05

Darwin core is divided into classes and terms

• http://rs.tdwg.org/dwc/terms/index.htm

dcterms:rights :資料授權的方式如:創用 CC 姓名標示、姓名標示─非商業性

Darwin core is divided into classes and terms

• http://rs.tdwg.org/dwc/terms/index.htm

basisOfRecord :資料基底,如:PreservedSpecimen- 標本收藏FossilSpecimen- 化石標本LivingSpecimen- 活體標本HumanObservation- 人為觀測MachineObservation- 機器觀測StillImage- 靜態影像SoundRecording- 錄製聲音OtherSpecimen- 其它標本

Darwin core is divided into classes and terms

• http://rs.tdwg.org/dwc/terms/index.htm

recordedBy :資料記錄者為主要的採集者或觀測者

Darwin core is divided into classes and terms

• http://rs.tdwg.org/dwc/terms/index.htm

samplingProtocol :採集方法如採集時使用方法或步驟的名稱、參考或簡短描述。例如:紫外光陷阱、霧網、底拖網

Darwin core is divided into classes and terms

• http://rs.tdwg.org/dwc/terms/index.htm

eventDate :資料發生日期如採集日期, 1997-12-02

Darwin core is divided into classes and terms

• http://rs.tdwg.org/dwc/terms/index.htm

locality :位置、採集地,如里龍山decimalLatitude :十進位緯度,採集或觀測事件發生地點中心位置的緯度,以十進位表示decimalLongitude :十進位經度,採集或觀測事件發生地點中心位置的經度,以十進位表示

Darwin core is divided into classes and terms

• http://rs.tdwg.org/dwc/terms/index.htm

Darwin core is divided into classes and terms

• http://rs.tdwg.org/dwc/terms/index.htm

scientificName :學名,該分類群最低階層的完整名稱,應採用最近被接受的分類方式,盡可能地精確,包含作者、發表年代、看法引證來源、不確定性的指示。例如: "Coleoptera" ( 目 ), "Vespertilionidae" ( 科 ), "Manis" ( 屬 ), "Ctenomys sociabilis" ( 屬 + 種小名 ), "Ambystoma tigrinum diaboli" ( 屬 + 種小名 + 亞種小名 ), "Quercus agrifolia var. oxyadenia (Torr.) J.T. Howell" ( 屬 + 種小名 + 種下階層 + 種下名 + 學名作者

Darwin core is divided into classes and terms

• http://rs.tdwg.org/dwc/terms/index.htm

taxonRank :分類等級該分類群最低階層的等級,如 "subspecies", "varietas", "forma", "species", "genus“, “family”

Darwin core extension• http://rs.tdwg.org/dwc/terms/index.htm

paleontology - 古生物學常用詞彙已經被整合到 GeologicalContext

Darwin core 的近期發展 • Darwin core 與基因多樣性的標準

Darwin core 的更改記錄• http://rs.tdwg.org/dwc/terms/history/index.htm

8 個運用 Darwin core 要注意的事情 (1)• 對於分享的每一筆記錄,需要產生一個獨特唯一的”核心 ID(core ID)”

– 流水編號– lsid

core ID scientificName vernacularName recordedByurn:lsid:coatbp.sinica.edu.tw:observation:1

Grammoplites scaber 橫帶牛尾魚 邵廣昭

urn:lsid:coatbp.sinica.edu.tw:observation:2

Begonia silletensis (A. DC.) C. B. Clarke

厚壁秋海棠 彭鏡毅

8 個運用 Darwin core 要注意的事情 (2)

• 盡可能使用 Darwin core 欄位name 俗名 collector

Grammoplites scaber 橫帶牛尾魚 邵廣昭Begonia silletensis (A. DC.) C. B. Clarke 厚壁秋海棠 彭鏡毅scientificName vernacularNa

merecordedBy

Grammoplites scaber 橫帶牛尾魚 邵廣昭Begonia silletensis (A. DC.) C. B. Clarke 厚壁秋海棠 彭鏡毅

8 個運用 Darwin core 要注意的事情 (3)

• 不要使用類別名稱,如 Occurrence, Event, MaterialSample, Location, Taxon

Taxon Location EventGrammoplites scaber 台灣 標本採集Begonia formosana (Hayata) Masam. 水鴨腳 自然觀察

scientificName locality basisOfRecordGrammoplites scaber 台灣 標本採集Begonia formosana (Hayata) Masam. 水鴨腳 自然觀察

8 個運用 Darwin core 要注意的事情 (4)

• 使用 Darwin core已經定義的說明scientificName locality basisOfRecordGrammoplites scaber 台灣 標本採集Begonia formosana (Hayata) Masam. 水鴨腳 自然觀察

scientificName locality basisOfRecordGrammoplites scaber 台灣 PreservedSpecimen

Begonia formosana (Hayata) Masam. 水鴨腳 HumanObservation

8 個運用 Darwin core 要注意的事情 (5)

• 盡可能的填上所調查資料屬性scientificName vernacularName recordedBy

Grammoplites scaber 橫帶牛尾魚 邵廣昭Begonia silletensis (A. DC.) C. B. Clarke 厚壁秋海棠 彭鏡毅

scientificName

vernacularName

recordedBy

decimalLongitude

decimalLatitude

eventData

kingdom associatedMedia

right

taxonRank

Grammoplites scaber

橫帶牛尾魚

邵廣昭 121.22 22.46 2001-10-11 動物界 1.Jpg Cc-

byspecies

Begonia silletensis (A. DC.) C. B. Clarke

厚壁秋海棠

彭鏡毅 120.111 24.892 1998-10-23 植物界 2.jpg Cc-

byspecies

8 個運用 Darwin core 要注意的事情 (6)

• 格式需要符合定義的規範scientificName eventData decimalLatitudeGrammoplites scaber 11-11-11 N 22.47

Begonia silletensis (A. DC.) C. B. Clarke

102-11-11 22 。 41’36

scientificName eventData decimalLatitudeGrammoplites scaber 2011-11-11 22.47

Begonia silletensis (A. DC.) C. B. Clarke

2013-11-11 22.68

8 個運用 Darwin core 要注意的事情 (7)

• 若有些資料被想公開,可以用 informationWithheld 來加以說明– 如:此物種為瀕危物種,因此座標隱藏( location

information not given for endangered species )scientificName decimalLongitude decimalLatitude informationW

ithheldGrammoplites scaber

location information not given for endangered species

Begonia silletensis (A. DC.) C. B. Clarke

121.11 22.68

8 個運用 Darwin core 要注意的事情 (8)

• 若有些資料欄位目前對應不到 Darwin core ,這些欄位是可以保留,但發佈的時候,這些資料會被忽略

“Wingspan” is not a Darwin Core term

Resources

Darwin core 中文說明: http://www.taibif.tw/taibif_search/dwcDescribe.php

開啟 EXCEL 將資料鍵入

資料整合發布工具( Integrated Publishing Toolkit, IPT )

資料整合發布工具( Integrated Publishing Toolkit, IPT )

58

• Basic Metadata• Geographic Coverage• Taxonomic Coverage• Temporal Coverage• Keywords• Associated Parties• Project Data• Sampling Methods• Citations• Collection Data• External Links• Additional Metadata

Ecological Metadata Language (EML)Sections of metadata

Darwin core archive 架構

Darwin core archive 架構

Darwin core archive 架構

Darwin core archive 架構

Darwin core archive 架構

Darwin core archive 架構

Darwin core archive 架構

Darwin Core Archive: Benefits

• Simple format (text files) • Efficient harvesting (single file) • Efficient storage (compressed) • Easy access (no special software required)

What is 'Data Paper' ?• Searchable / online accessible datasets

– Should always be linked to the published datasets they described.

• Metadata described– Contains facts about data.– Rather than reporting a

research investigation. • Scholarly publication /

scholarly credit67

68

Ecological Researchhttp://www.springer.com/life+sciences/ecology/journal/11284

69

Produce manuscript for data paper

70

71

72

73

RTF file

74

Pensoft Publisher (http://www.pensoft.net)

75

Create Account: register76

Create Account: step 177

Create Account: step 278

Create Account: step 379

Create Account: finish80

81

82

83

84

85

Enter metadata (cont.)86

Upload submission87

88

89

90

91

92

工作坊你會學到什麼?

繳交資料格式及綜合介紹物種調查資料

生物多樣性檢核工具

一份 DwC-A

metadata

利用 IPT上傳研究成果與原始分布資料

建立資源集

• 介面介紹• 帳號申請

建立物出現紀錄

• 上傳一份DwC• Darwin Core Mappings

Metadata填寫

利用 IPT上傳研究成果中名錄資料從word 檔整理

利用EXCEL建檔

發佈名錄資料

上傳名錄

名錄

TaiBIF網站介紹

您認為這麼辛苦整理資料,是為了?給其他有需要的人看,方便閱讀給機器看,加速資料分享計畫要求

謝謝聆聽Thank you for your attention

100