rda: its implementation and localization
DESCRIPTION
RDA的实施与本地化. “从文献编目到知识编码:关联数据技术与应用”专题研讨班. 上海图书馆. July 21, 2012TRANSCRIPT
2012.7.21 “从文献编目到知识编码:关联数据技术与应用”专题研讨班1
RDA 的实施与本地化
胡小菁华东师范大学图书馆
“从文献编目到知识编码:关联数据技术与应用”专题研讨班2
机器可操作
实施方案
MARC更新
解构AACR2
基于FRBR
RDA
Outline
andmore
本地化
3
关于 RDA
《资源描述与检索》
4
RDA 是什么?描述与组织所有资源类型的可扩展框架 内容类型
地图、计算机、记谱、声音、触觉、图片、文本、实物、动画、其他、未指明(共 25 种)
媒介类型音频、计算机、缩微、显微、投影、立体、无中介、视
频、其他 载体类型 发行模式
单部、多部分专著、连续出版物、集成资源
5
与原有标准的关系 AACR2
解构,但继承与兼容 ISBD 、 MARC21 、 DC
元素集兼容
6
要达到什么目的? 走出图书馆界
适用范围:档,博,数字存储机构( LAM ) 走出英语世界 不限于特定元数据标准
7
基本理念 基于国际编目原则声明( ICP )
最高原则:用户的便利性 采用 FR 系列概念模型(实体 / 属性 / 关系)
FRBR 实体:作品、内容表达、载体表现、单件 FRAD 实体:人个、家族、团体、地点
目标之响应用户需求 查找 find 识别 identify 选择 select 获取 obtain 理解 understand
8
关于 FRBR 模型
书目记录的功能需求
9
关于 FR 模型
Zumer, Maja. FRBR: A Generalized Approach to Dublin Core Application Profiles. Proc. Int’l Conf. on Dublin Core and Metadata Applications 2010
概念实物事件地点
+Group1
+Group2
FRSAD
FRAD
FRBR
10
书目实体 WEMI
莎士比亚哈姆莱特
中文版朱生豪译
外文社1999
中北馆
11
书目记录中的实体 - 属性 - 关系主要责任者:莎士比亚 著题名:哈姆莱特 / 莎士比亚著 ; 朱生豪译出版发行:北京 : 外文出版社 , 1999
载体形态: 452 页 , [1] 页照片 : 图 ; 19 厘米
统一题名: Hamlet
译自: Hamlet, prince of Denmark
主题:话剧 剧本 英国 中世纪其他责任者:朱生豪 译ISBN : 7-119-02289-X
个人 -W 关系M
M
M
W
E 关系概念 -W 关系个人 -E 关系
M
12
实体的唯一标识符
13
FRBR 化显示 按作品集中(莎士比
亚) 皆大欢喜 终成眷属 哈姆莱特 麦克白 仲夏夜之梦 ……
按作品和内容表达家族细览 文本 动画
按语种细览 按媒介类型细览
计算机(如电子书) 非中介(如纸本图书) 视频(如录像片)
14
RDA 与 AACR2
《英美编目条例》
15
AACR2 vs. RDA
Part I. 著录2 图书 / 小册子 /印刷单页3 舆图资料 4 手稿 5 乐谱 6 录音 7 电影和录像8 图片资料 9 电子资源10 三维物品及教具11 缩微品 12 连续性资源
Part II. 标目、统一题名和参照21 选择检索点22 个人23 地理名称24 团体25 统一题名
记录属性Section 1 载体表现 M 单件 ISection 2 作品 W 内容表达 ESection 3 个人 / 家族 / 团体Section 4 概念 /对象 / 事件 / 地
点 记录关系
Section 5 WEMISection 6 个人 / 家族 / 团体Section 7 概念 /对象 / 事件 / 地
点 记录相互间关系
Section 8 WEMI间Section 9 个人 / 家族 / 团体间Section 10 概念 /对象 / 事件 /
地点间
16
声音特征
AACR2 元素( 7 个)type of recording
playing speed
groove characteristic
track configuration
number of tracks
number of sound channels
recording and reproduction characteristics
RDA 元素( 8 个)type of recording( 数字 / 模拟 )
recording medium ( 磁 / 光 )
playing speed
groove characteristic
track configuration
tape configuration
configuration of playback channels
special playback characteristics
17
样例 AACR2
RDA录音类型 : analog播放速度: 7 ½ ips音轨配置: 2 track播放声道配置: mono
18
关系、关系、关系 Part I. 著录
2 图书 / 小册子 /印刷单页3 舆图资料 4 手稿 5 乐谱 6 录音 7 电影和录像8 图片资料 9 电子资源10 三维物品及教具11 缩微品 12 连续性资源
Part II. 标目、统一题名和参照21 选择检索点22 个人23 地理名称24 团体25 统一题名
记录属性Section 1 载体表现 M 单件 ISection 2 作品 W 内容表达 ESection 3 个人 / 家族 / 团体Section 4 概念 /对象 / 事件 / 地
点 记录关系
Section 5 WEMISection 6 个人 / 家族 / 团体Section 7 概念 /对象 / 事件 / 地
点 记录相互间关系
Section 8 WEMI间Section 9 个人 / 家族 / 团体间Section 10 概念 /对象 / 事件 /
地点间
19
关系
Athena Salaba: RDA-wksp6.pdf, p.3
20
元数据标准结构 / 编码标准
发布标准交换格式
内容标准编目规则
数据值标准取值体系 /词汇表
2709/HTML/XML
AACR2/RDA/CCO
MARC/DC/CDWA
中图法 /LCSH/AAT
编目标准
21
RDA 与 MARC
RDA in MARC
22
336-338 字段 245 $h 一般资料标识 336 内容类型
337 媒介类型 338 载体类型
23
260 与 264 字段 260 出版发行
$a 出版发行地$b 出版发行者$c 出版发行日期
264 #0 生产未出版资源
264 #1 出版 264 #2 发行 264 #3 制造 264 #4 版权日期
24
受控值采用 URI (实验) 受控值:关系指示词、 336-338 、编码数据字段、受控检索点
MARC咨询委员会讨论结果( 2010-1-17 )一些参与者不愿意实验,因为涉及大量系统工
作:如何解释、取回什么、如何定义值与 URI的关系。某些参与者愿意用一套测试记录来实验。在问题整理出以前没有定案。
将准备文件,对如何在MARC 中使用 URI提供指导与实例,供希望实验者使用。
MARC DISCUSSION PAPER NO. 2010-DP02: Encoding URIs for controlled values in MARC records (2009-12-14)
25
MARC 的问题之:一对多 其他形态细节 (UNIMARC-215$c / MARC21-300$b)
图书(插图)215 $c 照片,彩图,地图
地图(形态、色彩、材料等)215 $c彩色,石膏
录音资料(材料、速度、录制方法、磁迹、声道、降噪或补偿说明)215 $c78rpm ,单声道,粗纹,横向
缩微资料(极性、缩率、色别、感光乳剂、片基、影像布局等)215 $c负像, 1:15 ,彩色,硝酸片基
fade away
26
RDA 的实施
1 、作为传统编目条例的替代品国际范围采用
2 、 FRBR 模型的实现3 、关联数据应用注册元素集及词汇表
27
应用实例: eXtensible Catalog (XC)
XC Schema采用 DC 应用纲要的概念,从不同的 Schema
中选择元数据元素包括:
22 个 RDA元素 (elements)
11 个 RDA职能指示词 (role designators)
全部 DC词汇 (dcterms)
专门定义的数据元素 关联数据应用初步
28
三种实施方案: FR 模型的实现 RDA Database Implementation Scenarios
2007.1 RDA 编辑 Tom Delsey提出2009.7修订
Scenario 3 :扁平文档(无连接) Scenario 2 :关联书目和规范记录 Scenario 1 :关系 /面向对象
29
Scenario 3
‘Flat file’ database structure (no links)
书目记录
规范记录
30
Scenario 2
Linked bibliographic and authority records
31
Scenario 1
Relational / Object-oriented database structure
32
各国实施 RDA
2013年第一季度美国( Day one: 2013.3.31 )
LC 、 NAL 、 NLMPCC :之后规范记录必须,书目记录时间未定
不列颠图书馆加拿大图书馆与档案馆德国国家图书馆澳大利亚国家图书馆
OCLC :设想依 RDA更新WorldCat 记录
33
RDA在中国 RDA 中文翻译
(2012.5- ) 国家图书馆出版社与
ALA签署协议 国家图书馆与 CALIS
联机合作编目中心组织 2013年初出版
RDA 理论与实践培训 2012.7.9-11 国家图书馆
“RDA在中国的实施和挑战”研讨会 2012.7.11 国家图书馆
34
本地化, Scenarios in China ?#1 中西文编目统一采用 RDA
#2 西编采用 RDA ,中编编制并采用另一并行标准#3 编制基于 FRBR 和 ICP 的本地标准用于中西文编目#4 (至少在短期内)保持现状
RDA 最终是否会用于中文资料编目? RDA 是否会用作《中国图书馆编目规则》未来版本的基础? 均尚未决定,也不会在一两年内决定。
──Ben GU (SCATNews, No. 37)
Kai Li. RDA in China. “RDA Worldwide”, ALAMS 12June 24th, 2012, Anaheim, California
35
西文编目:为 RDA做准备 政策准备
套录:沿用?改动?原编?
培训准备 系统准备
MARC格式设置(字段 / 子字段、索引规则)OPAC 显示设置
36
一大波僵尸正在接近!
37
“RDA :为关联数据而生”
Machine-actionable
38
让 RDA 从概念性转为行动性 数据模型会议(伦敦会议:不列颠图书
馆, 2007.4.30-5.1 ) DCMI 与 JSC合作 元数据管理组织 (
Metadata Management Associates)及志愿者实施
BL 及 Siderean软件公司资助 由 RDA 元素创立机器可操作本体 (machine-
actionable ontology) 图书馆由传统数据观转轨至关联数据及语义网的开端Karen Coyle: RDA Vocabularies for a Twenty-First-Century Data Environment. Library Technology Reports, 2010, v.46, no.2, p.26-36
39
RDA注册: RDVocab
http://rdvocab.info/
RDA 元素集
RDA 取值词表
40
RDA注册:取值词表
图书的载体形态902 p. : chiefly col. ill. ; 24 cm.
902 pages : chieflyColoured illustrations ; 24 cm.
RDA Illustrative Contenthttp://rdvocab.info/termLIst/IllusContent/1015
RDA colourhttp://rdvocab.info/termList/RDAcolour/1001
RDA Extent of Texthttp://rdvocab.info/termList/extentText/1001
描述 /著录中非照录部分的规定用语
关系指示词
AACR2
RDA
41
取值词表 2011.8 第一批出版
获批 11 种共 68 种(现 70 种)
2012.1 第二批出版载体类型内容类型媒介类型
JSCDCMI/RDA工作组
ALA 出版社评审通过
42
取值词:德语版 Vocabulary: RDA Content Type
Concepts: cartographic dataset
http://www.metadataregistry.org/conceptprop/list/concept_id/510.html
http://rdvocab.info/termList/RDAContentType/1001
43
RDA 联机注册:元素集http://metadataregistry.org/rdabrowse.htm
Lable……URITitle http://rdvocab.info/Elements/title
Edition statement http://rdvocab.info/Elements/editionStatement
Place of production http://rdvocab.info/Elements/placeOfProduction
Date of production http://rdvocab.info/Elements/dateOfProduction
Copyright date http://rdvocab.info/Elements/copyrightDate
Identifier for the manifestation http://rdvocab.info/identifierForTheManifestation
……
内容标准↓
元数据标准
44
把记录细化到数据 元数据注册目的
建立数据层应用间的兼容 以 RDF三元组格式表达数据
记录
数据
数据
数据主 宾谓
45
Bibliographic data in the Semantic Web /
Gordon Dunsire
Title: Cataloguing is fun!
Author: Mary MacDonald
Content type:
Media type:
LCSH:
microform
text
Cataloging
Bibliographic record: 12345
b12345 Author “Mary MacDonald”
b12345 Title “Cataloguing is fun!”
b12345 Content type “text”
b12345 Media type “microform
b12345 LCSH “Cataloging”
主 谓 宾
Name authority record: 8765
Heading: MacDonald, Mary
n8765 Heading “MacDonald, Mary”
n8765
t1234 Preferred label “microform”
t1234
lc1234
Heading “Cataloging”lc1234Preferred label “text”t9876
t9876
46
RDA 的修订:机器可操作RDA 第 3章机器可操作数据元素(讨论稿) 数量与尺寸
图书: 902 pages ; 24 cm乐谱: 1 score and 3 parts (19 pages)地图: 20 x 30 cm, on sheet 25 x 35 cm
元素→元素 - 方面
47
方面 - 单位 -量:乐谱数量文本描述: 1 score and 3 parts (19 pages)
Aspect: extent/number of subunits (数量 / 子单元数) Unit: score Quantity: 1 Aspect: extent/number of subunits (数量 / 子单元数) Unit: parts Quantity: 3 Aspect: extent/number of subunits (数量 / 子单元数) Unit: pages Quantity: 19
Machine-Actionable Data Elements in RDA Chapter 3: Discussion Paper (May 2012)
48
方面 - 单位 -量:地图尺寸
content/carrier: map Aspect: width Unit: cm Quantity: 20 Aspect: height Unit: cm Quantity: 30
carrier: sheet Aspect: width Unit: cm Quantity: 25 Aspect: height Unit: cm Quantity: 35
文本描述: 20 × 30 cm, on sheet 25 × 35 cm
Machine-Actionable Data Elements in RDA Chapter 3: Discussion Paper (May 2012)
49
设计准则:文本描述→可操作
功能: 易于为确定区分内容进行匹配 按大小、尺寸或其他准则排序 基于数量对媒介材料做更细粒度的分面 为自动确定数量提供更佳途径 以不同语言提供文本值与标签 能够为特定用户精简及条列更复杂的数量信息 录入时数据有效性检查
Machine-Actionable Data Elements in RDA Chapter 3: Discussion Paper (May 2012)
50
RDF 图示
Machine-Actionable Data Elements in RDA Chapter 3: Discussion Paper (May 2012)Fig.1: RDF graphs of the basic extent sub-elements
51
不只是 RDA
走向machine-actionable
52
其他元数据注册 MARC21 书目 (http://marc21rdf.info/) IFLA 名称空间 (http://iflastandards.info/)
ISBD (http://iflastandards.info/ns/isbd/)FR (http://iflastandards.info/ns/fr/)
已出版
Open Metadata Regitsry
53
MARC21 书目:非官方版( 2011.9.11 )
MARC21 Element Sets 元素集 (14 个 ) 00X (定长 /控制字段) 0XX 、 1XX 、 2XX 、 3XX 、 4XX 、 5XX 主题: 60X (个人) , 61X (团体 /会议) , 63X (统
一题名) , 64X (时间) , 65X 7XX 8XX
MARC21 Vocabularies 取值词表 (115 个 ) 定长字段中各字符位的取值: 006 ( 1
个)、 007 ( 94 个)、 008 ( 20 个)http://marc21rdf.info/
54
ISBD ( 2012.2 出版) ISBD Element Sets 元素集
ISBD elements Element list (182) ISBD Vocabularies 取值词表
ISBD Content Form Concept list (11) ISBD Content Qualification of Dimensionality
Concept list (2) ISBD Content Qualification of Motion Concept list (2) ISBD Content Qualification of Sensory Specification
Concept list (5) ISBD Content Qualification of Type Concept list (3) ISBD Media Type Concept list (10)
西班牙国家图书馆书目
关联数据用此发布
http://iflastandards.info/ns/isbd/
55
功能需求系列( 2012.5 出版) FRBR Element Sets 元素集
FRAD model Element list (147) FRBRer model Element list (216) FRBRer open model Element list (3) 待审 FRSAD model Element list (19)
FRBR Vocabularies 取值词表 FRAD User Tasks Concept list (4) FRBRer User Tasks Concept list (4) FRSAD User Tasks Concept list (4)
http://iflastandards.info/ns/fr/
56
Schema.org 的图书馆扩展 类 Classes (近似内容类型)
如:档案资料、计算机文件、游戏、图像、乐谱…… 对象特性 Object Properties
如:出版地 数据特性 Data Properties
馆藏数、 OCLC控制号 命名个体 Named Individuals (近似载体类型)
如:有声书、蓝光碟、盲文书、光盘、 VHS 录像带……
标注特性 Annotation Properties dc:creator, dc:description, dc:title, vs:term_statusExperimental “library” extension vocabulary for use with Schema.org
57
LC 的后MARC 计划 书目框架转变行动( 2011.5- )
取代MARC 21 ,以从新兴的内容标准中充分受益 以语义网和关联数据技术做实验在更广泛的网络搜索环境中最大限度重用图书馆元数据
Bibliographic Framework Transition Initiative
58
LC正式启动以关联数据取代MARC
建模计划( Modeling Initiative , 2012.5- ) Eric Miller领导的 Zepheira 团队 把 MARC21格式翻译到关联数据模型,同时尽可能保留传统格式健壮且有利的方面
提出作为有力起点的模型供讨论基于反馈及进展,改变或调整提出的模型
最初的模型将作为演示系统 /服务的工作基础,反过来也会用于进一步细化模型
LC 现在将开始组织不同的方案,以使图书馆参与者更为广泛
The Library of Congress Announces Modeling Initiative
59
References
Athena Salaba. RDA: The New Cataloging Standard, A Workshop offered by the School of Library & Information Science, Kent State University. October 21-22, 2011
Gordon Dunsire. Bibliographic data in the Semantic Web – what issues do we face in getting it there? Presented to the ALCTS Cataloging and Classification Section Executive Committee Forum, ALA Annual, 24 June 2011
Peter J. Rolla, Machine-Actionable Data Elements in RDA Chapter 3: Discussion Paper (May 2012)
Tom Delsey. RDA Database Implementation Scenarios (5JSC/Editor/2/Rev, 1 July 2009)
60
推荐博客: Metadata Matters
Open Metadata Registory 团队This blog is about Metadata, attached to the
site of Metadata Management Associates. 博客作者
Diane HillmannGordon Dunsire……
http://managemetadata.com/blog/
Question ?