江西省 地方标准jxdb.jxbz.org.cn/upload/20190114/201901141029407651.pdf2019/01/14  · db36/t...

18
ICS 35.240 L 70 DB36 西 DB 36/T 1098—2018 政务数据开放平台技术规范 Technical specifications for government data open platform 2018 - 12 - 29 发布 2019 - 07 - 01 实施 江西省市场监督管理局 发布

Upload: others

Post on 24-Oct-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

  • ICS 35.240 L 70

    DB36 江 西 省 地 方 标 准

    DB 36/T 1098—2018

    政务数据开放平台技术规范

    Technical specifications for government data open platform

    2018 - 12 - 29发布 2019 - 07 - 01实施

    江西省市场监督管理局 发 布

  • DB36/T 1098—2018

    I

    目 次

    前言 ................................................................................. I

    引言 ............................................................................... III

    1 范围 .............................................................................. 1

    2 规范性引用文件 .................................................................... 1

    3 术语和定义 ........................................................................ 1

    4 分类组织方式 ...................................................................... 2

    5 开放数据集元数据 .................................................................. 2

    6 数据开放平台技术架构 .............................................................. 7

    7 数据开放流程 ..................................................................... 10

    8 开放内容要求 ..................................................................... 12

    9 开放管理制度 ..................................................................... 12

  • DB36/T 1098—2018

    II

    前 言

    本标准按照GB/T 1.1-2009的给出的规则起草。

    本标准由江西省发展和改革委员会提出并归口。

    本标准起草单位:江西省信息中心。

    本标准主要起草人:金俊平、杜军龙、杨霁轩、袁小乐、袁振武、李敏、周剑涛、刘浪、刘芳芳、

    胡坚勇、龚松、占晓华。

  • DB36/T 1098—2018

    III

    引 言

    江西省数据开放平台(江西省政务数据开放平台)是由江西省发展和改革委员会牵头,相关政府部门

    共同参与建设的政府数据服务门户,是汇集、管理、应用及开放全省政府机构与行业部门政务数据、公

    共服务类数据的综合性数据服务平台。平台提供政府向公众开放的各类数据资源,提供数据查询、接口

    调用、应用开发等服务,致力于充分发挥政府数据资源的整体开发利用价值,满足公众对政府数据的“知

    情权”和“使用权”。

    本规范为江西省各地区政府开展数据开放工作时,提供技术标准和制度管理的依据。

  • DB36/T 1098—2018

    1

    政务数据开放平台技术规范

    1 范围

    本标准规定了政务信息资源开放数据的分类组织方式、开放数据集元数据、数据开放平台技术架构、

    数据开放流程、开放内容要求和开放管理制度。

    本标准适用于各级政府部门开放各类政务数据,并为各相关部门政务数据资源开放提供实操性指

    导。

    2 规范性引用文件

    下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本文

    件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

    GB/T 7027 信息分类编码的基本原则和方法

    GB/T 21063.1 政务信息资源目录体系 第1部分:总体框架

    GB/T 21063.3 政务信息资源目录体系 第3部分:核心元数据

    GB/T 21063.4 政务信息资源目录体系 第4部分:政务信息资源分类

    GB/T 21063.6 政务信息资源目录体系 第6部分:技术管理要求

    《国务院关于批转发展改革委等部门法人和其他组织统一社会信用代码制度建设总体方案的通知》

    (国发〔2015〕33号)

    《江西省政务信息资源目录编制规范(试行)》(赣发改高技〔2017〕965号)

    3 术语和定义

    GB/T 7027、GB/T 21063.1确定的及下列术语和定义适用于本文件。

    3.1

    元数据

    描述信息资源特征的数据。一般包括信息资源的分类、名称、开放属性、提供方、发布日期等。

    3.2

    元数据元素

    元数据的基本单元,用以描述信息资源的某个特性。

    3.3

    元数据实体

    一组说明数据相同特性的元数据元素。

  • DB36/T 1098—2018

    2

    3.4

    政务信息资源

    政务部门在履行职责过程中制作或获取的,以一定形式记录、保存的文件、资料、图表和数据等各

    类信息资源,包括政务部门直接或通过第三方依法采集的、依法授权管理和因履行职责需要依托政务信

    息系统形成的信息资源等。

    3.5

    政务信息资源目录

    通过对各政务信息资源依据规范的元数据描述,按照一定的分类方法进行排序和编码的一组信息,

    用以描述各个政务信息资源的特征,以便于对政务信息资源进行检索、定位与获取。

    3.6

    数据集

    一种由数据所组成的集合。

    3.7

    数据指数

    数据集开放数量统计的重要方法,用以计算数据开放平台中各类数据的完善程度。

    4 分类组织方式

    政务信息资源开放的数据分类组织方式应按照下列方式组织分类:

    a) 基础信息资源目录包括江西省人口基础信息资源、法人单位基础信息资源、自然资源和空间地理信息资源、社会信用基础信息资源、电子证照基础信息资源等;

    b) 主题领域包括但不限健康保障、社会保障、食品药品安全、安全生产、价格监管、能源安全、城乡建设、社区治理、生态环保、应急维稳;

    c) 部门信息资源目录包括:党中央、全国人大常委会、国务院、全国政协、最高人民法院、 最高人民检察院的政务部门信息资源,省(自治区、直辖市)、计划 单列市以及其下各级政务

    部门信息资源。

    5 开放数据集元数据

    5.1 概述

    本文件对开放数据的政务信息资源目录元数据进行定义和描述,元数据内容包括的属性见表1。

  • DB36/T 1098—2018

    3

    表1 元数据内容

    元数据实体 元数据元素 类型

    信息资源基本信息

    信息资源名称 核心元数据

    信息资源代码 核心元数据

    信息资源分类 核心元数据

    信息资源摘要 核心元数据

    信息资源格式 核心元数据

    更新周期 核心元数据

    发布日期 核心元数据

    信息资源提供方

    资源提供方 核心元数据

    资源提供方代码 核心元数据

    信息资源开放属性

    是否向社会开放 核心元数据

    开放条件 核心元数据

    信息项描述

    信息项名称 核心元数据

    数据类型 核心元数据

    数据长度

    开放属性

    信息项描述

    5.2 元数据描述

    5.2.1 信息资源名称

    5.2.1.1 定义:开放数据集的名称。

    5.2.1.2 数据类型:字符串型。

    5.2.1.3 最大出现次数:1。

    5.2.1.4 备注:必选项。

    5.2.2 信息资源代码

    5.2.2.1 定义:开放数据集的唯一标识代码。信息资源代码的编码遵循赣发改高技〔2017〕965号。

    5.2.2.2 数据类型:字符串型。

    5.2.2.3 最大出现次数:1。

    5.2.2.4 备注:必选项。

  • DB36/T 1098—2018

    4

    5.2.3 信息资源分类

    a) 定义:开放数据集的分类信息,具体分类详见 4.分类组织方式。 b) 数据类型:字符串型。 c) 最大出现次数:1。 d) 备注:必选项。

    5.2.4 信息资源摘要

    a) 定义:对信息资源内容的概要描述信息。 b) 数据类型:字符串型。 c) 最大出现次数:1。 d) 备注:必选项。

    5.2.5 信息资源格式

    a) 定义:描述信息资源的存在方式。信息资源提供方应尽可能提供可机读的电子格式及相关软件版本信息,如只有纸质介质应尽量提供电子扫描格式。电子格式的信息资源,可采用但不限于:

    电子文件的存储格式为 OFD、wps、xml、txt、doc、docx、html、pdf、ppt等;电子表格的存

    储格式为 et、xls、xlsx等;数据库类的存储格式为 DM、KingbaseES、Access、Mysql、DBase、

    Sybase、Oracle、SqlServer、DB2等;图形图像类的存储格式为 jpg、gif、bmp、png等;流

    媒体类的存储格式为 swf、rm、mpg 等;自描述格式,由提供方提出其特殊行业领域的通用格

    式,如气象部门采用的“表格驱动码”格式。

    b) 数据类型:字符串型。 c) 最大出现次数:1。 d) 备注:必选项。

    5.2.6 更新周期

    a) 定义:信息资源的更新频率。分为实时、每日、每周、每月、每季度、每年等。 b) 数据类型:字符串型。 c) 最大出现次数:1。 d) 备注:必选项。

    5.2.7 发布日期

    a) 定义:资源提供方发布开放数据集的日期。 b) 数据类型:日期型,格式为 CCYY-MM-DD。 c) 最大出现次数:1。 d) 备注:必选项。

    5.2.8 资源提供方

    a) 定义:提供开放数据集的政务部门。 b) 数据类型:字符串型。 c) 最大出现次数:1。 d) 备注:必选项。

    5.2.9 资源提供方代码

  • DB36/T 1098—2018

    5

    a) 定义:提供开放数据集的政务部门代码。代码采用《国务院关于批转发展改革委等部门法人和其他组织统一社会信用代码制度建设总体方案的通知》的法人和其他组织统一社会信用代码结

    构。

    b) 数据类型:字符串型。 c) 最大出现次数:1。 d) 备注:必选项。

    5.2.10 是否向社会开放

    a) 定义:信息资源面向社会公众开放的属性,包括“是”和“否”,对应取值分别为 1和 0。 b) 数据类型:数值型。 c) 最大出现次数:1。 d) 备注:必选项。

    5.2.11 开放条件

    a) 定义:对社会开放资源的条件描述,当“是否向社会开放”取值为 1时,描述开放条件。 b) 数据类型:字符串型。 c) 最大出现次数:1。 d) 备注:必选项。

    5.2.12 信息项名称

    a) 定义:描述开放数据集中具体信息项的中文标题。 b) 数据类型:字符串型。 c) 最大出现次数:1。 d) 备注:必选项。

    5.2.13 数据类型

    a) 定义:标明该信息项的数据类型。其中,结构化数据(数据库类、电子表格类)的,应标明数据类型及数据长度,包括:字符串型 C、数值型 N、货币型 Y、日期型 D、日期时间型 T、逻辑

    型 L、备注型 M、通用型 G、双精度型 B、整形 I、浮点型 F、二进制型 blob、文本型 text。

    b) 数据类型:字符串型。 c) 最大出现次数:1。 d) 备注:可选项;当信息资源为结构化数据集时,为必选项。

    5.2.14 数据长度

    a) 定义:标明该信息项在计算机中存储时占用的字节数,适用于结构化数据(数据库类、电子表格类)。属于数据库类的,数据长度即该信息项对应的字段在数据库中的指定长度或默认长度;

    属于电子表格类的,估算该信息项内容字数的上限,并折算成字节数,该字节数即为数据长度。

    b) 数据类型:字符串型。 c) 最大出现次数:1。 d) 备注:必选项。

  • DB36/T 1098—2018

    6

    5.2.15 开放属性

    a) 定义:对该信息项是否向社会开放的描述,包括“是”和“否”,对应取值分别 1和 0。 b) 数据类型:数值型。 c) 最大出现次数:1。 d) 备注:必选项。

    5.2.16 信息项描述

    a) 定义:对该信息项的内容进行简要描述。 b) 数据类型:字符串型。 c) 最大出现次数:1。 d) 备注:可选项;当信息资源为结构化数据集时,为必选项。

  • DB36/T 1098—2018

    7

    6 数据开放平台技术架构

    6.1 数据开放平台采用“数据+服务+应用”的模式,通过信息资源编目,融合各类数据,形成数据管

    理体系,统一提供数据开放、共享服务。需要开放共享的数据,都通过数据资源中心进行统一的管理。

    总体框架如图 1所示。

    图1 数据开放平台总体框架图

    6.2 开放门户主要功能

    6.2.1 首页展示

    首页的展示主要包括热门数据图表展示、数据主题列表、最新数据提示、最热门数据提示以及数据

    下载排行榜等。对于用户所关心的数据信息,在前台数据目录页面显著位置展现,方便社会公众和数据

    使用者了解数据结构和所包含的原始信息。

    6.2.2 数据目录

  • DB36/T 1098—2018

    8

    数据目录中包含了该数据的元数据基础信息、历史数据信息、关联数据信息、以及下载地址或数据

    API接口地址等内容。

    6.2.3 数据指数

    数据指数可以包括部门开放指数、主题开放指数、热搜指数等。

    6.2.4 数据服务

    数据服务模块允许数据分析人员、专业数据公司以及数据主管部门利用数据开放平台中开放的数据

    进行移动应用和第三方数据服务的开发。

    6.2.5 数据预览

    数据预览功能需至少提供5条样例数据进行预览,为数据使用者提供一个数据概貌,方便数据使用

    者快速判断数据内容是否符合要求,提高平台页面响应速度,提高数据使用者对数据的理解。

    6.2.6 关联数据推荐和数据图谱

    描述数据与数据之间存在的多种关联关系,比如:强关联关系或弱关联关系等。数据图谱提供了从

    “关系”的角度去分析问题的能力,结合图数据库技术将各种不同类型的信息联系在一起,形成一张数

    据关系网络。

    6.2.7 数据互动

    数据开放平台为社会公众提供数据互动功能,互动内容包括允许数据使用者将开放的数据页面链接

    分享到社交网络。“收藏”功能支持将感兴趣的数据目录进行收藏,“纠错”功能实现将社会公众发现

    数据错误的问题及时反馈给该数据目录的系统管理员、数据管理员、数据提供单位或机构人员,积极发

    挥社会公众的力量,帮助数据开放平台完善数据质量。

    6.2.8 交流与反馈

    完善数据开放主管部门、数据提供部门和社会公众之间的沟通交流机制,通过该功能可以快速了解

    社会公众对数据的需求、咨询和建议,通过设置一些常见问题查询,也可以让社会公众清晰地知道数据

    开放平台是什么、对外提供什么服务、数据开放的政策以及他们所拥有的权益,为数据开放平台增添活

    力,提高数据开放的透明度。

    6.3 开放平台部署架构

    6.3.1 部署架构

    数据开放平台的数据来源均是从政务外网发布审核流程后,再按需求整理数据资源推送到互联网

    区,供互联网用户使用。考虑到安全性和可靠性,开放平台的数据流向由政务外网单向流出到互联网区。

    对于互联网区产生的日志数据和用户数据,通过网闸,定时导入政务外网。部署架构参考示意图,如图

    2所示。

  • DB36/T 1098—2018

    9

    互联网区政务外网区

    数据融合ETL数据采集

    ETL数据采集

    数据开放门户服务器

    防火墙

    单向访问

    防火墙

    逻辑防火墙

    政务部门用户 公众用户

    开放端口:80

    数据开放数据库服务

    定时导入

    网闸

    网闸

    图2 开放平台部署架构参考示意图

    6.3.2 访问策略

    根据图2所示,互联网区和政务外网区服务器之间,以及用户与服务器之间的访问策略如表2、表3

    所示。

    表2 互联网区服务器访问策略

    所在区域 源 IP/服务器名称 目标 IP/服务器名称 目标端口 所在区域

    互联网区

    数据开放门户应用服

    务器 数据开放数据库服务器 自行定义 互联网区数据库

    互联网用户 数据开放门户应用服务器 80

    表3 政务外网区服务器访问策略

    所在区域 源 IP 目标 IP 目标端口 所在区域

    政务外网区 数据开放后台 数据开放数据库服务器 自行定义 互联网区

    政务外网区 政务外网用户 数据开放后台 80 政务外网区

  • DB36/T 1098—2018

    10

    7 数据开放流程

    根据《江西省政务信息资源目录编制规范》,数据资源的共享和开放可分为无条件共享、有条件共

    享、不予共享、是否向社会开放等几种类型,数据开放的流程需遵循完成数据采集、入库、开放,数据

    提供方需负责维护和更新本部门和开放数据资源目录,保证上述信息的真实性、准确性、完整性、及时

    性和有效性。如图3所示。

  • DB36/T 1098—2018

    11

    图3 政务数据资源开放流程

  • DB36/T 1098—2018

    12

    8 开放内容要求

    8.1 政务信息资源的开放范围

    政务信息资源的开放范围应重点包括但不限于:信用、交通、医疗、卫生、就业、社保、地理、文

    化、教育、科技、能源、农业、环境、经济、金融、安全、统计、气象、企业登记监管等民生保障服务

    相关领域,将可开放的政府数据集中向社会开放。

    8.2 开放数据资源的提供形式

    数据开放平台应以标准的结构化文件发布,如CSV、XML、JSON、XLS、XLSX等,以提高开放数据资

    源的机器可读率,原则上不以PDF文件、网页或图片等格式发布。同时,进一步建立完善的数据发布审

    核流程,结合系统自动化检查和人工审查的方式,对发布的数据格式进行检查,确保所发布的数据满足

    数据格式的开放性要求。

    9 开放管理制度

    9.1 法律法规制定

    地方政府通过立法和出台相关政策,规范政府数据在“聚、通、用”各个环节的合法性、合规性。

    对政府数据实行动态管理,在部门职责、平台搭建、数据采集、监督管理、安全保障等方面予以规范和

    促进。

    9.2 数据提供保障

    政务信息资源数据开放按照“谁主管,谁提供,谁负责”的原则,数据提供部门应主动、及时维护

    和更新数据,确保数据的完整性、准确性、时效性和可用性。

    9.3 数据安全管理

    严格执行国家有关安全保密法律法规的规定,注重安全保密管理机制的建设,对数据的使用过程进

    行全程留痕、监控审计,推动政府数据共享开放工作依法有序进行。

    9.4 绩效考核制度

    实行政务数据开放全过程管理与监控,建立数据开放绩效考核制度。绩效考核制度应从数据的连续

    性、一致性、规范性、真实性、完整性与有效性等方面,对数据提供单位进行绩效评分考核。

    _________________________________

    目  次前  言引  言政务数据开放平台技术规范1  范围2  规范性引用文件3  术语和定义3.13.23.33.43.53.63.7

    4  分类组织方式5  开放数据集元数据5.1  概述5.2  元数据描述5.2.1 信息资源名称5.2.1.2 数据类型:字符串型。5.2.1.3 最大出现次数:1。5.2.1.4 备注:必选项。

    5.2.2 信息资源代码5.2.2.1 定义:开放数据集的唯一标识代码。信息资源代码的编码遵循赣发改高技〔2017〕965号。5.2.2.2 数据类型:字符串型。5.2.2.3 最大出现次数:1。5.2.2.4 备注:必选项。

    5.2.3 信息资源分类5.2.4 信息资源摘要5.2.5 信息资源格式5.2.6 更新周期5.2.7 发布日期5.2.8 资源提供方5.2.9 资源提供方代码5.2.10 是否向社会开放5.2.11 开放条件5.2.12 信息项名称5.2.13 数据类型5.2.14 数据长度5.2.15 开放属性5.2.16 信息项描述

    6  数据开放平台技术架构6.1  数据开放平台采用“数据+服务+应用”的模式,通过信息资源编目,融合各类数据,形成数据管理体系,统一提供数据开放、共享服务。需要开放共享的数据,都通过数据资源中心进行统一的管理。总体框架如图1所示。6.2  开放门户主要功能6.2.1  首页展示6.2.2  数据目录6.2.3  数据指数6.2.4  数据服务6.2.5  数据预览6.2.6  关联数据推荐和数据图谱6.2.7  数据互动6.2.8  交流与反馈

    6.3  开放平台部署架构6.3.1  部署架构6.3.2  访问策略

    7  数据开放流程8  开放内容要求8.1  政务信息资源的开放范围8.2  开放数据资源的提供形式

    9  开放管理制度9.1  法律法规制定9.2  数据提供保障9.3  数据安全管理9.4  绩效考核制度