e-science 网格的可扩展体系结构研究
DESCRIPTION
e-Science 网格的可扩展体系结构研究. 黄理灿 [email protected]. 浙江大学计算机学院、计算机应用专业. e-Science 主要研究科学领域的全球合作以及与之相适应的基础体系结构,它 将对未来的科学研究方式产生革命性的影响。网格( Grid )是使 e-Science 成为可能的基础体系结构。 本文的主要贡献有: - PowerPoint PPT PresentationTRANSCRIPT
提 要
e-Science 主要研究科学领域的全球合作以及与之相适应的基础体系结构,它将对未来的科学研究方式产生革命性的影响。网格( Grid )是使 e-Science 成为可能的基础体系结构。
本文的主要贡献有:( 1 ) 提出了虚拟动态分层体系结构( Virtual and Dynamic Hierarchic
al Architecture, VDHA ) ,用于解决 e-Science 网格的动态和可扩展性问题。 VDHA 结构综合了 C/S 模式和 P2P 模式的优点,并克服了它们的缺点。
( 2 ) 提出了高效的可扩展的服务发现协议,包括完全查询和发现协议、领域相关查询和发现协议。
( 3 ) 提出了基于 PKI 的可扩展的安全体系结构, 包括身份认证和访问控制。
( 4 ) 提出了基于本体论的网格服务描述语言 (OGSDL) 。旨在服务的自动发现和自动执行。
( 5 ) 实现了一个可扩展的网格系统原型— VDHA_Grid 。( 6 ) 提出了应用于 VDHA_Grid 网格监控的模型。 ( 7 ) 提出了基于 VDHA 文件共享服务和虚拟学术讨论服务模型,提出
了基于 VDHA 的异质信息共享服务和知识检索服务原型。
可扩展的 e-Science 网格的体系结构的研究动机
1 。目前主流网格技术 Globus 和 Web Service 技术其设计思想都是集中式、基于 C/S模式的。具有如下问题 : 管理困难、实现困难、空间复杂度困难、时间复杂度困难等等。同时,存在因单点失败引起整个系统崩溃的问题。
2 。 Peer to Peer 具有可扩展性、容错性等特点,然而它在安全性、体系结构等方面还存在不少缺陷。
3 。将目前的网格主流技术与 P2P 技术相结合,形成可扩展的、基于语义的网格体系结构,这是一项非常有理论和应用价值的重要工作。
e-Science 与 网格
e-Science 的精髓:基于网络的共享与协作。 共享:科研设施、信息、人才等的共享。 协作:共同完成某一项研究。 e-Science 历史: 2000 年 11 月英国 John Taylor 宣
布 1.2 亿英镑的 3 年计划而得名。 参加单位: 英国经济和社会研究机构( ESRC )、 英国自然环境研究机构( NERC ) 英国生物技术和生物科学研究机构( BBSRC )、 英国医学研究机构( MRC )、 英国工程与物理科学研究机构( EPSRC )、 英国粒子物理与天文学研究机构( PPARC )、 英国中心研究实验室机构( CLRC )
e-Science 与 网格
e-Science 计划:
第一阶段:开始网格研究, 进行 e-Science 测试床的开发和支持工作。
第二阶段: 是使第一阶段的研究成果达到
成熟和分发的使用的地步。
e-Science 与 网格
Öª ʶ ·þ Îñ £º×¢ ÊÍ·¢ ±í
Ä£ Äâ
·Ö Îö
·ÖÎöÒÇ
¸ß ÇåÎú ·ÖÎö ÒÇ
ÑùÆ·Êý ¾Ý
¿â
ÊÓƵ
˽ÓÐÊý ¾Ý
¿â
¹« ¹²Êý ¾Ý
¿â
一个未来的科学研究的工作流程的场景
网格 Globus 与 Web Service
Serv ice regis t ryS erv ice D es crip t io n
S erv ic e R eq u es to r Serv ice P ro v id er
S er v ic e
S erv ice D es crip t io nB in d
F in d
W S D L , UD D I
P u b lis h
W SD L,U D D I
Ó¦ Óòã
Á¬½Ó²ã
¾Ö²¿ ²ã
×Ê Ô´ ²ã
Рͬ ²ã
Peer to Peer1. C/S 模式
2. 集中目录服务器模式
3.纯 P2P 模式
• 无结构• 有结构( DHT e.g. Chord, CAN etc.)
E-Science 网格 我们把用于科学研究,其节点主要位于大学或研究机构的网格
系统称之为 e-Science 网格。 e-Science 网格节点一般是稳定的。一般地,人们不会有意频繁地加入或退出节点。另外,节点主机一般有人负责管理。节点主机可以是从超 级计算机到 PC 服务器的各种性能的主机。
在 e-Science 网格中,一般相关领域的科研机构会建立虚拟组织进行某一项目的合作研究。通常,某一虚拟合作研究项目由学术带头人牵头组织。 这些虚拟组织有长期存在的组织,也有临时的组织。
此外,全球协作研究的方式必须建立在体系结构的自治机制上,允许节点进入和离开 e-Science 网格系统。
E-Science 需要解决计算密集型的问题, E-Science需要解决数据密集型的问题, e-Science 需要解决异构的信息共享和合作问题,和解决地理上分散的知识的语义问题。所以,e-Science 网格包括了计算网格、信息网格和知识网格的内容。
e-Science 网格不是完全无政府的,必须是可管理的。
虚拟动态分层体系结构 虚拟动态分层体系结构( Virtual and Dynamic Hierarchical
Architecture ,简称 VDHA ) 具有自主性、可扩展性、移动计算、方便权限管理,以
及服务和资源的高效和精确发现等特点。 包含核心层和周围层 , 核心层由网格节点所组成, 周围层包括台式机、笔记本、 PDA 、传感器和其它网络等。 所有外围设备均通过有线或无线方式,经由接入节点
( entrance )进入 VDHA_Grid 网格系统。 节点的角色可以是普通节点、网关节点、协调者、接入节点和所有者节点。节点可以是其中之一或同时是这些角色中的几个。
虚拟动态分层体系结构 定义 1 网格节点 是网格系统中的节点 定义 2 接入节点( Entrance node ,符号为 ent) 是一网格节点,接入节 点是用户登录进入网格系统的接入点。
定义 3 所有者节点( Owner node ,符号为 ow) 是一管理用户的网格节点。
定义 4 用户( User 符号为 user) 是利用网格系统的角色。用户仅被自己的所有者节点管理,而不是被整个网格系统管理。
定义 5 客户机( Client host ,符号为 cli) 是用户用以登录网格和进行事物处理的设备(如台式机、掌上机、移动计算机等)。
定义 6 网关节点( Gateway node ,符号为 gn) 是在几个不同层次的虚拟组织行使协调功能的节点。
定义 7 虚拟组( Virtual group 符号为 VG) 为网格节点虚拟形成的组。 VGiα 表示这个虚拟组在第 i 层,它的名称为 α 。
定义 8 虚拟组协调者( Coordinator of virtual group ,符号为 cvg) 为在虚拟组中起协调作用的网关节点。 cvgiα 是一个网关节点,他在第i 层名称为 α 的虚拟组中起协调者的作用。
定义 9 虚拟组树( Virtual group tree ,符号为 VGT) 是由虚拟组形成的分层树。
定义 10 VDHA 为至少深度为 2 的虚拟组树。 VDHA 具有在网格节点数量、层次、虚拟组组成等方面的动态特点。
e-Science 网格的可扩展体系结构
图 1 。 VDHA_Grid 的网络结构图和 VDHA 的结构
d es k to p
s er v er
en tr an c e
w ir e les s
n etw o r k
P D A
C ell P h o n e
L ap to p
Kio s k
n o d e
g atew ay n o d e
VO
r o o t v ir tu a l g r o u p( F ir s t- lay er v ir tu a l g r o u p )
S ec o n d - lay er v ir tu a l g r o u p
T h ir d - lay er v ir tu a l g r o u p
网格组管理协议 Grid Group Management Protocol (GGMP)
网格组管理协议管理成员的申请加入或退出,以及维持 VDHA 的虚拟组树。协议的主要思想为:如果存在节点的变化例如加入或退出,这些变化将传至协调者节点,协调者节点将把这些变化传到此协调者节点本身所在的组的成员以及相邻两组的成员。如果网关节点需要变更,在线具有最大权值的节点将成为网关节点。
可扩展网格系统的体系结构
•图 2 可扩展网格系统( VDHA_Grid )的体系结构
Service requestor
Service registry
Service providerService
Service description
Publish, OGSDL
Security service
Find, QDP, OGSDL
Bind
A Grid node
Security, SGSI
基于本体论的网格服务描述语言( OGSDL )
X M L ( E x ten s ib le M ar k u p L an g u ag e)
R D F ( R es o u r c e D es c r ip tio n F r am ew o r k )
R D F S ( R D F S c h em a)
O W L ( O n to lo g y )
O G S D L ( S er v ic es ) L o g ic
图 3 OGSDL 的语言层次
VDHA_Grid 的层次结构Ap p lic a tio n
S er v ic es
G G M P ,Q D P , L P , . . . C o r e s e r v ic es
M es s ag e
C o m m u n ic a tio n s
T C P /I P
HT T P , S M T P , F T P , I I O P , . . .
S O AP AS N .1. . .
O G S D L S er v ic e D es c r ip tio n
G r id p r o to c o l an d c o r e s e r v ic es
S er v ic es , im p lem en ted b y v ar o u slan g u ag es o r p la tf o r m s
Ap p lic a tio n p r o g r am s
SECURITY
MANAGEMENT
可扩展的网格信息服务
完全查询和发现服务协议 Full Search Query and Discovery Protocol (FSQDP) ,具有时间复杂性 O(logN) 、空间复杂性 O(logNvg)以及消息复杂性 O(N) ( N 为网格节点总数,Nvg 为组节点数)。领域相关查询和发现服务协议 Domain-Specific Query and Discovery Protocol (DSQDP) ,具有具有时间复杂性O(logNvg) 、空间复杂性 O(logNvg) 以及消息复杂性 O(logNvg) 。
可扩展的网格信息服务
a , b , c , d e , f , g , h i, g , k , l q , r , s , t w , x , y , z 1 , 2 , 3 , 4 5 , 6 ,7 , 8m , n , o , p
c , g i, o 4 ,5q ,y
c , i y ,4
i,yR o o t lay er
Seco n d lay er
T h rid lay er
F o u rt h lay er
1 。完全查询和发现协议( FSQDP )
虚拟组成员个数对响应时间的影响
0 1 2 3 4 5 6 7 8 9 10
x 109
0
100
200
300
400
500
600
700
800
900comparison of different number of group members
number of nodes
num
ber
of m
essa
ge t
rasf
erre
d tim
e un
it
5 10 25 50 100 200
虚拟组树层数对响应时间的影响
0 1 2 3 4 5 6 7 8 9 10
x 109
0
1000
2000
3000
4000
5000
6000
7000Comparison of different layers
number of nodes
num
ber
of
message t
ransfe
red t
ime u
nit
345678
可扩展的网格信息服务
1 。领域相关查询和发现协议( DSQDP )
a , b , c , d e , f , g , h i, g , k , l q , r , s , t w , x , y , z 1 , 2 , 3 , 4 5 , 6 ,7 , 8m , n , o , p
c , g i, o 4 ,5q ,y
c , i y ,4
i,yR o o t lay er
Seco n d lay er
T h rid lay er
F o u rt h lay er
AL L
S o n g
P o p u larC las s ic
M ad o n n a
可扩展的安全体系结构 –身份认证的体系结构
C lien th o s t
Us er P r o x y
Us er
S ite 2
lo c a l p o lic y an dm ec h an is m s
s er v ic e P r o x y
s er v ic e in s tan c e
s er v ic e in s tan c e
S ite 1
lo c a l p o lic y an dm ec h an is m s
s er v ic e P r o x y
s er v ic e in s tan c e
s e r v ic e in s tan c e
lp
o w n er n o d e
s aap
s c d p
s c d s ip - I I
s c d s ip - I
身份认证-登录协议
VO _ AI
VO _ Br ain
AI _ Br a in ( Vir tu a l G r o u p )
A
B
C
D
C 1
1
4
2
3 en tr an c e n o d e p r o x y s ta t io n
由服务实例创建与撤消服务协议 -II 型( SCDSIP-II )
Step 1: sij.send (request-creation-instance, SLMSi) Step 2: SLMSi authenticates with SLMSk
Step 3: If the user pays for the service Skl Right = ACP (SLMSk, user, spkl)
Else Right= ACP (SLMSk, sij, spkl) Step 4: If Right <> FAIL Then
SLMSk creates instance of skl; SLMSk.send (success-create-instance, SLMSi);
SLMSi.send (success-create-instance, sij); Else SLMSk.send (fail-access-service, SLMSi); SLMSi.send (fail-access-service, sij);
访问控制模型
s erv ice d es crip t io n
d ep o s it yac c es s c o n tr o l
acco u n t in gac c o u n tin g
d a tab as e
au th o r iza tio nd a tab as e
au d it lo g
au d it p o lic ies
ac c o u n tin gp o lic ies
au th o r iza tio np o lic ies
Ad m in is tr a to r
au d it in g
S L M S
G r id s e r v ic es
G lo b a ls u b jec t
1
23
4
5
S ec u r itys er v ic e
VDHA_Grid 的监控服务、资源分配及管理服务
a , b , c , d e , f , g , h i , g , k , l q , r , s , t w , x , y , z 1 , 2 , 3 , 4 5 , 6 ,7 , 8m , n , o , p
c , g i , o 4 , 5q ,y
c , i y , 4
i ,yR o o t lay er
Seco n d lay er
T h rid lay er
F o u rt h lay er
分层集中式的网络监控服务的体系结构
VDHA_Grid 的 MCS消息流向图
a , b , c , d e , f , g , h i , g , k , l q , r , s , t w , x , y , z 1 , 2 , 3 , 4 5 , 6 ,7 , 8m , n , o , p
c , g i , o 4 , 5q ,y
c , i y , 4
i ,yR o o t lay er
Seco n d lay er
T h rid lay er
F o u rt h lay er
消息流向图
分层领域相关的网格资源分配与管理服务 (HDGRAM)
a , b , c , d e , f , g , h i , g , k , l q , r , s , t w , x , y , z 1 , 2 , 3 , 4 5 , 6 ,7 , 8m , n , o , p
c , g i , o 4 , 5q ,y
c , i y , 4
i ,y
C lien t h o s t
7
12
34
6
4
5
8
领域相关的资源分配与任务调度
HDGRAM 的模拟分析
节点数和完成的任务数对花费的时间的影响
原型系统 VDHA_Grid 的实现
VDHA_Grid 基于消息的实现
类 ServiceClass 代码 import java.io.*; import java.util.*; import java.net.*; import java.util.Hashtable; abstract public class ServiceClass { protected Hashtable nodeStatus; protected String strparameters = new String(); protected String strResultExcute = null; abstract public void doService(); public String nodeIP; public String port; public void putNodeIP(String Ip) { nodeIP = Ip; } public void putPort(String strport) { port = strport; } public void putHashNodestatus(Hashtable nodeStatus) { nodeStatus = nodeStatus; } public Hashtable getHashNodestatus( ) { return nodeStatus; } public void putstrParameters(String paras) { strparameters = paras; } public String getstrParameters( ) { return strparameters; } public String getstrResult() { return strResultExcute; }
原型系统 VDHA_Grid 的实现
VDHA_Grid 的主要界面
基于 VDHA 的 e-Science 网格原型系统
2 n d VG
All s c ien c er o o t VG
A I B rain I C B io lo g y a p p l. p h y s m at h
s o ftw are
ap p l. ch em is try d e s ig n & m a n uf a c tu r e
en v io n m en tres o u rce n u clear s ci co al C h in es e
m ed icin es m ic r o p h y s
B io m e d ic a lP h o to n ic s
Eq u ip m en tA g ricu ltu re
n a n o m e te rte c h n o lo g y
zh ejian gu n iv ers ity
Ts in g h u aU n iv ers ity IC T
I A E as tco m
AI . . .
M in is tr yD e p a r tm e n t
D ig i tal t ech
m a te r ia l
虚拟合作中心 e-Science 网格网格分层示意图
文件共享服务-结构
m etad atad ep o s ito r y
lit erat u re res o u rce
Se r v ic e L if e tim eM a n a g e m e n t
G r id N o d e
G N S P /G G M P /AP e tc . p r o to c o ls
Serv ice D es crip t io nD ep o s it o ry
Q D PL iter a tu r e S er v ic e
C lien t h o s t
Br o w s er
soap protocol
XM L/RDF
authentication_ticket
G rid w i th V D H A , s erv iced is co v ery b y Q D P
文件共享服务- UML 图
文件共享服务-结果
基于 VDHA 的分布式知识检索服务-结果
展 望
如果许多用户在同一时间同时使用 DSQDP 协议, 由于消息都需要传到根虚拟组的协调者, 所以造成根虚拟组协调者节点的通信拥塞和消耗大量的计算时间。 为了避免此类情况,用 DHT 的方法将协调者组成一个基于 DHT 的 P2P 网络。当消息传递到这一层次的协调者时,采用 DHT 的方法找到符合条件的协调者,然后,由此协调者按 DSQDP 协议搜索到满足条件的节点。 将来的工作是具体实现。我们将来的工作在于进一步完善 VDHA_Grid 原型,使之能够发布给其他机构使用。
Thanks