基于池化架构的分布式并行计算网络系统的研究

来源:岁月联盟 作者:朱双双 傅华明 时间:2010-08-30
 摘  要 随着的快速,通过整合分散的资源,搭建分布式并行计算环境进行大规模分布式计算已成为重要趋势。本文分析了现有分布式计算系统结构的本质特征,明确了搭建分布式并行网络系统与现有网络结构之间的矛盾,提出了一种新的基于池化技术架构的分布式并行计算网络连接结构并讨论了其中关键难点问题。     关键词 池化;分布式并行计算;连接结构;网络 

1  引言

    分布式并行计算近年来一直是国内外计算机界具有重要意义的研究课题,高性能分布式计算发展到今天,通过整合分散的计算资源,调动所有可能的计算资源进行大规模高性能计算已成为一种趋势,也是目前彻底突破计算瓶颈唯一行之有效且廉价的解决方案。而如何组织互联网分散的、互不相识的空闲计算机组成动态的并行工作组是问题的关键,发展的看,构筑分布式并行计算网络系统将成为可能。主要在于两点:    (1) 网络计算资源庞大,但实际利用率非常低,据有关统计表明,系统使用率仅30%左右,有的空闲率竟达91%,如何利用闲散资源构筑强大的并行计算能力已越来越被人们所关注,而分布式并行计算网络环境在使用上具有重要的现实意义。    (2) 网络技术得到很大突破,Tbps级传输速率和10-12比特一下的传输差错率将成为现实,网络的带宽局限将得到极大缓解,网上形成庞大而繁杂的各类资源,如何更好管理组织利用这些资源是应用的关键。

2  传统计算机互连结构特征分析

    机间互连主要为了实现资源共享、任务并行和容错,其特征是自主性、透明性、并行性、互操作性和可扩展性。传统的计算机互连系统结构主要分为:    (1) 网络操作系统(NOS):主要目标是资源共享和提供非透明服务,用户具有完全的自主性。用户可采用自己的策略控制本地所有资源,这种网络机制对组成透明的分布式并行计算系统是不利的。    (2) 分布式操作系统(DOS):强调将互联系统作为一个整体来管理,对用户完全透明,面向对象的微核式操作系统代替单晶式操作系统成为发展方向,比较典型的有Amoeba,Mach,Chorus,Clouds,Sprite等,这类系统不适应网络系统对自主性的要求。    (3) 分布式系统环境(DSE):运行在操作系统之上,即中间件,主要目标是互操作性和开放性,有较强的自主性,典型系统有OSF DCE和各类NOW系统,DSE作为中间层可集成不同的独立系统提供对分布式应用的支持,用户既可在原有平台下工作,又可和DSE交互,DSE还可屏蔽底层系统的异构性,因此,DSE技术是构筑分布式计算网络的一种好方法,但其主要目标是提供透明互操作性和定向服务,而不是任务的并行。    理想的分布式并行计算网络系统应具有透明性,并能实现动态调度计算资源和方便用户使用的目的。根据之一目标和上述三类计算机互连结构的分析,可以看出实现高效率的分布式并行计算网络平台系统的难点在于解决系统透明性与用户自主性之间的矛盾。

3  基于池化架构的分布式并行计算网络系统

    池化是新近提出的技术概念,自从国际互联网工程工作组提出高可靠服务器池化概念以来,国外的多家IT巨头(包括:西门子、思科、摩托罗拉等)都对该项目极为关注,均积极参与该项目的理论研究和研发方案的探讨和论证。     该项目由国际互联网工程工作组牵头并联合多家著名IT巨头,已历时长达数年的研究和探讨,其理论模式、体系架构都已相当成熟,同时它也将是在高可靠网络领域上的首个位于传输层的高可靠网络服务体系框架,弥补了现行互联网核心技术层面上的缺陷。该技术对可靠性、机动性有较高要求的网络系统具有极高的应用价值。     本文基于池化架构,提出了一种完全透明的实现动态调度的分布式并行计算网络系统模型,其系统结构如图1所示。

3.1池化架构的基本组件与功能

    池化架构的基本组件与主要功能为:    (1) 池化器:系统连接结构中心,嵌入式硬件池化器负责收集池中所有服务器的计算资源属性,统一管理、监控和操作服务器池,并能根据运算任务计算量大小动态选择服务器资源。    (2) 控制台服务器:负责自动分割运算任务后,发布运算任务至服务器池中。           


图1  池化分布式并行计算网络结构图
    (3) 节点服务器:即服务器池中各服务器计算资源,既可为小型机也可为普通PC机。池化系统对服务器的软、硬件类型配置没有任何限制。    (4) 服务器与客户端池化设置软件:控制台安装客户端池化设置软件与服务器池化设置软件,各节点服务器安装服务器池化设置软件。池化设置软件如图2、3所示。 
                          2  服务器池化设置图3  客户端池化设置

 

3.2  池化系统的工作流程

3.2.1形成过程    首先按项目的类别划分不同的服务器池,各节点服务器安装池化服务器端设置软件,进行协议、端口号、池策略、池名等设置(同一服务器池内的节点服务器,池策略必须一致)。然后池化器通过定时发布组播协议监控服务器池内服务器运行状况,并收集服务器性能信息。其后控制台服务器安装池化客户端设置软件,用户登陆控制台发布计算任务。3.2.2运行过程    用户通过各自密码登陆控制台发布计算任务,控制台自动切割任务后,池化器对池名进行池名解析,并根据预先设置好的池策略将任务“撒进”计算池,各节点服务器接收任务后进行任务计算,最后将各自计算结果汇总至控制台。3.2.3扩展过程    池化架构分布式并行计算系统具有灵活的扩展性,池化器对所连接的服务器数量没有限制,同时对服务器软、硬件类型配置也没有任何限制,池化器最大可同时容纳1000个会话业务。服务器只需安装池化服务器端设置软件即可加入服务器池。3.2.4监控过程    池化器负责系统各个资源的描述、变动、分配与保护,与运行时的系统密切合作,保证整个系统的正常运行。池化器定时发送组播消息,收集各节点服务器运行状态,计算性能信息,这些信息成为任务分配时所用策略的重要依据。池化器一旦发现某节点服务器发生故障,即可迅速将该台服务器计算任务转发给池内另一台服务器,并将故障服务器“迁出”计算池。

3.3 池化分布式并行计算系统解决的问题

    1) 充分利用现有资源    利用池化技术,任何一台联在互联网上的普通PC机可通过池化软件加入服务器池中,等待任务分配。系统能充分利用现有服务器资源,将所有运算子任务分配给节点服务器,有效避免计算资源闲置现象的发生。    2)降低对服务器的配置要求    普通PC如果能运行操作系统,能保证最小运算的运行,即可加入服务器池中。系统对加入服务器池中的服务器性能要求不高,将硬件要求降到最低,能解决服务器价格昂贵带来的资金紧缺问题。    3) 解决运算速度瓶颈,提高工作效率    如果加入服务器池中服务器数量足够多,超大规模运算项目足够细化,则池化分布式计算系统的处理能力可以达到甚而超过价格昂贵的巨型计算机。    4)实现智能管理    池化设置软件操作界面友好、人性化,操作简便。信息管理人员通过界面输入运算程序所需参数,资源管理系统控制台自动切割运算任务,在后台将各个分割好的运算任务分配给服务器。

4 结束语

    本文在分析现有分布式计算系统结构的本质特征基础上,明确了搭建分布式并行系统的关键问题是系统透明性与用户自主性之间的矛盾,提出了一种新的解决该问题的基于池化技术架构的分布式并行计算网络连接结构。该连接结构在一定程度上优化了分布式并行计算系统性能,实现智能管理,消除了传统分布式计算“人工”切割计算任务、“人工”收集汇总计算结果的限制,且系统运营扩展灵活,监控自动化性能得到成分体现。

  

[1] 张焰. 爻尔软件池化技术白皮书. http://www. x2- soft.com.[2] 张焰,朱双双,韩斌辉. 池化分布式并行计算解决方案.  http://www.x2-soft.com.[3] 王柏,王红熳,邹华. 分布式计算环境[M]. 北京:北京邮电大学出版社,2000 [4] 章勤,鄢娟,金海等. 昊宇网络计算平台体系结构研究[J]. 计算机研究与,2003,40(12):1725-1730.

图片内容