试析服务器负载均衡技术在高校图书馆网络应用研究

来源:岁月联盟 作者:李焕勤 时间:2014-06-25

  论文关键词:负载均衡 图书馆服务器
  论文摘要:阐述了多台服务器负载均衡的概念、类型和实现方法,介绍了该技术在郑州师范高等专科学校图书馆的应用.
  随着网络技术的飞速发展,图书馆作为全校的信息资源共享中心,拥有的数字资源快速膨胀,提供的服务内容日益拓宽,读者对图书馆资源访问量不断增加,使得许多初期表现较好的服务器已经显得疲惫不堪,面对大量的用户访问已是无能为力,影响了系统的正常运行,更有甚者,个别服务器经不起大量的负荷而宕机,致使业务中断,严重影响了图书馆的形象。为解决这些问题,很多图书馆采用的方案是购买大量的服务器,而且服务器的配置越来越高。但只是依靠单一的网络设备提供服务,网络设备的整体能力得不到充分发挥,使整个系统投入和维护的成本提高,造成了不必要的资源浪费。如何确保为读者提供低成本、高性能、高可靠的服务是图书馆急需解决的问题。负载均衡技术的不断完善和应用,为图书馆解决这些问题提供了新的思路。
  1负载均衡技术
  1.1负载均衡定义
    负载均衡是建立在现有网络结构之上的,它提供了一种廉价、有效、透明的方法扩展网络设备和服务器的带宽,增加吞吐量,加强网络数据处理能力,提高网络的灵活性和可用性。负载均衡是一种策略,它能让多台服务器或多条链路共同承担一些繁重的计算机或多条链路共同承担一些繁重的计算或任务,从而以较低成本消除网络瓶颈,提高网络的灵活性和可靠。服务器负载均衡就是由多台服务器以对称的方式组成一个服务器集合,每台服务器都具有等价的地位,都可以单独对外提供服务而无须其他服务器的辅助。通过某种负载分担的算法,将外部发送来的请求均匀分配到对称结构中的某一台服务器上,而接收到请求的服务器独立地回应客户的请求。
  1.2负载均衡类型
    服务器负载均衡可以分为软件负载均衡和硬件负载均衡。
    (1)软件负载均衡是指在一台或多台服务器相应的操作系统上安装一个或多个附加软件来实现负载均衡。也就是利用网络协议的重定向功能来实现负载平衡。例如:在Http协议中支持定位指令,接收到这个指令的浏览器将自动重定向到该指令指明的另一个URL上,与执行服务请求相比,发送定位指令对Web服务器的负载要小得多,因此,可以根据这个功能来设计一种负载平衡的服务器,一旦W eb服务器认为自己的负载较大,它就不再直接发送回浏览器请求的网页,而是送回一个定位指令,让浏览器去服务器集群中的其他服务器上获得所需要的网页。在这种方式下,服务器本身必须支持这种功能,然而实现这一目标却有很多困难,例如一台服务器如何能保证它重定向过的服务器是比较空闲的,并且不会再次发送定位指令,定位指令和浏览器都没有这方面的支持能力,这样很容易在浏览器上形成一种死循环。因此,这种方式在实际应用当中并不多见,使用这种方式实现的服务器集群软件也较少。
    (2)硬件负载均衡是直接在多台服务器和外部网络间安装负载均衡设备,这种设备我们通常称之为负载均衡器。负载均衡器在客户群和服务器群中间起桥接作用,一方面接受客户的请求,另一方面定时从服务器中获取负载信息,并将客户请求提交到当前负载最轻的服务器上执行。此外,当系统中某一台服务器出现故障时,它就将其上的负载分配到别的服务器上,从而实现了故障接管功能。由于专门的硬件设备完成专门的任务,独立于操作系统,所以整体性能得到大大的提高,加上多样化的负载均衡策略,智能化的流量管理,可达到最佳的负载均衡需求。
  1.3负载均衡的具体实现方法
    常见的负载均衡方法有DNS负载均衡、代理服务器负载均衡、网络地址转换负载均衡等。
    (1)DNS负载均衡。DNS负载均衡方法是一种最早使用的负载均衡方法,它通过修改DNS设置,为多个地址配置同一域名,从而使访问同一域名的客户机,返回不同的服务器地址,达到负载均衡的目的。DNS负载均衡的优点是简单、易行,并且服务器可以位于互联网的任意位置上,但是它不能区分服务器的差异,也不能反映服务器的当前运行状态。这种负载均衡的基本设计思想只能算是负载均衡技术的最初应用。
    (2)反向代理负载均衡。使用代理服务器可以将请求转发给内部的Web服务器,使用这种加速模式显然可以提升静态网页的访问速度。因此也可以考虑使用这种技术,让代理服务器将请求均匀转发给多台内部Web服务器之上,从而达到负载均衡的目的。这种代理方式与普通的代理方式有所不同,标准代理方式是客户使用代理访问多个外部Web服务器,而这种代理方式是多个客户使用它访问内部Web服务器.因此也被称为反向代理模式。使用反向代理的好处是,可以将负载均衡和代理服务器的高速缓存技术结合在一起,提供有益的性能,具备额外的安全性,外部客户不能直接访问真实的服务器。可以采用较好的负载均衡策略,将负载非常均衡地分给内部服务器,不会出现负载集中到某个服务器的偶然现象。缺点就是首先必须为每一种服务专门开发一个反向代理服务器,并且针对每一次代理,代理服务器就必须维护一个对外的连接、一个对内的连接,因此对于响应要求特别高的连接请求时,代理服务器的负载也就非常大,容易成为服务的瓶颈。

    (3)基于NAT的负载均衡技术。网络地址转换(NAT)指在内部地址和外部地址之间进行转换,使得具备内部地址的计算机能访问外部网络,而当外部网络中的计算机访问地址转换网关拥有的某一外部地址时,地址转换网关能将其转发到一个映射的内部地址上。因此,如果地址转换网关能将每个连接均匀转换为不同的内部服务器地址,此后外部网络中的计算机就各自与自己转换得到的地址对应的服务器进行通信,从而达到负载分担的目的。NAT负载平衡是一种比较完善的负载平衡技术,起着NAT负载平衡功能的设备一般处于内部服务器到外部网间的网关位置,如路由器、防火墙、四层交换机、专用负载平衡器等,平衡算法也较灵活,如随机选择、最少连接数及响应时间等来分配负载。
    NAT负载平衡可以通过软硬件方式来实现。通过软件方式来实现 NAT负载平衡的设备往往受到带宽及系统本身处理能力的限制。由于NAT比较接近网络的低层,因此就可以将它集成在硬件设备中,通常这样的硬件设备是第四层交换机和专用负载平衡器,第四层交换机的一项重要功能就是NAT负载平衡。
  2负载均衡技术在图书馆网络中的应用
    图1中,图书馆的各个服务器连接到核心交换机,并通过防火墙与校园网连接。在实施负载均衡前,每个服务器都承担一种Web服务,服务器配置的差异和各种数据库访问量的差异造成了服务器负载的差异。系统中CNKI系列数据库、WWW书目检索系统的访问量大,致使服务器负载过高,不能为用户提供高质量的服务。超星数字图书馆服务器在有读者下载图书时,突发访问量大,而大多的时间比较空闲。万方数据库服务器和图书馆网站服务器则负载较轻。另外,在任何一台服务器发生故障时,此服务器承担的服务也就无法进行。为此,我们计划优化图书馆网络信息平台,建立负载均衡系统,要求具有较高的吞吐能力和处理能力,网络各层均不存在阻塞,具备对突发流量的承受能力和容灾能力。经过研究,我馆决定采用F5 BIG-IP5000来实现负载均衡。

图片内容