当前位置：首页 > 网络学院 > 操作系统 > Linux

菜鸟学习Linux集群之概念篇

来源：岁月联盟编辑：exp 时间：2011-09-09

前两天学习了集群的应用，简单总结下：集群并不是很高深难懂的知识，只要掌握其原理，那么实现起来并不是很困难。下面我们一起来简单学习下集群。
什么是集群？

集群或者说是群集：其目的是为了实现将多台计算机组合以来完成特定的任务，比如天气预报，大型网络游戏，这些都需要很大的运算量，单台计算机实现成本太高，而且不显示。那么就需要通过集群的方式，将废弃的或者正在使用的计算机联合起来，结合整体的力量来解决这些问题。
集群的类型大致分为三类：
1.LB Load Balancing（负载均衡集群）
2.HA High Availability（高可用性集群）
3.HP High Performance（高性能集群）
简单说明下这三种类型的集群：
1. 负载均衡型的集群目的是为了提高服务的并发能力，比如三台WEB服务器组合成一个集群，我们就需要用这种类型的集群来实现负载均衡，既让这三台WEB服务器的负载平均一些，不至于有很空闲的服务器。
2. 高可用性的集群目的是为了提供7*24小时服务的能力，通过提供冗余服务器，来防止宏机造成的服务中断
3. 高性能集群目的是为了在短期内解决大量复杂的计算，常见的天气预报系统，科学勘探，人口普查等等
同时，集群提供了非常好的扩展/缩减性非常，可以方便的增加或者减少服务器。
集群实现的方式
LB负载均衡
F5(硬件)
lvs
haproxy
HA 高可用
Heartbeat ***目前分类成几个小项目
corosync+openais: RHCS ***REDHAT6.0目前使用的，它的可配置，可共享性优于上面的
ultramokey
keepalive
HP高性能
bowerful
============================分割线======================================
下面我们来详细的介绍下负载均衡集群和高可用集群的实现原理
负载均衡集群
————负载均衡其实就是一个乐队的指挥，指挥下面的乐队

clip_image002

为了实现负载均衡，我们需要一个前端的负载均衡器---------Direcor转发服务器（或者专业的硬件），通过它来接受客户端的请求，把这些请求来转发给后方的服务器。在这个转发的过程中，根据后方服务器的负载情况（通过算法）平均分配，以实现负载均衡。
上面说了，可以通过构架专用的服务器来实现负载均衡器的作用，那么通过什么软件来实现这个服务呢？
主要有两种：
1. LVS Linux Virtual Server LVS是由国人章文嵩开发的开源集群软件，是目前广泛使用的集群软件之一。
2. haproxy
LVS经过优化能够提供接近于硬件的性能，而且开源所以使用很多。但是当Director这台主机当机了，整个集群就失效了，这就是单点故障，所以我们需要通过另一种集群的组合来实现集群的功能。
好处：
1.实现负载均衡
2.能过提供类似高可用的功能，比如第一台WEB服务器当机了，通过算法将请求转到第二台
3.能够非常容易扩展，便捷的扩展性，很容易增加主机
高可用集群
—————认为哪个地方不会出错，它就出错----莫非定律

clip_image004

上面说了，高可用集群就是为了可以提供7*24小时在线服务的能力，那么完成这样的需求都需要什么呢？
完成高可用集群需要:
1.服务一旦发生故障，服务就转移到另一台服务器
假设服务器A有一颗“心脏“，在它正在提供服务的时候，剩余两台服务器通过探测它的”心跳“来确认它是否还”活着“，如果“心跳”停止了，那么立刻再监听一次，如果这次“心跳”仍然是停止的，那么立刻顶替上去提供服务
2.数据同步
数据同步的实现方式：
1）通过类似NFS的共享服务，但是NFS也需要网络传输，效率比较低
2）通过某种机制（文件同步rsync），将A节点改变的内容发给B节点.
# Rsync是一个命令，不过现在有专业的工具，通过rsync server来实现同步数据。它的效率比较高，但是缺点是文件必须存两份。
上面的都是在文件级别实现同步，效率不高，但是比NFS高多了，缺点是数据村两份
3) DRBD：在内核中基于块级别的共享，类似于rsync比rsync工作级别更低的，效率更高的解决方案，而且新版本的内核已经做进内核，廉价
4）使用专业级别的SAN ，通过光纤来同步块设备，（存储区域网络）这种存储的级别非常高，通过块设备。
但是数据同步存在一个问题：
A节点很忙，B认为A当机了，就抢过服务，而A并没有当机，这样A也抢服务，这样A,B同时读写共享文件系统同一个文件，造成文件系统崩溃

clip_image006

解决这种问题的方法：
B抢过服务后，B（通过电源交换机）直接将A关闭。当然还有其他的实现方法。
上述只是一种说明，真是情况超过100个节点，心跳探测是通过广播的方式通告，一旦没有广播，就判定那个节点死亡了，这样就造成了几十个节点争夺服务的情况，就需要其他的机制来限制这种争夺，比如排队，谁在最前，谁顶替，其他的继续监听，当然还有其他的方法。
高性能集群
类似于LVS，但是它的前端，是把请求分成N个小任务，给后方不同的主机处理，处理的结果返回给前端

clip_image002[1]

它通过bowerfull这个软件来实现，这里不作过多说明，因为我们不学这个………
它适用于在线量比较大的网站，游戏，云计算等领域等需要短时间内完成大量复杂运算的领域。

下篇介绍LVS的原理，算法以及简单实现~谢谢观看
作者“Dean的Linux”

上一篇：archlinux安装问题

下一篇：iptables常用端口设置

当前位置：首页 > 网络学院 > 操作系统 > Linux

菜鸟学习Linux集群之概念篇

图片内容

最近更新

随机推荐