HP-UNIX做代理服务器

来源:岁月联盟 编辑:zhu 时间:2008-03-31
HP-UNIX做代理服务器内容简介:安装完成后,可根据以下配置Proxy: 1.基本配置 安装完成后,接下来要对Squid的运行进行配置。所有项目都在squid.conf中完成。Squid自带的squid.conf包括非常详尽的说明,相当于一篇用户手册,对配置有任何疑问都可以参照解决。 安装完成后,可根据以下配置Proxy:

  1.基本配置 

  安装完成后,接下来要对Squid的运行进行配置。所有项目都在squid.conf中完成。Squid自带的squid.conf包括非常详尽的说明,相当于一篇用户手册,对配置有任何疑问都可以参照解决。 

  在这个例子中,代理服务器同时也是网关,内部网络接口eth0的IP地址为192.168.0.1,外部网络接口eth1的IP地址为202.103.x.x。下面是一个基本的代理所需要配置选项: 

  http_port 192.168.0.1:3128

  默认端口是3128,当然也可以是任何其它端口,只要不与其它服务发生冲突即可。为了安全起见,在前面加上IP地址,Squid就不会监听外部的网络接口。 

  下面的配置选项是服务器管理者的电子邮件,当错误发生时,该地址会显示在错误页面上,便于用户联系: 

  cache_mgr start@soocol.com 

  以下这些参数告诉Squid缓存的文件系统、位置和缓存策略: 

  cache_dir ufs /var/squid 
  cache_mem 32MB 
  cache_swap_low 90 
  cache_swap_high 95

  在这里,Squid会将/var/squid目录作为保存缓存数据的目录,每次处理的缓存大小是32兆字节,当缓存空间使用达到95%时,新的内容将取代旧的而不直接添加到目录中,直到空间又下降到90%才停止这一活动。如果不想Squid缓存任何文件,如某些存储空间有限的专有系统,可以使用null文件系统(这样不需要那些缓存策略): 

  cache_dir null /tmp 

  下面的几个关于缓存的策略配置中,较主要的是第一行,即用户的访问记录,可以通过分析它来了解所有用户访问的详尽地址: 

  cache_access_log /var/squid/access.log 
  cache_log /var/squid/cache.log 
  cache_store_log /var/squid/store.log 

  下面这行配置是在较新版本中出现的参数,告诉Squid在错误页面中显示的服务器名称: 

  visible_hostname No1.proxy 

  以下配置告诉Squid如何处理用户,对每个请求的IP地址作为单独地址处理: 

  client_mask 255.255.255.255

  如果是普通代理服务器,以上的配置已经足够。但是很多Squid都被用来做透明代理。所谓透明代理,就是客户端不知道有代理服务器的存在,当然也不需要进行任何与代理有关的设置,从而大大方便了系统管理员。相关的选项有以下几个: 

  httpd_accel_host virtual 
  httpd_accel_port 80 
  httpd_accel_with_proxy on 
  httpd_accel_user_host_header on

  在Linux上,可以用iptables/ipchains直接将对Web端口80的请求直接转发到Squid端口3128,由Squid接手,而用户浏览器仍然认为它访问的是对方的80端口。例如以下这条命令: 

  iptables -t nat -A PREROUTING -s 192.168.0.200/32 -p tcp --dport 80 -j REDIRECT 3128 

  就是将192.168.0.200的所有针对80端口的访问重定向到3128端口。 

  所有设置完成后,关键且重要的任务是访问控制。Squid支持的管理方式很多,使用起来也非常简单(这也是有人宁愿使用不做任何缓存的Squid,也不愿意单独使用iptables的原因)。Squid可以通过IP地址、主机名、MAC地址、用户/密码认证等识别用户,也可以通过域名、域后缀、文件类型、IP地址、端口、URL匹配等控制用户的访问,还可以使用时间区间对用户进行管理,所以访问控制是Squid配置中的重点。Squid用ACL(Access Control List,访问控制列表)对访问类型进行划分,用http_access deny 或allow进行控制。根据需求首先定义两组用户advance和normal,还有代表所有未指明的用户组all及不允许上网的baduser,配置代码如下: 

  acl advance 192.168.0.2-192.168.0.10/32 
  acl normal src 192.168.0.11-192.168.0.200/32 
  acl baduser src 192.168.0.100/32 
  acl baddst dst www.soocol.com 
  acl all src 0.0.0.0/0 

  http_access deny baduser 
  http_access allow advance 
  http_access allow normal

  可以看出,ACL的基本格式如下: 

  acl 列表名称 控制方式 控制目标

  比如acl all src 0.0.0.0/0,其名称是all,控制方式是src源IP地址,控制目标是0.0.0.0/0的IP地址,即所有未定义的用户。出于安全考虑,总是在最后禁止这个列表。 

  下面这个列表代表高级用户,包括IP地址从192.168.0.2到192.168.0.10的所有计算机: 

  acl advance 192.168.0.2-192.168.0.20/32 

  下面这个baduser列表只包含一台计算机,其IP地址是192.168.0.100: 

  acl baduser 192.168.0.100/32 

  ACL写完后,接下来要对它们分别进行管理,代码如下: 

  http_access deny baduser 
  http_access allow advance 
  http_access allow normal 

  上面几行代码告诉Squid不允许baduser组访问Internet,但advance、normal组允许(此时还没有指定详细的权限)。由于Squid是按照顺序读取规则,会首先禁止baduser,然后允许normal。如果将两条规则顺序颠倒,由于baduser在normal范围中,Squid先允许了所有的normal,那么再禁止baduser就不会起作用。 

  特别要注意的是,Squid将使用allow-deny-allow-deny……这样的顺序套用规则。例如,当一个用户访问代理服务器时,Squid会顺序测试Squid中定义的所有规则列表,当所有规则都不匹配时,Squid会使用与最后一条相反的规则。就像上面这个例子,假设有一个用户的IP地址是192.168.0.201,他试图通过这台代理服务器访问Internet,会发生什么情况呢?我们会发现,他能够正常访问,因为Squid找遍所有访问列表也没有和192.168.0.201有关的定义,便开始应用规则,而最后一条是deny,那么Squid默认的下一条处理规则是allow,所以192.168.0.201反而能够访问Internet了,这显然不是我们希望的。所以在所有squid.conf中,最后一条规则永远是http_access deny all,而all就是前面定义的“src 0.0.0.0”。 

  2.高级控制 

  前面说过,Squid的控制功能非常强大,只要理解Squid的行为方式,基本上就能够满足所有的控制要求。下面就一步一步来了解Squid是如何进行控制管理的。 

  通过IP地址来识别用户很不可靠,比IP地址更好的是网卡的MAC物理地址。要在Squid中使用MAC地址识别,必须在编译时加上“--enable-arp-acl”选项,然后可以通过以下的语句来识别用户: 

  acl advance arp 00:01:02:1f:2c:3e 00:01:02:3c:1a:8b ... 

  它直接使用用户的MAC地址,而MAC地址一般是不易修改的,即使有普通用户将自己的IP地址改为高级用户也无法通过,所以这种方式比IP地址可靠得多。 

  假如不想让用户访问某个网站应该怎么做呢?可以分为两种情况:一种是不允许访问某个站点的某个主机,比如ok的主机是ok.sina.com.cn,而其它的新浪资源却是允许访问的,那么ACL可以这样写: 

  acl sinapage dstdomain ok.sina.com.cn 
  ... ... 
  http_access deny ok 
  ... ... 

  由此可以看到,除了ok,其它如www.sina.com.cn、news.sina.com.cn都可以正常访问。 

  另一种情况是整个网站都不许访问,那么只需要写出这个网站共有的域名即可,配置如下: 

  acl qq dstdomain .tcccent.com.cn 

  注意tcccent前面的“.”,正是它指出以此域名结尾的所有主机都不可访问,否则就只有tcccent.com.cn这一台主机不能访问。 

  如果想禁止对某个IP地址的访问,如202.118.2.182,可以用dst来控制,代码如下: 

  acl badaddr dst 202.118.2.182 

  当然,这个dst也可以是域名,由Squid查询DNS服务器将其转换为IP。 

  还有一种比较广泛的控制是文件类型。如果不希望普通用户通过代理服务器下载MP3、AVI等文件,完全可以对他们进行限制,代码如下: 

  acl mmxfile urlpath_regex /.mp3$ /.avi$ /.exe$ 
  http_access deny mmxfile 

  看到regex,很多读者应该心领神会,因为这条语句使用了标准的规则表达式(又叫正则表达式)。它将匹配所有以.mp3、.avi等结尾的URL请求,还可以用-i参数忽略大小写,例如以下代码: 

  acl mmxfile urlpath_regex -i /.mp3$ 

  这样,无论是.mp3还是.MP3都会被拒绝。当然,-i参数适用于任何可能需要区分大小写的地方,如前面的域名控制。 

  如果想让普通用户只在上班时间可以上网,而且是每周的工作日,用Squid应当如何处理呢?看看下面的ACL定义: 

  acl worktime time MTWHF 8:30-12:00 14:00-18:00 
  http_access deny !worktime 

  首先定义允许上网的时间是每周工作日(星期一至星期五)的上午和下午的固定时段,然后用http_access 定义所有不在这个时间段内的请求都是不允许的。 

  或者为了保证高级用户的带宽,希望每个用户的并发连接不能太多,以免影响他人,也可以通过Squid控制,代码如下: 

  acl conncount maxconn 3 
  http_access deny conncount normal 
  http_access allow normal 

  这样,普通用户在某个固定时刻只能同时发起三个连接,从第四个开始,连接将被拒绝。 

  总之,Squid的ACL配置非常灵活、强大,更多的控制方式可以参考squid.conf.default。
   
  3.总结 

  下面把整个squid.conf总结一下: 

  # 服务器配置 
  http_port 192.168.0.1:3128 
  cache_mgr start@soocol.com 
  cache_dir null /tmp 
  cache_access_log /var/squid/access.log 
  cache_log /var/squid/cache.log 
  cache_store_log /var/squid/store.log 
  visible_hostname No1.proxy 
  client_mask 255.255.255.255 
  httpd_accel_host virtual 
  httpd_accel_port 80 
  httpd_accel_with_proxy on 
  httpd_accel_user_host_header on 

  # 用户分类 
  acl advance arp 00:01:02:1f:2c:3e 00:01:02:3c:1a:8b ... 
  acl normal proxy_auth REQUIED 
  acl all src 0.0.0.0 

  # 行为分类 
  acl mmxfile urlpath_regex /.mp3$ /.avi$ /.exe$ 
  acl conncount maxconn 3 
  acl worktime time MTWHF 8:30-12:00 14:00-18:00 
  acl sinapage dstdomain ok.sina.com.cn 
  acl qq dstdomain .tcccent.com.cn 

  # 处理 
  http_access allow advance 
  http_access deny conncount normal 
  http_access deny !worktime 
  http_access deny mmxfile 
  http_access deny sinapage 
  http_access deny qq 
  http_access allow normal 

  配置后的状况是,advance组可以不受任何限制地访问Internet,而normal组则只能在工作时间上网,而且不能下载多媒体文件,不能访问某些特定的站点,而且发送请求不能超过3个。 

  通过本文的介绍,它可以了解Squid的基本能力。当然,它的能力远不止此,可以建立强大的代理服务器阵列,可以帮助本地的Web服务器提高性能,可以提高本地网络的安全性等。要想发挥它的功效,还需要进一步控制。

图片内容