隆波田动中禅视频:LVS集群系统网络核心原理分析(转)

来源：百度文库编辑：九乡新闻网时间：2024/04/28 20:22:33

LVS文章荟萃

LVS集群技术

FunBSD

Preface
IPVS
HeatBeat
Ldirectord
Patch
Scripts
Reference

高可用性(High Available Cluster)，例：
Linux-HA
负载均衡(Load balancing Cluster)，例：
LVS
、
MOSIX
高性能计算(High Performance Computing)，例：
Beowulf

Load Balancer(负载均衡器)：
Load Balancer是整个集群系统的前端，负责把客户请求转发到Real Server上。
Backup是备份Load Balancer，当Load Balancer不可用时接替它，成为实际的Load Balancer。
Load Balancer通过Ldirectord监测各Real Server的健康状况。在Real Server不可用时
把它从群中剔除，恢复时重新加入。
Server Array(服务器群)：
Server Array是一组运行实际应用服务的机器，比如WEB, Mail, FTP, DNS, Media等等。
在实际应用中，Load Balancer和Backup也可以兼任Real Server的角色。
Shared Storage(共享存储)：
Shared Storage为所有Real Server提供共享存储空间和一致的数据内容。

安装在Load Balancer上，把发往Virtual IP的请求转发到Real Server上。

Virtual Server via NAT
Virtual Server via IP Tunneling
Virtual Server via Direct Routing

轮叫（Round Robin）
加权轮叫（Weighted Round Robin）
最少链接（Least Connections）
加权最少链接（Weighted Least Connections）
基于局部性的最少链接（Locality-Based Least Connections）
带复制的基于局部性最少链接（Locality-Based Least Connections with Replication）
目标地址散列（Destination Hashing ）
源地址散列（Source Hashing）
最短期望延迟(Shortest Expected Delay)
无须队列等待（Never Queue）

在Load Banlancer上安装IPVS内核补丁
在Load Banlancer上安装IPVS管理软件
在Real Server上安装ARP hidden内核补丁

http://www.kernel.org/

http://www.linuxvirtualserver.org/software/ipvs.html

http://www.ssi.bg/~ja/#hidden

安装在Load Balancer和Backup上，运行于active/standby模式。
当Load Balancer失效时，Backup自动激活，成为实际的Load Balancer。
切换到active模式时，按顺序启动Virtual IP、IPVS和Ldirectord。
切换到standby模式时，按顺序关闭Ldirectord、IPVS和Virtual IP。

http://www.linux-ha.org

监测Real Server，当Real Server失效时，把它从Load Balancer列表中删除，恢复时重新添加。

http://www.linuxvirtualserver.org/

http://www.linux-ha.org/

http://www.ultramonkey.org/

http://www.linuxts.com/modules/sections/index.php?op=viewarticle&artid=375

http://www.yesky.com/SoftChannel/72341302397632512/20040311/1776261.shtml

http://www-900.ibm.com/developerWorks/cn/linux/theme/special/index.shtml#cluster

LVS手册

可伸缩网络服务的设计与实现

LVS文章荟萃

关于用LVS搭建web服务器集群

文嵩您好！大家好！我想使用LVS搭建一个web服务器集群，用于解决我们一个项目中突发访问量过大导致的服务器宕机问题。我的实验环境是：实验室几台普通的PC机（配置不太相同），一个10M的HUB，PC机安装的系统是RedHat9.0，内核版本是2.4.20，web服务器为Apache2.0。我现在设计的步骤是： 1、重新下载内核 2、然后打上LVS补丁 linux-2.4.20-ipvs-1.0.8.patch.gz ipvs-1.0.8.tar.tar 3、配置核心选项 4、重新编译内核 5、重启系统 6、安装ipvsadm-1.21-4.src.rpm 7、调试想请教一下：这样的实验环境可不可以？实验步骤可不可行？另外：我想采用基于内容的负载分配机制，请问： web服务器的内容应该怎样部署？（应用系统需要在一两天的时间内完成几万名学生的网上选课） LVS中基于内容的负载均衡机制是怎样的？可以和IP负载均衡配合使用么？（注：关于数据库服务器的集群另外有人在做，暂且认为使用单台高性能机器作为数据库服务器呵呵）谢谢：）
利用集群技术实现Web服务器的负载均衡

集群LVS+GFS+ISCSI+TOMCAT

LVS集群系统网络核心原理分析

ipvsadm命令参考

集群技术在不同领域应用的关键要素以及不同

可伸缩网络服务的设计与实现

可伸缩网络服务的体系结构

可伸缩网络服务的定义

网络服务的需求

可伸缩性（Scalability），当服务的负载增长时，系统能被扩展来满足需求，且不降低服务质量。
高可用性（Availability），尽管部分硬件和软件会发生故障，整个系统的服务必须是每天24小时每星期7天可用的。
可管理性（Manageability），整个系统可能在物理上很大，但应该容易管理。
价格有效性（Cost-effectiveness），整个系统实现是经济的、易支付的。

LVS集群的体系结构

LVS集群的通用结构

负载调度器（load balancer），它是整个集群对外面的前端机，负责将客户的请求发送到一组服务器上执行，而客户认为服务是来自一个IP地址上的。它可以是用IP负载均衡技术的负载调度器，也可以是基于内容请求分发的负载调度器，还可以是两者的结合。
服务器池（server pool），是一组真正执行客户请求的服务器，执行的服务有WEB、MAIL、FTP和DNS等。
后端存储（backend storage），它为服务器池提供一个共享的存储区，这样很容易使得服务器池拥有相同的内容，提供相同的服务。

为什么使用层次的体系结构

为什么是共享存储

高可用性

可伸缩Web和媒体服务

可伸缩Cache服务

可伸缩邮件服务

地理分布LVS集群的体系结构

体系结构

使得用户访问离他们最近的系统，对用户来说体验到更快的响应速度，对服务提供商来说节约网络带宽，降低成本。
避免灾难导致系统中止服务。当一个地点发生地震、火灾等使得系统或者网络连接瘫痪时，所有的用户访问可以很快由其他地点的LVS集群来提供。除了已建立的连接中断以外，这一切对用户来说都是透明的。

基于BGP的地理分布服务器集群调度

服务器集群间的负载均衡

小结

IP负载均衡技术

通过NAT实现虚拟服务器（VS/NAT）

通过IP隧道实现虚拟服务器（VS/TUN）

通过直接路由实现虚拟服务器（VS/DR）

三种方法的优缺点比较

Virtual Server via NAT

Virtual Server via IP Tunneling

Virtual Server via Direct Routing

小结

负载调度

内核中的连接调度算法

轮叫调度（Round-Robin Scheduling）
加权轮叫调度（Weighted Round-Robin Scheduling）
最小连接调度（Least-Connection Scheduling）
加权最小连接调度（Weighted Least-Connection Scheduling）
基于局部性的最少链接（Locality-Based Least Connections Scheduling）
带复制的基于局部性最少链接（Locality-Based Least Connections with Replication Scheduling）
目标地址散列调度（Destination Hashing Scheduling）
源地址散列调度（Source Hashing Scheduling）
最短预期延时调度（Shortest Expected Delay Scheduling）
不排队调度（Never Queue Scheduling）

轮叫调度（Round-Robin Scheduling）

轮叫调度算法流程

加权轮叫调度（Weighted Round-Robin Scheduling）

加权轮叫调度算法流程

最小连接调度（Least-Connection Scheduling）

最小连接调度算法流程

加权最小连接调度（Weighted Least-Connection Scheduling）

加权最小连接调度的算法流程

基于局部性的最少链接（Locality-Based Least Connections Scheduling）

LBLC调度算法流程

带复制的基于局部性最少链接（Locality-Based Least Connections with Replication Scheduling）

LBLCR调度算法流程

目标地址散列调度（Destination Hashing Scheduling）

目标地址散列调度算法流程

素数乘法Hash函数

源地址散列调度（Source Hashing Scheduling）

动态反馈负载均衡算法

连接调度

简单连接调度

实际TCP/IP流量的特征

动态反馈负载均衡机制

综合负载

权值计算

一个实现例子

小结

轮叫调度（Round-Robin Scheduling）
加权轮叫调度（Weighted Round-Robin Scheduling）
最小连接调度（Least-Connection Scheduling）
加权最小连接调度（Weighted Least-Connection Scheduling）
基于局部性的最少链接（Locality-Based Least Connections Scheduling）
带复制的基于局部性最少链接（Locality-Based Least Connections with Replication Scheduling）
目标地址散列调度（Destination Hashing Scheduling）
源地址散列调度（Source Hashing Scheduling）

IP虚拟服务器的实现和性能测试

系统实现的基本框架

系统实现的若干问题

Hash表

垃圾回收

ICMP处理

可装卸的调度模块

锁的处理和优化

连接的相关性

本地结点

数据统计

调度器所处理报文的总数
调度器所处理连接的总数
调度器中所有并发连接的数目
每个虚拟服务处理连接的总数
每个服务器所有并发连接的数目

防卫策略

调度器间的状态同步

性能测试

LVS集群的应用

http://www.LinuxVirtualServer.org/

英国国家JANET Cache Service（wwwcache.ja.net）是为英国150所以上的大学提供Web Cache服务。他们用28个结点的LVS集群代替了原有现50多台相互独立的Cache服务器，用他们的话说现在速度就跟夏天一样，因为夏天是放假期间没有很多人使用网络。
Linux的门户站点（www.linux.com）用LVS将很多台VA Linux SMP服务器组成高性能的WEB服务，已使用将近一年。
SourceForge（sourceforge.net）是在全球范围内为开发源码项目提供WEB、FTP、Mailing List和CVS等服务，他们也使用LVS将负载调度到十几台机器上。
世界上最大的PC制造商之一采用了两个LVS集群系统，一个在美洲，一个在欧洲，用于网上直销系统。
以RealPlayer提供音频视频服务而闻名的Real公司（www.real.com）使用由20台服务器组成的LVS集群，为其全球用户提供音频视频服务。在2000年3月时，整个集群系统已收到平均每秒20,000个连接的请求流。
NetWalk（www.netwalk.com）用多台服务器构造LVS系统，提供1024个虚拟服务，其中本项目的一个美国镜像站点（www.us.linuxvirtualserver.org）。
RedHat（www.redhat.com）从其6.1发行版起已包含LVS代码，他们开发了一个LVS集群管理工具叫Piranha，用于控制LVS集群，并提供了一个图形化的配置界面。
VA Linux（www.valinux.com）向客户提供基于LVS的服务器集群系统，并且提供相关的服务和支持。
TurboLinux的“世界一流Linux集群产品”TurboCluster实际上是基于LVS的想法和代码的，只是他们在新闻发布和产品演示时忘了致谢。
红旗Linux和中软都提供基于LVS的集群解决方案，并在2000年9月召开的Linux World China 2000上展示。

小结

三种IP负载均衡技术，在一个服务器集群中，不同的服务器可以使用不同的IP负载均衡技术。
可装卸连接调度模块，共有五种连接调度算法。
高效的Hash函数
高效的垃圾回收机制
虚拟服务的数目没有限制，每个虚拟服务有自己的服务器集。
支持持久的虚拟服务
正确的ICMP处理
拥有本地结点功能
提供系统使用的统计数据
针对大规模DoS攻击的三种防卫策略

内核中的基于内容请求分发

基于内容的请求分发

相同页面的请求被发送到同一台的服务器，所请求的页面很有可能会被服务器缓存，可以提高单台服务器的主存Cache使用效率。
一些研究[94]表明WEB访问流中存在空间的局部性。Layer-7交换可以充分利用访问的局部性，将相同类型的请求发送到同一台服务器，使得每个后端服务器收到的请求相似性好，有利于进一步提高单台服务器的主存Cache使用效率，从而在有限的硬件配置下提高系统的整体性能。
后端的服务器可运行不同类型的服务，如文档服务，图片服务，CGI服务和数据库服务等。

内核中的基于内容请求分发KTCPVS

KTCPVS的体系结构

KTCPVS实现

KTCPVS高可用性

KTCPVS的调度算法

加权最小连接调度

基于局部性的最小连接调度

基于内容的调度

TCPHA的设计与实现

《TCP迁移技术报告》

本文来自ChinaUnix博客，如果查看原文请点：http://blog.chinaunix.net/u/16029/showart_135867.html

LVS集群系统网络核心原理分析(转) RAC数据库集群服务器系统性能瓶颈分析(zt) 服务器集群负载均衡好大一个IP (F5,LVS,DNS,CDN) 制造业ERP系统的核心功能和管理思想分析 Nginx负载均衡和LVS负载均衡的比较分析 Mongodb集群节点故障恢复场景分析数据库集群技术分析和比较1 struts2核心工作流程与原理（转）监控专业知识培训初级教材(三监控系统设计原理分析)1 监控专业知识培训初级教材(三监控系统设计原理分析)2 监控专业知识培训初级教材(三监控系统设计原理分析)3 技术分析的核心核心竞争力分析模型核心竞争力分析模型..... Android核心分析之一刹车系统工作原理门禁系统原理１红绿灯系统控制原理百度Hadoop分布式系统揭秘：4000节点集群 : NoSQLfan DDE决策系统原理及使用方法（转）电路原理分析电表原理分析分析单硅机原理专业技术分析操作原理