|
采用POWER5虚拟技术进行服务器整合
概述
随着用户不断要求降低IT基础架构运行成本,服务器整合的重要性被提到了前所未有的高度。服务器整合指通过减少分散的基础设备数量来简化和优化IT环境。服务器整合将首先从应用环境开始,包括应用服务器和数据库服务器,并相应对涉及的物理服务器、网络和存储进行优化。服务器整合的优点本文不再赘述,而将重点放在基于POWER5的p5服务器进行服务器整合的实践和效果上。
服务器整合倍受关注,关键原因在于新一代服务器硬件和逻辑分区可以整合分散在多个小系统上的应用,并集中到一台大服务器上。新近推出的IBM p5家族产品传承了自大型主机上的虚拟引擎技术,该技术可提取硬件上的物理属性,通过整合实现更灵活更经济的系统运行模式。
IBM先进的POWER虚拟技术
一直以来,IBM处于虚拟化技术的倡导者和领航者的地位。随着p5系统的发布,其上所附带的虚拟功能进一步扩大了IBM在该领域的领先优势。IBM的POWER虚拟技术包括微分区和虚拟I/O(磁盘和通信适配器的虚拟),下面将着重探讨微分区的实践。
微分区能实现在一台服务器上运行比物理处理器数量更多的分区,该功能成为p5服务器上最富有革命性的新亮点。图一展示了分区技术的演进。图一最左边是传统的对称多处理器系统的结构图,由一个操作系统管理整个系统的计算资源。图一中间部分展示了逻辑分区(LPAR)的结构图,它于2001年在p系列690服务器和AIX 5L操作系统平台上首次公布。在逻辑分区的支持下,一个系统内可独立的运行多个分区,每个分区运行独立的操作系统。在这一环境下,逻辑分区的CPU“颗粒大小”(Granularity)是和物理处理器一样大的,也就是说,每颗物理处理器的计算力不能被切割,只能对处理器进行捆绑,这样,也就不可能划分出比物理处理器数量更多的分区。2003年,IBM推出了AIX 5L V5.2操作系统,进一步延伸了这一代逻辑分区功能,实现联机状态下可对逻辑分区中的计算资源进行调度,即所谓动态逻辑分区(DLPAR),但CPU“颗粒大小”并没有进一步减小。今天,最新的微分区技术打破了分区上CPU“颗粒大小”受物理处理器数量的限制,系统可以创建和运行比物理处理器数量更多的分区(如图一最右边),进一步提升了系统的灵活性。

系统整合规划
在进行系统整合之前,需要对整合做出全程规划。
先了解一下原有用户环境:现有5台服务器,每台均为IBM RS/6000 44P-270,配置375MHz处理器,4MB L2缓存,7GB系统内存,每台服务器连接一台IBM串行磁盘系统D40。每台服务器运行同样的软件堆栈:AIX 5L V5.2操作系统,WebSphere WAS5.0,和数据库DB2 Universal Database V8.1 FP4。应用服务器上的应用软件基于J2EE代码,运行多种类型的交易,负载轻重程度不同。
制定系统整合规划首先要确定遗留服务器上原有应用对处理器、内存和I/O的需求。我们通过测试应用环境,确定了服务器峰值CPU利用率。如果从一个长期角度来看,大多数服务器上CPU的利用率差异很大,但一般来说,峰值多出现在一天的某个时段。本次,我们以峰值使用情况作为系统整合规划的基准,但其实这么做也是保守的,因为在即将实施的5个系统分区完全有可能在同一时间冲击峰值。不过,考虑到峰值确保了即使在最困难的环境下,服务调度的质量也能得到保证。本例取现有服务器运行峰值的1.33倍为新系统计划值。
我们计划将44P-270所附带的SSA磁盘子系统移植到整合平台上,因为测试显示原有磁盘系统的性能足够满足新环境。这简化了客户移植过程,并能在新旧环境对比时结果更直观可靠。
系统整合规划中对原服务器和用于整合的p5服务器的比对和规划基于IBM服务器rPerf测试值列表。44P-270系统的rPerf测试值为3.59,考虑到服务器的利用率在60%左右,所以用于整合的服务器的rPerf测试值要高于14.3(每台3.59rPerf测试值×60%利用率×5台×1.33增长空间=14.3rPerf测试值)。根据该值,最适合原有环境的服务器是配置四颗1.65GHz POWER5处理器的p5 570,其rPerf测试值为19.66。该配置p5 570的rPerf测试值比需求略高,不过也为以后的成长留了一定的空间。这样的空间一方面避免rPerf测试值与实际情况的差异,另一方面也为微分区功能留有余地,毕竟在高系统负荷下,并发执行多个分区也会占用系统资源,具体占用量视系统利用率和应用特征而不同。
虽然原有系统每台配置了7GB的内存,但实际中有比较多的富余,这在系统整合工作中经常遇到。为新系统中5个分区配置的内存数量为16GB,这样每个分区3GB内存,对于新环境十分充足。
测试环境描述1
性能测试应用是用来测试p5 570和原服务器所组成的2层测试环境的性能表现。第一层包括用来驱动“系统在测”(System Under Test)的设备,第二层包括WebSphere应用服务器和DB2数据库服务器,均运行32位内核的AIX 5L。因为应用服务器和数据库服务器在同一操作系统中运行,所以之间不需要外部的通信连接。
测试环境使用了典型的请求和响应模式,模拟的用户通过Web浏览器提出请求,服务器处理请求并向用户发回反馈。应用基于Java2平台,并使用企业版技术(J2EE)。图2描述了整个流程。Enterprise Java Beans (EJBs)执行IBM应用服务器和DB2数据库服务器,经由EJBs,负载通过Web层接入应用。此环境还利用了Java Messaging service(JMS)和Message Queue(MQ)基础架构来提高其复杂性和真实度。负载运行了多种交易类型,既有大CPU负载的运算,又有小负载的。
图2,测试环境数据流程图

测试环境描述2
测试环境包括一个基准平台(见图3右侧)和一个目标平台,每个平台都包括一个服务器(SUT)和一个驱动器。原有服务器平台包括的服务器驱动器都是44P-270系统,运行32位内核的AIX 5L V5.2,均配置4路375MHz处理器和一个10/100Mbps网卡。原有服务器通过一块SSA适配器连接外部存储。系统整合平台包括一台IBM eServer p5 570服务器,运行1.65GHz POWER5处理器,并虚拟出5个微分区。为对应原来的服务器系统及测试目的,由相同的44P-270系统驱动每个分区。每个分区运行32位内核的AIX 5L V5.3,并分配了0.8个POWER5处理器,分区对CPU的占用被锁定。每分区包括一个SCSI适配器、一个SSA适配器和一个10/100Mbps网卡,3GB物理内存。用一个Cisco100Mbps全双工网络交换机组网,服务器和客户端通过它进行通讯。
每个分区和对应原有系统使用一个9GB SCSI硬盘用于AIX 5L镜像,16×9GB SSA磁盘系统配置成2个环路(loop),运行数据库、DB2日志、基于Web的Java的应用和数据分析仓库。写密集型数据库日志放在第二个环路中,确保得到最好的性能表现。
5个分区和原有系统都采用相同的应用堆栈,并装有JDK 1.4、WAS 5.1GM、MQ和DB2 V8+FixPack 4,同时安装了DB2 JDBC驱动器,来运行性能工作负荷。

图3,虚拟服务器整合拓扑图
评价整合效果——第一部分
下面我们将详细介绍系统的测试结果,从而展示在客户负载不断提高的情况下,实施微分区的服务器系统与原有服务器系统的性能差异。测试中,通过逼近原有服务器的峰值模拟不断增加的客户,随着驱动工作负载的客户数量的增加,负载开始倾斜。测试开始时,以25次/秒运行驱动一个服务器分区,其他4个分区运行AIX 5L但没有活动工作负载。然后,3个分区空闲,2个分区加上25次/秒运行的负荷。随后,加载分区数量不断增加,最后5个分区都加上了负载。
图4显示随着加载分区数量的不断增加,吞吐量的增加呈线性增长。

图4,吞吐量
为评价系统提供服务的质量,我们对每种交易类型的响应时间进行了监测。因活动分区数与交易响应时间呈线性,我们将分析重点集中在中等强度的工作负荷交易上。图5显示了随着加载分区数量的增加响应的变化情况。图形说明平均响应时间并未随分区负载增加而显著提高,第90个百分点的响应时间也与传统服务器环境中随CPU利用率增加的情况类似。
实际上响应时间对于这样的工作负载来说,受微分区的影响非常小。管理程序的分派机制足够精细,能让分区迅速响应且效率很高,不会对分区吞吐量有显著影响。

图5,响应时间
图6比较了在相同运行情况下,分区服务器与原有服务器的响应时间。在持续不断的相同工作负荷下,每个活动分区的响应时间和吞吐量类似或好于原有服务器。这是因为p5 570有更强大的处理器,在CPU密集型的计算中更有效。

图6,响应时间分区对比原有系统
图7显示在所有测试中,所驱动的工作负荷都非常平缓。同时,与原有服务器的比较在所测量的工作负荷上非常精确。

图7,每分区吞吐量分区对比原有系统
数据还说明当原有服务器接近峰值时,分区服务器的升高始终低于原有服务器负载的升高。此外,性能的接近显示当初根据原有服务器的使用情况规划所需服务器的配置十分准确。在该工作负荷水平下, p5服务器上的5个活动分区正好能取代原来的设备。
评价整合效果——第二部分
下一个数据显示了在更高吞吐量下,分区服务器处理工作符合的能力。在工作负荷过载的情况下,该配置的分区服务器仍然能够提供相当理想的计算服务表现。
在图8的比较中,我们测试了加载的5个分区,并做了两种情况的比较。第一种情况,每个分区加载了25次/秒运行,第二种情况则加载了33次/秒运行。图8对比了在中等交易强度下,平均和第90个百分点的响应时间。在33次/秒运行负荷下,分区服务器系统利用率达到90%。服务器利用率越高,响应时间越受影响,这一事实与测试中响应时间增加相关。不过测试证明,即使在如此高的利用率下,分区服务器的响应低于规划的标准。

图8,响应时间中等大小的交易量
结论
通过以上的实验和对比,我们得出以下三点结论:
- 在一台p5 570上所虚拟的5个分区的性能与5台不堪重负的44P-270旗鼓相当。配置IBM虚拟引擎系统技术的p5平台具有相当的可扩展性和精细度,能有效的发挥4颗POWER5处理器的效能,在要求苛刻的Web应用服务环境中,比原有服务器上20颗POWER3处理器表现更好。
- p5虚拟技术所实现的分区服务器与5台按应用分配的原有服务器表现相当。微分区不会约束典型工作负载的响应。
- 分区或未分区设备的计算性能可直接进行换算,证明利用微分区进行服务器整合简便易行。
|