摘要: IT容量管理是对容量进行评估、规划、分析、调整和优化的过程,它结合了业务、服务和资源容量需求,以保证对资源的最优利用,满足与用户之间所约定的性能等级要求。本文通过实例讲述了如何对应用系统进行IT容量评估、规划等的方法。
Abstract: IT capacity management capacity is the assessment, planning, analysis, adjustment and optimization process of capacity, which combines the requirements of the business, services and resources capacity, in order to ensure optimal utilization of resources and meet the agreed performancelevel requirements of the user. The paper describes the way to conduct IT capacity assessment and planning on the applications through examples.
关键词: 容量评估;逻辑工作负载;服务等级;容量规划
Key words: capacity assessment;logic work load;service level;capacity planning
中***分类号:TP30 文献标识码:A 文章编号:1006-4311(2012)20-0211-03
0 引言
国家电网“十二五”期间,将完成SG186各业务系统的深化应用及SG-ERP的建设。随着IT应用的不断深化,其规模和复杂性会使得一些关键应用面临着性能问题。用户为保障应用系统能够稳定、高效率的运行,往往会进行大规模的投资。IT容量的科学化管理是影响性能的重要因素之一。
IT容量管理是对容量进行评估、规划、分析、调整和优化的过程,它结合了业务、服务和资源容量需求,以保证对资源的最优利用,满足与用户之间所约定的性能等级要求。
1 容量评估
对不同的IT基础架构进行容量评估可采用不同的方法和手段,但主要包括以下3个基本步骤:①理解业务需求,划分优先级;②定义IT服务的等级;③分析评估当前IT容量。
1.1 定义IT服务等级 充分理解业务需求是做好IT容量管理的前提。从用户、IT运维部门、信息管理部门收集各应用系统的日常运行数据,归类业务需求划分优先级,作为定义IT服务等级的关键因素。在定义IT服务等级之前需要做大量的调研工作,主要包括下面几个部分:
①先通过监控各应用系统在日常运行时的工作负载和指标数据,匹配工作负载和性能数据,从而建立反映业务服务水平相对应的工作负载。从***1可以看出IT提供的服务质量很大程度上由它所承受的工作负载所决定;②其次选择一个典型应用,设定在不同的负载的情况下运行,采集监控指标数据。通过这些信息能够反映IT资源消耗和业务量之间的相关性,基于时间纬度进行分析,逐步建立工作负载的变化模型。***2显示一个典型应用24小时之内消耗CPU的情况,看出大部分时间CPU利用率并不是很高,峰值出现的时间段仅有3-4个小时。③最后根据工作负载的变化模型、业务需求优先级及未来增长量定义IT服务等级。定义的内容不仅包括内存、磁盘IO、网络带宽等IT资源的利用率,而且还包括用户期望的系统体验感受,尤其是响应时间、吞吐量等。从***3可以看出CPU利用率与开始定义的工作负载并不匹配,因此建立合理准确的负载变化模型是一个逐步完善的过程。
1.2 分析评估IT容量 分析评估应用系统的IT容量的整个过程包括以下工作内容:
1.2.1 考虑各应用系统的特点,通过吞吐量和并发测试,采集应用系统的吞吐量、响应时间、并发用户数等关键性能指标,比较当前系统定义的IT服务等级中包括的各项指标值;
1.2.2 收集当前系统的资源利用率,包括CPU、内存、磁盘IO等指标数据,评估当前系统IT容量是否满足业务需求及未来增长量;
1.2.3 分析当前系统在不同工作负载情况下的资源利用情况,建立系统在不同工作负载下的性能指标的服务等级,规划IT容量规模。
2 容量规划
容量规划是将IT数据、业务目标、业务操作和过程关联起来,并以量化的方式展现IT基础设施和应用系统之间的关系。最理想的情况是业务指标无缝匹配性能数据,例如指标可以是应用的事务/请求数量,呼叫中心接到的呼叫数,再或是某时间段内的***用户数等。
2.1 基本过程 为实现业务指标无缝匹配性能数据,量化IT资源消耗和业务量之间关系的目标,需分3步走:①建立反映业务服务水平对应的逻辑工作负载;②收集准确的历史性能数据(包括测试环境和生产环境);③将工作负载和性能数据做匹配。
2.2 模型建立 基于时间维度建立多个负载模型可以更好的反映真实情况,如选取峰值段建立负载模型,或选取一般业务量时间段建立负载模型,建立模型的数量完全取决于用户的关注点。确定负载模型通常包括以下内容:①首先选择工作负载的峰值段建立模型;②然后在模型中输入从业务部门获取的业务数据;③最后确定业务量增长或者降低的趋势如何影响将来的IT设备性能,以及提供的服务水平是否影响预期目标。
2.3 规划方法 IT系统性能容量规划是基于收集的历史性能数据来规划系统将来的负载。这些数据包括CPU负载、I/O负载、内存负载等。保障其科学性和准确性的前提条件是确保监控手段的可靠性,同时保证收集足够多的性能和业务数据。