【摘要】数据安全及应用安全在单位信息化系统建设与运行管理过程中起着至关重要的作用,越来越受到重视。容灾为系统提供了比数据备份更高等级的保护,按不同的划分方式有不同的划分类型。本文对常见的容灾技术作了分析比较,有利于使用者根据实际情况建立符合本单位需要的容灾系统。
【关键词】数据;容灾;恢复;备份
一、容灾的概念
当前,在单位信息化系统建设与运行管理过程中,数据安全及应用安全作为建设中的重要环节应当放到首要位置,立足长远,优先考虑,未雨绸缪,容灾系统就是在这种情况下应运而生的,它能保证关键数据不丢失、关键业务不中断,最大限度地保障数据及应用的高可靠性。
容灾为系统提供了比数据备份更高等级的保护,数据备份只能保证数据的可靠,在数据恢复期间系统服务是停滞的,而容灾在数据安全的基础上,更强调业务系统的安全。容灾工程就是采用必要的技术和特定机制,防范由于***事打击、自然灾害、社会***、病毒入侵、人为破坏或系统故障等造成的信息系统数据损失、业务中断,确保计算机信息系统在遭受破坏的情况下能够尽可能减少损失、尽快恢复运行的一项系统工程。容灾的实现主要是通过在本地或异地建立和维护一个备份系统,利用地理上的分散性加强对灾难事件的抵御能力。容灾系统更加强调外界环境对系统的影响,特别是大范围的灾难性事件对信息系统节点的影响,提供节点级别的系统恢复功能。
容灾系统有两个关键性指标:一是恢复时间目标(RTO)(Recovery Time Objective),即灾难发生后,业务功能从停顿到恢复的时间要求;二是恢复点目标(RPO)(Recovery Point Objective),即当灾难发生后,系统和数据必须恢复到的时间点要求。在国际标准SHARE 78中定义的容灾系统有七个层次,从最简单的仅在本地进行磁带备份到将备份的磁带存储在异地,再到建立应用系统实时切换的异地备份系统,恢复时间从几天到小时级到分钟级、秒级或0数据丢失。
二、容灾类型
容灾按不同的划分方式有不同的类型。
一是按照业务系统与备份系统之间的距离远近划分为本地容灾和异地容灾。本地容灾一般将业务系统与备份系统放在同一个建筑物内或相近的范围之内。异地容灾则将备份系统远离业务系统,从数十公里到上千公里不等。
二是按照实施容灾的层次划分为数据容灾、应用容灾与业务容灾。数据容灾是指在异地建立一个数据备份系统,该系统是业务系统关键数据的一个可用复制。该数据可以是业务系统数据的完全实时复制,也可以比业务系统数据略微落后,确保灾难发生后业务数据一定是可用的。应用容灾是在数据容灾的基础上,建立一套完整的与业务系统相当的备份系统。建立这样一个系统不仅需要一份可用的数据复制,还要有包括网络、主机、应用、甚至IP等资源以及各资源之间的良好协调。业务容灾是将业务分解为粒度较细的应用,当灾难发生时可以通过对业务进行重组从而保证业务的连续性。
三是按照数据复制模式不同划分为同步复制、异步复制、半同步复制和自适应复制。同步复制要求在主备中心同时提交I/O操作(主要是写操作),并且只有在都完成之后才能进行下一次I/O操作,它能保证数据的RPO在秒级,但同步模式通常会对系统的性能产生较大的影响,对网络带宽要求较高,整体投资较大,运营成本较高,支持的距离有限。异步复制不要求数据在主、备节点同时提交,数据首先在主节点提交,随后处理后续服务,然后才在备份节点提交。半同步复制基本与异步复制相同,但是它只允许在接收到备份中心确认信息前进行读操作而不允许写操作。自适应复制则是同步、异步复制的折衷。
三、常用容灾技术
1.基于磁盘阵列保护
一般服务器数据存储都采用磁盘阵列来确保数据安全,常用的有RAID1、RAID5、RAID6等,能够提供不同方式的磁盘数据保护,这种保护提供了信息系统最为基础的数据保护方式,当单块硬盘出现故障时,能够通过磁盘阵列恢复数据。
但其缺点也较为明显,首先,它无法保护业务,在数据恢复期间系统是无法提供正常服务的,而且服务器其它部件导致的宕机或其它原因导致的业务停滞,它是无法解决的;其次,它只能解决单个服务器问题,不是一种集中解决方案。
2.磁带库/虚拟磁带库
传统的磁带库及近年出现的虚拟磁带库技术是一种超大容量存储备份方式,广泛应用于银行、石油、***书馆、广播电视、***队等需要海量存储的部门和行业,能够以较高性能和较低成本为异构系统提供存储归档和备份,便于离线和异地保存。
这种方式与应用系统无关,是基于数据层面的备份,可以为异构应用提供大容量集中式数据备份。但磁带库技术仍旧只是一种备份技术,它不能解决业务系统的应急恢复能力,在数据和应用系统恢复期间业务是停滞的,只能保证数据的容灾,不能保证应用的容灾。
3.集群技术及双机热备
集群(Cluster)技术是指一组相互***的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个***服务器。这些进程可以彼此通信,对网络客户机来说是就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。
其中,只有两个节点的高可用集群又称为双机热备,即使用两台服务器互相备份。当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续对外提供服务。可见,双机热备是集群技术中的最简单的一种。
虽然集群技术能够达到数据和应用的双保险,但这种模式也有弊端。它无法避免数据误删除、逻辑性破坏和自然灾难,且代价高昂,无法统一管理和集中。
4.CDP与远程引导技术
持续数据保护(CDP)是一种在不影响应用系统正常运行的前提下,持续捕捉或跟踪目标数据所发生的任何改变,可以恢复到此前任意时间点的方法。CDP系统能够提供块级、文件级和应用级的备份。CDP技术通过在操作系统核心层中植入文件过滤驱动程序来实时捕获所有文件的访问操作,对于需要CDP连续备份保护的文件,当CDP管理模块经由文件过滤驱动拦截到其改写操作时,则预先将文件数据变化部分连同当前的系统时间戳(System Time Stamp)一起自动备份到存储设备。从理论上说,任何一次的文件数据变化都会被自动记录,因而称之为持续数据保护。
CDP技术是对传统数据备份技术的一次***性的重大突破。传统的数据备份解决方案专注于对数据的周期性备份上,因此一直伴随有备份窗口、数据一致性以及对生产系统的影响等问题。现在,CDP为用户提供了新的数据保护手段,系统管理者无须关注数据的备份过程(因为CDP系统会不断监测关键数据的变化,从而可以自动实现数据的保护),而是仅仅当灾难发生后,简单地选择需要恢复到的时间点即可实现数据的快速恢复。
通过在客户端加装iSCSI型主机总线适配器(HBA卡,Host Bus Adapter)实现SANboot,其功能是当受保护服务器操作系统不能正常启动时,通过对HBA卡的配置,并选用相应系统启动选项,就可实现受保护服务器操作系统的快速启动,SANboot启动速度与本地相当。
将最新的CDP技术和iSCSI HBA远程引导技术相结合,就能够提供文件、数据库、操作系统的实时备份与恢复,整合数据备份、系统恢复、灾难恢复、本地及异地容灾等多项功能,并且能同时给多个系统提供容灾服务,在容量、带宽、成本等方面是一种较为出色的解决方案,可以满足大多数单位信息化建设的要求,提高数据防护能力,为业务工作正常开展提供有力支撑。
四、容灾系统建立
容灾系统的建立,一定要以用户的需求为出发点,首先要根据应用的类型确定需求的优先顺序原则,这样才能确定相关的方案。以下的因素应是容灾系统建设重点考虑的相关原则:
1.容灾系统应具有开放性,不依赖特定硬件系统。应支持包括TCP/IP网络在内的广泛的传输介质。
2.考虑到容灾能力和对应用系统性能的影响,容灾方案不仅要支持近距的、同步的数据容灾,还必须能支持远程的、异步的数据容灾。对于异地数据容灾,数据复制不仅仅要求在异地有一份数据拷贝,同时必须保证异地数据的完整性、可用性。
3.容灾系统本身应具备各种容错考虑。能支持灵活多样的容灾结构。
4.完善的容灾系统应该考虑实用的灾难恢复手段,建立多层次的广域网络故障切换机制。在远程的容灾系统中,既要包含本地系统的安全机制、远程的数据复制机制,还应具有广域网范围的远程故障切换能力和故障诊断能力。也就是说,一旦故障发生,系统要有强大的故障诊断和切换策略制订机制,确保快速的反应和迅速的业务接管。实际上,广域网范围的高可用能力与本地系统的高可用能力应形成一个整体,实现多级的故障切换和恢复机制,确保系统在各个范围的可靠和安全。