灾难恢复存储解决方案
为什么您需要灾难恢复计划?
当企业越来越依赖于数据去进行处理它的商业行为以及由此来保证它在业界的竞争力的时候,数据处理的高可靠性和高可用性就尤为关键。一个计算机系统的长期停止将直接导致明显的财务流失,更为重要的是,您将失去客户的信任以及一系列的企业赖以生存发展的市场,在一些情况下,数据的丢失甚至将会导致整个企业的失败。
据一项美国的研究报告显示,在灾害之后,如果无法在 21 天内恢复资讯作业,有 75% 的公司业务会完全停顿,43% 的公司再也无法重新开业,因而有 20% 的企业在两年之内被迫宣告破产。美国 Minnesota 大学的研究表明,遭遇灾难的同时又没有灾难恢复计划的企业,超过 60% 以上企业在的两到三年后将退出市场,随着企业对数据处理依赖程度的递增,此比例还有上升的趋势。因此,在限定的时间内成功的灾难恢复将应该是一个企业战略计划中的一个关键组成部分。
IBM S/390 业务恢复存储解决方案
由于应用的可用性和灾难恢复能力越来越被看重,越来越多的公司开始采用双站点策略。IBM 被称为地理分散并行系统(Geographically Dispersed Parallel Sysplex ,GDPS)的 S/390 多站点应用可用性解决方案,将 S/390 并行 Sysplex 技术与远程拷贝技术集成在一起,能够提高应用的可用性和灾难恢复能力。
IBM 的存储系统部在 1994 年推出了两种远程拷贝功能,一种被称为 PPRC(Peer-to-Peer Remote Copy,对等远程拷贝),一种被称为 XRC(Extended Remote Copy,扩展远程拷贝),并在 1995 年投入应用。1996 年,所有 IBM 3990 存储控制家族产品的先前型号都被具有远程拷贝功能的型号6替代。
对等远程拷贝(PPRC)功能现在被所有主要的 S/390 存储供应商视为 S/390 Sysplex 灾难恢复领域的前途所在。PPRC 和增强 OS/390 以及地理分散并行 Sysplex (GDPS) 一道,成为业界高可用性解决方案的领导者。最近的 Gartner 分析表明,并行 Sysplex 解决方案每年平均停机时间少于 10 分钟。
GDPS 是一种多站点应用可用性解决方案,具有管理远程拷贝配置和存储子系统、自动执行并行 Sysplex 操作任务、从单一控制点执行故障恢复等功能,从而达到了提高应用可用性的目的。通过 GDPS 和 PPRC,IBM 使灾难发生后进行恢复的时间缩减到以分钟计算。
除非特殊说明,下文叙述的所有解决方案都假设主站点和恢复站点之间通过企业系统连接(ESCON)一类的宽带连接互连。
备份和恢复
在所有的 IT资 源中,数据最重要,但也最不稳定最复杂。其他资源,如处理能力、供应商提供的软件、DASD、存储设备、建筑物等,都是最终可替换的,但大部分数据却是不可替换的。而数据对商业活动来说是最重要的。在这里我们将讨论适用于灾难恢复的不同 IBM 产品,它们能够进行不同类型的数据管理,设置不同的数据备份选项。本部分主要叙述用于灾难恢复的功能,但并没有覆盖这些产品所有的可用功能。
远程拷贝
当某一应用站点停机时,IBM 的远程拷贝功能能够进行快速有效的灾难恢复。该功能能够在远程站点实时维护数据的镜像拷贝,并确保以与主站点完全相同的次序在远程站点进行数据写入更新的远程复制。这一解决方案在远程拷贝控制机制下自动对 DASD 卷上的数据进行跟踪。这种跟踪的发生独立于使用这些数据的应用。因此,来自不同应用的独立远程拷贝功能是不需要的。
应用的性能保护、数据当前值选项和数据独立都是 IBM 远程拷贝设计中的组成部分。远程拷贝方法有以下不同的两种:
对等远程拷贝(PPRC)
扩展远程拷贝(XRC)
PPRC 和 XRC 都试图通过维护 DSAD 卷间的实时拷贝来达到数据保护的目的。远程拷贝超出了狭隘意义上的双重拷贝,因为它允许副卷存储在远地点上。双重拷贝的主要用途是保护数据不受设备失效的损害,而远程拷贝的目的要更加广泛。
对等远程拷贝 (PPRC)
PPRC 提供的灾难恢复能够最大限度地保留数据当前值。如果您属于以下的情况,PPRC 将能够很好地适合您的需要:
避免数据丢失是您最优先的考虑
您的运行站点和恢复站点之间的距离不超过 103 公里
您的工作负载和要求能够承受同步拷贝带来的性能损失
PPRC 提供有助于保留数据当前值和完整性的两类选择。一个选择是将卷标记为"关键",保证在副卷不能更新时,原有的更新也将无效,不论卷是处于同步状态还是非同步状态,甚至是在灾难出现时也如此。这一功能通过 APAR 提供,在写入时被设置为可用。