金山夜话考拉:业务永不停顿 数据容灾技术进行时

来源:百度文库 编辑:九乡新闻网 时间:2024/05/03 06:25:44

业务永不停顿 数据容灾技术进行时

 

容灾重点指标

在企业构建容灾系统时,有两个至关重要的指标,这就是RPO和RTO。这两个指标的高低,决定了企业需要建立的容灾系统的级别。从前文的表格中我们不难看出,不同容灾方案的RTO和RPO是不相同的。

RPO

RPO可简单地描述为企业能容忍的最大数据丢失量,它是反映恢复数据完整性的指标。在同步数据复制方式下,RPO等于数据传输时延的时间;在异步数据复制方式下,RPO基本为异步传输数据排队的时间。


最高级别的容灾

在实际应用中,考虑到数据传输因素,业务数据库与容灾备份数据库的一致性(SCN)是不相同的,RPO表示业务数据库与容灾备份数据库的SCN的时间差。发生灾难后,启动容灾系统完成数据恢复,RPO就是新恢复业务系统的数据损失量。


数据越重要,需要的容灾等级越高。

RTO

RTO可简单地描述为企业能容忍的恢复时间,它是反映业务恢复及时性的指标,表示业务从中断到恢复正常所需的时间。RTO值越小,代表容灾系统的数据恢复能力越强。各种容灾解决方案的RTO有较大差别,基于光通道技术的同步数据复制,配合异地备用的业务系统和跨业务中心与备份中心的高可用管理,这种容灾解决方案具有最小的RTO。容灾系统为获得最小的RTO,需要投入大量资金。在RTO中,还有一个比较重要的时间段,我们称之为网络恢复时间(NRO)。


一个系统从发生故障到恢复应用过程中的RTO、RPO、NRO指标

当然,在灾难恢复的关键指标中,RTO和RPO仅仅是两个较为突出的代表,也不能仅通过它们的数值来判断容灾体系和效果的好坏。RTO和RPO越小,可以说容灾系统效果越好,但从经济角度考虑,最佳的容灾解决方案不一定是最适合的容灾解决方案。容灾系统的总体投入(TCO)和投资回报(ROI)对于许多用户来说是十分重要的设计指标。TCO包括建立系统、维护系统和扩充系统的总投入。由于容灾系统的启用概率很低,新技术的发展和新产品性价比的提高必定造成容灾设备的贬值。另外,IT系统的任何软硬件变化都会引起容灾系统相应的变化,势必加大对系统升级的投入。要想把这种变化的影响减到最小,容灾系统的灵活性和兼容性也应该是十分重要的指标。

名词解释

灾难(Disaster)

由于人为或自然的原因,造成信息系统严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定时间的突发性事件。通常导致信息系统需要切换到灾难备份中心运行。

灾难恢复(Disaster Recovery)

为了将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态、并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态,而设计的活动和流程。

灾难恢复规划DRP(Disaster Recovery Planning)

为了减少灾难带来的损失和保证信息系统所支持的关键业务功能在灾难发生后能及时恢复和继续运作所做的事前计划和安排。

灾难备份中心(Backup Center for Disaster Recovery)/备用站点(Alternate Site)

用于灾难发生后接替主系统进行数据处理和支持关键业务功能运作的场所,可提供灾难备份系统、备用的基础设施和技术支持及运行维护管理能力,此场所内或周边可提供备用的生活设施。

 

什么是同步和异步?

同步方式是指主/备中心磁盘阵列同步地进行数据更新。前端应用系统的I/O写入主磁盘阵列后(写入Cache中),主磁盘阵列将利用自身的机制同时将I/O写入后备磁盘阵列;后备磁盘阵列确认后,主中心磁盘阵列才返回应用的写操作完成信息。

异步方式是指应用系统的I/O写入主磁盘阵列后(写入Cache中),主磁盘阵列立即向前端应用系统返回“写完成”信息,主机应用可以继续进行I/O操作。同时,主中心磁盘阵列将利用自身的机制将I/O写入后备磁盘阵列,实现数据保护。