您所在的位置:IT专家堂 > 存储 > CDP技术——系统安全的更深层保护方法

CDP技术——系统安全的更深层保护方法

2006-08-30 10:38 颜军 51CTO.com 字号:T | T
一键收藏,随时查看,分享好友!

CDP是一种数据的连续时间点的保护技术,其根本作用是能够在故障瞬间完成任何时间点的故障恢复,达到业务的快速连续的作用,从根本上解决传统备份中低恢复能力和非精细时间策略(如按照天的备份)的先天弱点。这种技术的诞生造成了备份领域和灾难恢复领域的一次革命,今后数年,人们仍将看到这种技术所带来的深远的影响和颠覆传统容灾备份的划时代意义。要理解CDP的新和奇,我们还是要分析传统的容灾和备份技术。

AD:

【51CTO.com专家特稿】CDP是一种数据的连续时间点的保护技术,其根本作用是能在故障瞬间完成任何时间点的故障恢复,达到业务的快速连续的作用,从根本上解决传统备份中低恢复能力和非精细时间策略(如按照天的备份)的先天弱点。这种技术的诞生造成了备份领域和灾难恢复领域的一次革命,今后数年,人们仍将看到这种技术带来的深远影响和颠覆传统容灾备份的划时代意义。要理解CDP的新和奇,我们还是要分析传统的容灾和备份技术。

当今天的人们在高谈容灾和业务连续性,在议论备份系统的选与建时,人们偶尔会灵机一动产生一个思考,这就是,所有的灾难我们都能防御吗?所有的灾难我们都能快速恢复吗?

容灾和备份,首先要清楚容什么样的灾,其次要清楚灾难后如何恢复,采用何种技术和管理手段确保信息系统能够在系统之后的快速再建、数据如何利用后援手段确保最小程度的丢失。

具体来说,我们可以将常规的业务系统故障风险分为几大类:

1) 系统的物理故障风险,如主机系统、网络系统、数据库系统、存储系统等。

2) 网络的安全风险,如大规模的网络入侵、黑客侵入、病毒的侵扰等

3) 系统的变更风险,如组织变更、系统升级等

4) 系统的环境风险,如突发自然灾害(包括地震、大规模停电、水灾、火灾等)

5) 人为的错误,包括程序错误、人工误操作等

人们经过认真分析发现,常规的容灾系统具有保持业务在上述1-4类风险下的业务恢复能力,而第五类的人为错误只能依靠备份系统来恢复,但这类故障却是各类故障中发生频率最高的。

人们发现,一个美好的灾难备份系统建设的愿望,在实践中往往是那么的过程繁杂,抉择难断。容灾系统固然可以通过各种复制手段解决大多数类型的故障的业务快速恢复问题,但是建立容灾系统的成本是相当高昂的,而且人们仍然要面对最易发生的人为故障(属于Rolling Disaster 渐变式灾难)无法医治的难点。

过去,只能采用常规的备份系统。数据备份系统,是指为防止系统出现操作失误或系统故障导致数据丢失,而将数据集合从应用系统中以备份格式到处到离线的存储介质的过程,在数据备份过程中,一般采用备份软件和磁带库的物理介质保存系统配合来进行。 而常规的备份系统实际上采用的是粗放型的备份策略,如按照日月年等策略进行的各种全备份和增量备份,以及辅助进行的合成备份等(由于备份设备的制约和容量的限制,精细化的备份是不现实的)。在一般的备份系统中,常见的是每天一次,也就是对于数据保护的实时性或近实时性并不提供保证,而且,备份出来的格式是专用的备份格式,并非应用系统中的数据原有格式,恢复时一定要通过格式转换进行倒回操作,因此也并不保证恢复的快捷和精细化的时间点恢复。举例来说,一旦系统存放了1TB的数据,并且按照日增量进行备份,一旦当日中午11:00发生意外,需要全数据的恢复,那么我们只能恢复到上一个恢复点(如昨日23:00),而且,恢复的用时可能会在5小时以上,这还要取决于增量备份的份数。这样的恢复能力,远远满足不了用户越来越高的安全要求和服务要求,需要有一个契机和一个新的技术的诞生,来达到以用户为中心的数据安全和系统安全的要求。

在容灾体系中,人们往往采用RPO(灾难是的数据保存点)和RTO(灾难后的业务恢复点)这两个指标来衡量容灾体系的应急能力和系统保护能力。一般而言,容灾系统确保RPO指标的基本要求(也就是仅仅考虑数据要保存到接近故障点)以及一些系统更高的RTO指标的要求,也就是灾难时要考虑业务的处理系统的快速恢复能力。由于一般容灾系统采用的复制技术的局限,往往在数据库等业务恢复时,遇到一致性要求的数据回滚问题,这往往会使得应用的启动会耗费一定的时间(RTO无法达标)。而能够解决人工故障恢复问题的传统备份技术,RPO指标和RTO指标都远远无法达到容灾的要求,因为备份技术诞生时的业务连续性要求今天已发生了根本性的改变。设想一下,恢复到上一个备份日以及数小时的恢复周期,这已经落后于以信息为动脉的现代信息社会的要求。

实际上,现在已经产生了连续数据复制保护和多点影像保护的技术,这就是CDP的数据连续性保护技术,这一技术的出现,真正使得数据的点备份变成了连续跟踪数据变化的多点精细跟踪技术,使得传统意义的备份系统已经淡化,而快速恢复以及任意时间点恢复已经成为现实。由于CDP可为重要数据的变化提供即时与连续的保护,IT管理人员完全不再需要考虑备份设定或策略设置的问题。当灾难发生时,基于CDP的解決方案可迅速的将数据恢复到任何一个需要的还原点,为用户提供更高的灵活性。

CDP技术的几种结构类型

就应用架构方面来看,现有的CDP产品可分为主机式(Host-Base)与存储网络式(Storage Network-Base)两类:

主机式的CDP架构类似现在备份软件常用的主/从式架构,系统以一台CDP备份主机作控制,并在需要CDP保护的服务器上安装代理程序(Agent)。代理程序会监控服务器上的磁盘I/O动作,忽略读出的数据而只捕捉写入的数据,写入数据时实际是写入磁盘之前先复制一份,再通过网络送到CDP主机上。因此,CDP主机上会保存各服务器的数据副本。这类CDP技术支持连续的复制和时间间隔的复制策略,重点在于保护服务器内部的系统数据和直连式存储的数据,而且,系统级别的灾难可以通过副本进行系统快速恢复或远程启动。

目前的主机型CDP技术,是当前比较普遍的CDP技术类型。

存储网络式CDP技术也可以归为一类,这一类型的CDP产品无需部署代理程序,而是通过受保护主机的存储网络或网络中的数据传输协议来实现,又多种的实现的变形方式。这种解决方案是一种有软、硬件的整体解决方案,产品本身是一部CDP服务器,通过LUN以动态逻辑磁盘卷(Volume)的形式呈现给欲保护的主机。使用者可以利用主机的逻辑磁盘卷管理软件(LVM)将其加入到主机的一个镜像动态逻辑磁盘中,这样当主机将数据写入原来的存储设备时,也会通过LUN同步复制一份到CDP服务器上,当然,如果CDP服务器直接置于存储网络中也是完全可以的,这样,被保护主机对于存储设备的访问是基于CDP服务器的动态逻辑磁盘卷(Volume)。CDP服务器含有即时操作系统,会自动替写入的数据加上时间索引,并能够通过复制技术实现远程传输(到灾备中心)。这种存储网络式CDP产品基本无需部署代理程序(除非数据库的即时代理),使用者在选择各种保护形态时需要考虑原有存储设备与CDP服务器间的存取速度是否能同步等问题。

CDP记录数据的每一个“瞬间”

简单的讲,CDP技术具备以下几种特性:

(1) 数据的变化受到持续的捕捉与监控。CDP要求的数据监控的精细程度是精细到系统的每个I/O存取动作,也就是说,每个I/O动作都会受到捕捉与监控。

(2) 所有数据的变化过程都被保存在一个与主存储地点不同的独立地点中。要特別注意的是,CDP保存的系统数据变化是完整且连续的,不是只保存某个特定时间点下的状态,而且保存了数据在过去时间内所有因I/O写入动作所导致的数据变化。

(3) 数据的还原点或说目标恢复点(Recovery Point Objectives,RPO)是任意的。从前述可知,由于CDP保存了系统在过去一定时间间隔下所有的数据变化,在发生渐变式灾难时(如刚刚发现的过去的错误)可以成为日后还原时的还原点。因此,使用者可将数据快速恢复到过去任意一个存储点的状态,从而解决快速恢复各类系统软错误的致命问题。

CDP与传统远程复制的区别

讲到CDP持续、即时的监控并记录系统数据变化的特性,市场上已有的远程复制(Replication)产品也能达到类似的功能,如Veritas Replication 、EMC MirrorView等复制软件都可以通过同步或异步的方式,持续不断的将系统数据动态的复制到远程的独立存储设备上。不过,这种复制类的产品只是在远程创建了一个与原系统一样的副本而已,旧的数据状态会被新的数据状态所覆盖,并没有历史记录,因此不能提供多个还原点恢复的功能,而只能提供一个与原始系统最新状态完全相同的副本。也就是说,如果原始系统的数据发生错误或是中毒,复制软件仍会把这此含有错误或是中毒的数据复制到远程,而远程的副本也会含有与原始系统一样的问题。

而CDP的不同则在于其能够利用自动时间点快照等方式提供多个持续的数据状态点供使用者选择。如果使用者的系统中毒,则使用者在判定中毒的时间后,通过CDP产品即可像录像带倒带一样,将数据“倒回”到中毒前一刻的状态。由于CDP记录的精细度极高,因此可以将数据状态还原到发生问题的前一“瞬间”。CDP的多时间点保护可以达到为使用者提供多个还原版本供选择的目的,增加复原时的灵活性,万一某个快照版本无法使用,使用者还有其他的快照版本可用。

我们以CDP技术的一个代表美国飞康公司的CDP架构为例,做一个简单的机理阐述,飞康的CDP技术涵盖了主机型和存储网络型两种CDP实现类型。具体实现的机理是:首先利用连续或间隔型的复制策略,实现用户系统内的包括系统数据在内的数据连续复制(即可以支持到本地的复制,也可以同时进行到异地的复制),以确保灾害发生时,数据恢复到最新的时间点,同时,采用配合复制的时间点快照技术(如TimeMark),连续产生多个时间点固定影像(可以按照每小时的间隔或分钟的间隔),这些影像不仅时间精细化,而且是直接可用的image,人们无需进行任何改造,直接mount即可使用。人们遇到大量的渐进性故障时,如病毒的侵袭、人工的误操作、软件的BUG等等发生时,大可不必惊慌,因为你所做的只需要找到系统中存留的影像(如几分钟前的),进行简单的空间重新定位(不到一分钟),你就会愉快地看到被破坏的数据又重现光明,灾难压力化解于无形。当然,你还可以利用这些数据的多点连续快照,进行任何的开发和挖掘工作,数据的价值得到充分利用和增值。

我们再看一下,试想,系统完全损坏后(包括硬盘),几分钟内,系统又通过远程引导和恢复了起来,这在传统的恢复技术中是不可想象的,飞康的CDP构架(内部的disksafe组件)实现了,通过虚拟化存储技术,存储服务的多项难点被突破,人们的多个梦想被实现,这实在是人们办公、生产时的福音。

CDP技术的出现,真正意义使得数据复制和备份具有了高性能的RPO和RTO的能力,克服渐进式的灾难具有了杀手锏。这一技术将在不远的将来对于容灾技术和备份技术的架构产生又一次修正。

目前,CDP 技术也成为了其他一些存储厂商所关注的焦点,一些传统的存储备份技术也在悄悄地发生着变化,融入CDP的数据多点快速恢复的元素。对于用户而言,CDP技术完全是应用的要求、是信息化的要求、是服务水准的要求,CDP 技术带来的无穷价值毋庸多言,用户从中受到的益处是十分巨大的。越来越多的人在感受着这一点,这也是存储技术发展的技术结晶。

作者简介

颜军 中国存储专家,中国计算机学会存储专业委员会委员,1987年毕业于北京大学。现任美国飞康软件公司中国区技术总监。

精通存储系统的设计与实施,成功的设计、规划和实施了中国第一个存储网络(SAN)系统,中国第一个SAN备份系统,中国第一个软件容灾系统。亲自指挥了众多重大存储项目的设计和实施,在多种刊物发表了众多学术专著。拥有存储领域的造诣,在国内存储领域享有盛誉。

多年来,颜军曾出任朗登科技技术总监、快威科技科技集团技术总监。2005年10月,出任美国飞康软件公司中国区技术总监。(责任编辑:石海峰 shihf@51cto.com




分享到:

栏目热门

更多>>

同期最新

更多>>

  • 头条 使用检查约束验证SQL Server中的数据
  • 构建应用程序最关键的目标之一是确保所有进入数据库的数据都要符合你的业务规则,数据校验是应用程序的关键部分,确保你的数据满足业务分析师制定的需求。本文将给大家介绍如何使用检查约束验证SQL Server中的数据。
  1. 对话职业经理人阿朱:程序员转型期的职业选择
  2. 从检测到防护:全面打造网站安全

热点职位

更多>>

热点专题

更多>>

读书

精通JavaScript动态网页编程(实例版)
本书通过大量实例代码,以ECMA-262版本3为基础,结合JavaScript 1.5和JavaScript 5.5,由浅入深、循序渐进地介绍了JavaScript知

最新热帖

更多>>

51CTO旗下网站

领先的IT技术网站 51CTO 中国首个CIO网站 CIOage 中国首家数字医疗网站 HC3i 51CTO学院 区块链第一聚合媒体 zhijiapro