A-A+

容灾备份解决方案

2007年08月18日 网络存储 评论 11 条 阅读 10,279 次

呵呵,这是我帮公司写的,发布在存储世界上的软文,宣传性较重,大家姑且看看。

灾难备份建设是一项周密的系统工程,也是一个全新的危机管理领域。灾难备份建设不仅需要进行灾难备份中心建设和IT系统购置,更需要有灾难备份技术、危机管理、风险管理、业务连续计划制订、灾难演练和灾难恢复等灾难备份专业领域知识。此外,灾难备份也不同于一般的IT项目,它是单位机构业务流程的延续,它需要建立完善的灾难备份中心运营管理体系,需要不断保持业务连续性计划的有效性,以保障灾难备份中心能持续发挥灾难备份功能。

常见容灾系统按业务系统不同、所要求的RTO和RPO不同,可分为介质容灾、远程备份容灾、数据容灾和应用容灾等四种类型。

介质容灾

业务系统已将数据备份到可移动介质(如磁带、光盘、胶片等)上,为了保证这些数据在灾难发生时能够被妥善的保存,并在系统重新安装或恢复后,将介质上的数据恢复回去,最简单的容灾方法就是将这些介质定期地以人工的方式收集到容灾中心,在容灾中心进行最为妥善的介质保存措施。

远程备份容灾

对恢复时间要求较高,没有在本地实施备份系统的部门,可通过远程网络直接将数据备份到容灾中心的存储池中,保证数据的安全性。采用这种容灾方式,一般要求恢复的数据时间点在灾难发生前的几十分钟到几个小时;而从灾难发生后,需要完成从恢复系统、恢复数据、直到实现对外提供应用服务这么一整套的恢复工作,所需要时间大约为几小时到一天。

数据容灾

数据容灾的保护对象是生产系统产生的业务数据。为了更好地实现数据的容灾,数据容灾方案必须能够实现对数据库数据、基于文件系统的数据,甚至对系统的数据卷,进行实时有效保护。数据容灾的根本目的,是能够重新利用复制的数据。也就是说,数据容灾的核心是恢复,如果容灾的数据无法恢复和重新使用,就失去了容灾的意义。

基于数据容灾的实现技术有很多,为了实现不同用户数据容灾的需要,容灾中心的数据容灾架构应该能够支持和实现多级别的数据容灾,根据功能框架的设计,需要实现的数据容灾方案包括:

l 数据文件容灾实现

l 数据库容灾实现

l 存储网络层数据容灾实现

l 数据卷容灾实现

l 磁盘阵列级数据容灾

一、数据文件容灾

数据文件容灾主要实现用户端文件级数据到容灾中心的复制。通过容灾中心复制软件的和用户端复制代理软件的配合,容灾中心可以监控用户端文件的修改,定时或实时(根据数据设定的策略)将用户端文件同步到容灾中心。系统能够实现基于数据文件或数据字节层次的数据复制、时间调度复制等,并可以采用一对多和多对一的数据复制方式。

二、数据库容灾

通过使用基于数据库软件复制技术保证远程数据库的复制。用户端主机安装数据库同步软件的客户端和数据库agent,通过搭建的网络环境和容灾中心数据库同步软件的服务器端通讯,按照定义的规则实现整库级、用户级、表级的数据同步。在不同用户端的生产服务器上都部署上数据库同步软件的客户端和数据库agent,可以和容灾中心的数据库同步软件服务器端实现N对一模式的远程数据复制。

三、数据卷容灾

数据卷容灾采用卷管理器的磁盘镜像功能来实现。通过在容灾中心主机和用户端主机上安装卷管理器软件,可以将容灾中心的镜像磁盘和用户端的主磁盘上的分区或卷虚拟为服务器能够看到的同一分区或卷,这样在用户端主机发生I/O操作时,系统会自动将数据分别写入本地的主磁盘阵列和容灾中心的镜像磁盘阵列中,从而实现数据的镜像。这种写操作是对主机而言的,是逻辑上的。当客户端数据发生灾难时,容灾中心数据可以被接管应用。当客户端中心系统重建后,数据可以随时从容灾中心得到恢复。

数据卷容灾的实现,需要在用户端主机上安装专用的数据复制软件。这种方式需要对客户端的改动较大,而且卷复制操作系统平台不同和数据传输性能的影响,很难实现大规模“一对多”容灾模式。因此,建议容灾中心先期不作本方案的实施,如果有具体用户需求,再设计具体的方案,具体实现。

四、网络层数据容灾

存储网络级数据容灾,一般通过专门的设备为远程复制容灾提供I/O路径和复制路径,实现基于SAN层次的数据容灾。通过在用户端和容灾中心的系统中配置专用服务器,在其上安装专用软件。容灾中心的专用服务器可以配置为定时对用户端专用服务器的数据进行复制,从而实现关键数据的远程复制和保护。传输链路可以选择IP网络和FC网络,如果IP城域网或广域网的带宽较低,可以采用异步的复制形式。

五、磁盘阵列级数据容灾

利用高性能磁盘阵列(硬件层次)的高级数据复制功能,通过存储子系统之间的通讯,并结合一些主机端的管理工具,来实现用户端数据和容灾中心对数据的传输复制。复制通过用户端和容灾中心磁盘阵列上的微处理器实时完成。将灾难发生时,可以将关键数据的损失降至最低,而且不需要主机干涉或占用主机资源,可以做到灾难发生的同时实现应用处理过程的恢复。

应用容灾

对于恢复时间要求非常高,而且具备在本地和容灾中心可以实现短时间范围内的数据复制能力的部门,一方面可以通过远程网络直接将数据复制到容灾中心的磁盘阵列中,另一方面可以通过远程集群管理软件实现容灾中心的待机状态的应用服务器和本地应用服务器保持一定的同步,从而在灾难时可以直接快速启动容灾中心的服务器,在最短的时间内对外提供服务。采用这种容灾方式,一般要求恢复的数据时间点在灾难发生前的几分钟到几十分钟;而从灾难发生后,只需要完成网络和应用服务的切换工作,所需要时间大约为几分钟到一小时。

构建UIT SVM为核心的虚拟化存储架构

我们利用UIT SVM虚拟化产品构建存储的基础架构,利用带外虚拟化技术在现有SAN存储架构增加虚拟化管理器(SVM)来实现更高级功能的管理。

首先,在每个数据中心将SVM从接入到现有的SAN 交换机,利用其存储虚拟化功能,对当前系统中来自于不同品牌的存储设备进行统一接管,将其聚合成一个或多个中央管理池(如下图),此过程是利用SVM的LUN数字签名功能,直接将系统中原有的LUNs移入存储池中,迁移时间短不需要进行数据的物理转移,而且不会破坏系统中原有的任何数据;

其次,在各主机系统安装相应的Agent(其中包含MultiPath多路径软件、I/O Mapping、与SVM通讯等功能),该多路径软件占用系统资源小,兼容各种主流开放平台的操作系统、主机HBA卡以及来自于不同厂商的异构的存储子系统,可以节省并代替例如EMC PowerPath/IBM RDAC等主机客户端软件,从而可靠地完成来自于SVM集中管理下的存储统一分配、管理、保护及容灾等功能;

最后,利用SVM将存储池中原有数据LUNs以卷(Volume)的形式重新分配给原有对应的主机,使数据库及应用能够继续正常运行。

至此,在非常短的时间内便在原有系统实现了真正意义上的整合,使异构的存储能够被统一地管理和利用起来,剩余的空间可以及时地分配给需要的服务器;在以后的系统更新及扩容时,新购进的不同品牌的存储可以直接在线加入到存储池中,由各业务单位根据需要分配给相应主机及应用,这样就大大提高了存储的利用率,简化了管理员的操作。

同时,由于SVM的带外技术以及主机Agent的存在,使系统实现数据访问全线速、多路径冗余的高可用性,无性能瓶颈和单点故障,使存储子系统和主机系统具有良好的可扩展性,尤其当SVM升级或者发生故障时,生产系统仍能进行正常的数据访问,确保了业务的连续性、可靠性。

为生产卷建立时间点的Pit(Point in Time)

MultiView 是一个开放兼容的基于存储网络的快照技术,它可以创建SAN中任何存储设备上数据的瞬间的,可读/写的,低容量的时间点(Pit)快照。能够工作于绝大多数的存储设备上,能够部署快照在SAN上而不是在每一个存储设备上创建快照。PiTs可以用来提供给任何主机访问使用,包括零窗口的数据备份、在线恢复、测试开发,同时生产数据保持在线和不受影响。

每一个MultiView PiT 卷快照相比源卷只占用很小的空间,因为它只保留Pit创建后卷上的改变记录。Pit所需要的空间无需提前分配或保留,Pit随着新的数据产生少量的增长。每一个卷的多个Pit可以保留在线使用。

l 自动创建PiT Snapshots

每一个小容量的PiT组合到一起形成数量众多的Pit 可以使得multiView 实现在一天里快速的频繁的磁盘备份。利用计划设定能够允许按照设定的时间频率自动的创建Pit,可使数据保护级别由晚间备份提高到每天小时级别的保护。

l 数据一致性

为了确保每个Pit的数据一致性,一致性组能够在卷上创建逻辑组的快照,例如数据库中的数据文件和日志文件。这样能让数据库静默实创建快照,还可以保持数据的完整性。

l 没有数据移动

MultiView 关键的优势之一就是创建Pit时没有物理的数据拷贝。通过简单的打开新的卷,用来保存源卷数据的任何变化的磁轨,这样避免了物理上的移动和数据的拷贝,这样每个Pit创建时仅仅数秒钟内完成,而与源卷大小没有关系。

l 在数分钟内恢复

相对于磁带恢复数据所需要较长的时间,也许是几个小时来恢复数据,从Pit上恢复数据一般仅需几分钟。当一个文件,记录或者文件系统需要恢复时,Pit可以通过View 来mount所需数据卷选择所需要恢复的数据恢复。同样,恢复时没有数据移动仅需几分钟而不是几小时或者几天。

l 每隔2小时(间隔将根据实际应用调整)创建时间点的数据保护

将保护级别提高到2小时。每个数据中心根据设计要求创建自己的时间点快照(Point in Time简称Pit),在这个时间点的数据状态将被保留,新产生的数据和改变的数据将直接写入到Pool中的临时存储空间中。

建立远程站点部署MultiMirror

MultiMirror 是一个企业级的灾难恢复和数据移动解决方案,它能够在站点之间连续地镜像数据,而不用考虑使用的是何种操作系统或何种存储系统,由一个SVM 虚拟卷作为源,可以任意向本地或远端的一个或多个有足够存储空间的SVM DOMAIN 传递并保存数据。它能够确保业务的连续性,将计划内和非计划内的停机造成的影响降到最低。

SVM multiMirror 异步方式的原理是,以一个SVM 虚拟卷作为数据源,把不断变化的源数据定义成多个时间点,在远端先建立起源数据的同步卷,再把每个时间点的数据状态生成一个快照卷,保证在源数据不断变化的情况下每个时间点的数据一致性和正确性:

异步multiMirror 是利用快照技术的灾难恢复解决方案,能够从任何存储设备上镜像数据到任何设备上,或者是本地或者是远程。异步multiMirror 技术结合了平台独立性、any-to-any(任意点对点)、瞬间异步镜像, 可读写低容量的Pit来确保站点间在灾难恢复时的数据完整性。它能够工作在绝大多数的存储品牌之上,允许用户部署镜像解决方案在SAN上而不是在各自存储品牌设备上。

为了降低数据复制时对于本地生产磁盘的性能影响,建议存储系统采用FC+SATA混用技术,这样将生产数据存放于本地FC高速磁盘设备上,将远程站点的数据写入到SATA做成的RAID组中,这样磁盘读写就不会相互干扰和影响,同时廉价大容量的SATA磁盘又可以作为存储大量数据副本的载体可以节省投入成本。

数据复制的工作完全由SVM来处理,SVM本身的设计的高性能的光纤卡和千兆网卡用于进行FC或者IP远程数据传输。因此所有的复制工作由SVM承担,结合双SVM可以实现数据复制的高可用性,这一点与传统的基于服务器主机和基于存储系统的复制是完全不一样的。

11 条留言  访客:11 条  博主:0 条

  1. netstor

    厉害呀,学了多长时间了

  2. maxwell

    StoreAge 的东西呵呵
    很少有人把几百万的存储交给一个带外的windows 来管理
    这个虚拟化是很好
    但不太好用

    netstor 你是同有的吧
    好好学习吧
    sansky 可是多年的大哥了

  3. sansky

    [quote]StoreAge 的东西呵呵很少有人把几百万的存储交给一个带外的windows 来管理这个虚拟化是很好但不太好用
    netstor 你是同有的吧好好学习吧sansky 可是多年的大哥了[/quote]

    呵呵

  4. sunjava2

    我留言了表示我喜欢你的文章!

  5. sansky

    [quote]我留言了表示我喜欢你的文章![/quote]

    呵呵,谢谢

  6. gaolsh

    Lz在UIT工作?

  7. 斯文扫地

    太菜了,
    还是看不懂

  8. alex

    看不懂的可以参考一下万国数据的网站,http://www.gds-china.com,他们专门搞这个的。

  9. supengnest

    svm采用lun的电子签名,这个是什么东东,可以直接将原有系统的lun纳入到自己的管理体系进行虚拟化,然后再以卷分配给主机,我想这个虚拟化的过程实现,而且原有的数据不被破坏是怎么实现的

  10. patty

    备份中国专业的在线备份服务提供商,除了在给你本地备份外,远程的数据终端备份也为你提供安全保密的专业备份,
    在容灾的解决方案中也为会你提供安全的数据保护机制
    http://www.beifen.com

  11. lntom

    数据卷容灾: 是否就是说AIX的LVM。

给我留言

Copyright © 【存储部落】 保留所有权利.   Theme  Ality

用户登录 ⁄ 注册

分享到: