1. 执行概要
有时会发生系统故障、自然灾害和人为过失。计算机会出现故障。用户会意外删除文件。有时会发生自然灾害。企业也会丢失数据。IT 管理部门需要问的一个重要问题就是:我的数据恢复计划是什么?NetApp® Filer 可以提供多种数据保护和恢复方案。本文将对这些方案进行讨论,同时给出在 Filer 上进行数据保护的解决方案建议。
“Network Appliance Filer 数据保护策略”旨在确定数据保护要求、技术解决方案、性能问题、客户针对数据保护难题的创造性解决方案并给出有关的建议。我们的目标是:帮助您积极筹备,迎接随着企业数据重要性的增加、对连续数据访问要求的提高及系统宕机成本的不断增大而带来的挑战。
服务器上的磁盘存储量正以惊人的速度激增。传统的数据保护机制已经发挥到了极致。许多企业缺乏备份途径使这一问题更加恶化。同时,存储量的增长速度要快于盒式磁带容量及磁带带宽的增长速度。使用磁带介质保护未来数万亿字节的系统将远远超过正常备份和恢复途径所能承受的限度。这些趋势表明,除了磁带备份外,还应尝试其他的补充方法。
通常,企业有下列四个数据保护方面的要求:
- 对意外删除的文件进行快速恢复,整个过程由用户启动
- 对文件系统或项目历史进行磁带存档,以备将来使用
- 最小的备份和恢复时间
- 从自然及人为灾难中快速恢复
针对这些要求,Network Appliance 提供了一组独特的解决方案:
- Snapshot™ 技术,用于每日联机备份
- SnapRestore™ 软件,用于将文件系统恢复为以前某个状态
- SnapMirror™ 软件,用于自动化文件系统复制
- 本机及第三方备份和恢复产品,用于对数据进行磁带存档
利用 Snapshot 功能,系统管理员可以对整个文件系统进行全天候(而非仅在夜间或周末)联机备份,以防止数据丢失。只要从 Snapshot 目录复制所需的文件,用户或系统管理员就可以恢复丢失的文件。Snapshot 可对意外删除的文件进行快速恢复,整个过程由用户启动。
Network Appliance 的第三方备份和恢复合作伙伴可提供全功能、高性能的磁带备份和恢复解决方案。这些产品使用网络数据管理协议 (NDMP) 集中管理和控制分布式异构数据,同时最大限度地减少网络流量。备份和恢复解决方案可以生成磁带存档,用于以后文件系统或项目历史的恢复。
SnapMirror 软件可进行从源 Filer 到目标 Filer 的自动文件系统复制。SnapMirror 软件可以全天候传输增量更新,以保持镜像内容与源 Filer 之间基本同步。源站点出现故障或问题时,即可访问目标站点镜像的关键业务数据,从而确保业务不会中断。SnapMirror 软件将长备份和恢复时间的需求降到最低,可实现快速灾难恢复。
SnapRestore 软件可在数秒内以最少的宕机时间将整个文件系统恢复为原先存储的快照副本。SnapRestore 软件将恢复文件系统,而 Filer 可供整个生产过程使用。该软件可用于从损坏的数据库、应用程序或损坏的文件系统中进行恢复。
本文中,Network Appliance 建议使用这些解决方案的数据保护策略。不仅 Network Appliance 在使用这些策略,许多客户也在使用这些策略。客户和 Network Appliance 内部 IT 工作组所提供的四种实际使用情况展示了这些在用的解决方案。
数据保护对业务至关重要。数据丢失的风险有很多,包括删除文件、系统崩溃、应用程序设计问题、病毒及各种灾难。代价是非常巨大的。这包括生产效率降低、丧失销售良机、为技术支持支付费用及失去客户。Network Appliance 深谙数据保护之道,可为您量身定制解决方案。
2. 简介
Network Appliance 企业存储设备 — 所谓的 Filer — 可以降低企业数据管理的成本和复杂度。运行 NetApp Data ONTAP™ 操作系统的 Filer 将数据合并到一个集中位置,从而无需配置多台通用服务器。我们特有的多协议文件系统可向 UNIX®、Windows® 及 Web 客户端提供同步文件服务。内置的 RAID4 软件可以防止因磁盘故障而丢失数据。同时,Clustered Failover 及冗余组件进一步提高了可靠性。
但是,不管文件服务器有多么可靠,多种因素结合起来却会造成数据的丢失,而这是企业最宝贵的财产。每天都会出现用户意外删除文件的情况,硬件故障也时有发生,而且自然或人为灾难也会导致数据中心瘫痪。Strategic Research Corporation (SRC) 对 237 个 UNIX 及 PC 站点进行了调查,编制出“2000 年备份和存档简报”报告。这些站点的管理员每年平均会进行 263 次单个或多个文件的恢复及 6 次完整的文件系统恢复。由于数据丢失是一个现实问题,因此规划数据恢复十分必要。
SRC 还就服务器、系统管理及设备采购的二次集中这一发展趋势进行了报告。该问题是企业为保持网络不间断联机,从而使用户随时能访问数据的必然要求。SRC 报告表明:网络越集中,数据管理成本越低。NetApp Filer 针对此趋势提供了可靠、统一的文件存储功能。二次集中还为利用第三方集中管理的备份和恢复解决方案、磁带库及 Network Appliance 镜像技术实现数据保护的集中管理和自动执行创造了机会,进一步降低了成本和风险。
传统的数据保护机制是将数据备份到磁带介质上。按照对技术发展趋势的预测,还应考虑除磁带备份以外的补充方法。这些趋势包括:
- 需要备份的绝对数据量正在激增。
- 许多公司的备份时间正在缩短或趋于零。
- 存储量(系统中的磁盘数与每个磁盘大小的乘积)正在增加。
- 存储量的增长速度要快于盒式磁带容量及磁带带宽的增长速度。
图 1 说明了由 IDC 预测的价格介于 10,000 美元到 3,000,000 美元之间的服务器平均存储量的增长情况。
来源:
IDC 的全球磁盘子系统
图 1:价格介于 10,000 美元到 3,000,000 美元之间的服务器的预测存储量
实际的问题是存储量的增长速度要快于盒式磁带容量及磁带带宽的增长速度。随着存储量的增加,磁带变得越来越不实用。备份 6TB 的 Filer 需要大约 71 盘 DLT8000 磁带。进行灾难恢复时,使用单台 DLT8000 磁带机恢复同一文件系统将大约需要 140 小时。如果增加多台磁带机并行执行恢复过程,以将恢复时间缩短为较为合理的 8 小时,则需要 17 台磁带机,这超出了 Filer 所能连接的磁带机数。随着 Filer 存储量的增加,此问题越发严重。尽管磁带备份仍将是大多数备份策略的一个重要组成部分,但是还必须考虑诸如将磁带备份与文件系统镜像配合使用等方案。
为了应对这种趋势,Network Appliance 提供了多种备份和恢复解决方案来满足客户当前和未来的需要。它们包括:
- Snapshot™ 技术,用于每日联机备份
- SnapRestore™ 软件,用于将文件系统恢复为以前某个状态
- SnapMirror™ 软件,用于自动化文件系统复制
- 本机及第三方备份和恢复产品,用于对数据进行磁带存档
设计数据保护策略的起点是与数据可用性有关的业务问题,这一点将在第 3 节中进行讨论。接着,我们将介绍 NetApp Filer 上的数据保护技术。第 5 节将讨论数据因素,例如企业中信息的相对重要性、数据的动态程度、数据集大小、文件系统结构及数据类型。这些问题决定了磁盘上数据的组织方式及使用的保护策略。
性能问题也会影响数据保护的决策。磁带备份和恢复性能建议一节给出了有关控制影响传输率的因素的建议。客户使用情况展示了典型客户问题的解决方案。最后,本文将对有关如何使用 NetApp Filer 满足备份和恢复需要(包括如何配置备份 Filer)的建议进行总结。
3. 影响数据保护的业务问题
在规划备份和灾难恢复策略时,企业会首先面对下列有助于确定需求的业务问题。
3.1. 确定关键业务数据
制定数据保护计划的第一步是确定在灾难恢复时应首先予以恢复的关键业务信息。还需要确定其余数据的相对优先级。信息的价值决定了所用的保护技术。除了信息的“业务关键度”以外,还应考虑诸如数据集大小、文件系统结构、数据类型及变化率等因素,这些将在第 5 节进行讨论。
3.2. 防止数据因用户错误而损坏
大多数企业都需要能够快速便捷地恢复意外删除的文件。由于恢复文件应尽可能与丢失的版本接近,因此需要经常备份文件。理想情况下,最终用户应能够通过将意外删除文件的早期版本从磁盘复制到自己相应的目录中而进行联机恢复。这样,系统管理员将不必从磁带中恢复文件。
3.3. 进行数据存档以备将来使用
存档数据可提供数据集(例如项目目录结构)的完整的自统一副本,用于以后进行联机恢复。许多企业要求对存档磁带进行场外存储。多年后,利用这些存档磁带可以恢复单个文件或文件系统。例如,软件开发公司可能需要重新编写软件的早期版本,以修复客户的错误。这需要一种磁带存档方案,由此可以重新构建较早的系统。
3.4. 降低对运营造成的影响
接下来,应了解业务的“备份时间”。业务运营是否可以留出备份时间,一般在系统使用率较低且备份过程不会影响用户的时间进行?如果可以,该备份时间定在什么时间?有多久?如果不可以,就备份过程对日常运营所造成的影响而言,可接受程度是多少?尽管并不需要经常执行恢复操作,但备份操作可能需要不间断地进行,而且不应明显降低系统性能。
3.5. 灾难恢复
如果由于灾难而导致企业停机检修,每小时或每天的代价是多大?企业能承受多长时间的停业?不妨实际计算一下因用户效率降低、丧失商机及在系统管理员数据管理时间方面所付出的代价。
什么是“恢复时间”?或者说灾难恢复的速度必须有多快?在恢复时间内有没有可能从磁带中进行恢复?有些公司可能要求服务器镜像解决方案,这样系统能更快地恢复联机状态。还有些公司可能要求有一个远程热站点在发生灾难后不久即进入联机状态。
下一节将介绍 NetApp Filer 上的数据保护技术。结合自身要求及可用技术的信息,企业可以着手设计数据保护解决方案,以满足自己的需要。解决方案可涵盖从每周及每日增量磁带备份到完整的 Filer 镜像策略,结合磁带备份进行存档。
1 条回复
[…] Filer使用WAFL Optimized intelligent RAID 4(增强型RAID 4) 提供硬盘保护机制。传统的RAID […]