NetApp Filer 的数据保护策略-4

Posted by

5. 了解数据

有几个关键因素在推动数据保护策略:

  • 关键业务数据可接受的恢复时间
  • 所恢复的动态数据的更新要求
  • 总数据集大小及卷和配额树的大小
  • 文件数及文件大小
  • 目录结构
  • 数据类型和数据压缩

5.1. 关键业务数据

应确定企业中数据的相对优先级及在发生灾难时各种数据类型所需的恢复速度。同时,应考虑所恢复的文件的更新要求。按对企业的重要程度进行数据分类使系统管理员可以根据恢复要求设计灵活的数据保护策略。
Network Appliance 建议客户将文件系统整理到多个卷和配额树中,从而优化数据保护措施。例如,通过将关键数据分离到专用的卷或配额树中,可以:

  • 镜像关键业务数据,从而可用于即时灾难恢复
  • 不时生成快照副本,从而确保最新版本的文件可供联机使用
  • 限制卷或配额树的大小,减少磁带的备份和恢复时间

出于备份和恢复目的分离关键数据还可以提高全部数据的总体备份和恢复速度。独立备份关键数据可以降低非关键数据的备份频率。

5.2. 动态数据

尽管与关键业务数据类似,但快速变化的数据可能要求不同的保护策略。例如,它可能要求更高的备份频率,以捕捉到经常性的变化。通过将动态数据分离到专用的卷或配额树中,企业即可围绕它设计保护策略。
例如,对快速变化的数据进行增量备份要比对静态数据进行备份需要更长的时间,这是因为要备份的更改数据会很多。如果此类数据位于自己独立的卷中,即可进行经常性的增量备份。不经常变化的存档数据可放到独立的卷中,偶尔进行一次增量备份,且仅在较长的时间间隔后进行完整地转储
动态数据的备份方式还影响 SnapMirror 技术的使用。IT 经理可以制定更为频繁的增量传输时间表,以确保镜像内容是最新的。

5.3. 总数据集大小

了解总数据集大小及每个卷和配额树的大小可以帮助系统管理员对磁带备份和恢复时间及 SnapMirror 数据传输时间做出预测,并判定是否满足企业的需要。

下表利用单个磁带机的平均备份和恢复速率计算了磁带备份和恢复的时间。

200GB

500GB

备份时间 @ 20GB/小时

10 小时

25 小时

恢复时间 @ 16GB/小时

12.5 小时

31.25 小时

2:备份和恢复时间示例

如果无法接受磁带备份或恢复时间,请尽可能使用速度更快的磁带机。管理员还可以考虑将大型卷分割为较小的卷或配额树。例如,如果将 500GB 的卷分割为三个配额树,则每个配额树可以备份到一个独立的磁带机上,或者可以在三个夜晚进行独立的完整备份。

对于恢复时间长的大型卷而言,可以考虑使用 SnapMirror 软件进行快速灾难恢复。大小超过 500GB 的卷或总数据集大小超过 1.4TB 的数据集可能会超出 SCSI 或光纤通道和磁带的原始性能限制,因此可能更适合使用 SnapMirror 解决方案。

5.4. 文件数及文件大小

对于给定的卷大小,处理大量小文件所需的时间要大于处理少量大文件所需的时间。文件数越多,意味着处理的目录结构越大。此外,不管文件大小如何,每个备份的文件都有与之关联的固定开销。弄清文件数和文件大小可以使管理员深入了解所能得到的磁带备份或恢复性能。

5.5. 目录结构

目录结构也会影响备份/恢复解决方案的性能。目录较大和目录较深都会导致性能降低。处理各个目录时,大目录会增加内存管理的复杂性。小目录的所有内容可以一次载入内存中;由于内存大小的限制,大目录只能将部分内容载入内存中。内存管理及经常性从磁盘中读取目录等操作会增加开销。
较深的目录结构一般意味着文件/目录比率更高。为容纳一定数目的文件,较深的目录结构要比较平的目录结构需要更多的目录。备份文件时,目录数越多,工作量越大。此外,在进行恢复时,除非已创建父目录,否则将无法创建子文件/目录。这种父子依存关系阻碍了以高度并行的方式创建文件/目录。

5.6. 数据类型和数据压缩

现在的磁带机都有尝试压缩数据流的内置数据压缩机制,用于提高设备的数据数据速度。数据压缩率越大,备份速度就越高。数据压缩率较小时,速度就会降低。压缩过程还会紧缩数据结构,从而增加磁带中所能容纳的信息量。
不同的数据类型,其压缩量也各不相同。文字(例如新闻组数据)倾向于有大量的冗余,因此通常按 1.5:1 的比例进行压缩。在一个备份性能测试中,高压缩数据 (1.8:1) 的传输率可达 37GB/小时。
另一个极端是不可压缩数据,例如图片文件或二进制可执行文件。图片对象倾向于在生成时进行压缩,因此不能进行进一步的压缩。写入磁带时,高压缩数据实际上可能只略作膨胀。介于之间的是混合数据,例如在主目录中可能会看到包含文本文件、图形文件和二进制文件的混合结构。

对于所有压缩算法而言,试图进一步压缩已经非常紧密的数据会导致备份速度低于关闭压缩功能时的备份速度。管理员可以将紧密的数据分隔到独立的配额树中,并关闭此配额树或卷所在的磁带机的压缩功能。

6. 磁带备份和恢复性能建议

Network Appliance 的测试已判定:转储恢复的传输率与下列因素有关(按重要性逆序排列):

  • 并行的备份或恢复数
  • 磁带机类型
  • 数据类型和数据压缩
  • CPU 负载

我们的测试表明:下列因素对转储恢复的传输率没有影响或有很小的影响:

  • 磁盘驱动器容量
  • 卷大小
  • 磁盘数(或轴数)

Network Appliance 已证实各种磁带机是符合要求的,如 NOW Web 站点(http://now.netapp.com/)上的系统配置指南所列。Network Appliance 备份和恢复合作伙伴还提供了一些符合要求的额外磁带库。其中的大多数合作伙伴都在自己的 Web 站点公布了磁带设备合格表。

6.1. 并行备份或恢复会话

提高备份和恢复性能最重要的一个因素是增加并行备份或恢复会话数,尤其是在使用本地连接的磁带机的情况下。为获得最佳的性能,请将并行备份或恢复会话数增加到在用 Filer 所支持的最大并行会话数。目前,F840 最多支持八台磁带机;F820、F760、F740、F85 及 F630 最多支持四台磁带机;其他所有型号都支持两台磁带机。

6.2. 磁带机性能

磁带机性能规范在备份和恢复性能中起着非常重要的作用。性能较高的磁带机(例如 Sony DTF-2 磁带机或 IBM Ultrium LTO 磁带机)相对于较慢的磁带机(例如 Quantum DLT7000 磁带机)而言,备份和恢复会话的时间要短。本小节将概述受支持的磁带机的未压缩及压缩性能,数据由磁带机制造商公布。

受支持的磁带机制造商公布的传输速度

制造商及型号

以 MB/s 为单位的连续未压缩传输率

以 MB/s 为单位的连续压缩传输率

Exabyte 8900 / Mammoth-1

3

6

Exabyte Mammoth 2

12

30

IBM 3590B

9

27

IBM 3590E

14

34

IBM Ultrium LTO 3580

15

30

Quantum DLT4000

1.5

3

Quantum DLT7000

5

10

Quantum DLT8000

6

12

Sony AIT

3

6

Sony AIT-2

6

12

Sony DTF

12

20

Sony DTF-2

24

40

StorageTek 9840

10

20

3:受支持的磁带机的传输速度

有关受支持的磁带机的详细列表,请参见 NOW Web 站点:http://now.netapp.com/

6.3. 处理不同的数据类型

数据类型(压缩性)对备份和恢复速度确实有着重大影响。因此,应尽可能将已高度压缩的数据(例如视频流或图像)与未压缩的数据(例如文本文件或源代码)分隔开。应将诸如此类的数据隔离到独立的卷或配额树中。对于主体已压缩的数据而言,请使用无硬件压缩功能的磁带设备。对于包含主体未压缩或可压缩的数据的卷或配额树,请使用进行硬件压缩的磁带设备。这样将提高磁带备份和恢复的整体性能。

6.4. CPU 负载问题

当负载达到某个点时,CPU 负载对备份和恢复性能略有影响。此外,备份和恢复过程自身也会略微增加 CPU 负载。运行多个同步备份或恢复操作会加大这种影响的效果。随着同步备份或恢复操作数的增多,最终会开始影响所在系统的用户操作性能。

为获得最佳的备份和恢复性能,请不要在 CPU 负载超过 80% 的情况下进行备份和恢复。同时,尽量不要因并行备份或恢复操作数的增加而使 CPU 负载超过 75%。

21 条回复

  1. Herpesyl