CAS技术及产品介绍-5

Posted by

EMC Centera的RAIN体系结构

Centera系统的体系结构主要由四个部分组成:所要存储的数据对象、应用软件服务器、Centera存储服务器和客户端数据库。整个数据的存储可以分为五个过程:

(1)由应用软件服务器创建或使用数据对象;

(2)应用软件服务器在IP通路上通过一套Centera的标准API把数据对象发送给Centera存储服务器;

(3)Centera存储服务器按照特定算法针对所存储的数据内容片断的本身生成全局惟一的内容地址;

(4)Centera存储服务器把这一内容地址返回给应用软件服务器;

(5)内容地址由应用软件服务器保存在专用数据库中,以备客户端用户存取。

整个Centera网络存储系统的工作流程如下图所示。

Centera的CAS网络存储服务器采用了一套独特的可以避免任何单点故障(No-Single-Points-of-Failure)的RAIN(Redundant Array of Independent Nodes,独立节点的冗余阵列)存储体系结构,与CentraStar操作环境一起实现了一套集TB-PB安全高效扩展、自管理、自修复和自动重配置与一体的内容寻址存储系统。整个系统由很多节点构成,所有节点分为存储节点(Storage Nodes)和访问节点(Access Nodes),其中前者主要用于存储和保护数据,而后者主要为外部提供API访问。RAIN系统包含构成如下图所示。RAIN中的每一个节点都包含一套高端配置的计算机系统(典型配置:2GHz P4 CPU/512MB RAM/320GB EIDE/10/100BT NIC)和运行在Centera之上的操作环境CentraStar——在整个Centera中处于核心和关键地位。

Centera的软硬件在一个机柜内实现了一套P2P透明的集群环境,而这个机柜对于CAS网络存储客户端用户而言不过是一个“黑箱”罢了。Centera的初始配置容量为2.9TB,并且还可以非常便捷地扩充至几百TB甚至PB。一个机柜就能装有8、16、24或32个完全一样的节点,可以分别提供3.8TB、7.7TB、11.5TB或15.4TB的映像存储容量。Centera的每一个节点都具备数据处理能力,都拥有1TB的原始数据存储能力,并具有通过一个私有LAN与CAS网络存储系统的其他集群节点进行互连。

当需要向CAS网络存储系统增加存储容量时,新容量就作为“构建块”加入Centera的自配置系统,运行在Centera上的驻留软件就会通知整个网络存储系统有新的容量添加进来,并立刻为系统可用。

Centera大大简化了网络存储系统的规划和管理,用户不必关心RAID类型,也不必担心LUN绑定,更不用考虑创建何种文件系统。应用程序和存储管理员可以从繁重的超大容量文件系统管理和极为复杂的多网络存储拓扑结构中解脱出来。

据估计,在采用Centera的CAS网络存储系统中,一个管理员能够管理几百TB甚至PB级的数据,而在传统网络存储解决方案中仅能有效管理20TB~50TB的数据量。

概括地讲,基于RAIN结构的CAS网络存储系统的特点主要包括以下几点:

  • 透明的P2P集群存储环境;
  • 自配置功能;
  • 各个节点均冗余;
  • 通过镜像和奇偶保护手段来加强内容保护;
  • 通过CDF+Blob来加强自诊断和自恢复能力;
  • 远程监控能力;
  • 不可能发生任何单点故障。