CAS产生的背景
内容寻址存储(Content Addressed Storage,CAS)是由美国EMC公司2002年4月率先提出的针对固定内容存储需求的先进的网络存储技术。CAS具有面向对象存储特征,基于磁记录技术,它按照所存储数据内容的数字指纹寻址,具有良好的可搜索性、安全性、可靠性和扩展性。EMC同时推出了其CAS产品Centera,并成为CAS存储技术的代表性产品。之后,一些存储公司相继推出了相关的产品,使CAS技术备受关注。
在整个IT领域,网络存储技术无论从其存储介质、传输协议还是应用领域上讲,都一直扮演着非常活跃的角色。在网络存储技术的快速发展过程中,有两个问题越来越引起企业界和学术界的普遍关注:一是人类社会信息数量级的指数增长对整个计算机技术提出了严峻的挑战;二是以磁存储为中心的存储技术在包括网络存储在内的整个存储领域中越来越起着举足轻重的作用。
人类已经步入一个数字化的信息时代,信息在社会生活的各个领域中正处于前所未有的关键地位。据统计,现在全人类每年要产生10亿~20亿GB的新信息,这一信息数量相当于全球每人每年要产生250MB的信息。另据美国加州大学Berkeley分校及EMC公司所做的调查显示,在全社会每年产生的所有信息中,有超过75%的信息是属于固定内容(Fixed Content)的数据,也就是说,这些信息一旦生成就不再变更,类似于光存储中的WORM(Write Once Read Many)盘片,一次写入,多次读取。这类固定内容的信息存储主要包括法律条文、标准和规范的电子文档以及数字化医学信息、电子邮件及附件、支票图像、卫星图像、音频/视频信息等。
四种存储介质的信息数量对比
纸质印刷、胶片、光盘和磁盘是信息存储的四种主要存储介质。在全人类每年产生的新信息中,磁存储无疑是这些信息最大的存储介质,也是发展最为迅速的存储技术,而所有印刷文档仅仅占每年新产生的总信息数量的0.003%!采用这四种存储介质的信息数量的粗略对比如表1所示。不仅如此,磁存储的成本也在急剧降低。据预计,磁存储的成本将由2000年的大约10美元/GB跌至2005年的1美元/GB。
与此同时,ATA磁盘存储和磁存储技术的深入发展,大大推动了网络存储技术的进步和应用。去年,Serial ATA Ⅱ规范已经得到Serial ATA Working Group(现已更名为Serial ATA International Organization,SATA-IO)的认可,估计速度高达3Gbps Serial ATA Ⅱ的硬盘近期就会推向市场。新型高速磁盘的推出对网络存储技术所产生的强有力的推动力是显而易见的。
由此可以看出,固定内容信息数量的急剧增长与磁存储技术的不断发展是联系在一起的,这意味着新的网络存储技术空间出现——尤其是当传统网络存储技术无法适应大量的固定内容存储时。虽然采用块或文件访问方式的传统网络存储系统在一定程度上可以满足几十、几百TB的网络存储应用需求,但这类存储系统的可扩展性、管理效率以及扩展整个存储系统后的性价比远远不能满足动辄几百TB(Terabyte,1TB=1000GB)乃至PB(Petabyte,1PB=1000TB)的大规模面向固定内容的网络存储需求。不仅如此,对数据的安全访问和长久保存要求苛刻的新存储系统亦对传统网络存储系统解决方案提出了严峻的挑战。同时,据Enterprise Storage Group评估,在未来几年内,任意时间和任意地点都能保证所需数据的安全、可用且符合有关标准和规范的新型网络存储系统解决方案、网络存储系统产品以及网络存储系统服务,具有潜在的60亿美元的市场空间,这无疑会激起网络存储服务提供商探索先进网络存储技术的浓厚兴趣。
在这种背景下,美国EMC公司在2002年4月率先提出了一种叫做内容寻址存储(Content Addressed Storage,CAS)的新型网络存储技术,以实现对面向固定内容(Fixed Content)的新型网络存储系统的安全、高效、便捷的访问、管理和扩展。
企业存储集团分析家Peter Gerr曾说道,CAS技术出现的非常及时,关于固定内容的存储需求已经很高,并将不断增长,而传统的文档存储解决方案的局限性也在不断暴露,并同时发布了其CAS产品。