<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>【存储部落】 &#187; 重复数据删除</title>
	<atom:link href="http://www.sansky.net/article/tag/de-duplication/feed" rel="self" type="application/rss+xml" />
	<link>http://www.sansky.net</link>
	<description>sansky的存储技术博客，内容涵盖存储解决方案、存储系统、存储硬件、存储软件、存储管理、存储安全、数据备份与恢复、数据保护、存储基础知识，为大家推荐各种存储产品、和存储技术、视频监控、广电、电信、政府、教育、医疗等行业存储系统解决方案，</description>
	<lastBuildDate>Sat, 31 Dec 2011 10:22:25 +0000</lastBuildDate>
	<language>zh-cn</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>深度剖析云存储</title>
		<link>http://www.sansky.net/article/2008-09-17-depth-analysis-of-storage.html</link>
		<comments>http://www.sansky.net/article/2008-09-17-depth-analysis-of-storage.html#comments</comments>
		<pubDate>Tue, 16 Sep 2008 21:03:41 +0000</pubDate>
		<dc:creator>sansky</dc:creator>
				<category><![CDATA[精华推荐]]></category>
		<category><![CDATA[热点1]]></category>
		<category><![CDATA[云存储]]></category>
		<category><![CDATA[云计算]]></category>
		<category><![CDATA[应用存储]]></category>
		<category><![CDATA[CDN]]></category>
		<category><![CDATA[cluster]]></category>
		<category><![CDATA[重复数据删除]]></category>

		<guid isPermaLink="false">http://www.sansky.net/article/2008-09-17-%e6%b7%b1%e5%ba%a6%e5%89%96%e6%9e%90%e4%ba%91%e5%ad%98%e5%82%a8.html</guid>
		<description><![CDATA[云存储（cloud storage）这个概念一经提出，就得到了众多厂商的支持和关注。Amazon在两年前就推出的Elastic Compute Cloud（EC2：弹性计算云）云存储产品，旨在为用户提供互联网服务形式同时提供更强的存储和计算功能。内容分发网络服务提供商CDNetworks和业界著名的云存储平台服务商 Nirvanix发布了一项新的... ]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.sansky.net/article/tag/cloudstorage" class="st_tag internal_tag" rel="tag" title="标签 云存储 下的日志">云存储</a>（cloud storage）这个概念一经提出，就得到了众多厂商的支持和关注。Amazon在两年前就推出的Elastic Compute Cloud（EC2：弹性计算云）云存储产品，旨在为用户提供互联网服务形式同时提供更强的存储和计算功能。内容分发网络服务提供商CDNetworks和业界著名的云存储平台服务商 Nirvanix发布了一项新的合作，并宣布结成战略伙伴关系，以提供业界目前唯一的云存储和内容传送服务集成平台。半年以前，微软就已经推出了提供网络移动硬盘服务的Windows Live SkyDrive Beta测试版。近期，EMC宣布加入 道里可信基础架构项目，致力于云计算环境下关于信任和可靠度保证的全球研究协作，IBM也将云计算标准作为全球备份中心的3亿美元扩展方案的一部分。</p>
<p><span lang="EN-US" xml:lang="3亿美元扩展方案的一部分。">云存储变得越来越热，大家众说纷”云”，而且各有各的说法，各有各的观点，那么到底什么是云存储？</span></p>
<h3>1 什么是云存储</h3>
<p>云存储在云计算 (cloud computing)概念上延伸和发展出来的一个新的概念。云计算是是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(<a href="http://www.sansky.net/article/tag/grid" class="st_tag internal_tag" rel="tag" title="标签 GRID 下的日志">Grid</a> Computing)的发展，是透过网络将庞大的计算处理程序自动分拆成无数个较小的子程序，再交由多部服务器所组成的庞大系统经计算分析之后将处理结果回传给用户。通过云计算技术，网络服务提供者可以在数秒之内，处理数以千万计甚至亿计的信息，达到和”超级计算机”同样强大的网络服务。</p>
<p>云存储的概念与云计算类似，它是指通过集群应用、网格技术或分布式文件系统等功能，将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作，共同对外提供数据存储和业务访问功能的一个系统。</p>
<p>如果这样解释还是难以理解，那我们可以借用广域网和互联网的结构来解释云存储。</p>
<p><strong>云状的网络结构</strong></p>
<p>相信大家对局域网、广域网和互联网都已经非常了解了。在常见的局域网系统中，我们为了能更好地使用局域网，一般来讲，使用者需要非常清楚地知道网络中每一个软硬件的型号和配置，比如采用什么型号交换机，有多少个端口，采用了什么路由器和防火墙，分别是如何设置的。系统中有多少个服务器，分别安装了什么操作系统和软件。各设备之间采用什么类型的连接线缆，分配了什么 xml:lang=IP地址和子网掩码。</p>
<p>但当我们使用广域网和互联网时，我们只需要知道是什么样的接入网和用户名、密码就可以连接到广域网和互联网，并不需要知道广域网和互联网中到底有多少台交换机、路由器、防火墙和服务器，不需要知道数据是通过什么样的路由到达我们的电脑，也不需要知道网络中的服务器分别安装了什么软件，更不需要知道网络中各设备之间采用了什么样的连接线缆和端口。</p>
<p>广域网和互联网对于具体的使用者是完全透明的，我们经常用一个云状的图形来表示广域网和互联网，如下图：</p>
<p style="text-align: center;"><a title="互联网络" rel="lightbox" href="http://www.sansky.net/files/2008/09/clip-image001.jpg"><img id="urn:zoundry:jid:clip_image001.jpg" src="http://www.sansky.net/files/2008/09/clip-image001.jpg" border="0" alt="互联网络" width="438" height="373" /></a></p>
<p>虽然这个云图中包含了许许多多的交换机、路由器、防火墙和服务器，但对具体的广域网、互联网用户来讲，这些都是不需要知道的。这个云状图形代表的是广域网和互联网带给大家的互联互通的网络服务，无论我们在任何地方，都可以通过一个网络接入线缆和一个用户、密码，就可以接入广域网和互联网，享受网络带给我们的服务。</p>
<p>参考云状的网络结构，创建一个新型的云状结构的存储系统系统，这个存储系统由多个存储设备组成，通过集群功能、分布式文件系统或类似网格计算等功能联合起来协同工作，并通过一定的应用软件或应用接口，对用户提供一定类型的存储服务和访问服务。</p>
<p style="text-align: center;"><a title="超级保险箱解决方案系列图1" rel="lightbox" href="http://www.sansky.net/files/2008/09/clip-image003.jpg"><img id="urn:zoundry:jid:clip_image003.jpg" src="http://www.sansky.net/files/2008/09/clip-image003.jpg" border="0" alt="超级保险箱解决方案系列图1" width="487" height="308" /></a></p>
<p>当我们使用某一个独立的存储设备时，我们必须非常清楚这个存储设备是什么型号，什么接口和传输协议，必须清楚地知道存储系统中有多少块磁盘，分别是什么型号、多大容量，必须清楚存储设备和服务器之间采用什么样的连接线缆。为了保证数据安全和业务的连续性，我们还需要建立相应的数据备份系统和容灾系统。除此之外，对存储设备进行定期地状态监控、维护、软硬件更新和升级也是必须的。</p>
<p>如果采用云存储，那么上面所提到的一切对使用者来讲都不需要了。云状存储系统中的所有设备对使用者来讲都是完全透明的，任何地方的任何一个经过授权的使用者都可以通过一根接入线缆与云存储连接，对云存储进行数据访问。</p>
<p><strong>云存储不是存储，而是服务</strong></p>
<p>就如同云状的广域网和互联网一样，云存储对使用者来讲，不是指某一个具体的设备，而是指一个由许许多多个存储设备和服务器所构成的集合体。使用者使用云存储，并不是使用某一个存储设备，而是使用整个云存储系统带来的一种数据访问服务。所以严格来讲，云存储不是存储，而是一种服务。</p>
<p>云存储的核心是应用软件与存储设备相结合，通过应用软件来实现存储设备向存储服务的转变。</p>
<h3>2 云存储的结构模型</h3>
<p>与传统的存储设备相比，云存储不仅仅是一个硬件，而是一个网络设备、存储设备、服务器、应用软件、公用访问接口、接入网、和客户端程序等多个部分组成的复杂系统。各部分以存储设备为核心，通过应用软件来对外提供数据存储和业务访问服务。云存储系统的结构模型如下：</p>
<p style="text-align: center;"><a title="云存储系统结构" rel="lightbox" href="http://www.sansky.net/files/2008/09/clip-image005.jpg"><img id="urn:zoundry:jid:clip_image005.jpg" src="http://www.sansky.net/files/2008/09/clip-image005.jpg" border="0" alt="云存储系统结构" width="544" height="353" /></a></p>
<p>云存储系统的结构模型由 4层组成。</p>
<p><strong>一、存储层 </strong></p>
<p>存储层是云存储最基础的部分。存储设备可以是FC光纤通道存储设备，可以是NAS和 iSCSI等IP存储设备，也可以是 SCSI或SAS等 DAS存储设备。云存储中的存储设备往往数量庞大且分布多不同地域，彼此之间通过广域网、互联网或者 FC光纤通道网络连接在一起。</p>
<p>存储设备之上是一个统一存储设备管理系统，可以实现存储设备的逻辑虚拟化管理、多链路冗余管理，以及硬件设备的状态监控和故障维护。</p>
<p><strong>二、基础管理层：</strong></p>
<p>基础管理层是云存储最核心的部分，也是云存储中最难以实现的部分。基础管理层通过集群、分布式文件系统和网格计算等技术，实现云存储中多个存储设备之间的协同工作，使多个的存储设备可以对外提供同一种服务，并提供更大更强更好的数据访问性能。</p>
<p>CDN内容分发系统、数据加密技术保证云存储中的数据不会被未授权的用户所访问，同时，通过各种数据备份和容灾技术和措施可以保证云存储中的数据不会丢失，保证云存储自身的安全和稳定。</p>
<p><strong>三、应用接口层：</strong></p>
<p>应用接口层是云存储最灵活多变的部分。不同的云存储运营单位可以根据实际业务类型，开发不同的应用服务接口，提供不同的应用服务。比如视频监控应用平台、IPTV和视频点播应用平台、网络硬盘引用平台，远程数据备份应用平台等。</p>
<p><strong>四、访问层： </strong></p>
<p>任何一个授权用户都可以通过标准的公用应用接口来登录云存储系统，享受云存储服务。云存储运营单位不同，云存储提供的访问类型和访问手段也不同。</p>
<h3>3 云存储的技术前提</h3>
<p>从上面的云存储结构模型可知，云存储系统是一个多设备、多应用、多服务协同工作的集合体，它的实现要以多种技术的发展为前提。</p>
<p><strong>一、宽带网络的发展 </strong></p>
<p>真正的云存储系统将会是一个多区域分布、遍布全国、甚至于遍布全球的庞大公用系统，使用者需要通过ADSL、DDN等宽带接入设备来连接云存储，而不是通过FC、 SCSI或以太网线缆直接连接一台独立的、私有的存储设备上。只有宽带网络得到充足的发展，使用者才有可能获得足够大的数据传输带宽，实现大量容量数据的传输，真正享受到云存储服务，否则只能是空谈。</p>
<p><strong>二、 WEB2.0技术 </strong></p>
<p>Web2.0 技术的核心是分享。只有通过web2.0技术，云存储的使用者才有可能通过 PC、手机、移动多媒体等多种设备，实现数据、文档、图片和视音频等内容的集中存储和资料共享。Web2.0技术的发展使得使用者的应用方式和可得服务更加灵活和多样。</p>
<p><strong>三、应用存储的发展 </strong></p>
<p>云存储不仅仅是存储，更多的是应用。应用存储是一种在存储设备中集成了应用软件功能的存储设备，它不仅具有数据存储功能，还具有应用软件功能，可以看作是服务器和存储设备的集合体。应用存储技术的发展可以大量减少云存储中服务器的数量，从而降低系统建设成本，减少系统中由服务器造成单点故障和性能瓶颈，减少数据传输环节，提供系统性能和效率，保证整个系统的高效稳定运行。</p>
<p><strong>四、集群技术、网格技术和分布式文件系统 </strong></p>
<p>云存储系统是一个多存储设备、多应用、多服务协同工作的集合体，任何一个单点的存储系统都不是云存储。</p>
<p>既然是由多个存储设备构成的，不同存储设备之间就需要通过集群技术、分布式文件系统和网格计算等技术，实现多个存储设备之间的协同工作，使多个的存储设备可以对外提供同一种服务，并提供更大更强更好的数据访问性能。如果没有这些技术的存在，云存储就不可能真正实现，所谓的云存储只能是一个一个的独立系统，不能形成云状结构。</p>
<p><strong>五、 CDN内容分发、P2P技术、数据压缩技术、重复数据删除技术、数据加密技术 </strong></p>
<p>CDN内容分发系统、数据加密技术保证云存储中的数据不会被未授权的用户所访问，同时，通过各种数据备份和容灾技术保证云存储中的数据不会丢失，保证云存储自身的安全和稳定。如果云存储中的数据安全得不到保证，想来也没有人敢用云存储，否则，保存的数据不是很快丢失了，就是全国人民都知道了。</p>
<p><strong>六、存储虚拟化技术、存储网络化管理技术 </strong></p>
<p>云存储中的存储设备数量庞大且分布在多不同地域，如何实现不同厂商、不同型号甚至于不同类型（如FC存储和 IP存储）的多台设备之间的逻辑卷管理、存储虚拟化管理和多链路冗余管理将会是一个巨大的难题，这个问题得不到解决，存储设备就会是整个云存储系统的性能瓶颈，结构上也无法形成一个整体，而且还会带来后期容量和性能扩展难等问题。</p>
<p>云存储中的存储设备数量庞大、分布地域广造成的另外一个问题就是存储设备运营管理问题。虽然这些问题对云存储的使用者来讲根本不需要关心，但对于云存储的运营单位来讲，却必须要通过切实可行和有效的手段来解决集中管理难、状态监控难、故障维护难、人力成本高等问题。因此，云存储必须要具有一个高效的类似与网络管理软件一样的集中管理平台，可实现云存储系统中设有存储设备、服务器和网络设备的集中管理和状态监控。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.sansky.net/article/2008-09-17-depth-analysis-of-storage.html/feed</wfw:commentRss>
		<slash:comments>12</slash:comments>
		</item>
		<item>
		<title>谁是最对的重复数据删除方案[转]</title>
		<link>http://www.sansky.net/article/2008-05-08-who-is-the-most-of-the-duplication-of-data-to-delete-programmes-to.html</link>
		<comments>http://www.sansky.net/article/2008-05-08-who-is-the-most-of-the-duplication-of-data-to-delete-programmes-to.html#comments</comments>
		<pubDate>Thu, 08 May 2008 09:48:37 +0000</pubDate>
		<dc:creator>sansky</dc:creator>
				<category><![CDATA[好文收藏]]></category>
		<category><![CDATA[重复数据删除]]></category>
		<category><![CDATA[VTL]]></category>

		<guid isPermaLink="false">http://www.sansky.net/article/2008-05-08-%e8%b0%81%e6%98%af%e6%9c%80%e5%af%b9%e7%9a%84%e9%87%8d%e5%a4%8d%e6%95%b0%e6%8d%ae%e5%88%a0%e9%99%a4%e6%96%b9%e6%a1%88%e8%bd%ac.html</guid>
		<description><![CDATA[在Clipper Group2006年8月发布的”备份技术的发展（The Evolution of Backups）”分析白皮书中，分析师针对提升容量效益部分做出了这样的报告：”重复数据删除技术是备份技术的下一个发展步骤。”在二级存储归档时删除重复数据可以大幅削减存储介质的成本、进一步流畅管理任务，同时最小化复制数据时的... ]]></description>
			<content:encoded><![CDATA[<p>在Clipper Group2006年8月发布的”备份技术的发展（The Evolution of Backups）”分析白皮书中，分析师针对提升容量效益部分做出了这样的报告：”重复数据删除技术是备份技术的下一个发展步骤。”在二级存储归档时删除重复数据可以大幅削减存储介质的成本、进一步流畅管理任务，同时最小化复制数据时的带宽需求。</p>
<p>尽管重复数据删除的概念非常先进，但由于识别重复数据、索引唯一数据、将被紧凑的数据恢复到初始状态所需要的处理能力要求的成本太高，致使这项技术的推广非常缓慢。但是，随着技术的发展，处理能力越来越经济高效，重复数据删除技术在近期再次成为市场的焦点。</p>
<p>许多厂商都声称自家提供的是&#8217;最佳&#8217;的重复数据删除产品，而将辨别真伪和判断哪些因素对企业的业务更为重要的难题留给了迷茫的用户。甚至有些厂商不切实际的大肆渲染自家产品可以巨量删除重复数据，致使很多早期的重复数据删除用户对他们之前选择的解决方案感到非常失望。</p>
<p>企业想要找到可以真正提供经济效益、高性能且无限扩展的长期数据储存的重复数据删除技术，就必须充分考虑到一些关键性因素。本文将有助于那些想要使用重复数据删除技术的用户了解更多背景资料，从而做出明智的购买选择。</p>
<p><strong>重复数据删除成为一项操作需求</strong></p>
<p>由于二级存储卷的不断增加，企业需要一种方法可以极大的减少数据卷。而很多法律法规的变化，也使得企业面临更大的挑战，被迫不得不改变他们原有的数据保护方式。通过消除重复数据，使数据归档时尽可能的紧凑、简洁，不仅极大的削减了企业成本，同时企业还可以将更多的数据在线保留更长时间。很多企业都希望将数据存储环境的成本效益和性能发挥到最优，而重复数据删除正是这样一种技术，因此很快吸引了企业IT主管的眼球。</p>
<p>虽然压缩技术也可以提供平均值为2：1的数据压缩，但这对于企业需要处理的海量数据只不过是很小的部分，实在是杯水车薪。只有重复数据删除技术才能满足企业大量削减数据量的需求。</p>
<p>由于人们对物理搬运磁带的方式所面临的风险（损坏、被窃、丢失等）早已非常明了，而企业在进行远程存储时又特别重视关键信息的保护和风险最小化的问题，电子化传输无疑成为远程传送的最佳选择。在将备份数据以电子传输方式传送到远程站点进行归档时，重复数据删除能够使所需的带宽需求最小化。</p>
<p><strong>优秀的重复数据删除解决方案应该具备的关键性标准</strong></p>
<p>当用户在评估重复数据删除解决方案时，可以将下面的八条标准作为主要评估标准：</p>
<ul type="disc">
<li>1 能够解决关键性问题：有效删除重复数据</li>
<li>2 能够与当前环境相整合</li>
<li>3 VTL容量</li>
<li>4 重复数据删除对备份性能的影响</li>
<li>5 具备可扩展能力</li>
<li>6 支持分布式应用</li>
<li>7 能够对存储库提供实时保护</li>
<li>8 效率及有效性</li>
</ul>
<p><strong>1.</strong> <strong>能够解决关键性问题：有效删除重复数据</strong></p>
<p>重复数据删除解决方案是否能够真正解决关键问题所在：有效的删除二级存储上的重复数据，是我们首先要考虑的问题。重复的备份数据会造成多次储存需求，只要重复数据不被删除，储存需求就会继续。</p>
<p>ESG集团2007年发布的报告用图表方式说明了备份向新技术发展的必要性。相对于一次全备份来说，增量和差异数据备份也可以减少备份的数据量。</p>
<p style="TEXT-ALIGN: center"><a rel="lightbox" href="http://www.sansky.net/files/2008/05/121024009165-clip-image001.jpg"><img id="urn:zoundry:jid:121024009165_clip_image001.jpg" src="http://www.sansky.net/files/2008/05/121024009165-clip-image001.jpg" border="0" alt="" width="512" height="339" /></a></p>
<p>然而，即使是增量备份，在保护基于文件级变化的数据时，还是会备份很多重复的数据。当需要跨越多个站点的多台服务器进行备份时，通过部署重复数据删除解决方案减少存储才是更好的选择。</p>
<p><strong>2.</strong> <strong>能够与当前环境相整合</strong></p>
<p>一个高效的重复数据删除解决方案应该对当前IT环境的影响/中断越小越好。许多企业都选择利用VTL备份来避免影响/中断，以在不改变企业当前备份策略、处理或软件的情况下提升备份质量。因此，基于VTL的重复数据删除技术在部署时对环境影响也应该是最小的。它将更多的注意力集中在了备份这个巨大的重复数据存储池上。</p>
<p>基于VTL的t重复数据删除解决方案通常要求使用专用设备，但这并不影响部署的灵活性。一个充分灵活的重复数据删除解决方案应该即可以以软件包形式提供给用户，也可以提供给用户整体的解决方案（Turnkey Appliance），从而最大限度的使用户的现有资源得以利用。</p>
<p><strong>3. <a href="http://www.sansky.net/article/tag/vtl" class="st_tag internal_tag" rel="tag" title="标签 VTL 下的日志">VTL</a></strong><strong>容量</strong></p>
<p>如果重复数据删除技术的部署是围绕着VTL进行的，那么VTL自身的容量就必须作为评估的一部分来考虑。重复数据删除节省下的容量是不能解决由于使用不够规格的VTL所引发的问题的。因此，既要全面考虑VTL的功能性、性能、稳定性以及支持能力也要充分考虑重复数据删除的扩展能力。</p>
<p><strong>4.</strong> <strong>重复数据删除对备份性能的影响</strong></p>
<p>在哪里、什么时候进行重复数据删除是关系到备份处理性能的非常重要的问题。有些解决方案试图在数据进行备份时删除重复数据，这会使VTL的性能降低多达60%以上，直接造成备份过程太慢和备份窗口太大的严重性能影响。</p>
<p>相比之下，在备份任务完成之后进行重复数据删除的解决方案则不会出现这些问题，而且不会对备份性能带来任何影响。另外，为了最大限度的发挥易管理性，解决方案允许用户依照多种不同的因素，如资源利用、生产进度、创建时间等进行精细（磁带级或磁带组级）的基于策略的重复数据删除。这使得存储经济性轻松实现，同时，也将系统资源的利用发挥到最大。</p>
<p><strong>5.</strong> <strong>具备可扩展能力</strong></p>
<p>由于重复数据删除解决方案是用于长期的数据储存的，在容量和性能方面的可扩展能力也是非常重要的考虑因素，而且至少要考虑未来五年甚至更长时间的增长计划。那么，在保证快速访问的前提下，你希望有多少数据保存在磁带上？你需要怎样的数据索引系统呢？</p>
<p>优秀的重复数据删除解决方案提供的架构，无论是在初始部署时，还是面对未来系统的长期增长，都应该能保证最优化（Right-sizing）、最经济的架构规模。集群可以帮助用户满足不断增长的容量需求&#8212;即使是N多Petabyte数据增长的环境&#8212;而且不会降低重复数据删除的效率或系统的性能。</p>
<p style="TEXT-ALIGN: center"><a rel="lightbox" href="http://www.sansky.net/files/2008/05/121024009171-clip-image003.jpg"><img id="urn:zoundry:jid:121024009171_clip_image003.jpg" src="http://www.sansky.net/files/2008/05/121024009171-clip-image003.jpg" border="0" alt="" width="512" height="296" /></a></p>
<p style="TEXT-ALIGN: center">这个架构还为存储库保护的部分提供了故障切换（Failover）功能。</p>
<p><strong>6.</strong> <strong>支持分布式应用</strong></p>
<p>重复数据删除技术，不只是能为单个数据中心带来利益，对于具有多个分支机构或多个站点的大型企业来说，它可以让整个企业的分布式应用受益无穷。一个包含复制和多级重复数据删除的解决方案可以将这一技术的优势发挥到极致。</p>
<p>举例来说，一个企业由1个总部和3个区域代表机构构成，可以在区域代表机构部署一台具备重复数据删除功能的容灾设备，使本地存储及向远程中央站点的复制更为高效。这种解决方案使数据复制到中央站点的带宽需求降到最低，它只不过是用来确定远程的数据是否已经包括在中央的存储库中。所有站点中，只有唯一的数据会被复制到中央站点或是容灾站点，否则所需的带宽就会增大。</p>
<p><strong>7.</strong> <strong>能够对存储库提供实时保护</strong></p>
<p>保证对删除重复数据的存储库的访问是非常关键的，因此它不能允许有单点故障发生。一个优秀的重复数据删除解决方案应该包括可以在本地存储故障发生时提供保护的镜像功能，同时也应该具备复制功能以在灾难发生时从提供保护。这种解决方案还应该在出现节点故障时具备故障切换能力，即使是一个集群中的多个节点出现故障，企业也必须能够及时恢复数据同时还要保证业务持续运营。</p>
<p><strong>8.</strong> <strong>效率及有效性</strong></p>
<p>与基于文件的重复数据删除方式相比，在SUBFILE或数据块级分析数据的方式删除的冗余数据会更多。比如，一个4MB大小的文件被修改了一行内容，如果是文件级解决方案，整个4MB的文件都必须再被保存，而存储上就需要保存两遍。如果这个文件被发送给多个人（这种情况非常普遍），这种负面的效应也会随之倍增。</p>
<p>大多数SUBFILE重复数据删除处理是通过将大量的数据分割成&#8217;块&#8217;，就像虚拟磁带匣一样，在相对小尺寸的数据块中搜索重复数据。分割成大块的数据处理速度更快，但发现的重复数据也比较少；而分割成小块的数据可以更轻松的发现更多重复数据，但它在扫描数据时所需的开销也会更高。</p>
<p>如果数据在磁带（或其它应用的数据流）的时候就被分割成&#8217;块&#8217;，重复数据删除处理在备份软件创建的元数据上就能进行。优秀的解决方案可以分离元数据，从而在分割成&#8217;块&#8217;的实际数据文件中发现重复数据，这种方式使找到重复数据的机率更高。有些重复数据删除解决方案甚至可以按照所掌握的数据格式来调节分割的&#8217;块&#8217;的大小。如果能将这些技术结合应用，将使发现的重复数据数量大幅增加。这在重复数据删除解决方案的经济效益标准方面影响重大。</p>
<p><strong>找到最适合的整体解决方案</strong></p>
<p>由于业务应用需要和法律法规的要求，存储的数据量还在不断的增加，重复数据删除也快速上升到至关重要的地位。在大幅消除数据量、削减存储需求、最小化数据保护成本和风险方面，重复数据删除可说是唯一的应对办法。</p>
<p>尽管重复数据删除技术所带来的利益多多，企业还是应该抵御住不时出现的针对这一技术的大肆抄作。无论是哪种方式，重复数据删除的删除比率都可以根据数据自身的格式和保护策略的不同而发生变化。</p>
<p>为了使重复数据删除技术的利益最大化，企业应该从上面提到的几个标准出发，充分考虑，仔细评估，找到真正适合自己的重复数据删除解决方案，而不应该简单的听信于宣传的重复数据删除比率的理论数值。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.sansky.net/article/2008-05-08-who-is-the-most-of-the-duplication-of-data-to-delete-programmes-to.html/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>重复数据删除的经济性[转]</title>
		<link>http://www.sansky.net/article/2008-05-07-duplication-of-data-to-delete-the-economy-to.html</link>
		<comments>http://www.sansky.net/article/2008-05-07-duplication-of-data-to-delete-the-economy-to.html#comments</comments>
		<pubDate>Wed, 07 May 2008 13:33:13 +0000</pubDate>
		<dc:creator>sansky</dc:creator>
				<category><![CDATA[好文收藏]]></category>
		<category><![CDATA[重复数据删除]]></category>
		<category><![CDATA[VTL]]></category>

		<guid isPermaLink="false">http://www.sansky.net/article/2008-05-07-%e9%87%8d%e5%a4%8d%e6%95%b0%e6%8d%ae%e5%88%a0%e9%99%a4%e7%9a%84%e7%bb%8f%e6%b5%8e%e6%80%a7%e8%bd%ac.html</guid>
		<description><![CDATA[数据量正在迅速增加，企业用户不仅产生更多的原始数据，而且政府管理机构还要求他们在数据生命周期中多次备份和保留这些数据。如果每周的完整备份数据的保留期是1年，每天的递增备份数据的保留期是10天，那么，1TB数据在其整个生命周期中需要53TB的存储容量来提供数据保护。备份、管理和保... ]]></description>
			<content:encoded><![CDATA[<p>数据量正在迅速增加，企业用户不仅产生更多的原始数据，而且政府管理机构还要求他们在数据生命周期中多次备份和保留这些数据。如果每周的完整备份数据的保留期是1年，每天的递增备份数据的保留期是10天，那么，1TB数据在其整个生命周期中需要53TB的存储容量来提供数据保护。<a href="http://www.sansky.net/article/tag/backup" class="st_tag internal_tag" rel="tag" title="标签 备份 下的日志">备份</a>、管理和保存这些数据将大大增加劳动力成本。</p>
<p>　　但好消息是硬盘存储的费用在降低，重复数据删除技术则可应用在基于磁盘的虚拟磁带库(<a href="http://www.sansky.net/article/tag/vtl" class="st_tag internal_tag" rel="tag" title="标签 VTL 下的日志">VTL</a>)上，通过只备份和保存某段数据一次，从而帮助控制数据量的增长。</p>
<p>　　VTL是基于硬盘的系统，它模拟磁带技术使企业可以用最小的中断将它们安装在已有的环境中。重复数据删除软件(某些VTL提供)保存基线数据集合，然后检查随后的备份集合，寻找重复的数据。当找到重复数据时，它保存很小的数据表达式，这些数据表达式使软件可以根据需要汇编和恢复完整的文件。</p>
<p>　　目前有两种主要的重复数据删除方法：基于散列的方法和基于字节比较的方法。基于散列的方法利用一种算法对输入数据进行处理来创建很小的表达式和数据唯一的标识符(即所谓的散列值)。然后，将其与保存在查寻表中的散列值进行比较。但是，利用查寻表来确定重复的散列串会造成巨大的性能压力，并且可能需要几周时间才能取得最优的重复删除效率。</p>
<p>　　效率更高的方法是在对象级上进行比较。例如，将Word文档与另一个Word文档进行比较，要么采用模式匹配算法;要么采用效率更高的智能分析技术。智能分析在更详细地比较两个文件之前会分析备份文件和参考数据集合来确定可能是冗余的文件。由于把处理重点放在可能的重复数据上，它可以更彻底地去除重复数据和避免不必要的处理新文件。</p>
<p>　　一些技术在数据备份过程中进行重复数据删除。这种在线的重复数据删除会降低备份性能，增加备份的复杂性。另一些技术执行带外的重复数据删除，在执行时，它们首先备份数据，然后再执行重复数据删除。</p>
<p>　　字节级重复数据删除可提供高达25:1数据压缩率。当与典型的VTL特性，即压缩技术配合使用时，企业无须增加存储容量就可在同样的空间中多保存50倍的数据。这种压缩技术不仅使用户可以在线保存更多的数据，并使数据保持更长的在线时间，还带来了将数据保存在硬盘上的优势。例如，把数据保存在硬盘上比保存在磁带上占用更少的物理空间，并大大减少电源、冷却、安全和其他运营与基础设施费用。据最近的一份Gartner报告说，到2008年，50%的数据中心将缺少满足高密度设备需要的电源和冷却容量。</p>
<p>　　重复数据删除技术通过使备份到VTL的费用大大低于纯基于硬盘的数据保护解决方案，改进了数据保护的经济性。同时，它也是数据中心应对急剧增加的能源、劳动力和空间费用，以及管理即将出现的电源和冷却容量短缺的重要的途径。</p>
<p><img width="300" height="317" src="http://image.it168.com/cms/2008-5-4/Image/200854173617.gif"/></p>
]]></content:encoded>
			<wfw:commentRss>http://www.sansky.net/article/2008-05-07-duplication-of-data-to-delete-the-economy-to.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>NetApp A-SIS重复数据删除技术[转]</title>
		<link>http://www.sansky.net/article/2008-05-07-netapp-a-sis-remove-duplication-of-data-technology-to.html</link>
		<comments>http://www.sansky.net/article/2008-05-07-netapp-a-sis-remove-duplication-of-data-technology-to.html#comments</comments>
		<pubDate>Wed, 07 May 2008 13:27:17 +0000</pubDate>
		<dc:creator>sansky</dc:creator>
				<category><![CDATA[好文收藏]]></category>
		<category><![CDATA[快照snapshot]]></category>
		<category><![CDATA[重复数据删除]]></category>
		<category><![CDATA[NetApp]]></category>

		<guid isPermaLink="false">http://www.sansky.net/article/2008-05-07-netapp-a-sis%e9%87%8d%e5%a4%8d%e6%95%b0%e6%8d%ae%e5%88%a0%e9%99%a4%e6%8a%80%e6%9c%af%e8%bd%ac.html</guid>
		<description><![CDATA[大家都知道，存储系统的容量正在以惊人的速度增长。在过去的 10 年里，NetApp 提供的存储系统容量从数十 GB 发展到数百 TB，足足翻了 10,000 倍！但是，多数企业发现它们对存储的需求甚至增长得更快，&#8211; 除了存储所有这些数据的磁盘或磁带的成本外，&#8211; 数据中心空间和电源也变得越来越昂贵。... ]]></description>
			<content:encoded><![CDATA[<p>大家都知道，存储系统的容量正在以惊人的速度增长。在过去的 10 年里，<a href="http://www.sansky.net/article/tag/netapp" class="st_tag internal_tag" rel="tag" title="标签 NetApp 下的日志">NetApp</a> 提供的存储系统容量从数十 GB 发展到数百 TB，足足翻了 10,000 倍！但是，多数企业发现它们对存储的需求甚至增长得更快，&#8211; 除了存储所有这些数据的磁盘或磁带的成本外，&#8211; 数据中心空间和电源也变得越来越昂贵。因此，它们的重要目标之一就是尽可能高效地使用存储。</p>
<p>从存储数百个 Snapshot 副本仅需极少磁盘空间的独特的 Snapshot™ 技术，到允许系统管理员在运行时扩展和设定卷的 FlexVol®技术，NetApp 一直是高效利用存储的行业先锋.</p>
<p>五月份，NetApp 宣布了一种新的重复数据删除技术，能够大大提高指定磁盘空间可存储的数据量：高级单实例存储 (A-SIS) <a href="http://www.sansky.net/article/tag/de-duplication" class="st_tag internal_tag" rel="tag" title="标签 重复数据删除 下的日志">重复数据删除</a>。NetApp NearStore® R200 和 NearStore on FAS 系统均可使用该技术（免费！）</p>
<p>重复数据删除能以单个共享数据块为参考寻找相同的数据块并将其替换，从而提高效率。相同的数据块可能属于多个不同的文件或 LUN，或者可能重复出现在同一个文件中。A-SIS 重复数据删除是 NetApp <a href="http://www.sansky.net/article/tag/wafl" class="st_tag internal_tag" rel="tag" title="标签 WAFL 下的日志">WAFL</a> 文件系统不可或缺的一部分，该系统管理 NetApp FAS 系统上所有存储。因此，不管您运行何种应用程序或如何访问数据，重复数据删除都在”后台”运行，并且开销很低。至于用户能节约多少空间，则取决于数据集和它所包含的重复数据删除量。</p>
<p><strong>A-SIS 重复数据删除如何运作</strong></p>
<p>实质上，A-SIS 重复数据删除采用老式的计算机科学技术-参考计算。以前，WAFL 仅跟踪数据块是否在使用。借助 A-SIS 重复数据删除，它还能跟踪有多少在使用。在目前的实施中，不同文件或同一文件中的单个 WAFL 块可参考多达 256 次。文件并不”知道”它们之间在共享数据-WAFL 内的簿记会在后台管理这些细节。</p>
<p>WAFL 如何确定哪两块可以共享？答案是 WAFL 会为每块计算出”指纹”，这是块数据的哈希。具有相同指纹的两个块即可用于共享。</p>
<p>在卷上启用 A-SIS 重复数据删除后，它会为备份卷中所有正在使用的块计算出一个指纹数据库（此过程称为”收集”）。完成初步设置后，卷即可用于重复数据删除。</p>
<p>为了不减缓普通文件操作，副本搜索将作为一个单独的批次处理来完成。由于文件系统会在正常使用过程中进行更新，WAFL 将创建描述其数据块更改的日志。该日志不断累积，直到出现以下某种情况：</p>
<p> 管理员发布 sis start 命令<br /> sis config 计划中指定的下一次发生<br /> 日志更改超出了预定的阈值</p>
<p>这些事件中的任何一件都会触发重复数据删除过程。启动重复数据删除过程后，A-SIS 会使用变更块的指纹作为密钥来给日志排序，然后将排好序的列表与指纹数据库文件合并。一旦两个列表中出现相同的指纹，则可能有两个相同的块可折叠成一个。这种情况下，WAFL 会弃用其中一个块，并用另一个块的参考将其替换。因为文件系统时刻在变，除非两个块确实仍在使用并且含有相同的数据，否则我们当然可采取这一步骤。</p>
<p>A-SIS 重复数据删除实施利用了 WAFL 的某些特殊功能，从而使重复数据删除的成本降到最小。NetApp 很早以前就发现，要确保存储在磁盘上的数据的完整性，应该采用皮带与吊带式 (belt-and-suspenders) 方法。（事实上，最好有几双吊带。）因此，磁盘上的每个数据块都通过校验和得到保护。</p>
<p>A-SIS 使用该校验和作为它的指纹。由于无论如何都会计算指纹，相当于”无消耗”，因此不会给系统增加任何负担。且由于 WAFL 绝对不会覆盖正在使用的数据块，因此在闲置数据块之前，”指纹”将保持有效。A-SIS 重复数据删除与 WAFL 的紧密集成也意味着更改日志是一种高效的操作。其结果是 A-SIS 重复数据删除可用于广泛的工作负荷，而不仅是用于备份，其它重复数据删除实施的情况也是如此。</p>
<p><strong>哪些类型的环境较使用适合 A-SIS？</strong></p>
<p>首先，您的数据应是使用了很长时间。如果您想马上更改数据，则努力寻找重复数据意义不大。系统还应具有 CPU 剩余空间。更改日志和指纹匹配是为效率而设计的，但都要耗用 CPU。如果您的系统长时间处于高 CPU 利用率，则重复数据删除带来的额外负载将是致命一击。</p>
<p><strong>节约磁盘空间的其它方法</strong></p>
<p>NetApp 提供了许多其它可更加高效地使用磁盘空间的方法，它们各具优缺点。不必仅选择一个；因为它们大部分都可以结合使用。</p>
<p><span style="COLOR: #0000ff">Snapshot 副本</span></p>
<p>从一开始，WAFL 就允许通过 Snapshot 技术共享数据块。由于文件会随时改变，您可使用 Snapshot 副本捕获该文件的多个版本，并且存储成本仅与版本之间的更改量相对应。</p>
<p>无论作为本身的功能，还是作为诸如 SnapVault[R] 和 <a href="http://www.sansky.net/article/tag/snapmirror" class="st_tag internal_tag" rel="tag" title="标签 snapmirror 下的日志">SnapMirror</a>[R] 之类的应用程序的基础，Snapshot 副本都已证明了其价值。在 WAFL 中，就性能而言它们没有问题。它们的主要限制是它们只能在同一文件的不同版本之间提供块共享，这与在不同文件之间共享重复块的 A-SIS 不一样。</p>
<p>有时，如果您未使用过 NetApp 存储，您会发现 Snapshot 副本的 NetApp”纯增量”方法在所有主要的存储供应商中独树一帜，并且是我们的 SnapVault 和 SnapMirror 产品背后的基本技术，也是它们成功的主要原因。</p>
<p><span style="COLOR: #0000ff">压缩</span></p>
<p>在将数据写入磁盘之前进行压缩是一种节约空间的好方法。很多算法（如 gzip）可将文件压缩到一半或更小，即使没有可供共享的重复数据也能做到。压缩的缺点是它需要耗用大量 CPU 资源。而且，有些类型的数据（如映像）已经过压缩，不能得到这种优势。由于 A-SIS 重复数据删除可将数据的数百份副本压缩成一份，在拥有很多副本的环境中这可能比压缩节约远远更多的空间。</p>
<p>NetApp 目前在 Decru[R] 和 <a href="http://www.sansky.net/article/tag/vtl" class="st_tag internal_tag" rel="tag" title="标签 VTL 下的日志">VTL</a> 产品中提供了压缩功能。</p>
<p><span style="COLOR: #0000ff"><a href="http://www.sansky.net/article/tag/content-addressed-storage" class="st_tag internal_tag" rel="tag" title="标签 内容寻址存储 下的日志">内容寻址存储</a> (<a href="http://www.sansky.net/article/tag/cas" class="st_tag internal_tag" rel="tag" title="标签 CAS 下的日志">CAS</a>)</span></p>
<p>尽管内容寻址存储的实施方法常常很不一样，但它在概念上与 A-SIS 重复数据删除相似。数据的”斑点”经过哈希处理后，哈希值将用于对其进行识别。对于指定哈希值的数据只会存储一个副本。一个文件可能包含许多斑点。</p>
<p>从某种意义上说，CAS 比 A-SIS 重复数据删除更灵活，因为 CAS 斑点不必是整个文件系统块。但是，在某个很重要的方面，CAS 却不够灵活。借助 A-SIS 重复删除功能，WAFL 可使用指纹作为密钥来共享块，但其基本数据结构仍然不变并且该共享是隐蔽的。（当然，您可随时关闭 A-SIS 重复数据删除功能。） 反之，在大多数 CAS 实施中，始终是通过哈希值来找到斑点。这就使它很难获得较高的性能，因此 CAS 通常是用于大部分为写入操作的归档应用程序，而不是需要对电子发现和数据恢复等即时读取作出快速反应的应用程序。</p>
<p>CAS 有一个方面有时会引起争议，即如果两个斑点具有相同的哈希密钥，则将其视为相同。如果两个不同的斑点碰巧具有相同的哈希值，那么数据就会丢失。这叫做”哈希冲突”或”误判”。有些统计数据可以很好地说明这种情形极不可能出现，但许多人还是不以为然。A-SIS 重复数据删除因此采取了一种保守的方法，只有块的内容（不单单是指纹）相同时才会共享块。在删除作为副本的块之前，A-SIS 逐个字节进行了比较以确保该数据确实相同。</p>
<p><strong>总结</strong></p>
<p>A-SIS 重复数据删除利用 WAFL 的独有特征来节省磁盘空间，同时保持较低系统开销。在许多环境中，可以大量地节约空间。即使在主目录环境等主存储应用程序中，A-SIS 重复数据删除也经常可以节约大量空间。</p>
<p>比如借助 NetApp Snapshot 技术，A-SIS 重复数据删除机制一定会为将来开发新颖的新应用程序（如克隆文件）奠定基础。WAFL 的持续演进是一个令人兴奋的发展过程。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.sansky.net/article/2008-05-07-netapp-a-sis-remove-duplication-of-data-technology-to.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>重复数据删除与虚拟容灾相得益彰[转]</title>
		<link>http://www.sansky.net/article/2008-05-07-duplication-of-data-and-delete-virtual-disaster-complement-each-other-to.html</link>
		<comments>http://www.sansky.net/article/2008-05-07-duplication-of-data-and-delete-virtual-disaster-complement-each-other-to.html#comments</comments>
		<pubDate>Wed, 07 May 2008 12:44:40 +0000</pubDate>
		<dc:creator>sansky</dc:creator>
				<category><![CDATA[好文收藏]]></category>
		<category><![CDATA[容灾]]></category>
		<category><![CDATA[内容寻址存储]]></category>
		<category><![CDATA[CAS]]></category>
		<category><![CDATA[重复数据删除]]></category>
		<category><![CDATA[虚拟化]]></category>
		<category><![CDATA[snapmirror]]></category>
		<category><![CDATA[VMware]]></category>
		<category><![CDATA[WAFL]]></category>

		<guid isPermaLink="false">http://www.sansky.net/article/2008-05-07-%e9%87%8d%e5%a4%8d%e6%95%b0%e6%8d%ae%e5%88%a0%e9%99%a4%e4%b8%8e%e8%99%9a%e6%8b%9f%e5%ae%b9%e7%81%be%e7%9b%b8%e5%be%97%e7%9b%8a%e5%bd%b0%e8%bd%ac.html</guid>
		<description><![CDATA[从物理服务器转变为整合的虚拟化基础设施具有不可否认的 IT 优势。但是，快速迁移到 VMware 使灾难恢复 (DR) 的传统方法过时了，也增加了 DR 实施的复杂性。 用于 VMware® Virtual Infrastructure 3 (VI3) 的 DR 要求您的所有 VM（虚拟机）都需要定期复制到远程站点，从而消耗了大量的存储和网络带宽。通过在 VMw... ]]></description>
			<content:encoded><![CDATA[<p>从物理服务器转变为整合的虚拟化基础设施具有不可否认的 IT 优势。但是，快速迁移到 <a href="http://www.sansky.net/article/tag/vmware" class="st_tag internal_tag" rel="tag" title="标签 VMware 下的日志">VMware</a> 使灾难恢复 (DR) 的传统方法过时了，也增加了 DR 实施的复杂性。</p>
<p>用于 VMware® Virtual Infrastructure 3 (VI3) 的 DR 要求您的所有 VM（虚拟机）都需要定期复制到远程站点，从而消耗了大量的存储和网络带宽。通过在 VMware 主存储系统上使用 <a href="http://www.sansky.net/article/tag/netapp" class="st_tag internal_tag" rel="tag" title="标签 NetApp 下的日志">NetApp</a> <a href="http://www.sansky.net/article/tag/de-duplication" class="st_tag internal_tag" rel="tag" title="标签 重复数据删除 下的日志">重复数据删除</a>，可以大大减少您的主存储环境中的数据量。数据量的减少会使得您的下游基础设施的优势不断加强，从而减少复制所需的带宽以及 DR 站点上所需的存储。</p>
<p>使用重复数据删除所节约的成本可以使 DR 在成本可能会受到控制的情况下变得切实可行。例如，有个客户曾报告在重复删除其 VMware Virtual Desktop Infrastructure (VDI) 环境之后，为其桌面提供 DR 所需的存储和带宽变得很少了，并且为其 VDI 环境和 VI3 环境添加 DR 切实可行。</p>
<p>在本文中，我将探讨通过 VMware DR 实施重复数据删除所需要采取的措施。我还将讨论利用您的 DR 环境中的复制数据用于 DR 测试及其它目的的情况。</p>
<p><strong>在主 VMware 环境中实施重复数据删除</strong></p>
<p>由于 VMware 环境中的每个虚拟机都要求为其操作系统采用专用的存储，因此会出现大量的重复数据。您可能有很多 VM 安装了同一个操作系统和应用程序。</p>
<p>如果 100 个 VM 运行同一个操作系统，且每个虚拟机需要 10GB 至 20GB 的存储空间，即 1TB 至 2TB 的存储空间专用于同一数据的几乎相同的拷贝。应用 NetApp 重复数据删除可以有效消除此冗余。</p>
<p>概括地说，如果将 X 个虚拟机指定给一个存储卷，在重复数据删除后，您所需的操作系统存储空间量将是非重复数据删除环境下所需存储空间量的 1/X。很显然，所获得的实际结果将取决于卷中有多少个 VM 和这些 VM 相似程度。</p>
<p>实际上，客户在 ESX VI3 环境通常可以节省 50% 或更多的空间，某些情况下存储空间节省可高达 90%。这是对整个 VMware 存储环境（包括应用程序数据，而不仅仅是操作系统）进行重复数据删除。在 VDI 环境下，客户通常可节省高达 90% 的存储空间。</p>
<p>NetApp 重复数据删除的另一个优点是它不仅可以在主存储设备上运行，还可以在任何现有的 NetApp 卷上运行。即使您的 VMware 基础设施建设很完善，也可以运行重复数据删除并节省大量存储空间。只需提供重复数据删除许可证（免费）和目标存储系统上的 NearStore® 许可证即可进行操作。</p>
<p><strong>灾难恢复配置</strong></p>
<p>虽然主存储环境中的存储空间使用量得到减少本身已经是一个重大益处，但是在使用 NetApp <a href="http://www.sansky.net/article/tag/snapmirror" class="st_tag internal_tag" rel="tag" title="标签 snapmirror 下的日志">SnapMirror</a>® 实施灾难恢复时，从重复数据删除中获得的真正收益更加明显。因为重复数据删除大大减少了必须复制的数据量，从而减少了 DR 位置所需的空间和站点间所需的网络带宽。进行重复数据删除以后，您也许可以配置 DR 以尽可能低的速度进行链接，将更容易和更快速地让您的 DR 环境维持运转。</p>
<p style="TEXT-ALIGN: center"><img width="400" height="256" src="http://image.it168.com/cms/2008-4-18/Image/2008418141117.jpg"/></p>
<p style="TEXT-ALIGN: center">图 1) 在具有 DR 复制的 VMware 环境应用重复数据删除。</p>
<p>如要配置 DR，首先请在存储数据的主 VMware 存储环境中对所有卷执行重复数据删除。然后在 DR 站点的主卷和目标卷之间创建 SnapMirror 关系。</p>
<p>与许多其他复制解决方案不同，SnapMirror 不要求目标配置与源配置完全一样。如果需要，您可以在 DR 站点中使用不同的 NetApp 存储系统和价格较低的磁盘（如 SATA 磁盘，而不是光纤通道磁盘）。</p>
<p>当 SnapMirror 第一次运行时，它会将每个源卷与其目标卷同步。此过程通常是 SnapMirror 实施时最耗带宽的部分，但是因为源卷都已执行重复数据删除，因此要传输的数据量会比实际量少很多。此方法是以下用户的理想之选：链接速度慢、没有足够带宽执行初始同步但可以管理此后出现的增量更新。</p>
<p>请注意，因为重复数据删除在卷级起作用，所以您必须使用 Volume SnapMirror 来获得最大收益。Volume SnapMirror 在整个卷上执行，因此您的镜像始终与源卷有相同的重复数据删除级别，还可节省空间、减少带宽利用以及加速镜像更新过程。</p>
<p>一旦完成初始同步，您就可以配置 SnapMirror 按计划运行，让 DR 站点内容始终保持最新。在每次迭代时，SnapMirror 仅传送已更改的数据块，因此它能更有效地利用网络带宽。您将需要在主站点定期运行重复数据删除。根据您的特定需求，可在以下时间运行重复数据删除：</p>
<p> 按指定的时间表<br /> 卷中有 20% 的新数据时自动运行<br /> 在需要时手动运行（例如，在安装大的修补程序以后）</p>
<p>使用 SnapMirror 后，无论主卷上有什么更改，都会自动反映到辅助卷上，因此不需要在您的 DR 站点运行重复数据删除。由于辅助卷是镜像，它们从主卷”继承”重复数据删除状态。</p>
<p><strong>利用 DR 环境</strong></p>
<p>获得 DR 站点的所有数据并通过 SnapMirror 定期更新后，并不意味着事情到此结束。NetApp 还可以利用 DR 站点存储的数据进行 DR 测试、开发或各种其他用途。</p>
<p style="TEXT-ALIGN: center"><img width="350" height="266" src="http://image.it168.com/cms/2008-4-18/Image/2008418141156.jpg"/></p>
<p style="TEXT-ALIGN: center">图 2) 在 DR 站点利用 FlexClone® 可将复制的数据用于多种用途。</p>
<p>在典型的 DR 测试环境中，在测试开始前必须将用于测试的所有数据复制到另一组磁盘。这意味着您需要两倍的存储空间，并且在开始测试前的复制操作也很耗时间。</p>
<p>借助 NetApp FlexClone 技术，您可以使任意或所有 DR 卷都成为具有空间效益的可写克隆；只在更改克隆卷时才会占用额外的空间。这些 FlexClone 卷便于您及时捕捉 DR 数据在固定时间点的静态视图，而不用中断进行中的 SnapMirror 更新，也不需要大容量的额外存储。</p>
<p>使用 FlexClone，您可以将进行 DR 测试的时间从 24 小时或更长时间降到几个小时，这是因为该过程快速、可靠、高效且无需使用密集资源。也可以通过类似方式对应用程序开发工作、数据挖掘、修补程序测试等使用 FlexClone。</p>
<p>DR 站点代表大量的资源投资。借助 FlexClone，您可以利用这些资源执行其他任务，而不会负面影响 DR 就绪。通过简化 DR 测试，FlexClone 使它更容易符合公司规定的 DR 测试需求以确保 DR 就绪。</p>
<p><strong>总结</strong></p>
<p>将 NetApp 重复数据删除应用到主 VMware 存储会在主基础设施和 DR 基础设施中产生巨大收益。在典型环境中，可以将主存储需求减少 40% 至 60%。此节省模式会将 DR 站点所需的存储以及 DR 所需的带宽减少相应的数量，使 DR 速度更快、更有效率。您可以使用 NetApp FlexClone 来利用 DR 站点的数据进行 DR 测试、应用程序测试/开发或其他活动，以便最大化资源利用。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.sansky.net/article/2008-05-07-duplication-of-data-and-delete-virtual-disaster-complement-each-other-to.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>网格式 重复数据删除备份系统</title>
		<link>http://www.sansky.net/article/2008-05-03-net-remove-duplication-of-data-backup-system.html</link>
		<comments>http://www.sansky.net/article/2008-05-03-net-remove-duplication-of-data-backup-system.html#comments</comments>
		<pubDate>Sat, 03 May 2008 07:09:12 +0000</pubDate>
		<dc:creator>sansky</dc:creator>
				<category><![CDATA[存储产品]]></category>
		<category><![CDATA[备份]]></category>
		<category><![CDATA[重复数据删除]]></category>
		<category><![CDATA[GRID]]></category>

		<guid isPermaLink="false">http://www.sansky.net/article/2008-05-03-%e7%bd%91%e6%a0%bc%e5%bc%8f-%e9%87%8d%e5%a4%8d%e6%95%b0%e6%8d%ae%e5%88%a0%e9%99%a4%e5%a4%87%e4%bb%bd%e7%b3%bb%e7%bb%9f.html</guid>
		<description><![CDATA[ExaGrid® Systems, Inc. (http://www.exagrid.com), the leader in cost-effective and scalable disk-based backup solutions with byte-level data de-duplication, today announced the industry&#8217;s first 30TB disk-based backup system with data de-duplication and a scalable GRID architecture. This product enhancement allows customers to &#8230; <a href="http://www.sansky.net/article/2008-05-03-net-rem... ]]></description>
			<content:encoded><![CDATA[<p>ExaGrid® Systems, Inc. (<a href="http://www.exagrid.com">http://www.exagrid.com</a>), the leader in cost-effective and scalable disk-based backup solutions with byte-level data de-duplication, today announced the industry&#8217;s first 30TB disk-based backup system with data de-duplication and a scalable <a href="http://www.sansky.net/article/tag/grid" class="st_tag internal_tag" rel="tag" title="标签 GRID 下的日志">GRID</a> architecture. This product enhancement allows customers to store a 30TB full backup, plus weeks or months of retention, in a single <a href="http://www.sansky.net/article/tag/grid" class="st_tag internal_tag" rel="tag" title="标签 GRID 下的日志">GRID</a> system. The expanded 30TB capacity will be available for both ExaGrid&#8217;s EX series servers with internal storage, as well as the ExaGrid <a href="http://www.sansky.net/article/tag/iscsi" class="st_tag internal_tag" rel="tag" title="标签 ISCSI 下的日志">iSCSI</a> Gateway for Dell® EqualLogic™ PS Series storage arrays.</p>
<p>In addition to expanded backup capacity, ExaGrid provides best-in-class backup performance by writing to disk at full disk speed (post-processing) and by adding complete servers in a GRID for system expansion, instead of just more disk capacity. This scalable GRID-based approach maintains fast backup performance even as data grows. ExaGrid is also uniquely fast for restore performance as it stores the most recent backup in its complete, non-de-duplicated form ready for rapid restoration or tape copies.</p>
<p>The latest version of the ExaGrid Disk-based Backup system includes the following important enhancements and customer benefits:</p>
<p><strong>Scalable Virtualized GRID Architecture:</strong></p>
<ol>
<li>Store a 30TB full backup, plus retention of backup history, in a single GRID system (up to six 5TB ExaGrid servers in a virtualized GRID system).</li>
<li>Plug-and-play growth-new systems virtualize together automatically. No splitting data or losing de-duplication efficiency across separate systems.</li>
<li>Fully configured ExaGrid installations are managed via a single Web UI, accessed with one login, unlike other solutions that require logging into and managing multiple separate devices.</li>
<li>Performance scales with data growth since processing power and memory are added along with storage capacity.<br />
Automatic load balancing across all servers in the GRID.<br />
Multiple 30TB GRID systems can be installed for increased capacity.</li>
</ol>
<p><strong>Highest Performance for Shortest Backup Window and Fastest Data Restoration:</strong></p>
<ol>
<li>Fastest backup performance due to post-process de-duplication. Write directly to disk without any processing on the fly to slow down backups. (Backup throughput: up to 4TB/hour).</li>
<li>Fastest restore and tape copy performance with byte-level data de-duplication which keeps the most recent backup in its whole form, unlike other solutions which require re-assembly from small blocks and large hash tables. (Restore throughput: up to 2.6TB/hour).</li>
</ol>
<p><strong>Most Cost-Effective and Flexible Solution:</strong></p>
<ol>
<li>Granular sizing options “right size” to specific customer backup data requirements, today and in the future.</li>
<li>Five EX Series server configurations with internal storage hold full backups of 1TB, 2TB, 3TB, 4TB or 5TB, plus retention. Servers can be combined, with up to six servers in a single GRID (5TB EX Series servers x 6 = 30TB ExaGrid GRID system).</li>
<li>No need to over buy storage capacity upfront. Systems can be easily combined in a virtualized GRID for larger capacities as needed.</li>
</ol>
<p><strong>Support for Leading Backup Applications:</strong></p>
<ol>
<li>CA ARCserve®</li>
<li>CommVault® Galaxy</li>
<li>Symantec Backup Exec™</li>
<li>Symantec NetBackup™</li>
<li>EMC Networker®</li>
<li>Microsoft® SQL Dump</li>
<li><a href="http://www.sansky.net/article/tag/vmware" class="st_tag internal_tag" rel="tag" title="标签 VMware 下的日志">VMware</a>® Backup (VMDK)</li>
<li>Energy and Rack Space Efficient Operation:</li>
</ol>
<p>Customers can store many times more backup data in the same space for substantial savings in power, cooling and space requirements versus standard disk.</p>
<p>“We hear over and over again that completing ever larger backups in a short backup window is a primary customer concern,” said Bill Andrews, president and CEO, ExaGrid Systems, Inc. “This latest product enhancement allows customers to achieve the shortest backup window possible with our post-processing data de-duplication, but also to maintain that short backup window as their data grows by leveraging our scalable GRID architecture. This approach also allows customers the flexibility to buy only what they need, when they need it, as additional servers can be added into the GRID at any time.</p>
<p>The strength of our scalable GRID architecture is that you can grow the system as your data grows and performance does not degrade. Each server brings additional memory, processor and bandwidth resources, along with storage capacity.”</p>
]]></content:encoded>
			<wfw:commentRss>http://www.sansky.net/article/2008-05-03-net-remove-duplication-of-data-backup-system.html/feed</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>企业数据信息安全解决方案</title>
		<link>http://www.sansky.net/article/2007-09-04-data-protection.html</link>
		<comments>http://www.sansky.net/article/2007-09-04-data-protection.html#comments</comments>
		<pubDate>Tue, 04 Sep 2007 03:38:51 +0000</pubDate>
		<dc:creator>sansky</dc:creator>
				<category><![CDATA[好文收藏]]></category>
		<category><![CDATA[备份]]></category>
		<category><![CDATA[CDP]]></category>
		<category><![CDATA[解决方案]]></category>
		<category><![CDATA[重复数据删除]]></category>
		<category><![CDATA[虚拟化]]></category>
		<category><![CDATA[VMware]]></category>
		<category><![CDATA[数据安全]]></category>

		<guid isPermaLink="false">http://www.sansky.net/html/2007-09-04-1344.html</guid>
		<description><![CDATA[转载地址：http://www.chy123.com/Case.asp?id=267 随着全球信息化及宽带网络建设的飞速发展，具有跨区域远程办公及内部信息平台远程共享的企业越来越多，并且这种企业运营模式也逐渐成为现代企业的主流需求。企业总部和各地的分公司、办事处以及出差的员工需要实时地进行信息传输和资源共享等，企业... ]]></description>
			<content:encoded><![CDATA[<p>转载地址：<a href="http://www.chy123.com/Case.asp?id=267">http://www.chy123.com/Case.asp?id=267</a></p>
<p>随着全球信息化及宽带网络建设的飞速发展，具有跨区域远程办公及内部信息平台远程共享的企业越来越多，并且这种企业运营模式也逐渐成为现代企业的主流需求。企业总部和各地的分公司、办事处以及出差的员工需要实时地进行信息传输和资源共享等，企业之间的业务来往越来越多地依赖于网络。但是由于互联网的开放性和通信协议原始设计的局限性影响，所有信息采用明文传输，导致互联网的安全性问题日益严重，非法访问、网络攻击、信息窃取等频频发生，给公司的正常运行带来安全隐患，甚至造成不可估量的损失。因此必须利用信息安全技术来确保网络的安全问题，这就使得网络安全成了企业信息化建设中一个永恒的话题。<span id="more-1344"></span></p>
<p>目前企业信息化的安全威胁主要来自以下几个方面：一是来自网络攻击的威胁，会造成我们的服务器或者工作站瘫痪。二是来自信息窃取的威胁，造成我们的商业机密泄漏，内部服务器被非法访问，破坏传输信息的完整性或者被直接假冒。三是来自公共网络中计算机病毒的威胁，造成服务器或者工作站被计算机病毒感染，而使系统崩溃或陷入瘫痪，甚至造成网络瘫痪。如前段时间在互联网上流行的”熊猫烧香”、”灰鸽子”等病毒就造成了这样的后果。网络不是一个安全的”阳光乐土”，那么如何来保障我们的网络安全，为企业的商务运作保驾护航呢？</p>
<p>本期针对企业面临的几个主要威胁来源，推荐一些安全解决方案产品。</p>
<p>网络数据保护解决方案</p>
<p>创新科 <a target="_blank" href="http://www.sansky.net/html/2007-09-01-1327.html" title="UIT WebDisk网络硬盘解决方案">UIT WebDisk网络硬盘解决方案</a></p>
<p>存储虚拟化已成为了网络存储领域的热门话题，是推动网络存储发展的催化剂。网络存储可以有效提高存储资源利用率。在过去的10年中，商业的模式发生了重大的改变。其中，基于因特网的商业模式的爆炸性增长给信息的获取和存储技术带来了新的挑战。因此，发展一种具有高效益、易管理的先进存储方式就成为必然。</p>
<p>UIT WebDISK存储解决方案是一款基于网络的文件管理和信息存储、适用于个人用户和企业用户的解决方案。WebDISK采用UIT先进的存储架构，可以管理超大容量的存储空间；提供持续的、高带宽、高适用、自动负载均衡的网络存储；WebDISK采用多用户分布式虚拟文件系统，为用户提供优秀的网络文件管理服务；WebDISK采用J2EE技术架构，通过JDBC和数据库连接池访问数据库，满足大量访问需求；MVC方式的三层结构设计，保证系统灵活高效；多处采用缓存技术，满足系统整体性能。</p>
<p>UIT WebDISK方案中采用UIT BA880系列NAS存储系统，为从部门级到企业级数据中心的不同机构提供PB级的存储。能够提供持续的、高带宽的性能，灵活简单的部署，帮助企业对数据进行有效的管理和应用。BA880采用专用的文件操作系统，实现了全局统一命名、自动负载均衡、高可用群集的网格化存储架构。在不影响业务运行的情况下，能够进行磁盘容量和控制器扩展，来提高业务的灵活性并降低成本。</p>
<p>网络防范解决方案</p>
<p>Fortinet FortiGate 3000防火墙系列</p>
<p>随着网络罪犯的混合威胁攻击日益泛滥，以及Web 2.0、VoIP和IPTV等应用正逐步占用大量带宽，企业和服务提供商需要更高性能的安全产品来满足其当前和未来的需求。由于很少有安全厂商能够应对这一挑战，所以部分客户不得不在其下一代网络的安全和性能之间做出选择。下一代网络和带宽密集型应用正在改变着个人和企业使用互联网的方式，而且对安全和性能提出了更高的要求。</p>
<p>统一威胁管理(UTM)解决方案的提供商Fortinet公司的FortiGate3000多重威胁安全产品系列具有高度的可扩展性，非常适合网络核心和数据中心部署，可满足企业对灵活、可扩展性能解决方案的需求。它具备模块化的高级夹层卡(AMC)扩展选项，能够提供硬件加速万兆XFP接口以及千兆SFP接口和硬盘存储选项。AMC技术规范是一个开放式的标准，由PIC工业计算机制造商协会(PICMG)开发，能够满足下一代运营商级硬件需求。</p>
<p>该系列中FortiGate 3810A和FortiGate 3016B产品整合了Fortinet公司现有的FortiASIC-CP6内容处理器和新的FortiASIC-NP2网络处理器。FortiASIC-NP2网络处理器使单台设备的防火墙吞吐量高达26Gbps，而最新的同类竞争产品所提供的防火墙吞吐量仅为7Gbps。此外，所有FortiGate 3000系列平台均硬件加速千兆以太网接口，实现了线速防火墙和近线速VPN性能，保证VoIP和IPTV等时间敏感型应用不会遭受网络延时或抖动的影响。</p>
<p>凹凸科技SifoWorks包过滤防火墙</p>
<p>网络的发展日新月异，新技术的应用同时也带来了更多的网络安全问题。目前，网络病毒及来自内部网络的攻击成为新的安全威胁，如何有效地防御这些攻击已成为很多网络安全人员需要认真思考的问题。</p>
<p>凹凸科技互联网安全网关系列产品SifoWorks(包过滤防火墙)是通过ICSA实验室IPSec产品1.0D标准认证的产品。它捆绑了IPSec VPN的包过滤防火墙，基于凹凸科技自主研发并获得专利的ASIC芯片，在全负载下能够达到线速，并实现高性能安全功能。SifoWorks包含全面的安全应用并实现最短延时，其中包括深度内容检测及过滤、URL拦截、语音电话技术VoIP H.323拦截，非常适合各行业中高端客户应用。SifoView采用Client-Server构架，通过图形化的使用界面，集中管理企业中所有的网络设备，进行Policy的部署与性能的监控。IT人员能依照不同的角色设定不同的管理权限，让整个网络能在完整的分工制度下，获得良好的控制。SifoView克服了传统的VPN防火墙容易出错的策略部署方式，提供IT管理员一个简易、集中的管理能力。</p>
<p>作为一款全线速多功能的安全网关系统，它不仅具备良好的数据包处理能力，还提供多项高性能的安全防御措施，如防火墙、IPSec VPN、内容检测过滤等，适用于各类型企业用户。SifoWorks系统拥有最佳的整体性价比，同时具有严密的高安全等级，其独特创新的系统架构、安全灵活的深度内容检测，以及多项高级的防护功能，可为不同用户整合并提供安全可靠的网络平台。</p>
<p>Check Point UTM-1统一威胁管理解决方案</p>
<p>目前企业对安全保护的要求日益提高，一方面要求对连接性、设备可用度、性能表现、成本及管理工作影响最低，另一方面却要求安全保护能全面覆盖操作系统、网络及数据安全。由于涉及面广，只有专注在安全领域的厂商才能胜任。此外，为了协助IT管理人员把安全工作做好，一个统一管理安全平台是非常必要的。</p>
<p>Check Point UTM-1的全新统一威胁管理(UTM)设备系列，专门为大中型企业的地区办事处提供全方位、多层次的安全保护，抵御间谍软件、病毒、网络攻击等互联网威胁。UTM-1系列的部署方法十分简便，它支持集中化控制功能，减少了多地点管理的安全保护的复杂性。UTM-1系列具备stateful-inspection 防火墙、IPSec VPN、网关防病毒、防间谍软件及入侵防御等安全功能，可以抵御各种传统的威胁，此外，它也配备了一个新型的Web 应用防火墙，用于保护Web服务器。UTM-1系列也为VoIP、即时消息传送及对等网络提供安全保护。</p>
<p>UTM-1系列拥有整合Check Point SmartCenter管理功能，不需采用额外硬件或软件便能提供集中化、内置安全管理。通过使用整合SSL VPN技术，为远程工作人员提供安全连接，同时通过全面监控及报告功能，使得IT系统管理人员对其网络设施的情况了如指掌。充分发挥统一安全体系结构的优点，部署在企业分支办公地点的UTM-1设备能无缝地插入现有的Check Point环境，并在整个企业高效、平稳地运作。通过使用UTM-1设备，客户将可以升级使用各种新技术，例如基于网关的防垃圾邮件功能、Web 过滤等。Check Point UTM-1既可以单独使用，也可以作为大型网络环境的一部分，对单个地点进行管理或远程管理。</p>
<p>Juniper UAC统一接入解决方案</p>
<p>企业网络日益复杂和广泛，许多员工、合作伙伴和合同商要求通过网络端点访问企业的关键业务信息，他们的网络端点却可能存在管理混乱的现象。网络接入控制(NAC)成为企业安全流程的关键。随着接入控制市场的发展、NAC实施规模和范围的扩大，企业需要的解决方案能使他们充分利用现有网络和安全基础设施投资，并能够无缝兼容异构IT环境。</p>
<p><a target="_blank" href="http://cn.juniper.net/" title="Juniper网络公司">Juniper网络公司</a>的UAC解决方案，在整个网络上实时执行动态策略管理，将用户身份、端点完整性及定位信息与接入控制捆绑起来，帮助企业解决了平衡接入和安全控制的问题。UAC解决方案包含多个组件，包括Infranet控制器(集中化的策略管理器)、UAC代理器(可动态下载的端点软件)、以及各种策略执行点，这些策略执行点包括Juniper网络公司的防火墙和所有802.1X交换机或无线接入点。在UAC 2.0解决方案中，Infranet控制器和UAC代理器包含了Funk软件公司(2005年被Juniper公司收购)的集成功能，包括Odyssey Access Client(OAC)802.1X客户端程序和Steel-Belted Radius(SBR)。从运行开始到分配IP地址之前，UAC提供动态的接入控制和细致的资源级控制。UAC解决方案选项灵活，使企业能够即时支持有线/无线园区、数据中心和分支机构等接入控制。企业可以选择使用防火墙、全面内容安全和入侵检测功能，来保护重要的局域网资产，同时利用该解决方案来支持第二层上的802.1X执行。</p>
<p>此外，客户也可以立即运行已经支持现有802.1X 标准基础设施的UAC解决方案，利用分层叠加部署的方式来提供更加细致的随时接入。客户可以无缝增加其配置，而无须重新配置新的UAC代理器或新的控制器。</p>
<p>网络性能优化解决方案</p>
<p>BlueCoat SG Client广域网优化解决方案</p>
<p>对于地域分布较广的企业，整合企业所有信息和数据的需求非常迫切，很多企业通过建立一个数据中心来解决这个问题。但是随着地理距离不断增加，业务应用程序和基本协议造成延迟，远程办公室的员工及移动终端用户无法访问数据。另外，企业的很多业务也依赖于内部网络应用程序”随时随地”的接入和数据访问。</p>
<p>Blue Coat SG Client采用的架构类似于服务导向架构(简称SOA)，而采用策略导向架构(简称POA)与应用服务器按照终端服务请求提供服务的SOA不同，POA基于终端操作策略提供加速和安全服务。在基于SOA的网络计算中，SG Client不是将服务请求发送到应用服务器，而是将终端操作条件发送到管理中心。支持多种类型终端设备是SG Client POA的主要功能。SG Client 的基础是客户端服务框架，当终端设备连接到企业网络的时候，随选即用服务代理程序给终端用户提供安全和加速功能。</p>
<p>SG Client亦提供CIFS物件快取功能，而且首推版的SG Client支持压缩档的加速功能。在兼容性方面，该客户端软件可整合到企业现有的VPN联机通道，除了PC端的网络优化代理程序之外，该公司将进一步推出针对手持装置的代理工具，同时也可能推出针对Mac作业平台的代理工具。客户端的软件安装十分简单，IT管理人员可透过远端派送工具，进行统一安装作业，或寄发内含安装网页连接的邮件给端点使用者，使用者只要点取连接、进入安装页面，再根据画面提示逐步点选，即可轻松完成安装工作。</p>
<p>Network General NetworkDNA智能架构解决方案</p>
<p>网络和应用性能数据分别保留在多个部门的多个系统中，IT系统的故障对这种管理数据模型形成了挑战，解决复杂问题需要许多IT专业人员对整个系统进行深层分析。为了能快速解决业务问题，企业常常备有至少两个以上的IT管理解决方案，但不能达到预期的效果。</p>
<p>Network General网络智能架构NetworkDNA技术平台，能够使客户访问、管理和共享网络智能，实现实时的IT性能管理。NetworkDNA可以提供网络真实情况的来源，能够使Network General软件解决方案实现信息共享和集中管理。作为网络智能应用的核心技术，NetworkDNA的开放架构能够收集、分类、索引和整合实时IT标准数据，降低IT管理的复杂程度，确保企业服务的一致性。</p>
<p>其配套采用的Network General PMDB数据库可以为实时性能分析、问题解决方案、服务水平报告以及服务保障提供基础支持。PMDB存储丰富的IT性能管理数据，可以由配置管理数据库、其他的数据存储设备和企业级解决方案进行访问。</p>
<p><a href="http://www.sansky.net/article/tag/vmware" class="st_tag internal_tag" rel="tag" title="标签 VMware 下的日志">VMware</a> Infrastructure虚拟化技术解决方案</p>
<p>随着IT技术的广泛普及，计算机成了政府、企业、院校、研究机构等单位重要的应用工具，在我们享受现代技术应用的同时，却不得不面对诸如服务器过剩、资产利用率低、病毒控制、远程访问、灾难恢复等许多问题，这些将使IT建设投入更多的成本。</p>
<p>VMware推出VMware Infrastructure 3是一个完整的基础结构虚拟化产品套件，提供了全面的虚拟化、管理、资源优化、应用程序可用性和操作自动化功能。VMware虚拟化解决方案包含：架构优化方案、业务连续性方案、桌面系统管理、软件生命周期等。VMware虚拟架构完全满足分布式虚拟化、管理和自动化的要求，可以根据业务需要随时扩展容量，并实现始终在线。架构优化方案可以整合服务器，降低运维、机房、供电、冷却成本；业务连续性方案可以降低计划和非计划停机，简化容灾；桌面管理方案主要面向企业和最终用户，改善安全和移动灵活性；软件生命周期自动化可以快速部署服务器，改善软件质量。</p>
<p>通过虚拟架构整合服务器，可以控制x86服务器的蔓延，VMware虚拟基础架构使企业能够通过提高效率、增加灵活性和加快响应速度而降低IT成本。管理一个虚拟基础架构使IT能够快速将资源和业务需求连结起来，并对其进行管理。</p>
<p>VMware的虚拟技术主要包含以下重要特性：该技术能够把正在运行中的虚拟机从一台物理机器上搬移到另一台，而服务不中断；当服务器故障时，自动重新启动虚拟机，没有集群软件的成本高和复杂性；按需自动调配资源，基于预定义的规则智能分配资源，从而动态提高系统管理效率，并且自动化地实现硬件维护；虚拟架构增强了备份和恢复，通过备份很少数量的文件和封装来备份整个虚拟机，恢复虚拟机文件，而且可用共享的存储重启虚拟机。</p>
<p>CA XOsoft数据保护解决方案</p>
<p>当前，越来越多的企业都深刻意识到关键的业务信息和数据是一种重要资产，必须做好数据复制及关键业务的连续数据保护工作，才能确保信息和数据的连续安全可用，保证业务的顺利开展。CA智能化存储管理解决方案引入XOsoft产品，通过向传统的备份和恢复技术(ARCserve Backup)增加持续性数据保护技术CDP和自动应急切换，对业务提供全面的灾难恢复、持续性数据保护，以满足客户的数据复制、应急切换和数据恢复等需要，帮助客户最小化应用宕机时间并加快恢复速度。</p>
<p>CA XOsoft包含五大产品线：WANSync灾难恢复方案、WANSyncHA高可用性方案、Enterprise Rewinder连续数据保护方案、Assured Recovery灾难恢复不间断测试方案和WANSyncCD内容分布与集成方案。CA XOsoft为企业提供持续的业务数据保护，确保关键业务信息的完整性、可靠性和冗余性，提供实时异步数据复制技术满足企业在灾难恢复时的需求。当灾难发生或IT服务异常时，企业最需要不间断的IT服务。通过CDP技术，在数据被破坏时缩短恢复时间，可以实现在复制系统上进行按钮式、手动或全自动的应用程序和数据的测试，提供集中化的远程分支机构备份、内容交付和网上发布，使数据保护更加完整。</p>
<p>与此同时，XOsoft还具有多平台应用特点，支持Windows、Unix和Linux等多种操作系统。此外，CA XOsoft与CA BrightStor ASCserve Backup一起，形成完整的数据保护产品，满足从企业关键数据保护、恢复管理到基础数据备份保护管理的全线需求。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.sansky.net/article/2007-09-04-data-protection.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>UIT WEBDISK网络硬盘技术规格</title>
		<link>http://www.sansky.net/article/2007-09-01-uit-webdisk-parameter.html</link>
		<comments>http://www.sansky.net/article/2007-09-01-uit-webdisk-parameter.html#comments</comments>
		<pubDate>Sat, 01 Sep 2007 03:50:11 +0000</pubDate>
		<dc:creator>sansky</dc:creator>
				<category><![CDATA[存储产品]]></category>
		<category><![CDATA[创新科UIT]]></category>
		<category><![CDATA[解决方案]]></category>
		<category><![CDATA[重复数据删除]]></category>
		<category><![CDATA[数据安全]]></category>

		<guid isPermaLink="false">http://www.sansky.net/html/2007-09-01-1327.html</guid>
		<description><![CDATA[UIT是专业的存储设备及存储解决方案的提供商，其存储相关的产品在金融、电信、银行、证券、广电等行业有着广泛的应用。UIT拥有专业的技术研发和支持团队，可以向用户提供一个全面的存储解决方案。 WebDisk是UIT推出的一款网络形式的文件管理系统，也即网络硬盘。最主要的特点是，用户随时随地... ]]></description>
			<content:encoded><![CDATA[<p>UIT是专业的存储设备及存储解决方案的提供商，其存储相关的产品在金融、电信、银行、证券、广电等行业有着广泛的应用。UIT拥有专业的技术研发和支持团队，可以向用户提供一个全面的存储解决方案。</p>
<p style="text-align: left">WebDisk是UIT推出的一款网络形式的文件管理系统，也即网络硬盘。最主要的特点是，用户随时随地都可以管理他的文件，不管他是在家中、单位或其它任何地方，只要你连接到因特网，就可以管理你存储在远程WebDisk系统上的文件，就如同管理存储在本地的文件一样，甚至还可以和其他人共享他的文件。<span id="more-1327"></span></p>
<p><strong>系统主要功能</strong></p>
<p style="text-align: left">WebDisk的核心是文件传输，策略定制和空间管理，具体请参考WebDisk功能列表，其中主要功能如下表所列：</p>
<p>文件上传、下载。</p>
<p>文件夹上传、下载。</p>
<p>影音文件在线播放。</p>
<p>图片文件在线浏览。</p>
<p>断点续传。</p>
<p>基于策略的自动化传输。</p>
<p>传输任务队列管理。</p>
<p>系统管理。</p>
<p>空间管理。</p>
<p>用户管理。</p>
<p>用户组管理。</p>
<p>基于WEB的访问方式。</p>
<p>基于WEB Folder的访问方式。</p>
<p>基于客户端的访问方式。</p>
<p>系统报警功能</p>
<p>系统报表功能</p>
<p><strong>系统拓扑结构</strong></p>
<p><strong>各服务器的功能</strong></p>
<p style="text-justify: inter-ideograph; margin: 0cm 0cm 0pt 42pt; text-indent: -21pt; line-height: 150%; text-align: justify; tab-stops: list 42.0pt">1. WebDisk应用服务器负责处理WebDisk的业务逻辑，如，上传文件时，它负责将文件转储到存储设备上，并将文件名，文件大小等信息写入数据库服务器。</p>
<p style="text-justify: inter-ideograph; margin: 0cm 0cm 0pt 42pt; text-indent: -21pt; line-height: 150%; text-align: justify; tab-stops: list 42.0pt">2. 数据库服务器存储系统元数据，包括WebDisk系统的用户信息，目录列表，文件列表，文件名，文件大小，上传时间等。</p>
<p style="text-justify: inter-ideograph; margin: 0cm 0cm 0pt 42pt; text-indent: -21pt; line-height: 150%; text-align: justify; tab-stops: list 42.0pt">3. 存储设备上存储所以上传的文件。</p>
<p><strong>WebDisk</strong><strong>应用服务器高可用性(HA)</strong>工作原理</p>
<p style="text-justify: inter-ideograph; margin: 0cm 0cm 0pt 21pt; line-height: 150%; text-align: justify">WebDisk应用服务器可以采用多种”负载均衡”方案：</p>
<p style="text-justify: inter-ideograph; margin: 0cm 0cm 0pt 63pt; text-indent: -21pt; line-height: 150%; text-align: justify; tab-stops: list 63.0pt">1、软件实现：如Windows的NLB、Linux的LVS，特点是成本较低，但性能相对稍差。</p>
<p style="text-justify: inter-ideograph; margin: 0cm 0cm 0pt 63pt; text-indent: -21pt; line-height: 150%; text-align: justify; tab-stops: list 63.0pt">2、硬件实现：如CISCO的CSS11501，特点是性能较好，但成本较高。</p>
<p style="text-justify: inter-ideograph; margin: 0cm 0cm 0pt 63pt; text-indent: -21pt; line-height: 150%; text-align: justify; tab-stops: list 63.0pt">3、UIT负载均衡技术：软件实现，成本较低，采用点对点数据传输方式，性能比以上二种均要好，但对于Internet应用，需要为每个服务器分配一个公网IP。</p>
<p style="text-justify: inter-ideograph; margin: 0cm 0cm 0pt 21pt; line-height: 150%; text-align: justify">UIT负载均衡技术工作原理如下：</p>
<p style="text-justify: inter-ideograph; margin: 0cm 0cm 0pt 42pt; text-indent: -21pt; line-height: 150%; text-align: justify; tab-stops: list 42.0pt">1. 当用户发起一个请求时，DNS服务器根据用户提供的域名，以轮叫（Round Robin）的方式为其分配一个应用服务器IP，使客户端与该应用服务器直接建立通讯连接。</p>
<p style="text-justify: inter-ideograph; margin: 0cm 0cm 0pt 42pt; text-indent: -21pt; line-height: 150%; text-align: justify; tab-stops: list 42.0pt">2. 应用服务器从元数据数据库中获得最新的服务器状态表，并将其中负载最轻的服务器信息返回给客户端。</p>
<p style="text-justify: inter-ideograph; margin: 0cm 0cm 0pt 42pt; text-indent: -21pt; line-height: 150%; text-align: justify; tab-stops: list 42.0pt">3. 客户端与负载最轻的应用服务器建立点对点的联系，并将作业交给的这一应用服务器。</p>
<p><strong>数据库服务器高可用性(HA)</strong>工作原理</p>
<p style="text-justify: inter-ideograph; margin: 0cm 0cm 0pt 42pt; text-indent: -21pt; line-height: 150%; text-align: justify; tab-stops: list 42.0pt">1. 在系统中，数据库的负载并不重，但如果处于高可用性考虑，可以采用”容错”的HA方案，或是Cluster的HA方案。</p>
<p style="text-justify: inter-ideograph; margin: 0cm 0cm 0pt 42pt; text-indent: -21pt; line-height: 150%; text-align: justify; tab-stops: list 42.0pt">2. 容错HA模式下，一台向WebDisk应用服务器提供数据服务，称为主服务器，另一台则处理备用状态，称为备用服务器，它不向WebDisk提供服务。主服务器负责把最新的数据同步到备用服务器中，始终使二台数据库服务器拥有相同的数据。当主服务器出现故障时，必须手工切换到备用数据库服务器，这时备用服务器则升级为主服务器，开始向WebDisk应用服务器提供服务。</p>
<p style="text-justify: inter-ideograph; margin: 0cm 0cm 0pt 42pt; text-indent: -21pt; line-height: 150%; text-align: justify; tab-stops: list 42.0pt">3. <a href="http://www.sansky.net/article/tag/cluster" class="st_tag internal_tag" rel="tag" title="标签 cluster 下的日志">Cluster</a> HA模式下，二台数据库服务器同时工作，同时向WebDisk服务器提供数据服务，数据数据库服务器之间相互同步数据。当其中某台数据库服务器失效后，由另一台向WebDisk服务器提供数据服务，不影响整个系统运行。</p>
<p style="text-justify: inter-ideograph; margin: 0cm 0cm 0pt 42pt; text-indent: -21pt; line-height: 150%; text-align: justify; tab-stops: list 42.0pt"><strong>系统主要特点</strong></p>
<p>WebDisk存储管理系统，采用J2EE技术架构，和独特的负载均衡技术，保证系统的高度可扩展性、灵活性和系统整体性能，主有功能特点如下。</p>
<p><strong>跨平台、高兼容</strong></p>
<p>WebDisk是基于Web方式的，可跨越具体的硬件平台、操作系统、文件系统、网络环境。</p>
<p>支持Windows、 Linux、Unix多种操作系统。</p>
<p>兼容Oracle、MS SQLServer、MySQL等多种关系数据库。</p>
<p>兼容IE、FireFox浏览器。</p>
<p>支持各种DAS、NAS、SAN存储设备。</p>
<p><strong>高可扩展性</strong></p>
<p>WebDisk应用服务器采用UIT特有的群集技术，群集中服务器的数量理论上没有限制，可无限扩充。</p>
<p>数据库服务器也可根据其不同的种类采用不同的扩展方式，如MS SQL Server可采用双机热备来提高数据库的可用性；Oracle可采用RAC群集方案，在数据库的可用性和性能提供更好的扩充；MySQL也可通过其群集方案进行扩充。</p>
<p><strong>高可用性</strong></p>
<p>WebDisk应用服务器采用UIT特有的群集负载均衡技术，将任意多台服务器组成一个性能强大的虚拟服务器，根据群集中每台服务器的负载情况，任务将被动态的分配到负载最轻的服务器；同时群集中的所有服务器均独立工作，如果其中某些服务器失效，只要群集中有一台服务器能正常工作，整个系统就能正常运转；群集中的各个服务器可以采用不同的硬件平台、不同的操作系统。</p>
<p><strong>高性能</strong></p>
<p>高效的数据传输能力，在100Mb带宽下，系统的数据处理能力可达12.493MB/s，带宽利用率高达99.95%。控制性能对资源消耗极少，数据传输能力完全取决于可用带宽。</p>
<p><strong>灵活的使用方式</strong></p>
<p>为了满足各种不同的需求和使用习惯，系统提供多种使用方式：有移动办公需求或习惯使用浏览器的用户可以以Web方式来使用本系统；习惯使用Windows资源管理器的用户可将WebDisk的相关目录以Web Folder方式放到资源管理器中，就象使用本地文件一样来使用本系统；有批量数据传输需求的用户可以以客户端方式来使用本系统。</p>
<p><strong>系统关键技术</strong></p>
<p><strong>断点续传</strong></p>
<p>当在网络上特别是在广域网上传输大文件时，由于网络的不稳定，很可能使传输中断，而断点续传技术可以在上次传输的断点之处继续传输剩余的部分，而不必重新传输整个文件，这一点对大文件的传输至关重要，WebDisk支持50G大文件传输。</p>
<p><strong>流媒体文件在线播放</strong></p>
<p>一般的，影音文件都比较大，传输操作费时、费网络资源。WebDisk的在线播放功能允许用户在下载之前预先浏览其内容，然后再决定是否下载，这样将减少一些不必要的下载，极大的节约用户时间，网络资源；另一方面，在线播放允许用户在下载的过程当中观看影音文件的内容，而不必等到将整个文件下载到本地之后再播放，这也将极大的增强用户体验。WebDisk支持声音文件、影音文件、Flash文件等多种文件在线播，和图片文件在线播展示。</p>
<p><strong>多线程并发数据传输</strong></p>
<p>多线程并发数据传输技术，可以让多个线程共同来传输同一个文件，这样可充分利用网络带宽资源、实现数据的高速传送。</p>
<p><strong>基于策略的自动化文件传输</strong></p>
<p>基于策略的自动化文件传输，可以让用户为传输文件源、目的位置、并发线程数、传输时间、任务优先级、失败重试次数、传输模式(全部、增量)的定制策略，实现无人值守的智能文件传输服务。</p>
<p><strong>独特的负载均衡技术</strong></p>
<p>一般的负载均衡技术方案,如Linux LVS或Microsoft NLS均需要负载均衡器来负责调节群集中的任务分配，而它通是一个热点设备，容易成为系统的性能瓶颈。WebDisk使用了一套全新的、无需负载均衡器的技术方案，消除了系统中热点设备，使系统具备更好的扩展性，充分利用群集中的所有计算机资源，使系统总是处在最优化状态。</p>
<p><strong>网络加速器</strong></p>
<p>未来重复数据删除技术，数据压缩技术的加入，将极大的减小文件的存储空间和网络传输数据量，降低网络带宽资源的消耗，这二项技术的加入将给数据存储和传输带来革命性的改变。</p>
<p><strong>多层次数据安全保障</strong></p>
<p>分层的权限结构体系，确保只有用户自己才能看到自己的停息。未来将我们还将加入以下技术来保障数据的安全性。</p>
<p>数字签名技术，确保数据在传输过程中没有被人截取和篡改。</p>
<p>数据加密传输技术，这样即便是数据流被他人从网络截取，其得到的也是无法识别的密文。</p>
<p>数据加密存储，用户可以选择性的将其敏感数据加密存储在网络硬盘上。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.sansky.net/article/2007-09-01-uit-webdisk-parameter.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Hifn拟收购Siafu强化存储安全</title>
		<link>http://www.sansky.net/article/2007-07-25-hifn-siafu.html</link>
		<comments>http://www.sansky.net/article/2007-07-25-hifn-siafu.html#comments</comments>
		<pubDate>Tue, 24 Jul 2007 16:02:24 +0000</pubDate>
		<dc:creator>sansky</dc:creator>
				<category><![CDATA[好文收藏]]></category>
		<category><![CDATA[重复数据删除]]></category>
		<category><![CDATA[ISCSI]]></category>
		<category><![CDATA[数据安全]]></category>
		<category><![CDATA[数据保护]]></category>

		<guid isPermaLink="false">http://www.sansky.net/html/2007-07-25-1197.html</guid>
		<description><![CDATA[近日国外媒体称，Hifn将会收购新兴厂商Siafu Software，以增强其在数据存储安全性方面的实力，实际上此前Siafu的iSCSI产品已经使用了Hifn芯片，不过Hifn仍然希望此次收购能够将Hifn在网络安全、数据压缩、存储安全上更强大的实力。  IDC的企业存储系统研究部门的副总裁Benjamin Woo认为，这是一次顺应时下... ]]></description>
			<content:encoded><![CDATA[<p>近日国外媒体称，Hifn将会收购新兴厂商Siafu Software，以增强其在数据存储安全性方面的实力，实际上此前Siafu的iSCSI产品已经使用了Hifn芯片，不过Hifn仍然希望此次收购能够将Hifn在网络安全、数据压缩、存储安全上更强大的实力。  IDC的企业存储系统研究部门的副总裁Benjamin Woo认为，这是一次顺应时下用户越来越重视安全性的趋势的收购。<br />
      Benjamin Woo认为，Hifn收购Siafu能够让用户有效地实现企业级的数据保护。同时，这次合作不仅对那些大型企业有意义，对于一些更小的企业也可以利用全新的安全特性和数据保护架构来保护数据。他预计，产品的价格将在可以接受的范围之内，其所提供的解决方案将涵盖数据的存储、压缩、加密、复制和重复数据删除。</p>
<p>      Hifn的CTO Russell Dietz表示，收购之后推出的新产品将帮助中小企业进行数据保护并减少冗余数据，“将力求为用户在最小的空间内提供最强大的存储能力。”从而令Hifn的产品顺应绿色存储的潮流。Dietz表示，Hifn的技术被用于虚拟磁带库和FalconStor、EMC、NetApp和IBM等厂商提供的其他存储解决方案中，其压缩技术已经被用于1亿个磁带产品中。<br />
      Hifn的CEO Albert Sisto表示：“这次收购进一步加强了Hifn的整合策略，即将Hifn的数据保护解决方案和存储、安全以及网络结合在一起。”他甚至表示，结合了Siafu Software的存储软件技术之后，Hifn的数据安全、数据保护以及其它存储解决方案将成为市场中最有竞争力的产品。</p>
<p>      交易的条款到目前还没有对外公布。Hifn在国内拥有众多合作伙伴，路由器，转换机和网络产品供应商银河风云与Hifn有着紧密联系，电信设备提供商ZTE（中兴）也是Hifn的安全处理器等产品的用户。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.sansky.net/article/2007-07-25-hifn-siafu.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

