DR Rapid:打通备份数据流动的任督二脉

戴尔易安信解决方案 2018-04-28

戴尔易安信解决方案

微信号 DellEMC_Enterprise
功能介绍 戴尔易安信解决方案专注于数字化转型中的前沿技术和解决方案,内容涵盖现代化基础架构、云计算、大数据、物联网及AI等,并通过对全球,特别是中国用户的成功实践案例分析和前沿技术解读,助力企业数字化转型,快人一步!
点击“戴尔企业级解决方案”快速订阅


近日ESG发布了一份实验室报告《Dell DR Series Appliances with OS 3.2: Performance, Security, Scalability, and Interoperability Enhancements》,评测对象是软硬件升级后的戴尔DR系列磁盘备份设备。


产品主要更新:
针对新的和已有数据的静态加密;

通过NDMP和iSCSI备份到虚拟磁带库(VTL),每个设备可以支持4个VTL容器;

性能升级。增加50%马力(DR6000更新到Ivy Bridge处理器,现在是12核/CPU)缩小备份窗口并加速恢复同时支持加密任务;

扩展性改进。DR6000现在支持在扩展柜中的6TB磁盘,提升RAID 6之后的总可用容量40%,从180TB达到252TB。这个可观的密度——在10U机架中252TB——带来了电源、制冷和管理方面的成本节约。

另外,配合DR2000v Hyperscale虚拟设备,最多3,000个DR2000v可以被授权到一个物理DR设备。

先重删/压缩,再加密
这里需要解释一点,就是如果先对数据加密,再做重复数据删除和压缩就没有效果了,无论你是定长还是可变长切块,因为数据中的规律在加密时完全被打乱。以传统磁带设备来说,压缩和加密是不能同时做的。如果备份软件做完重删再将数据写到磁带不是不可以,但通常这样使用的不多,因为在恢复时需要相同的备份软件环境、元数据和指纹库。戴尔DR系列目标设备是在备份写入时先做重删和压缩,再进行加密;读取时自然是先解密再“水化”复原数据。

戴尔DR系列的核心技术,主要来自于2010年收购Ocarina的压缩和重复数据删除技术,也就是上图中我们圈出的左上角——后来还增加了DR Rapid源端重删加速技术(类似赛门铁克OST和EMC DD Boost)。而右边列出的“支持2.5亿个文件”就属于它文件系统的扩展性了。
性能影响测试
ESG通过测试来验证加密对性能的影响,首先是单纯的目标端重复数据删除。除了CIFS和NFS两种标准文件协议之外,RDA是戴尔专为DR系列和NetVault备份软件通信而设计的专用协议,这里只用了Passthrough直通模式,没有打开其源端重删。

可以看出,仅做目标端重删时打开加密的性能影响是很小的。RDA协议的优势不小,我觉得它基本上可以替代传统跑在FC网络上的LAN-Free备份了。

上图引用自ESG实验室在去年5月的另一份报告:《Enterprise-class Backup Performance with Dell DR6000》

戴尔DR Rapid技术的一大特点是开放兼容。如上图:除了所有DR支持(也就是做过兼容性测试)的备份应用都可以使用标准NFS/CIFS做目标端重删之外;针对NetVault有自己的RDA;赛门铁克Backup Exec和NetBackup可以用OST协议;对于CommVault、TSM、NetWorker、RMAN等更多备份程序还提供Rapid CIFS/Rapid NFS插件,同样支持源端+目标端全局重复数据删除。

报告显示:“全新协议加速器Rapid NFS和Rapid CIFS(属于戴尔DR Rapid技术插件)是业内首创的源端技术插件。经测试,这些插件的备份处理性能可比传统NFS/CIFS备份高三至五倍。”

在打开源端重删之后,加密对性能的影响在DR4100上相对明显一些,但Rapid CIFS是个例外。ESG认为DR6000硬件配置更高所以计算资源充足些。源端重删将数据的Hash指纹计算和初步比对放在客户主机或者备份服务器上完成(可参考下图),而发送到DR设备后还要在全局指纹库比对,然后传送唯一数据块并压缩,所以DR在加密之前的处理也是不少的。

与前面一个图表比较,打开源端重删之后的备份吞吐性能基本在15-20TB/小时的水平,比单纯目标端重删确实提升巨大。

DR Rapid参考架构
上图是DR Rapid源端重复数据删除的一类部署方式。由于用的是NetWorker备份软件,配合DR6000重删的服务器安装Rapid NFS/Rapid CIFS插件,只有控制元数据会发送到NetWorker备份服务器。

有的厂商在宣传最大性能数字时,有意无意回避“DD Boost”这类技术带有的源端重删特征,在另外一些同行眼中那些数字则有“作弊”嫌疑。而我们则认为应该正视源端重删技术,运行插件消耗一部分计算资源是客观存在,但如果按常用的每天一次闲时备份,且服务器利用率允许的情况下也可以忽略这种影响。毕竟只要备份就可能有影响,何况源端重删还能节省网络带宽,所以用户根据自己实际情况来选择就好了。还有一点可变因素就是测试的数据样本,不同类型/重删率的数据产生的加速效果也有不同。

如果不愿消耗生产服务器的资源,也可以将DR Rapid插件安装在备份服务器上,配合DR系列进行另外一种“源端”去重。这种情况下会增加备份服务器的压力,客户端到备份服务器的网络流量不会减少,必要时可增加介质服务器来提高并发。

上表是ESG去年报告里的测试结果,可以看出有些环境下Rapid NFS甚至能达到比RDA略高的性能,而OST和Rapid CIFS也相差不多。打开源端重删按照20TB/小时计算相当于5.8GB/s,关闭源端重删按照5TB/小时也有1.4GB/s。DR4100比DR6000的性能要低一些,但也能满足大多数中小规模用户的备份恢复需求了。

总之,我们认为DR Rapid相对于同类技术的最大特点就是开放兼容、采用最便利的方法来与各种流行的备份软件适配。当您受困于备份/恢复速度,或者服务器与备份存储之间的网络瓶颈时,不妨尝试下戴尔DR系列来帮您打通这个数据流动的“任督二脉”吧!