岂止高性能 数据“花样”恢复指南(下)

戴尔解决方案2019-02-20

戴尔解决方案

微信号Dell_Enterprise
功能介绍 戴尔解决方案专注于数字化转型中的前沿技术和解决方案,内容涵盖现代化基础架构、云计算、大数据、物联网及AI等,并通过对全球,特别是中国用户的成功实践案例分析和前沿技术解读,助力企业数字化转型,快人一步!
前言

对于企业用户来说,业务连续性方案要涵盖技术保障、流程保障、业务恢复三个层面,从事件前、事件中、事件后三个阶段应对突发事,之前我们测试了Dell EMC精细的数据保护功能、以及发生故障后可以实现更苛刻的恢复点后,接下来围绕企业的故障场景,继续进行暴力测试。

在业务连续性测试环境,采用由SC7020、VLPEX与RecoverPoint构建的数据保护方案,SC7020采用英特尔® 至强® E5-2660v4处理器,该处理器针对SC存储提供必要性能和高级安全技术,能够提高数据中心的效率和可靠性。

能够在不同层级为企业数据安全提供灵活的保护▼:

• 在生产中心故障恢复,Oracle与VPLEX可自动将业务和数据从同城灾备中心切换回生产中心,整个过程无需人工干预,且对应用完全透明,无任何负面影响;

• 当生产中心数据丢失,仅需数分钟就可利用RecoverPoint将数据全部恢复(视数据量大小,恢复时间不等);

• 当生产中心数据被篡改或丢失,利用RecoverPoint可直接从远程灾备中心恢复任意时间点数据,操作简单,仅需数分钟时间;

• 在同城双活、远程异步的“两地三中心”数据保护方案中,企业可根据实际业务需要与数据中心预算,灵活选择数据保护级别,最大限度降低RTO与RPO。



1

产存储故障修复,业务回切

在前面的测试结束之后,Swingbench压力机仍持续下发压力,以让Oracle数据库应用持续运行。在此基础上,启动进行第二项测试,即当主生产站点A中SC7020存储的故障修复,并重新上线,验证VPLEX和Oracle集群能否自动将数据与业务切回到主站点A。

在DSM中,将SC7020存储的数据卷重新映射给PowerEdge R840服务器,以模拟SC7020存储故障修复,重新上线。

当VPLEX发现SC7020重新上线之后,其会自动将业务回切到主生产站点A,并将站点A故障后产生的数据同步回SC7020存储。在此过程中,Oracle数据库性能几乎不受影响,TPS与TPM均保持稳定状态,只有R840服务器的CPU占用出现轻微“锯齿”现象。

当站点A恢复服务,且SC7020存储数据同步完成之后,RecoverPoint自动恢复服务,并将数据备份到站点C。

综合测试1与测试2的结果,基于Dell EMC公司VPLEX以及SC系列存储构建的数据中心双活/主备方案,能够在主生产站点遭遇突发故障的情况下实现业务切换,应用可能会出现短暂的数据库“hang”住现象,但并不需要人工干预,切换完成之后,其能自动恢复正常性能状态。

当主站点存储故障恢复,并重新上线后,VPLEX能够免人工干预自动回切到主生产站点,其间业务持续稳定运行,没有收到任何影响。回切操作完成,数据同步之后,其也能自动恢复诸如数据备份等相关数据保护操作。


2

数据库数据损坏、丢失或误删  顺利恢复

由于人为误操作导致的应用停机、数据丢失等事件时有发生,如何保护企业应用数据也成为关注的话题。人为误操作可以通过流程管理等手段尽量避免,但并不能杜绝。一旦故障发生,如何尽可能完整地恢复数据,将企业损失降到最低,也是现代IT解决方案必须解决的问题。

我们基于Dell EMC公司SC系列存储与RecoverPoint产品组合构建了对Oracle数据库应用数据进行备份恢复解决方案,并验证其是否能够发挥应用作用,在应用数据遭到破坏、误删等情况下,是否能够顺利恢复。

基于SC7020和RecoverPoint构建的数据保护解决方案。上图中间IT拓扑代表主站点A,图左为站点B,图右为站点C。站点A通过RecoverPoint将数据备份到站点C中的VNX7600存储之中。

在测试3过程中,我们模拟数据库管理员登录到Oracle数据库服务器,对Oracle数据库文件进行操作,误删除了Oracle数据库文件,导致数据库停机,无法正常提供服务。

如上图所示▲,在图上红框中的命令行表示,删除了Oracle数据库文件内名为system01.dbf的数据库文件,导致Oracle数据库已经无法启动,并报错,找不到“system01.dbf”数据库文件。

经测试3表明,RecoverPoint能够有效地对应用数据进行保护,利用RecoverPoint的备份,可顺利对Oracle数据库进行恢复,让Oracle数据库重新运行。


3

对应用数据指定时间点恢复

关键应用数据是企业赖以生存的基础之一,而这一特点也被某些不法之徒所利用,通过黑客手段入侵应用服务器获取管理权限,对数据库进行非法操作。例如去年(2017年)发生的“勒索病毒”风波。而利用非法手段对数据库进行篡改也并非令人惊讶的事情。

在测试4中,我们模拟黑客入侵并获得数据库操作权限,对数据库记录进行篡改。检验RecoverPoint备份方案是否能够针对指定时间点数据进行恢复。

利用黑客手段非法入侵Oracle数据库服务器,获得管理权限之后对数据库数据进行篡改,并经过一段时间之后,才被企业发现,此时应用数据不仅在站点A、B间同步,同时也备份到了站点C。企业用户需要对数据库未被篡改前的数据进行恢复。

RecoverPoint不仅能够对指定的备份和指定时间点数据进行恢复,同时根据不同企业对应用数据的可靠性需求,以及企业实际IT投入成本的不同情况,对成本与数据丢失容忍度进行平衡,提供更灵活的备份恢复策略。

由此看来,Dell EMC公司的数据备份恢复解决方案RecoverPoint能够根据企业实际需要,对指定时间点的数据进行恢复,颗粒度甚至可以达到毫秒级别。

对于企业来说,如何保障各种关键应用持续运营,达到永续经营的良性循环,Dell EMC基于企业的业务连续性方案给出了专业和丰富的解决方案。

►根据不同应用场景,其有数据同步和异步的区别,数据同步通常意味着低延迟,这对基础设施要求较高,通常可构建于同一数据中心内或者距离较近的两个数据中心间,以实现“双活”保证业务持续运行。异步则通常距离较远(比如异地),对基础设施投入可适当降低,可用于备份归档方案。但并无绝对。对数据可用性要求苛刻的企业用户,也可实现异地之间的数据同步,比如Dell EMC此前就有成功案例,帮助用户实现数十乃至上百公里距离的两个数据中心间的数据同步。

►同时,在数据保护细粒度上,企业用户也可根据实际投入成本量力而行。其可预设三种数据备份方案:动态(Dynamic),即根据数据实际写入情况进行动态调整;固定每秒备份(Fixed per Second),即不管数据实际写入情况,每秒都会都一个备份;固定每个写入数据备份(Fixed per Write),即每次写入都进行一次备份(类似快照)。颗粒度最细由大到细,数据可用性以此增高,相对而言,成本也会有相应增长。

►测试结果表明,基于Dell EMC SC系列存储、VPLEX以及RecoverPoint等产品组合而成的完整解决方案,能够实现数据中心内的业务连续性,在主站点突发故障的情况下,能够迅速实现业务切换;而当主站点存储重新上线之后,其能自动回切,并同步数据,尽可能避免人工干预,降低管理复杂度。

同时,在异地远程站点的数据保护测试中,基于RecoverPoint的数据保护方案不但能够对应用整体数据进行恢复,同时也能够顺利完成对指定时间点的应用数据进行恢复,为企业用户提供灵活的数据备份与恢复方案。