存储极客 | 关键业务迁移之“去 I”先要“懂 I”

戴尔易安信解决方案 2018-04-27

戴尔易安信解决方案

微信号 DellEMC_Enterprise
功能介绍 戴尔易安信解决方案专注于数字化转型中的前沿技术和解决方案,内容涵盖现代化基础架构、云计算、大数据、物联网及AI等,并通过对全球,特别是中国用户的成功实践案例分析和前沿技术解读,助力企业数字化转型,快人一步!
点击"戴尔企业级解决方案"快速订阅



✎✎✎“存储极客”栏目再次与大家见面啦!在这里,只有一位大咖名叫“存储”,它的粉丝我们称为“存储极客”!
存储极客
这是一群存储偏执狂
为存储而生,跟存储死磕
各具独家秘笈
有观点,有碰撞,有干货
从2015年8月18起
做客存储极客栏目
与你分享存储里的那点事儿
首先解释一下,本文标题中的“去 I”与流行的“去 IOE”一词并不完全相同。许多同行朋友应该知道后者的产生不完全来自技术因素,因此准确地说,我们要讨论的是x86替代RISC小型机乃至大机,简称U2L(Unix to Linux)。

已成过去时的小型机市场
从2000年前后到现在,由于Intel x86服务器在性能和可靠性方面的不断加强,Unix小型机阵营不断缩水。


上图引用自ChinaByte比特网2012年发表的
《安腾和至强:究竟是谁受益于谁?》一文

如上图,RISC(精简指令集,在这里代表Power、SRPAC等小型机)和Mainframe大型机在2001年占据服务器市场63%的硬件支出,x86和EPIC(显性并行指令计算,代指Itanium安腾服务器)只占37%的市场。而到了2012年,前三个季度x86/EPIC就达到了75%占有率,RISC/Mainframe只剩下25%。

2001年应该是安腾刚起步不久,在这期间小型机市场先后经历了SGI放弃MIPS、康柏收购DEC,惠普收购康柏等事件。惠普坐拥PA-RISC和Alpha两大产品线,但由于难以独自支撑处理器设计和制造方面的巨大投入,最终选择与Intel合作发展Itanium平台。

每次指令集架构的变更,都意味着应用软件的迁移。HP-UX和OpenVMS这两个主要操作系统也随CPU经历了版本的调整。

到2009年Oracle收购Sun时,Sun原有硬件业务受到一定影响。这时候竞争对手们闻风而动,争抢SPARC小机用户这块蛋糕。除了IBM Power、HP Itanium,还有x86的忠实拥护者戴尔,由于2010年3月Intel正式推出Xeon 7500系列MP平台,作为Xeon E7的前身已经开始加强RAS特性。
上图引用自ZDNet 2010年的
“英特尔至强处理器7500系列发布会”专题

如今SPARC阵营的两家主要供应商Oracle和富士通市场空间都比较有限;Intel关键业务平台的重心已经由Itanium转向x86,Red Hat操作系统和Oracle数据库都停止或减少IA64相关研发,曾投入重金的惠普也无法挽回大势。

Power的性能和稳定性还强于x86吗?
由于惠普Superdome平台已经转向x86,如今再比较IA64有点伪命题了。真正实力较强,并还拥有可观用户群的小型机主要就是IBM Power家族了,尽管前景可能也不是很乐观。

IBM如今也发现,单凭销量下滑的传统AIX小型机,难以支撑Power处理器与Intel x86抗衡,于是推出自家运行Linux的小型机,并成立了OpenPOWER联盟。

IBM看重的应该是Linux生态系统和第三方硬件厂商带来的支持,然而离开AIX和PowerVM的小型机就有点像缺了左膀右臂,这一点我们在与IBM合作伙伴的交流中也基本达成共识。

如上表,Power 8处理器主频和单周期计算效率可能还优于今天的x86,但由于制造工艺等方面原因,核心数量目前最多12个;相比之下Intel Xeon目前最高18核,下一代很快达到22核。Power的成本也没有优势。

Power E880满配16颗CPU可达192核心。Intel Xeon E7可以支持8-32路的系统,但实际需求最大的x86关键业务平台还是4插槽,以戴尔PowerEdge R930为例,内存支持已经达到6/12TB。

单颗x86 CPU在性能上已经不是问题,我们再来看下可靠性。据同行朋友反映,小机出现硬件故障的情况也会有一些,并不一定低于今天的Xeon E7服务器。业界流行过一句话——“不会坏的是大机”,但国内真正对大机有需求并且能够承受其价格的,也就是金融行业中的四大行等有限几家,像“双十一”那么大交易量的支付宝,也早已靠x86成功实现了“去 I”。

受互联网等行业的影响,依靠分布式x86来满足性能和可靠性已经是未来的主流方向。

关键业务迁移是门技术活
正如业内技术专家们所说,如果是跑Oracle数据库,x86已经不比小型机差在哪里,DB2技术上并不占优,真正对部分用户“去 I”造成阻力的主要是上层应用软件和中间件与关键业务的绑定。

专业的问题,应该找专业的团队来解决。下面我们拿1-2家公司举例,简单讨论下关键业务迁移这个领域。

● Clerity:从Sun拆分出来的大型机移植业务
在2006年的一条新闻中,我们看到“Sun将其大型机移植业务出售给Clerity Solutions公司,后者计划将相关技术和支持拓展至Solaris以外的其它操作系统。”

“据了解,Clerity已经收购了Sun微系统大型机事务处理(MTP)以及大型机批处理管理器(MBM)软件,以及大型机移植工具和相关服务。大型机移植技术允许客户在Sun服务器上运行早期的大型机软件… 源自2001年Sun收购Critical Path公司——一个旨在帮助客户在Unix服务器上运行大型机软件的部门。”

“Clerity首席运营官Cameron Jenkins表示,由于开源狂潮对IBM大型机市场构成威胁,越来越多的客户寻求能够将大机型软件转移至其它操作系统的解决方案。因此,Clerity不仅帮助客户将大型机软件转移至Sun微系统Solaris操作系统,还将转移至Linux操作系统、HP-UX操作系统以及IBM公司AIX操作系统。
戴尔自2006年以来的收购路线图

上面引用了一张简单绘制的草图。目前人们关注的焦点集中在去年10月戴尔收购EMC,以及一同加入的VMware、Povital、Virtusteam、RSA和VCE联盟。而我们用红圈标出的位置,则是2012年4月戴尔收购的三家公司中的两家:Clerity Solutions和Make Technologies(还有一家全球领先的瘦客户端厂商Wyse,知道这家的朋友肯定更多)。

根据当时的新闻,“Clerity Solutions有约70名员工,将整合到戴尔服务部门… 看来戴尔是希望加强在旧系统迁移方面的能力,从而吸引到部分大型机的客户到x86平台。”

● Make Technologies:关键业务移植到开放平台
“Make Technologies创建于1999年,总部位于温哥华,拥有大约100名员工。主要产品包括应用移植软件套装TLM Enterprise Suite,他们的用户包括expedia、埃克森美孚、fidelity、通用汽车和td bank。”

“Make Technologies的软件和服务可以帮助企业客户将业务关键应用从传统系统转移到基于开放标准的平台,包括网络云基础设施。戴尔称,这些变化可以降低企业用户的运营成本… 收购Make Technologies可进一步扩展戴尔技术服务业务的能力。”

所谓“去 I”,有的朋友关心的可能是换了多少设备,还有没有再买小机?而业务迁移的能力容易被人们忽视。并不是每一家公司都有互联网行业中BAT那样的技术实力,对于大多数企业而言,选择有经验的公司或者机构合作进行关键业务迁移应该是更合适的选择。

“去 I”先要“懂 I”:
存储阵列的Power VIOS认证
对于采购3年以内的Power小型机保有用户而言,为了“去 I”而立即替换也不见得是个明智的选择。这时如果需要更换/添购存储阵列,能够良好兼容AIX环境还是有一定必要的。只有先融入用户的环境,产品获得认可,才能获得未来更多的机会。

戴尔在去年更新SC(Compellent)系列存储软件SCOS的过程中,增强了对AIX环境的支持。下图为截自IBM网站的认证:

我们看到这个认证是针对VIOS(Virtual I/O Server)的,它在IBM PowerVM框架中的作用大致相当于Xen虚拟化的Dom0。此外,上图中还有“AIX OEM PCM Software of Dell Storage Center…”,以及最大性能、灵活性和效率。接下来我想简单介绍下AIX MPIO多路径模型和VIOS的框架。

参考这个AIX MPIO模型,戴尔存储阵列适用于“OEM disk storage”的位置。根据我的了解,在SCOS 6.5.20之前,MPIO多路径驱动是通过中间的“AIX Default PCM”来做通用支持,此时可实现基本的Active/Standby故障切换,但可能不支持较为理想的负载均衡。

从SCOS 6.5.20开始,SC家族阵列能够配合戴尔提供的“Other vendor PCM”,也就是上面提到的Dell Storage Suite for AIX 2.2中的“AIX OEM PCM Software…”,在虚拟端口模式(Virtual Port mode)下实现完美的故障切换和多路径负载均衡。

在《戴尔SCv2000:入门级阵列硬件设计功力》一文中,我们介绍过戴尔SC系列的虚拟端口模式:

虚拟端口模式——通过将多个活动端口连接到每个 Fibre Channel 或以太网交换机,提供端口和控制器冗余。在虚拟端口模式下,每个物理端口都有 WWN(全球名称),并且还分配有附加虚拟 WWN。服务器仅以虚拟 WWN 为目标。在正常情况下,所有端口均可处理 IO。如果一个端口或控制器出现故障,一个虚拟 WWN 可被移至同一容错域中的另一个物理 WWN。在排除故障和重新平衡端口后,此虚拟端口会回归至首选物理端口。

与传统模式相比,虚拟端口模式提供以下优势:
● 更高的性能:由于所有端口都处于活动状态,因此可提供更多的前端带宽,而不牺牲冗余性。
● 更大的冗余:端口可以单独实现故障转移,无需通过控制器实现故障转移。
● 简化的 iSCSI 配置:每个故障域包含一个协调域中 iSCSI 端口查找的 iSCSI 控制端口。当服务器将该 iSCSI 端口的 IP 地址作为目标时,它会自动查找故障域中的所有端口。”

注:以上这段话引用自《Dell Storage Center - Dell Storage Client 2015 R1管理员指南》

简单地说,原来使用AIX小机连接戴尔SC阵列,主机接口应设为传统模式;而现在可以使用更为强大的虚拟端口模式。正如一位戴尔资深工程师所说:“对于既有AIX又有其它OS共用一个SC(Compellent)的环境也更简单了”。

同时,入门级的SCv2000也因此而受益。由于从简单易用出发,SCv2000只支持虚拟端口模式,因此刚推出时支持的操作系统列表里没有AIX,现在也可以加入了。
PowerVM典型的双VIOS高可用Virtual SCSI架构

最后我们再来看下PowerVM的Virtual SCSI架构。

一个来自外部阵列的LUN经过SAN存储网络,映射到4个FC HBA,它们被划分到两个Virtual I/O Server分区,我用蓝色圈出的就是多路径所在位置。相同的Hdisk裸磁盘或者LV逻辑卷可以通过两个VIOS的VSCSI虚拟适配器同时提供给Virtual I/O Client分区(即用户的Guset虚拟机)。

由于Virtual I/O Server本身也是一个LPAR(逻辑分区),双VIOS可以解决I/O虚拟化中的单点故障。如今LPAR和DLPAR(动态LPAR)已经在大多数AIX小型机上广泛使用。