中桥解读戴尔流动数据架构在医疗行业的大数据实时分析

戴尔易安信解决方案 2018-04-27

戴尔易安信解决方案

微信号 DellEMC_Enterprise
功能介绍 戴尔易安信解决方案专注于数字化转型中的前沿技术和解决方案,内容涵盖现代化基础架构、云计算、大数据、物联网及AI等,并通过对全球,特别是中国用户的成功实践案例分析和前沿技术解读,助力企业数字化转型,快人一步!


大数据是一个演进过程。传统商业智能可以通过增加数据类型、数据来源以及提高分析速度,应对越来越大的数据子集,逐步演进为大数据数据分析。新兴行业可以通过开源和分布式建立全新的大数据分析平台。

结合中桥的中国市场大数据分析频率、大数据分析类型和来源的调查结果,可以看出受访企业和机构在进行数据分析时面临多种存储难题,而为了解决这些难题,满足大数据时代的IT需求,企业需要大容量、高性能、保证数据生命周期高性价比的存储来满足大数据存储、数据保护和业务连续性需求。


医疗卫生行业的大数据业务价值


医疗卫生是大数据演进过程通过IT创造价值受益最大的行业。据麦肯锡预测,充分利用大数据分析,美国医疗卫生行业每年开支可以节省3000亿美元。实现这个目的,医疗卫生行业需要完整、准确地收集数据,近实时和实时分析,以及根据个性化需求呈现分析结果。


医疗卫生行业的大数据挑战


英国某卫生行业云计算提供商,为82%的国家健康服务机构提供产品或服务。通过对来自各种医疗机构的运营信息(判断类似病例的数量、范围和威胁性)、就诊病患信息(通过历史数据提取、及时更新数据实现跨地域名医实时会诊)、急救信息(判断死亡率和社会危害性)、社群网站和手机短信(增加数据来源,提高采样涵盖率)、卫生监控信息等多种大数据实现商业智能分析,针对任何可能威胁社会健康的疾病,为医疗机构提供近实时监控和预测信息,提高健康突发事件的应对能力。该提供商对于客户各种需求的满足,加大了对数据存储容量和性能、大数据分析频率和速度的要求。


大数据近实时分析应用


该提供商结合Microsoft SQL Server 2012 Enterprise 软件和商业智能工具,通过Windows Azure HDInsight Service的混合云平台,为各种医疗机构和医生提供用户可选择的商业智能分析服务。HDInsight的大数据功能可以处理大量结构化、半结构化和非结构化数据,并对上述数据进行实时或近实时分析。


大数据存储挑战


扩展和存储利用率:欧美医疗行业医疗档案需要终生保存,大量图像(如X片、CT影像、PACS信息)信息导致医疗卫生的数据存储总量持续快速增长,对存储的高可扩展性提出高需求。各种文件生命周期阶段读取性能大相径庭,对数据生命周期智能管理提出更高要求。为了满足HIS(医院信息系统)和PACs(影像系统)的存储需求,统一存储既要满足大数据演进过程事务处理性能需求,又要满足非结构化和半结构化数据的容量需求。

近实时分析性能:通过SQL实现近实时大数据分析服务,对OLTP和OLAP都提出更高要求。同时,相对于批量分析,近实时分析的数据子集量更大。通过分级存储可以提高资源利用率,但传统通过卷迁移实现的分级会导致迁移到底层的数据读写性能难以满足近实时分析的需求。


戴尔流动数据架构