
2020
05/15
今天周五啦~
轻松一下
小编来和大家讲个小故事
还记得当年声势浩大,被称为20世纪人类三大自然科学研究计划之一的“人类基因组计划”吗?
不过这个项目在进行到第八年的时候,却发生了一段小插曲,正是这个小插曲,加速了人类基因组计划的完成。
今天的故事
我们就从这个小插曲展开
当时人类基因组计划正有条不紊地进行,这时突然冒出一个叫Celera的公司,竟然宣称说,他们可以用更少的资金(仅3亿美元),并在三年内完成这一项目!
▐ What?集世界上多个国家人力物力的项目,竟然抵不过一家私人公司?
显然,Celera公司是有备而来,他们有如此底气的原因就是采用了和人类基因组计划不同的测序策略——全基因组霰弹枪测序法。
简单来说,这项技术是将整个基因组直接切成许多小而重叠的片段,然后再统一将这些小片段直接进行“Sanger测序”,最后通过算法检测小片段之间的重叠部分来直接重构人类基因组,使得基因测序的速度更快。
最终,经过3年你追我赶,这个比赛有结果了。
双方握手言和,同时发布了完成度超过90%的人类基因组草图。这比原定计划提早了好几年,并且所有人类基因组数据为人类共同财富,不允许专利保护,且必须对所有研究者公开!
为庆祝人类基因组计划完成而发行的邮票
回过头来看,人类基因组计划对整个生命科学研究带来了深远影响,相关应用已大大超出了生命科学本身,推动了一系列相关产业的发展。想象一下,曾经需要全球数个国家花费数十年,耗资超过30亿美元的基因组测序,到今天只需几小时、几百元的成本。
不过,虽然技术在突飞猛进,但每个人身上大约31.6亿个碱基对却是始终不变,而这就带来了一个问题——数据量太大了。
基因测序的步骤是将细胞放入基因测序仪,以此启动破译流程。但人类基因组数量庞大,如果从头至尾全部测序工作量实在太大。因此,细胞中的DNA会被分解成更易于管理的很多个小片段。从本质上来说,测序仪就是拍摄所有片段的快照,并利用计算能力对快照进行初始分析,然后将分析结果按某种文件格式进行保存,以便在流程下一阶段进行处理。
在这个过程中,不仅需要强大的计算能力以快速得出分析结果,并且每一次的快照都会产生大量数据,而一个人完整的基因组测序数据文件大小约为200GB,随着近年来基因测序产业的火热,这给基因测序公司带来了巨大的IT挑战。
具体来说,海量基因数据带来的数据存储、计算、安全等多方面挑战,已成为行业进一步发展必须解决的问题:
◆ 数据存储:从最初的人类基因组开始细分扩展,目前基因测序技术已经涉及到肿瘤、遗传病检测,扩展到植物、远古生物、细菌、病毒、微生物的基因检测。因此,数据种类和数据量都异常庞大,经常以PB为单位保存。
◆ 数据计算:基因序列数目庞大,对基因进行同源性搜寻、比对、分析、遗传发育分析等需要对海量、复杂、多变的数据进行分析和挖掘。这要求海量计算资源的支持,对计算性能、内存容量、数据带宽等要求很高。
◆ 数据安全:基因数据较为隐私,但传统的基因公司IT能力较弱,安全措施不到位,防御能力很弱。
◆ 数据全球化:由于基因行业特殊性,很多样本数据需要到当地采集。如果有数据共享,就需要全球化的多数据中心支持。
应当如何应对?
戴尔易安信有办法!
在大规模样本的数据分析和挖掘方面,戴尔易安信可以提供高性能计算(HPC)、机器学习、人工智能、大数据分析等多种应用场景的解决方案。其中的生命科学HPC方案,可以根据临床要求,帮助生物信息学中心、遗传学中心经济快捷地将基因分析转为临床治疗方案。
{{item.summary}}
{{item.summary}}
填写您的感兴趣的产品及个人信息,提交成功后会有专人与您沟通,为您提供专属底价。
请输入公司名称
请输入姓名
请输入手机
请输入邮箱
请选择
*验证码无效
恭喜您,秒杀成功!
后续工作人员会与您进行联系
抱歉,您没有抢到!
您还可以参与其他产品的秒杀活动哦
信息提交成功
感谢您参与我们本次的问卷调查活动
请补全您的身份信息
请输入姓名
请输入企业邮箱
请输入公司全称
请输入姓名
请输入企业邮箱
请输入公司全称
请输入企业邮箱
请输入手机号
订阅成功
我们将每月通过邮箱发送资料报告发给您
请输入手机号
请输入验证码
如果您对当前页面内容感兴趣,
可填写“项目咨询单”,
进行专业咨询及帮助。
* 点击确认按钮或关闭Cookie弹窗代表您已同意以上内容。
登录后发表评论
请输入您要写的评论