
北京大学前沿交叉学科研究院携手戴尔科技集团构建HPC和AI平台,支持研究项目在《自然》杂志发文
北京大学前沿交叉学科研究院以北京大学雄厚的基础学科和先进的技术学科为基础,通过探索科研与管理机制创新、推动基础条件建设、招聘和引进优秀科研人才、组织学术交流与研究项目申 请等工作,有力促进全院体制建设、学科建设和队伍建设。以关键共性技术、前沿引领技术、现代工程技术、颠覆性技术为突破 口,推动技术科研创新。在创新过程中,北京大学前沿交叉学科 研究院与北京大学工学院积极合作,响应国家提出的“努力实现关键核心技术自主可控,把创新主动权、发展主动权牢牢掌握在自己手中”的战略要求,联合构建HPC+AI高性能群集,力求强化自身的战略科技力量,提升学校和各个科研单位的创新能力和创新体系运转的整体效率。
解决方案概览
浮点计算总性能超过1000Tflops
为计算生物学、深度学习等多个课题组提供计算服务
承担了众多国家急需的重大项目研究
支持在Nature、Cell等著名期刊发表文章
“戴尔科技集团为我们提供了白金级技术支持服务,由TAM技术客户经理负责为我们提供主动性的硬件故障检测、预测性的检测故障风险评估、自动化的收集设备日志等一系列服务。同时,利用白金服务,IT人员可以自动创建支持事件,并触发售后流程,大大简化了我们的运维压力。”
北京大学前沿交叉学科研究院陈芳进博士
进入新时代,全球科技创新进入空前活跃的发展时期,新一轮科技革命和产业变革正在重构全球创新格局、重塑全 球科技版图。科学技术从来没有像今天这样深刻影响着国 家的前途命运,从来没有像今天这样深刻影响着人民生活 福祉。在这种大趋势下,北京大学前沿交叉学科研究院与 北京大学工学院共同出资并建立了一个北极星高性能计算 服务平台,为关键领域的精锐研发力量提供科技研究的战 略性计算服务能力。
戴尔科技集团HPC(High Performance Computing) 高性能计算与AI(Artificial Intelligence人工智能)平 台方案,包括228个计算节点,3台管理登陆节点,27个 GPU节点,其中4卡机20个、8卡机1个,2卡机6台,总 计7224个CPU 核心,103颗GPU,HPC系统的CPU浮 点峰值计算性能达到594Tflops,GPU双精度浮点峰值 计算性能达到780Tflops,整体达到千万亿次超算平台。 其中计算节点采用Dell EMC PowerEdge C6420、 GPU节点采用Dell EMC PowerEdge C4140。计算节 点C6420支持100Gb/s EDR,使得集群存储系统可进行纳秒级通讯和高带宽数据吞吐。计算节点C6420支持专 用系统引导控制器BOSS卡,2块 240GB支持NVMe协 议的M.2 接口的SSD硬盘(硬件RAID1镜像),大大加快 了系统启动速度。
作为GPU节点的C4140与计算节点、网络交换机高度融合,其在1U机箱配置内配置了2个英特尔®至强®Gold 6132处理器,该处理器计算主频为2.6GHz,最大睿频 频率为3.2GHz,缓存达到16MB,支持768GB内存,采 用14纳米制作工艺和64位CPU架构,拥有14个计算核 心,支持24个线程,支持AVX 2.0技术、英特尔Speed Shift 技术、英特尔TSX-NI技术、英特尔 EnhancedSpeedStep技术、英特尔Instruction Replay 技术,可以在电源节省、计算效能、计算安全方面为数 据中心提供更高效的支持。C4140还配置了4个NVIDIA GPU,节约了机柜空间,提升了计算密度。凭借独特的 交叉GPU设计,4个NVIDIA GPU 依托Nvlink2.0全互联, 提供全线速性能。
在管理方面,平台所有节点配置了远程管理卡 iDRAC9 Enterprise,提供远程图形界面,IT维护人员可以配置 Web浏览器,使用虚拟控制台监控群集中各个节点和网 络的运行状况,通过 iDRAC 可远程执行开机、关机、 重启、非屏蔽中断等一系列操作。计算网络采用了 Mellanox InfiniBand方案,做到了点到点全线速、无阻 塞。计算网络具有出众的吞吐量和超低的延迟。管理网 络引入了1台Networking S4048和7台Networking S3048,兼容iDRAC与集群软件管理,该网络提供了对 每个集群节点的管理需求型访问。
戴尔科技集团HPC高性能计算与AI平台已经成为了高性能、多功能、专业性的前沿型计算平台,特别是在AI深度学习方面,为校内外的生物学研究提供了高效计算支持。同时为计算生物学、深度学习、测序等多个课题组提供计算服务。具体包括测序仪离线处理、序列搜寻比 对分析、分子动力学模拟、计算机辅助药物设计和分子对接、生物网络的计算 、深度学习。
戴尔科技集团HPC高性能计算与AI平台全面支持基于深 度学习的分子图编码和基于深度学习的中药开方系统研 发。研发人员可以利用HPC高性能计算与AI平台开发基 于三维分子图的深度学习编码,进行基于深度学习的中医诊断开方。通过卷积神经网络或递归神经网构建多任务的分子预测模型,利用交叉验证来调参和验证,用外部数据来测试和评估模型。与此同时,从预测模型中挖掘 关键的信息。同时通过卷积神经网络或递归神经网络学习大量的方剂配伍信息,然后利用主药生成通过语义的自动关联分析得到的辅药,从而产生新的方剂。戴尔科 技集团HPC高性能计算与AI平台提供了高效并行的计算资源,大大加快了模型的训练,从而在有效时间内完成最终任务。
戴尔科技集团HPC高性能计算与AI平台也支持了基于化 学片段的从头计算药物设计,对于疾病的治疗和生物学功能的理解起到了重要的推动作用。传统的药物筛选过程耗时长、费用高,造成整个药物设计与发现过程效率低下。为了加速药物设计与发现过程,科研人员利用该 平台进行分子从头设计的方法逐渐获得发展,并取得了 良好的效果。科研人员通过蒙特卡洛树搜索和神经网络 模型结合的方式,实现对巨大化学空间的搜索和最优结 构的采样,快速完成了完整的从头药物设计流程,并对蛋白质口袋表征问题和打分函数问题进行了探索。利用 模型探索蛋白质口袋的化学空间并进行化学片段的组装 和拼接,实现了化学分子的生成,使用已有的蛋白质配 体复合物结构数据训练基于结构的深度学习打分模型, 并将训练好的模型用于评估生成模型生成的分子的质量。 结合生成模型与打分函数,利用强化学习策略进行模型 的训练,通过参数训练提升生成模型的性能,最终提高了生成分子的活性。
基于戴尔科技集团HPC高性能计算与AI平台,科研人员 利用Python编程语言,使用TensorFlow,Keras等深度 学习框架搭建了深度学习模型,强化了学习模型的训练, 实现了对深度学习打分函数模型的训练与测试,并对模 型进行训练。对于模型生成的分子,使用集群进行分子的合成性、毒性和物理化学性质的分析,并从中挑选出了合适的分子。
基于戴尔科技集团HPC高性能计算与AI平台有效解决了 实验测量研究周期长等一系列问题,提出了建立高性能 湍流数值风洞系统,以我国航空航天等领域亟需解决的 关键湍流问题为研究对象,开展大规模数值实验研究。 研究包括数值模型的前后处理、超大规模数值模拟和高 分辨率三维图形可视化。其目标是在典型流动湍流机理、 流场精细化预测和新型精确湍流模式及理论方面产出一系列原创性科研成果,为相关学科发展及工业和工程应用提供可靠地理论和技术支撑,同时进一步提升了湍流与复杂系统国家重点实验室在国际上的影响力。随着平台的建设完成,可以通过大规模数值模拟为各个学科研究提供高效支持,实现了对海量数据获取与分析能力的提升。其中,有相当一部分研究内容属国家重点项目,得益于戴尔科技集团HPC高性能计算与AI平台相对独立 的高性能计算和可视化系统,保证了数据较高的安全性 和研究的可持续性。
戴尔科技集团HPC高性能计算与AI平台已经正式上线运 行一段时间。其中“北极星”高性能计算平台已为校内外 多个院系单位、上百个用户提供了高性能计算服务,目 前系统已运行任务数超过千万个,搭建了多个专业领域 的软件平台。平台支持国家重点项目超过10个,支持科研人员在Nature、Cell等著名期刊发表文章,相关文章 共计65篇。其中包括Nature 2篇,Cell 1篇,Nature子刊5篇,Cell子刊6篇,其他学科级别的顶尖杂志6篇,统计影响因子超过10分的有25篇。
{{item.summary}}
{{item.summary}}
填写您的感兴趣的产品及个人信息,提交成功后会有专人与您沟通,为您提供专属底价。
请输入公司名称
请输入姓名
请输入手机
请输入邮箱
请选择
*验证码无效
恭喜您,秒杀成功!
后续工作人员会与您进行联系
抱歉,您没有抢到!
您还可以参与其他产品的秒杀活动哦
信息提交成功
感谢您参与我们本次的问卷调查活动
请补全您的身份信息
请输入姓名
请输入企业邮箱
请输入公司全称
请输入姓名
请输入企业邮箱
请输入公司全称
请输入企业邮箱
请输入手机号
订阅成功
我们将每月通过邮箱发送资料报告发给您
请输入手机号
请输入验证码
如果您对当前页面内容感兴趣,
可填写“项目咨询单”,
进行专业咨询及帮助。
* 点击确认按钮或关闭Cookie弹窗代表您已同意以上内容。
登录后发表评论
请输入您要写的评论