5月24日,在德国汉堡举办的ISC2023高性能计算大会上发布了最新IO500榜单,国家超级计算济南中心构建的验证性计算集群,在10节点研究型榜单登顶夺冠,测试得分突破13万,继济南超算山河计算集群在ISC2022夺冠后,超越历史最佳纪录15倍。
参加此次大会的济南超算团队相关负责人、济南超算总工程师王继彬在接受记者专访时表示,该项佳绩不仅意味着济南超算的存储基础设施问鼎全球,也标志着我国自主可控存储系统实现“弯道超车”。存储速度优化到极限在本次测试中,济南超算在10节点研究型榜单登顶夺冠。
“10个节点是什么意思呢?就是测试规则是有十个计算节点客户端去连接我们的存储系统,然后跑一个标准测试程序,完成测试涉及的各项指标,最终的参数得分项也就代表了我们存储系统的能力。如果一个节点10分,我们团队研究的这个存储系统一个节点能跑10分,两个节点能跑20分,10个节点就能跑接近100分,成绩呈现出良好的线性性能,可以说整个团队在针对存储性能优化方面,基于目前的硬件配置,我们做到了可优化的极限。”
本次全球算力比拼成功的背后并非一帆风顺。“提交分数截止时间是5月16日,但在4月21日,团队依然存在欠缺机器、部分机器故障等问题。在时间紧任务重的前提下,团队拧成了一股绳,所有难题的解决时间都被尽量压缩到一天以内。最终在整个团队的努力运作下,提前3天完成最终结果提交并斩获佳绩。”王继彬说。
存储能力实现“弯道超车”
记者采访了解到,此次济南超算全球算力比拼所用的配置,从硬件到软件,全部实现了“国产化”。
“我们这次所用的存储系统是国产研发100%自主可控存储系统。以前计算机里用的是机械硬盘,这是我们国家生产不了的,我们现在用的这套硬件存储系统所采用的‘固态硬盘’,从存储颗粒到主控芯片都是国产自研,不存在任何‘卡脖子’问题,单盘的读写速度比机械硬盘快20多倍。不仅如此,我们匹配存储的软件也是完全国产化。就是在全套‘国产化’的基础上,我们的成绩超越历史最佳纪录15倍,这就意味着中国在计算存储方面,已经实现了弯道超车。”
“计算速度、存储能力、网络性能”是评价计算性能的“三驾马车”。2011年,济南超算作为中国首批成立的国家超算中心,其90%的算力支撑都来自国产“神威·蓝光”计算机,凭借几乎全部国产的配置,实现了算力世界领先。此次“打榜”问鼎全球,意味着我国在存储能力上用“国产马车”跑出全球领先速度。
“超算中心是国产计算机软硬件的‘练兵场’。像华为、华中科技大学等公司和科研机构专注于如何用国产计算机替代国外计算机,超算中心则是从应用上给他们提供了练兵的机会和平台。因此这一次的测试,也充分证明了我们国产化配置存储系统一点不比国外差。”王继彬说。
记者采访了解到,在网络国产化替代上,济南超算已经开始布局,并已经在验证性集群上实现整套网络性能的测试,大部分应用场景可与国外持平。“下一步,我们还将在互联网络涉及的软硬件上进一步探索和优化,力争实现‘国产车道跑国产车’。”
未来应用到千家万户
存储系统属于算力的底层支撑系统,其整体自主可控,对国家算力发展至关重要,并且与百姓生活息息相关。
“比如气象预报的模型计算,假设之前是每秒能读取1G的数据,现在用我们这套存储系统,就有可能一秒钟读取能力提升到15G。以前要1个小时算完,现在存储系统性能提升了,有可能就缩短到40分钟,如果每天要算12次,那有可能因为缩短20分钟,每天能多算6次,这样的话预报精度更高。再比如要做一个平面设计渲染,或者说去渲染一段电影特效,有可能用以前的存储系统,光打开就得花几十秒,现在可能5秒钟就打开了,读取性能的提高使得渲染计算效率大大提升。”王继彬说。(济南日报 记者:李小梦 实习记者:张听源 袁海斌)