近日,我国算力领域首个全国性会议–“2022中国算力大会”(以下简称:算力大会)在济南盛大召开。
在新基建战略稳步推进、东数西算工程正式启动的大背景下,本届算力大会很重要一项任务就是展示我国基础设施发展最新成就,加强产业交流、推广先进的基础设施理念,以及推动数字经济的高质量发展。
为此,在今年三月,算力大会组委会即启动了“创新先锋”评选活动,面向全社会征集在新基建领域具有突出创新性、颠覆性和引领性的重磅成果,着重要求有完整的应用落地成果,能切实推动新基建高质量建设和数字经济健康发展。
值得关注的是,济南超算和华为公司联合打造的“数据存储集群系统”项目成功当选2022中国算力大会“创新先锋”,该项目基于华为OceanStor Pacific分布式存储打造,用于将当前分散在各个超算中心、数据中心里的众多存储设备里的数据互联起来,通过网络进行聚合。
“数据存储集群系统”以极具创新示范作用的应用效果获得大会组委会高度认可,充分证明了数据存力是实现算力价值的前提,在新基建赋能百业、推动数字经济发展中发挥了关键作用。
数据存力:实现算力价值的前提
在今年的算力大会上,数据存力吸引了来自各界与会嘉宾的密切关注。
与算力聚焦在“算”不同,数据存力则聚焦在“数”和“存”,它是数据生产要素处理的综合能力体现,衡量数据是否存好、管好和用好的重要参考依据。
众所周知,随着数字经济的蓬勃发展,数据成为重要的核心生产要素,新的核心生产力也呼之欲出。之前,大家认为算力是新的核心生产力;如今,业界普遍意识到,当数据存力不足或者效率低下,数据就无法高效流动、按需使用和充分挖掘价值,细到会影响到算力作用的充分发挥,大则关乎数字经济能否“跑得快和跑得远”。
数据存力之所以至关重要,是因为它是继算力之后,各行各业数字化能力建设的一种进阶,在数字经济发展中不可或缺。数据存力与算力二者结合从根本上改造和升级了生产力三要素,真正形成了新的核心生产力,在各种业务场景中让效率指数级增加,生产力得以前所未有的解放。
此外,数据存力的建设与数字经济的发展已经息息相关。《数据存力白皮书》相关调研数据显示,1元在数据处理的投资能够带来30—40元的价值回报。例如,疫情期间,以数据存力为支撑的行程码项目就可以为一座800万人的中等城市节省15亿元治疗费用支出。相当于每1元的存储投资就可节约37元医疗费用,其衍生收益可以达到1:35—40倍。
而在本次算力大会上,“数据存储集群系统”获得算力大会组委会高度认可,对于数据存力的建设极具创新示范作用,有利数据存力理念的普及。
华为与济南超算联手打造的数据存储集群系统当选创新先锋
济南超算成立于2011年,是从事高性能计算和智能信息处理技术研究并提供计算服务的综合性研究中心,致力于满足国家信息、海洋、安全、新能源新材料、生命健康等科研领域的需求。
众所周知,如今的科研范式因为大数据而改变。尤其是随着数据采集、存储等技术的不断提升,海量数据的出现彻底改变了传统科研模式。过去,科研人员通常先提出可行理论,再搜集数据,之后通过计算仿真进行验证;现在,数据密集型科研场景的大量涌现,研究人员则是先采集大量的数据,再基于海量数据间的相关性验证更多研究想法和理论,获得更多新知识和新发现。
可以说,数据密集型的科研新范式核心挑战还在于数据。济南超算专家认为,当前超算中心面对异构算力和多样化应用主要面临着三大存储挑战:
- 多数据中心数据孤岛,海量数据进不来、出不去,缺乏全局的数据视图,导致数据利用率低,价值难以挖掘。例如,数据中心C的AI训练,数据源来自数据中心A和B;与此同时,数据中心A和B也需要对训练结果数据实时可见和能按需访问。
- 混合负载成为HPC应用场景的常态,这些计算负载类型多样、应用复杂、容量需求走向EB级、性能要求极高。例如,混合负载通常是I/O模型多样,比如大文件大I/O、大文件小I/O及小文件小I/O,需要底层存储能够支持多样化的算力,以满足不同负载的需求。
- 多设备、多集群和多数据中心之间的数据流动与协作困难,需要更加智能的管理方式,实现数据全生命周期的安全管理。
为此,济南超算和华为公司有针对性研究,面对跨域算力应用场景,实现了数据按需、自定义流动,满足跨域分析(AI训练,大数据分析)等多种应用场景高效使用数据需求,数据存储通过算力网络构建数据存储集群系统,实现对多数据中心全局设备互联和全局数据共享流动。
如今,“数据存储集群系统”当选“创新先锋”,不仅获得了业界专家的广泛认可,更充分证明了算力要想充分发挥价值,解决数据层面的各种挑战是关键前提。
事实上,各界专家也在本次大会上也呼吁重视算力建设的同时,亦需要对数据存力建设提速,这样才能真正打造出领先的新型基础设施,推动数字经济的持续发展。
时不我待,建设数据存力需提速
最新的《全球数字经济白皮书(2022年)》显示,中国数字经济规模达到7.1万亿美元,同比增长16.2%,位居世界第二,数字经济成为驱动我国经济发展的关键力量。面向未来,全面、深刻的数字化是大势所趋,如何释放数据要素价值成为数字经济未来持续发展的关键所在。
显然,数据存力建设的提速将是必然。
首先,数据存力已是数字经济的基础,从长远发展来看,也是一个国家在数字化时代的核心竞争力之一,必须尽早和持续投入建设。
众所周知,数据已是核心生产要素,数据有序、安全、高效的流通、共享是数字经济持续发展的前提,而数据存力则是确保数据“存好”、“管好”和“用好”的关键。今年初,《“十四五”数字经济发展规划》出台,强调数据要素是数字经济深化发展的核心引擎,提出要充分发挥数据要素作用,鼓励数据流通及共享,也必然会带动数据存力的建设投入。
其次,随着全国一体化大数据中心总体设计完成,东数西算工程正式启动,从中短期内来看,将会有一批新型数据中心建成。这批新型数据中心代表着基础设施的先进水平,不能重蹈过去算力投入和数据存力投入比例失调的覆辙,而是需要平衡算力和数据存力的投入,有利于支撑数字经济长期高效发展。
第三,从企业/组织个体来看,数字化转型的深入,新场景和新业态涌现,对于数据存储容量、性能、效率、安全性和能耗提出了全方位的要求,企业/组织需要加紧数据存力的建设,抓住数据红利,充分释放数据价值,在市场竞争力中占据先机。
总体来看,数据存力在今年的算力大会上形成了广泛共识与共鸣,越来越多决策者意识到数据存力的巨大价值。面向未来,随着新基建、东数西算等战略工程的持续推进,数据存力的作用有望得到进一步显现,在数字化浪潮中发挥更大的价值。