“元融”:金融智能体全速冲刺不“撞墙”

作为现代经济运转的关键,金融行业的本质是对信息的高效处理与风险的精准定价。

随着AI大模型崛起,人工智能与金融行业产生出前所未有的共振,产业界亦全面形成新共识:继数字化与移动化之后,金融正迎来一场深刻的智能化变革,这不仅仅是生产工具的迭代,更是服务范式、运营模式乃至核心竞争力的系统性重塑。

尤其是智能体(AI Agent)的爆发,在合规、授信、交易、反欺诈等复杂金融场景展现中展现出的巨大潜力,加速驱动着金融AI从单点智能迈向多智能体协同。然而,智能体的规模化落地,也伴随着算力、存力等基础设施需求的结构性改变,传统金融基础设施不断承压与瓶颈突显,亟待全面走向变革。

近日,中科曙光在第32届中国国际金融展正式发布“元融”金融数智化解决方案,构建算、存、传三级强协同紧耦合架构,全面破解“I/O墙”与“通信墙”,为金融机构的智能体规模化落地带来全新路径。

智能体规模化落地:传统基础设施的AI隐痛

今年初,央行在科技工作会议上明确提出:深化业技融合,积极稳妥、安全有序推进金融领域人工智能应用,释放智能化发展动能。

事实上,在经历早期边缘辅助、知识库问答等单点智能的探索与实践之后,各类金融机构均将“智能体规模化落地”视为智能化下一阶段的关键。与前两年ChatBot等AI应用不同,智能体能够理解目标、拆解任务、调用工具、自主推理和执行复杂任务,对于信贷审批、资金管理、反欺诈、量化交易等金融场景的效能提升意义重大。

如今,以智能体为基本功能单元,实现多智能体在前、中、后台各种复杂业务场景的深度协同,已成为金融机构们数智化转型的核心目标。以合规与风险管理为例,风控与合规是金融的“生命线”,合规智能体在日益复杂的监管环境中解读监管规则、检查内部控制和辅助生成合规报告,信贷智能体则快速分析海量企业信息、提升审批质量与效率,并与合规智能体协同实现信用风险的穿透式管理。同样,在资产配置投研场景,构建机构级智能体工作流、多智能体投资模拟、群体智慧的战略配置成为趋势,深刻重塑资管机构的投研架构与日常工作……

这一转变是金融机构数智化转型的必然进阶,也对底层基础设施带来低延迟协同、Token经济效率、模型规模扩展等一系列挑战。例如,智能体在工作流中的链式调用需要快速响应,对于网络延迟极为敏感;同时,智能体在业务场景中自主推理,涉及到高频Token调用与共享,对于推理数据的快速获取尤为关键;另外,多智能体的协同工作必然会涉及到各种模型的统一管理和任务分配,对于MoE统一资源管理调度极为考验。

中科曙光北京公司副总裁 李柳

“多智能体高频并发调用与千亿参数模型的长上下文推理,需要极低时延和极高的数据吞吐能力。”中科曙光北京公司副总裁李柳介绍,“传统金融基础设施架构天然缺陷,存在存储I/O瓶颈和巨大的数据搬运开销,极易造成宝贵的AI算力‘闲置和空转’。”

为此,中科曙光带来金融智能体规模化落地的最优解:“元融”金融数智化解决方案。

元融,构建数智底座新机制

传统基础设施采用的是经典的“算力去找数据”模式,数据从存储到GPU需要经历漫长路径和转换,在千亿参数模型和多智能体高频并发的场景中,会产生难以忍受的时延,系统性短板愈发明显。

中科曙光“元融”金融数智化解决方案给出的破局方案则是构建“存、算、网深度协同”的全新数智底座机制,其核心逻辑是“算力靠近数据”,以全球首款无线缆箱式超节点scaleX40为核心,深度融合scaleFabric原生RDMA高速网络与ParaStor F9000分布式全闪存储,构建算、存、传三级强协同紧耦合架构,让计算靠近数据,从系统层面打破“I/O墙”与“通信墙”。

事实上,“元融”既非简单的硬件堆砌,也非局部的软件修补,而是基于系统级工程化能力打造驱动AI落地的数智化新底座。“元融”实现了统一内存语义的存算互联交互,在网计算与智能体通信的优化,存算网协同的统一智能调度,从而全精度满足金融机构多场景的需求。

例如,金融机构内拥有大量宝贵的私域数据,既是其构建差异化竞争力的关键,也是多智能体协同的基础,而“元融”金融数智化解决方案融入数据治理与编排,实现数据采集、处理、标注、训练、验证、部署、迭代的全数据治理流程的高效支持,为智能体规模化落地打下坚实的数据基础。

又如,Token经济效率当下成为包括金融在内所有行业拥抱AI遇到的一大挑战,“元融”金融数智化解决方案通过内嵌AI并行加速库,实现金融行业高价值私域数据的token化自动生成,让智能体的推理更加专业和精准。

再如,“元融”金融数智化解决方案融入自定义AI业务流,通过以存代算、以存促算,让存力介入AI整个业务流水线,打破算力和存力的边界,实现AI全流程加速。

据悉,得益于算、存、传三级强协同紧耦合架构,“元融”金融数智化解决方案能够平滑最大可扩容至单平面GPU卡>10万,统一内存语义管理容量>5T,且FP64算力可达4EFlops、FP16算力可达50EFlops,网络线速转发单卡分配400Gbps带宽,在组网和全精度算力性能方面远超传统基础设施。

“‘元融’基于中科曙光30年高性能计算经验、20年超大规模异构计算集群研制积累。”李柳如是说,“无论是硬件工程设计、集群系统优化,还是多集群的调度算法和安全可靠设计,中科曙光都能提供系统化的工程保障。”

两条腿走路,鱼和熊掌可兼得

当下,金融机构正站在一个智能时代的“十字路口”:一边是必须保证“业务永续”的底线,交易不能停、数据不能丢、系统不能垮;一边是必须拥抱“AI创新”的命题,AI要部署、智能体要跑起来、业务模式要重构。

如果说保障永续犹如跑马拉松,追求可预测性与高可靠性;那么赋能AI创新更像是百米短跑,追求敏捷、速度与颠覆性创新,两种需求的张力与冲突构成了金融机构当下数智化转型最大的挑战,这两种在传统金融基础设施下犹如鱼与熊掌不可兼得。为此,中科曙光构建了“两条腿走路”的发展策略,适配不同类型的场景需求,彻底破解”AI创新跑不快、核心交易稳不住”难题。

针对大模型训推、多智能体联动、智能风控、OCR合规问答等金融AI全场景,“元融”以scaleX40无线缆箱式超节点+ParaStor F9000分布式全闪存储+scaleFabric原生RDMA高速网络,实现计算、存储、传输全链路算存传三级强协同,实现计算、存储、传输全链路算存传三级强协同,显著降低长上下文推理首Token时延,提升GPU有效利用率与多Agent并发调度效率。

同时,保障业务永续是金融基础设施最原始的使命,也是数智时代最艰巨的挑战。而中科曙光FlashNexus 9000高端集中式全闪存储,集群性能达2亿IOPS,可支撑每秒30万笔核心交易处理,峰值交易速度提升约200%,时延降低30%;系统可靠性达99.99999%。另外,独有的RAID-QC四盘校验实现同池4块硬盘同时故障数据不丢,NexusMatrix全互联矩阵下4控坏3仍可稳跑,加上AA双活与两地三中心容灾,全方位守护金融核心业务平稳运行。

开放生态:让智能体在金融行业行稳致远

数据显示,2025年金融行业大模型中标项目数量同比激增341%,更加关键的趋势是应用模式正从单一的“大模型技术”向“智能体基础设施(Agent Infra)”加速迁移。显然,金融机构正加速开启一个多智能体协同的新时代。

众所周知,多智能体的精髓是协同执行,智能体的运行横跨模型层、算力层、数据层、应用层和安全层,涉及到基础设施、AI大模型、数据、应用、场景等众多环节,开放生态成为决定智能体变革能否从“试点盆景”走向“规模森林”的战略基石。如果无法构建起繁荣长久的产业生态,智能体在金融行业的规模化落地最终可能沦为镜中花和水中月。

对此,中科曙光通过兼容主流AI生态,并携手产业链上下游合作伙伴共同培育开放的智能体生态,不给金融用户制造“选择性焦虑”。例如,“元融”搭载SothisAI一站式开发、调度、运维平台软件,兼容CUDA;同时,广泛适配优化800+大模型,实现“开箱即用”。金融从业者无需面对繁琐配置,只需通过自然语言提出需求,系统即可自动拆解任务、调度算力,让开发从数月缩短至数小时,真正降低了智能体应用门槛。

更加关键的是,中科曙光注重与金融行业用户的紧密合作和应用实践,涵盖国有大行、股份制商业银行、保险公司、券商等不同类型金融机构的各种场景,携手各类合作伙伴“众行致远”,切实解决AI大模型、智能体协同等各种工程化落地难题,实现智能体在金融行业的规模化落地。

综合观察

当AI大模型与多智能体协同将信息密度和数据流转速度推向前所未有的高峰时,金融基础设施必须成为创新的“动力引擎”,而不是“减速带”。

面对AI重塑金融行业的方方面面,传统金融基础设施已无法跟上时代的节拍。中科曙光以“元融”为基石,通过算、存、传三级强协同紧耦合架构,构建起数智化新底座,推动智能体在金融行业的规模化落地,为金融数智化转型注入源源不断的动力。

分享到: 更多

为您推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注