国家数据局相关数据显示,截止今年3月,我国日均Token调用量已超过140万亿,相比于2024年初增长1000多倍;同时,OpenAI公布数据也显示,其API调用量为每分钟60亿Tokens,月度总量更是达到惊人的260万亿。
作为大模型处理信息的最小单元,Token调用量的爆炸性增长充分表明AI进入到应用爆发期,OpenClaw的“龙虾效应”、Hermes的“异军突起”……智能体(Agent)的火爆不仅带来海量Token的消耗,也直接将数据存储需求推向新高峰,更对于千亿规模的企业级存储市场产生深远影响。
过去三十年,当谈及企业级存储时,“存得下、保得住”是众多用户的核心诉求;如今,随着智能体(Agent)的爆发,“供得上、效率高”成为存储产品的新目标,这也直接推动存储产品逻辑全面走向重构。
诚如浪潮信息存储产品线副总经理郭海峰所言:“过去的数据像一个湖,它是静态且等待挖掘的;AI时代,数据更像是源源不断流淌的河流,预处理、标注、向量化、应用等阶段是一个动态的过程,这对于存储架构、产品和能力提出一系列全新挑战。”
存储产品逻辑变了
Gartner预测,到2026年底,40%的企业应用将集成任务特定型智能体;到2027年,将有50%的商业决策直接由智能体辅助或自动完成,将深刻改变组织与企业的运行方式。IDC更预测,到2030年,活跃智能体数量将从2025年的2860万增至22.16亿。
与传统应用不同,智能体并不是简单的“读取数据”,而是“理解和使用数据”。显然,随着智能体数量的爆发,并在越来越多的业务场景中承担分析、决策和执行任务,数据使用范式也会发生根本性变化,对于数据形态、加工方式和供给效率提出全新要求,这也推动着存储在AI时代的角色改变。

“进入到AI时代,存储不再是配角。存储正成为数字经济与智能生产力的核心底座,为AI赋能千行百业搭建起高效的数据平台。”郭海峰如是说。
事实上,随着智能体爆发,存储角色的改变,传统存储产品很难胜任起数据平台的重任。基于CPU通算架构发展而来的传统存储,其在数据供给效率、Token成本挑战和隐私安全等方面的短板愈发凸显。
例如,随着人工智能从“重训练”转向“重推理”,智能体开始走向规模化落地,记忆能力就成为落地的关键点。智能体长上下文记忆、多轮对话和复杂逻辑等直接导致KV Cache缓存数据量爆炸性增长,存储需要在性能、容量和效率上为智能体提供连续支撑。
同样,Token成本问题也亟待存储侧想办法化解。众所周知,进入到多智能体时代,Token大规模消耗将成为常态,Token成本就是竞争力。但GPU对于数据的渴求几乎“贪婪”,存储如无法提供低时延、高带宽的数据供给,不能更好地进行存算协同,不仅造成昂贵的算力资源闲置,还带来推理和Token成本高居不下。
更加关键的是,存储迎来一系列全新的数据安全问题,例如原始数据投毒、隐私数据泄露等,存储需要在数据校验、权限管理与容错机制上与时俱进,更好地支撑起AI训练、推理等需求。
浪潮信息存储产品线副总经理 郭海峰
“本质上,过去存储的数据、算法和应用都是围绕CPU设计展开;现在,存储产品需要围绕GPU去设计,从架构设计、底层硬件、数据链路和软件栈全部重构;同时,存储作为数据保护的最后一道屏障,需要设计出适合AI时代的安全机制。”郭海峰如是说。
A9000系列:AI数据平台的一次重要探索
无疑,进入到智能体时代,传统存储系统与现代企业需求之间的差距正迅速扩大,面向人工智能而设计的存储不仅仅是基础设施,更是企业在AI时代生产、竞争和创新的基础。
Gartner在《Hype Cycle for Storage Technologies, 2025》报告中认为,AI就绪存储(AI-Ready Storage)带来产品变革,生成式AI存储平台将成为存储创新触发期的关键技术;同时,Gartner还预测,到 2028 年,超过 20%的企业将在本地数据中心运行包括训练和推理等AI工作负载。
这并不是对云价值的否定。相反,Gartner的预测反映出AI走向全面落地的重要趋势:即基于成本、隐私和合规性的综合权衡,未来会相当大比例的AI工作负载返回本地数据中心,尤其是那些看重数据安全与合规的重要行业,会寻求企业存储平台来打造Agent AI时代高性能的数据基座。

事实上,当前整个存储行业都在围绕AI未来趋势在演进相关产品。以浪潮信息为例,其最新的A9000系列以AI原生并行架构设计为核心,针对Agent Memory高频访问进行专项优化;并内置AI原生KV Cache,将Token吞吐量提升超20倍;支持基于租户的统一资源管理、精细化权限管理及数据完整性校验。
“A9000系列推动存储从传统数据承载介质升级为深度参与推理过程、支撑多业务安全并行、保障结果可信的数据平台,是浪潮信息在AI数据平台领域的一次重要探索。”郭海峰介绍道。
具体来看,A9000系列从底层软件栈到硬件链路进行全方位重构,采用全用户态AI原生并行架构,通过全链路免锁与零拷贝技术大幅缩短存储访问路径,并支持海量上下文状态的实时检索与瞬时唤醒,确保记忆“随用随取”。
例如,企业级智能体要想真正落地,仅依靠对话级记忆能力是解决不了真实场景中的复杂任务。因此,A9000系列针对企业级智能体设计了新的记忆机制,确保智能体在多轮交互中能快速调取历史记忆,彻底规避因数据供给不及时导致的逻辑“断片”,为智能体提供连续性支撑。
郭海峰表示:“A9000系列采用GPU-Direct 链路,实现端到端的延迟降低,可提供单节点160GB/s带宽、200万IOPS和百μs级时延,使TTFT降低达97%。”
同时,由于HBM、显存等成本居高不下,加上显存占用高、重复计算多等问题,智能体涌现让KV Cache数据呈现爆炸性增长。因此,针对KV Cache的优化就成为存储领域重要的创新方向,目前业界存在着包括压缩与量化、分层存储与卸载以及池化等方向。
浪潮信息A9000系列的解决思路是内置AI原生KV Cache能力,利用创新 KV Cache 卸载与重用技术实现上下文数据的跨请求复用,大幅减少重复计算带来的算力损耗。据悉,在典型推理测试环境下,A9000系列实现Token吞吐量提升超20倍, TPOT降低96%,大幅优化单Token推理成本。
“企业级存储领域发展多年的数据全生命周期理论在AI场景同样适用,根据数据冷热程度来匹配不同的方案。现阶段出现3.5层更像是一个临时性产品,旨在解决推理效率不高的问题。未来,随着底层闪存颗粒、CXL等底层通信协议的革新,在存储第四层就可能解决这些挑战。”郭海峰表示。
此外,考虑到企业复杂的业务场景,以及AI生产环境中多业务并行、多角色协同的需求,A9000系列构建了面向AI的安全机制,基于租户的多维强隔离架构,实现数据、访问、配置的三重物理级隔离,确保多业务场景下的数据安全与访问边界;同时,基于Zero-trust安全架构实现更细颗粒度的权限管理与过程可追溯,守护用户数据隐私安全与业务运行可信。
“A9000系列产品并不是AI数据平台的最终形态。随着智能体应用的持续发展,存储相关产品与方案也将持续迭代创新。浪潮信息将会坚持存储平台化战略,瞄准一个平台或者一套方案来支撑起AI端到端流程需求。”郭海峰总结道。
AI需要存储新生态
事实上,基于企业级存储构建的AI数据平台未来将成为企业智能体全面走向落地的核心抓手,向下对接企业真实海量数据,向上连接模型与算力,决定着智能体在业务场景中“用起来、用得起和持续用”的关键。

不过,AI大模型、智能体等均处于高速发展阶段,技术路线尚未收敛,新协议、新标准、新应用层出不穷,这不仅驱动着存储产品进入到“持续迭代”的演进阶段,也酝酿着存储新生态的形成。存储生态将从过去简单的“分销”关系,将转向深度“共创”。
“浪潮信息将搭好台子,与合作伙伴共同唱好AI这场戏。”郭海峰在2026“数海同舟”存储生态合作伙伴大会上介绍道。
为此,浪潮信息首先会帮助合作伙伴完成AI时代的转型,利用全栈能力根据AI最先进趋势将最新成果转化为产品,帮助合作伙伴抛弃原有简单的分销模式和产品,平滑演进到最先进的AI方案,以实现快速转型。
此外,浪潮信息还将致力于兼容性、标准化相关建设工作上。众所周知,智能体等AI应用要想成为垂直行业的主流应用,接口对接和兼容性至关重要,浪潮信息将携手合作伙伴深入定制和联合开发,致力于应用兼容和互联互通、互操作,并积极携手业界共同制定标准,构建起AI时代的存储新生态。
综合观察
IDC认为,AI是重塑未来十年存储市场格局的根本性力量。
从“数据湖”到“数据河”,从“存数据”到“供数据”,千亿存储市场的产品逻辑的重构,本质上回答了一个核心命题:当数据不再是静止的资产,而必须成为实时流动的生产力时,存储应该扮演怎样的角色?
答案随着A9000系列的发布而逐渐浮现:存储已成为AI产业链的“主角”之一,它不再是简单的容器,而是数据的“理解者”和“调度者”。当模型能力不再是瓶颈,当应用落地成为主战场,存储将承载起数据的奔涌、托举住算力的吞吐、守护好业务的安全。
