从联接到赋能,新华三用端网协同加速“人工智能+”

在AI技术飞速发展的热潮中,智算网络已不再是传统的“流量管道”,而跃升为AI算力释放的“新引擎”,成为推动智算中心持续升级的关键变量。

尤其随着DeepSeek等MoE架构的AI大模型兴起,AI大模型的参数量与通信规模持续增加,以及多元算力生态的逐步形成,网络流量呈现出不确定性、Token带来的随机性、流量波峰与波谷交织等新特征,对于网络的带宽、调度、可靠性和扩展性带来极大考验。

因此,产业界愈发形成共识:智算中心不能仅依靠简单的堆砌算力,而亟需构建端网协同的智算网络,以此撬动整个AI基础设施资源的高效利用。

近年来,新华三前瞻性提出“算力×联接”开放战略,用一系列领先的智算网络产品与解决方案实现杠杆效应,大幅提升整个智算中心的算力利用率。正如新华三集团高级副总裁、网络产品线总裁乔剡在第九届未来网络发展大会上所言:“在算力狂飙的时代,网络的价值绝非仅仅是‘成本项’,更应该是‘赋能者’。”

新华三集团高级副总裁、网络产品线总裁 乔剡

智算网络需迈过三道坎

IDC《中国人工智能计算力发展评估报告》显示,2024年中国人工智能算力市场规模为190亿美元,同比增长86.9%,预计2028年,市场规模有望达到552亿美元,未来几年将保持高增长。

AI算力的高速增长,背后是AI大模型快速迭代对于算力的极度渴望,以及百行百业对于智能化的迫切需求。在整个智算中心中,智算网络恰如“高速公路”,承载着澎湃的AI算力。当AI算力狂飙之际,“流量洪峰”也如约而至,且充满不确定性和复杂性,智算网络这条“高速公路”如何不“失速”就成为整个产业界的焦点。

在乔剡看来,AI算力的快速发展,正对下一代智算网络提出三大关键挑战。

智算网络首先面临的是单集群规模不断提升带来的超大规模组网挑战。当万卡/十万卡集群不断出现时,AI集群复杂性与脆弱性也随之放大,如何确保无损传输并发挥强劲性能,就需要智算网络在端口密度、带宽/径向与收敛时延上同步演进。

此外,流量调度和端网融合也对智算网络带来极大考验。众所周知,AI大模型流量具有不可预测性和多变性特点,像集合通信(All-to-All)等高强度交互模式会形成难以预测的瞬间“流量洪峰”,很容易导致网络拥堵与瘫痪,这需要智算网络高效灵活的敏捷调度能力,以端网协同支撑起复杂流量的调度。

最后,大部分智算中心并非单一、同质化的算力架构,而是呈现出多元化趋势。然而,硬件协议、接口和软件栈的差异,也导致硬件之间“语言不通”,算力协同更无从谈起。智算网络则需要成为多元算力协同的核心抓手,以开放战略促进多元算力的并存发展,从而充分释放算力的价值。

“过去,计算、网络处于相对割裂的状态。进入到智算时代,AI集群规模不断扩大,带来更加复杂的流量动态和多元算力接入需求,网络的重要性也持续提升,网络需要打破割裂的状态,与端侧主动联动。”乔剡介绍道,“网络已成为决定算力收益的重要因素,其性能优化、改进对于AI算力意义重大。”

多维创新,让智算效应最大化

近年来,新华三提出“算力×联接”的战略,旨在通过技术架构、产品和解决方案多个维度的创新,实现从传统RoCE领域的持续创新,到打造新一代无损网络解决方案,再到全场景定制化智算方案,全方位深化端网协同效应,为AI算力发展构建起开放、高效和智能的“高速公路”,帮助百行百业步入智能化转型的快车道。

众所周知,传统网络架构一大短板就是技术架构的落后,无法支撑起AI算力高速发展的需求。为此,新华三面向万卡级算力互联场景打造出DDC(Diversified Dynamic-Connectivity,多元动态联接)架构,实现“超大规模、极致性能、开放解耦、智能运维”四大技术突破,高效解决智算网络中流量拥塞与调度难题,为智算网络能效提升夯实了全方位基础。

“DDC架构采用端到端全局调度机制,依托信元交换技术,可以快速适配网络流量变化和无感切换,很好地契合了智算场景的网络需求。”乔剡表示。

如今,端网协同已成为释放AI算力潜能、提升AI集群效率的关键抓手。除了架构层面创新之外,新华三还通过各种算法的创新突破智算网络各项挑战。以端网流量的有序协同为例,新华三通过熵值有序分配和增强CBRC算法,利用AD-DC智算版智能管控分析平台实现对于智算网络全生命周期运维管理,全流程保障高效算力互联。

此外在产品层面,新华三已经打造出智算网络产品矩阵,包括传统RoCE领域、创新DDC架构方案、以及定制化智算产品等,覆盖互联网、政府、运营商等多个行业不同规模的用户,可以灵活满足市场的多样化需求。

以AI智算交换机为例,新华三本次未来网络发展大会上正式发布800G AI智算交换机H3C S9828-128EP。该产品具备128个800G端口,为当前业内单机容量最高;二层组网架构下,相比上一代产品节省70%的设备用量和50%的光模块用量,全部端口均支持 LPO/LRO 光模块,实现超低时延传输和大幅降低能耗。

事实上,今年以来超节点、AI智能体等新趋势,也在潜移默化推动智算网络的持续变革。以超节点为例,突破单服务器、单机柜的限制,对于高速互联、集群协同、节点间通信和延迟性能提出了更多复杂需求;另外,智能体的崛起和进入到网络运维领域,也让智算网络的运维模式产生重要影响。

“对于中小规模的智算集群而言,超节点是一个很好的方案。不过,超节点的关键是需要在一个相对紧凑的空间做出弹性、高可靠和快速交付的智算系统,考验厂商的复杂工程能力。”乔剡直言道:“AI赋能网络也是一个重要趋势,但会是一个循序渐进的过程,智能体对于协助运维工程师提升工作效率和快速积累有很好帮助。未来的网络运维机制将是人机协同,运维人员通过多智能体组合进行优化和运维,最终决策还是需要人。”

开放的智算网络,让“人工智能+”行稳致远

人工智能已上升为我国的国家战略。近日,国务院又正式发布《关于深入实施“人工智能+”行动的意见》,确定实施科人工智能+科学技术、产业发展、治理能力等六大重点行动,明确分2027年、2030年、2035年三阶段推动人工智能与经济社会各行业各领域广泛深度融合。

可以预见,随着《意见》的颁布,百行百业将加速走向智能化,智算中心将成为众多行业智能化转型不可或缺的数字底座。这其中,一个开放和持续的智算网络对于加速“人工智能+”行动计划至关重要。

众所周知,封闭的技术生态在早期固然可以快速构建起门槛,但从长期发展来看则会成为产业创新的桎梏 。而智算网络的未来,将不仅仅是带宽和性能的竞赛,更是开放性和协同性的博弈。

尤其考虑到当下国内市场面临着先进AI算力稀缺、国产AI算力呈现多元化和有待成长的现实状况,一个开放的智算网络对于未来智算中心发展意义重大,开放不仅能够推动多元算力的适配、接入和互通,还能激发AI算力的创新活力,更有望带动产业标准的建立,以及加速行业智能化的进程。

无疑,新华三是目前市场中致力于构建开放智算网络的重要代表,无论是“算力×联接”的开放战略,还是DDC技术架构,亦或各种组网方案,新华三将开放的理念贯穿战略、技术和产品方案等多个层面,并与产业链上下游伙伴共同打造开放、多元、可持续的智算生态。

“新华三会通过先进的工程实践,继续深耕全域智算产品研发,并坚持多元芯片战略,致力于携手产业链伙伴建设开放标准,为行业的智能演进构筑基石。”乔剡最后总结道。

分享到: 更多

为您推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注