鹏城云脑II正式发布,中国开启E级AI超算时代

鹏城云脑上新啦!

2019年11月29日,鹏城实验室与华为在深圳共同发布了鹏城云脑II。这是继鹏城实验室主任高文院士在今年华为全联接大会上介绍鹏城云脑基本规划情况之后,鹏城云脑的又一大最新进展。

鹏城云脑之所以会受到极大关注,一方面是因为它是直接对接国家新一代人工智能发展战略和重大科技工程的创新基础平台,聚焦在新一代人工智能基础研究以及突破信息处理领域重大科学理论基础问题等领域;另一方面,鹏城云脑的建设代表着多样化计算重要的发展方向,对于异构计算未来的应用与实践具有极为重要的参考价值。

鹏城云脑II正式发布,中国开启E级AI超算时代

华为高级副总裁、Cloud & AI产品与服务总裁侯金龙(左)与鹏城实验室主任高文(右)出席鹏城云脑Ⅱ发布会

据了解,已经建成的鹏城云脑I峰值性能达到100 PFLOPS,而鹏城云脑II则是可以实现AI算力自由扩展至千P级的AI超算系统,以华为Atlas 900 AI集群为底座,通过多样化的异构计算平台、多源算法平台和多态智能应用,支撑AI 重大应用的模型训练及推理,可用于自动驾驶、城市大脑、智慧医疗、智慧交通、语音识别、自然语言处理等应用场景。

如今,鹏城云脑II的正式发布,华为Atlas 900 AI集群将在其中发挥至关重要的作用,这意味着鹏城实验室在打造软硬件一体化人工智能开源开放平台上迈出了重要一步,也是鲲鹏计算产业在科研领域的重大进展,堪称鲲鹏计算产业开始全面发力的又一大强音。

Atlas 900为鹏城云脑II打造最强底座

如果说通用计算是传统的汽油引擎,那么多样化计算就是面向未来的混合动力引擎,它代表着未来计算最重要的发展趋势。尤其是自动驾驶、机器视觉、智能语音等大量人工智能应用的大量涌现之际,各种神经网络算法以及相应的计算架构层出不穷,产生对于多样化异构计算的爆发式需求。

鹏城云脑作为探索人工智能奥秘和打造人工智能先进技术的基础性研究平台,是立足深圳面向全国的超大规模人工智能科研平台,对于多样性计算的需求可谓是与日俱增。自鹏城云脑I建成运行以来,平均每天运行500多个科研任务,支撑着来自北大、清华等高校的科研人员对于人工智能相关科研工作。

鹏城云脑II正式发布,中国开启E级AI超算时代

鹏城云脑

为应对日益增长的AI算力需求,进而吸引和汇聚更多科研人员在在鹏城云脑上进行相关研究,鹏城实验室与华为共建了鹏城云脑II,采用搭载鲲鹏、昇腾处理器的Atlas 900集群来提供充沛的算力。华为高级副总裁、Cloud & AI产品与服务总裁侯金龙表示:“今天华为Atlas 900集群系统正式入驻鹏城云脑Ⅱ,为鹏城云脑Ⅱ提供坚实的底座。鹏城云脑Ⅱ是业界领先的AI研究平台,鹏城实验室汇聚了大批院士与优秀AI研究人才,秉承双方共建鹏城云脑Ⅱ的理念,华为与鹏城实验室携手共同探索智能世界的未来方向、共同研究智能世界的难题。现在建设的是鹏城云脑Ⅱ一期,相信在各方共同努力下,千P级的鹏城云脑Ⅱ将指日可待,我们有信心把鹏城云脑Ⅱ打造成全球持续领先的AI研究平台。”

华为Atlas 900 AI集群是在今年华为全联接大会上正式推出的,由数千颗昇腾910 AI处理器组成,是目前全球训练最快的AI集群,代表着当今全球AI算力的巅峰。昇腾910 AI处理器则是目前全球最快的人工智能处理器,其性能比其他竞争对手高出两倍。

在衡量AI计算能力的标准ResNet-50图片分类模型下,Atlas 900只需59.8秒就完 成了训练,在同等精度下比原世界纪录快10秒。Atlas 900凭借其强大算力,可广泛应用于科学研究与商业创新,比如天文探索、气象预测、自动驾驶、石油勘探等领域。

Atlas 900拥有以下三大创新特性:

  • 强劲算力:数千颗昇腾910 AI处理器互联,半精度(FP16)算力达256-1024 PFLOPS,相当于50万台PC机的算力;采用SoC设计,整合了AI算力、通用算力 和I/O,有效提升训练效率。
  • 高速集群网络:采用HCCS、PCIe 4.0、100G以太三类高速互联方式,梯度同步时延缩短10%~70%;独创iLossless 智能无损交换算法,对全网流量进行实时 的学习训练,实现网络零丢包与端到端微秒级时延。
  • 高效散热:采用柜级绝热密闭系统,液冷占比可大于95%,系统能效比小于1.1。

华为智能计算业务部总裁马海旭表示:“华为Atlas人工智能计算平台基于华为昇腾系列AI处理器,通过模块、板卡、小站、AI服务器、集群等丰富的产品形态,打造面向‘端、边、云’的全场景AI基础设施方案,覆盖深度学习领域推理和训练全流程。Atlas 900作为Atlas系列的旗舰产品,代表了当今全球AI计算的领先水平,我们希望通过Atlas 900与鹏城云脑Ⅱ的合作,共同建设千P级AI集群应用,为业界提供充沛的算力,加速全行业智能化升级。”

除了Atlas 900 AI集群之外,华为已经基于昇腾910和310 AI处理器打造出全系列丰富的产品,包括Atlas 900 AI集群、Atlas 800 AI服务器、Atlas 500 智能小站、Atlas 300 AI加速卡和Atlas 200 AI加速模块等,可以面向云、边、端全场景的训练和推理提供强劲算力。

鲲鹏计算产业强音奏响

一个事实:鹏城云脑I是构建在国际GPU巨头产品之上的,而鹏城云脑II则是全面采用华为Atlas 900 AI集群。这是对华为AI计算产品充分认可,也是鲲鹏计算产业开始全面发力的一个缩影。

众所周知,华为在今年9月份正式发布了基于“鲲鹏+昇腾”的计算战略,并且开始着手打造“一云两翼双引擎”的鲲鹏计算产业布局。所谓双引擎指围绕“鲲鹏”与“昇腾”打造的两个基础芯片族,构筑异构的计算架构;而两翼则是指智能计算业务以及智能数据与存储业务,智能计算是面向端、边、云提供“鲲鹏+昇腾+x86+GPU”的多样性算力,智能数据与存储领域则融合了存储、大数据、数据库、AI,围绕数据的全生命周期让数据成本最优、价值最大;一云是指华为云,成为生态伙伴的黑土地,为世界提供普惠算力。

鹏城云脑II正式发布,中国开启E级AI超算时代

一云两翼双引擎

毫无疑问,在鲲鹏计算产业中,产品与技术无疑是整个产业发展的基石,它们的领先性将决定了未来产业能够走多远。回顾华为过一年多的诸多动作,很大一部分都在围绕多样化计算推出业界领先的产品,以夯实整个鲲鹏计算产业的基础。

以AI处理器为例,华为在2018年推出了昇腾310,今年则推出了昇腾910处理器以及全场景AI计算框架MindSpore。其中,用于推理的昇腾310,整型(INT8)算力16 TOPS,功耗仅8W;昇腾910半精度 (FP16)算力达到256 Tera-FLOPS,整数精度 (INT8) 算力达到512 Tera-OPS,达到规格算力所需功耗仅310W;而MindSpore全场景AI计算框架则可以针对不同的运行环境进行部署,大幅降低了AI应用开发门槛。

而鲲鹏处理器则从2007年开始研发,已经历时12年,今年推出的第三代芯片鲲鹏920则是业界首颗兼容Arm架构的64核数据中心处理器,性能比业界主流处理器高25%、内存带宽高60%;同时把CPU、桥片、网络和磁盘控制器“4合1”,是业界集成度最高的数据中心处理器。

在智能数据与存储方面,华为今年推出了全球首款AI-Native数据库GaussDB和OceanStor分布式存储。GaussDB首次将人工智能技术融入到分布式数据库的全生命周期,实现了自运维、自管理、自调优、故障自诊断和自愈,并且通过异构计算创新框架充分发挥X86、ARM、GPU、NPU多种算力优势,在权威标准测试集TPC-DS上性能比业界提升50%,排名第一。OceanStor分布式存储首次实现一套存储同时支持块、文件、对象、HDFS协议,单节点性能高达16.8万每秒读写速度(IOPS)和1毫秒以内时延,在业界标准测试SPC-1中排名第一。

事实上,在整个计算架构体系迎来变革之际,计算产业迎来了两万亿大蓝海的机会。华为过去一年多一系列产品的推出,涵盖了从芯片、服务器、存储,到操作系统、数据库、计算框架等,已经初步为鲲鹏计算产业打下了牢固的产品基础。就如华为在今年全联接大会上所言:华为将按照‘量产一代、研发一代、规划一代’的节奏投资芯片,持续演进,后向兼容,为产业发展提供长远保障。

除了领先的产品之外,华为还采取了硬件开放、软件开源、使能合作伙伴的策略,与合作伙伴共同把鲲鹏计算产业做大做强。

2019年是鲲鹏计算产业的元年,无论是新产品的发布,还是各种合作策略的推出,更像是华为在为鲲鹏计算产业打基础。而年末鹏城云脑II的发布就像一个音符,它奏响了鲲鹏计算产业全面发力的强音。未来,随着华为产品、解决方案、生态策略等进一步完善,鲲鹏计算产业将唱响多样化计算时代的最强音。

分享到: 更多

为您推荐

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注