回顾人类历史,每一次工业革命的核心驱动力都在于解决了关键技术的通用性之后,实现生产方式的巨大变化和生产力水平质的飞跃,从而深刻影响到人类社会的发展。
同样,正在到来的第四次工业革命中,若想让作为生产要素的数据、作为生产工具的智能技术真正释放出强大的数字生产力,实现生产力范式的变革,解决AI等智能技术的通用性恰如打通“任督二脉”般关键,也即如何真正降低AI落地门槛、实现AI技术随取随用。
但这并非易事,不仅涉及到AI技术、平台的创新,更与AI应用、产业实践经验息息相关,绝非一朝一夕之功所能完成,更需要产业界伙伴的长期努力。
今天,在华为全联接大会2022中国站上,华为云正式发布了《预训练大模型白皮书》,并且全新推出了矿山、气象、OCR三个大模型、天筹AI求解器智能建模工具以及数字人大脑等共9项云服务,多管齐下推动AI产业化走向落地。
正如华为云EI服务产品部部长尤鹏所言:“华为云践行‘一切皆服务’理念,将AI等先进技术、经验和应用开放在云上,全方位帮助更多企业在数字化转型中利用好云的新能力,实现从‘上好云’到‘用好云’的跨越。”
AI落地需要这样的大模型
“有多少智能背后就有多少人工!”–这虽然是人工智能领域近年来流行的一句揶揄之语,却也道出了AI落地在理想与现实之间的窘迫。
如今AI走向落地的确遇到诸多明显挑战:
- 模型专用特定领域属性明显,使得AI模型和应用开发存在大量碎片化的现象,在构建和训练模型上往往耗费大量资源;
- 很多模型的数据质量参差不齐,数据样本少的情况比比皆是;
- 模型精度不尽人意,训练效果差和训练周期长,导致模型在真实业务场景中实际效果差强人意。
如何打破这种局面?业界普遍认为,预训练巨量模型的脱颖而出,正在努力改变这种局面。预训练巨量模型就像现阶段人工智能的一个集大成者,实现一个AI模型在多个场景通用、泛化和规模化复制,减少对数据标注的依赖,大幅降低AI开发与应用的使用成本,推动人工智能真正向着通用化、工业化、集约化发展。
例如,华为云的盘古大模型就是突出代表。盘古大模型由NLP(中文语言)大模型、CV(视觉)大模型、多模态大模型、科学计算大模型、Graph(图网络)大模型等多个大模型构成,其中,盘古NLP大模型是业界首个千亿参数的中文大模型。盘古大模型的问世是为了解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题。
如今,“预训练大模型”已经成为人工智能领域快速发展的热点方向。近年来,参数规模和模型性能不断创新高,颇有些唯“参数量至上”的趋势。但模型参数的多少并不是评判模型能力的最好标准,模型的长期规划、模型的鲁棒性以及行业落地实践才是决定“预训练大模型”能否成功的胜负手。
显然,华为云在“预训练大模型”的长远发展方面棋高一招。
据悉,自2021年4月正式发布以来,华为云盘古大模型已经发展出L0、L1、L2三大阶段的成熟体系持续进化。所谓L0是指NLP大模型、CV大模型等五大水平领域的基础大模型;而L1指行业大模型,比如气象、矿山、电力等行;L2指面向各行业中细分场景的模型,比如电力行业的无人机巡检等。
在本次大会上,华为云又正式发布了盘古矿山大模型、盘古气象大模型和盘古OCR大模型三个大模型。盘古OCR大模型解决了OCR领域算法普适性不强的问题,并将标注工作量降低90%;相较于以前的文字识别预训练模型,盘古OCR大模型在11项公开数据集中取得显著的精度提升,而且与原本领先的文字识别算法相比,盘古OCR大模型的精度平均提升5%以上。
华为云的盘古气象大模型也极具意义。众所周知,近年来极端天气频发,给全球经济和人们生活造成了极大破坏,利用人工智能技术来预测天气就成为大势所趋。华云盘古气象大模型支持秒级预测未来7天全球天气情况,相比传统预报算法,速度提升1000倍、精度提升20%。
例如,今年8月,华为云盘古气象大模型实现秒级预测台风“马鞍”的登陆时间与轨迹,平均准确率90%,远超业界。
华为云盘古矿山大模型则覆盖整个矿区的8大主要业务场景和1000多个细分场景,边用边学、自我进化,通过学习少量异常样本就能识别所有存在风险的异常情况,模型精度达98%,相比传统模型平均提升10个百分点,有效保障井下安全。
毫无疑问,“预训练大模型”的出现,是人工智能与大数据、大算力结合的必然结果,也是人工智能现阶段发展的必然趋势。但如何“预训练大模型”之路走的既稳又远,让大模型不断融入到行业场景乃重中之重。“华为云正在不断迭代盘古大模型的能力,也让盘古大模型一步步从实验室走向千行百业,成为AI开发的操作系统。”华为云EI服务产品部部长尤鹏如是说。
华为云EI服务产品部部长尤鹏
AI应用开发如何实现So Easy
如果说大模型的兴起,解决了传统AI模型的泛化、对人工标注数据的强依赖以及应用开发落地成本高等难题,在技术层面降低了AI开发与应用的门槛;那么,在工具与平台、甚至在生态层面实现突破,则有望让AI应用开发“走下神坛”和降低门槛,成为现阶段AI产业化的又一大突破点。
一直以来,AI应用开发对于算法工程师等高级人才强依赖,参与应用开发门槛极高,极大影响了AI的产能。尤其是AI技术越来越复杂的大趋势下,如何让AI应用开发走向简单化,让那些具备产业经验的人才可以很好地应用AI,对于AI在千行百业中的普及和规模化应用极具意义。
为此,华为云从工具、平台、生态等方面多管齐下,不断降低AI应用开发的门槛。
例如,华为云在本次大会上发布了天筹AI求解器智能建模工具。众所周知,求解器是针对各行各业的复杂业务问题进行最优计算和决策的专业计算软件,但往往需要懂运筹学和编程的专家才能应用起来,以至于求解器在行业中应用率不高。
华为云推出了业界首个将AI和数学规划结合的商用AI求解器–天筹AI求解器,目的就是帮助传统行业用户优化决策问题,实现高效、及时的决策。天筹AI求解器智能建模工具则简化了开发人员的建模工作,大幅压缩原本需要数月的建模时间,将求解建模速度提高30倍,进一步降低企业应用求解器的门槛,加速推动AI决策在传统行业中的应用。
在平台层面,华为云发布了基于AI资产重用的AI落地新范式及其平台ModelArts Pilot。ModelArts Pilot具备“零代码开发”“丰富的模型资源”“自动化”和“持续进化”四项优势,支持AI应用自动生成,开发工作无需强依赖算法工程师。用户仅需要提供数据和需求描述,即可触发自动化流程,在调用API后仅需几行代码即可完成AI应用开发。
除了工具和平台外,华为云还致力于推动AI应用开发生态的成长与健壮,寄希望通过生态的力量来不断哺育开发者,降低AI开发难度和开发成本。为此,华为云推出了D-Plan生态伙伴计划,联合生态伙伴进行技术创新、项目交付、项目资产沉淀至平台并进行推广和复用,构建合作共赢的AI生态体系。
目前,华为云已经与行业ISV合作伙伴打造了9个行业场景Usecase,包括出行调度、销量预测、生产排程、货架识别、工业质检、游戏AI等。这些AI Usecase和5万多个AI资产都沉淀在华为云AI平台上,开发者可以随时利用AI资产库(算法、模型等)和方案来解决AI问题。
“事实上证明,云对于推动AI产业化极具价值。在华为云上,包括AI求解器开发环境和集成工具,只需4周时间就能完成AI应用开发,相比传统方式3-6个月时间,大幅提升了AI开发效率。” 华为云EI服务产品部部长尤鹏总结道。
《预训练大模型白皮书》为何值得关注
不可否认,“预训练大模型”如今被视为解决各种AI挑战的重要路径,业界对于“预训练大模型”的研究和应用也呈现百花齐放的局面。但“预训练大模型”距离规模化商业应用,还有需要持续演进和发展,不仅包含技术的演进,更包含商业模式的进化。
为此,华为云在本次大会上正式发布了《预训练大模型白皮书》,将华为云在大模型领域的研究与落地经验进行总结。由华为云人工智能领域首席科学家、IEEE Fellow、国际欧亚科学院院士田奇带领的盘古大模型研发团队认为,“预训练大模型”将成为未来AI计算的“操作系统”,向下管理AI 硬件,向上支撑AI 算法,将使得AI 开发更加规范化、可复制。
《预训练大模型白皮书》从人工智能发展趋势的角度详细剖析了大模型的由来、现状和未来趋势,并结合盘古大模型的五大模型、应用案例等介绍了大模型的应用情况,对于各行各业的企业CIO、开发者们普及大模型的价值与作用大有裨益。
例如,《预训练大模型白皮书》有两个重要判断:其一、在下一个划时代的计算模型出现以前,大模型将是人工智能领域最有效的通用范式,并将产生巨大商业价值;其二、对大模型的研究,将可能启发下一个通用计算模型。
另外,《预训练大模型白皮书》并未一味神化“大模型”的作用,而是从客观角度认为“预训练大模型”存在着局限性,即数据集越大、模型越大,提升同等精度所需要的代价就越大。为此,《预训练大模型白皮书》也探索了大模型落地的新思路,即针对小样本、长尾分布场景,云训练大模型与预置工作流配合往往能达到很好效果。
数字化是一道必答题。华为云希望让技术不难选、不难用,让企业从‘上好云’到‘用好云’,尤其是从多方位推动AI产业化,真正帮助千行百业的用户释放数字生产力,从而实现跨越式发展。