两年80亿美刀,云与AI的创新之路

近日,AI圈再出一条爆炸性新闻:亚马逊向Anthropic追加第二笔40亿美元。这是继去年投资40亿美元值之后,亚马逊对Anthropic又一大战略动作。

Anthropic是当前与OpenAI比肩的AI当红炸子鸡,其 Claude系列大模型获得市场广泛好评,市场占有率正在迅速攀升,直逼OpenAI。

如果仔细观察,无论是OpenAI与微软Azure还是Anthropic与亚马逊云科技,在Scaling Law法则的驱动下,大模型对于基础设施的规模、能力要求越来越高,云与AI的结合程度正迅速加深。例如,在此次亚马逊追投Anthropic中,亚马逊云科技从Anthropic的首选云服务商到现在又增加了“模型训练首要合作伙伴”,Anthropic计划使用Amazon Trainium和Amazon Inferentia芯片训练和部署未来的基础模型”。

可以说,亚马逊云科技与Anthropic的战略合作,正在上演云与AI创新的绝佳范本。下文将回顾亚马逊与Anthropic的合作历程,以及二者在战略合作之后,如何将Claude系列模型打造成业界顶尖大模型。

一年时间见证云与AI的紧密结合

众所周知,在大模型领域,大模型遵循Scaling Law法则发展,即独立增加训练数据量、模型参数规模或者延长模型训练时间,预训练模型的效果会越来越好。可以说,随着大模型规模越来越大,算力规模决定着AI迭代与创新的速度,也影响着AI应用的覆盖广度。

在人工智能时代,云与AI的结合成为必然。云服务商的算力基础设施无疑是最为领先,无论是算力基础设施的规模、运维能力,还是资源使用模式,都能够为大模型的训练、推理和应用提供最佳保障;而大模型等AI创新企业,则能够利用云服务强大和弹性的算力资源,聚焦在大模型的创新与应用上。

显然,从亚马逊与Anthropic短短一年的战略合作来看,云与AI结合带来的持续创新不可低估。下面我们回顾一下双方合作的历程:

  • 2023年9月25日,亚马逊宣布与Anthropic正式展开战略合作。合作内容包括:亚马逊云科技将成为Anthropic的主要云服务供应商;Anthropic将使用Amazon Trainium和Amazon Inferentia芯片来构建、训练和部署其未来基础模型;Anthropic长期承诺将通过Amazon Bedrock向全球亚马逊云科技客户提供其未来基础模型的访问权;亚马逊向Anthropic投资40亿美元。
  • 2024年3月5日,在Claude 3系列模型横空出世,亚马逊云科技宣布在Amazon Bedrock中提供Claude 3模型,客户将可以通过Amazon Bedrock访问Claude 3系列的三个支持视觉功能的模型——Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku。中杯——Claude 3Sonnet正式可用。
  • 2024年3月15日,小杯——Claude 3 Haiku在Amazon Bedrock中正式可用。它是Claude 3系列中响应速度最快、最紧凑的模型,旨在提供近乎实时的响应速度,以及无缝的生成式人工智能(AI)体验。
  • 2024年3月28日,亚马逊宣布完成对Anthropic的40亿美元投资。
  • 2024年4月17日,大杯——Claude 3 Opus在Amazon Bedrock中正式可用。至此,Claude 3家族全员到齐。
  • 2024年6月21日,Claude 3.5系列发布,中杯——Claude 3.5 Sonnet同时一时间在Amazon Bedrock上正式可用。
  • 2024年10月23日,Claude3.5 Sonnet增强版和Claude 3.5 Haiku发布,Claude 3.5 Sonnet增强版同步在Amazon Bedrock中正式可用。Claude 3.5 Sonnet目前在Amazon Bedrock中提供突破性的“电脑操作computeuse”功能(公测版),开发人员可以指示Claude像人类一样使用计算机:查看屏幕、移动鼠标、点击按钮以及输入文本。
  • 2024年11月4日,Claude3.5 Haiku在Amazon Bedrock中正式可用。
  • 2024年11月23日,亚马逊与Anthropic深化战略合作,追加第二笔40亿美元投资。

回顾2024年,Anthropic多次刷新大型语言模型的性能基准,成为整个大模型领域最为闪亮的明星。仔细分析,Anthropic每一代Claude模型都会在发布的第一时间在Amazon Bedrock中推出。Anthropic能够在熟悉的云环境中使用这些最新的领先模型,从而大大加快创新速度。亚马逊云科技与Anthropic此举无疑会驱动产业界更多AI公司加紧拥抱云计算,充分利用云的基础设施等优势,来加速自身创新速度,从而在竞争积累的市场中获胜。

Claude的成功,让云与AI值得更多期待

如今,Anthropic被认为是OpenAI在市场中最大的竞争对手。在今年多项大模型评测中,Anthropic Claude 3.5 大模型多次击败OpenAI。有分析预测,预计2024年OpenAI的市场份额将下降到34%,而Anthropic的市场份额预计将飙升至24%,呈现出超越OpenAI的强劲势头。

Claude3.5 Sonnet基准测试对比成绩

事实上,自Claude 3推出后,该系列模型始终处于生成式AI模型研发领域的第一梯队,Claude 3.5 Sonnet增强版中新增的电脑操作功能引发了人们对生成式AI的又一轮关注热潮。同时,升级后的Claude 3.5 Sonnet相较于前代有了全方位的提升,在编码这一强项上更是进步显著,并在多个行业基准方面都展现出全面的改进。

例如,Claude3.5 Sonnet在编码方面将SWE-Bench Verified 的性能从33%提高到49%,超过了所有公开模型的得分。

据悉,Anthropic接下来将亚马逊云科技指定为其模型训练首要合作伙伴,并计划使用Amazon Trainium和Amazon Inferentia芯片训练和部署未来的基础模型。2023年亚马逊云科技发布了Amazon Trainium2显著提升性能和能效,适配更大规模的分布式训练任务,并在集群性能扩展方面达到超算级水平;Amazon Inferentia则是亚马逊云科技自研的推理芯片,Amazon Inferentia2芯片可帮助客户将推理任务的成本降低40%。

亚马逊云科技首席执行官Matt Garman表示,通过在Amazon Bedrock中继续部署Anthropic模型,并与Anthropic合作开发定制化的Amazon Trainium芯片,我们将不断拓展生成式AI技术的应用边界。

Anthropic联合创始人兼首席执行官Dario Amodei也认为,过去一年是Anthropic突破性增长的一年,与亚马逊的合作至关重要,这使Claude模型的能力得以覆盖Amazon Bedrock上数万个客户的数百万终端用户。

可以期待的是,即将在拉斯维加斯举办的2024 re:Invent大会上,亚马逊云科技与Anthropic之间还会宣布哪些信息,这将是今年底整个AI圈最为关注与期待的热点。

综合观察,与国内百模大战的景象不同,北美市场的大模型市场竞争正在呈现出收敛的趋势,Anthropic等公司在现阶段凭借着与云服务商的紧密合作,迅速在算力等基础设施层获得了优势,加速了自身模型的迭代与创新速度,进一步拉开了其他竞争对手的距离。面向未来,随着亚马逊云科技与Anthropic合作的加深,云与AI的创新之路也值得更多期待。

分享到: 更多

为您推荐

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注