Deepseek后首个!MiniMax连发5个产品刷爆外网

在全球AI竞赛进入“下半场”的关键节点,一家来自上海的AI独角兽公司——MiniMax,用一场史无前例的“技术发布周”,宣告其在基座模型、多模态技术和通用智能体Agent、视频Agent等领域的全面突破。

那么,在这场不断进击极限的赛道上,他们是如何率先冲破技术边界、跨越现有上限的?

一、开源MiniMax-M1 重塑成本效益

当下,人们对AI的态度愈发务实,AI竞赛的焦点逐渐从模型参数转向效率成本和落地能力的综合比拼。

美国斯坦福大学发布的《人工智能指数报告》(AI Index Report 2025)首次对推理成本进行了追踪,报告显示,推理成本在过去两年中降幅超过 280 倍。硬件层面,成本每年下降约 30%,而能效每年提升约 40%,成本效益显著提升。

近期,大规模混合架构推理模型MiniMax M1重磅开源,重塑成本效益,闭源模型的技术壁垒被开源力量快速消解。

MiniMax-M1发布后在海外引起了开发者的广泛探讨:

社交平台X知名AI博主MinChoi评论称,MiniMax-M1简直可以说集Manus 、Deep Research、计算机技能和可爱于一体,随即他还展出了自己用MiniMax-M1做的10个有趣案例;美国知名科技媒体 VentureBeat 称为“正在搅动全球模型格局”,并成为当前开源体系下极具代表性的高性价比大模型;科技媒体The Decoder 则将其性能对标 Google Gemini 2.5 Pro,进一步印证了 MiniMax 在全球技术版图上的崛起地位。

MiniMax M1被誉为“全球首个开源大规模混合架构的推理模型”,其核心价值不仅在于多个生产力场景中比肩甚至超越顶尖闭源模型,更在于其极致的成本效益和技术创新,为AI的规模化应用提供了全新可能。

其独特的“闪电注意力”(Lightning Attention)混合架构与创新性的CISPO算法,在实现业内最高的100万上下文的输入与业内最长的8万Token的推理输出的同时,可以大幅提升计算效率。

技术报告显示,在进行8万Token深度推理时,所需算力仅为同赛道强手DeepSeek R1的约30%,实现了性能与效率的完美统一。在最新的 Artificial Analysis Intelligence Index 榜单中,MiniMax M1位列全球开源模型第二名。

更快的收敛意味着更少的训练时间和资源消耗。得益于CISPO算法的高效,M1模型的整个强化学习阶段仅使用了512块英伟达H800 GPU,耗时三周,成本仅为53.5万美元。

MiniMax官方表示,这一成本“比最初的预期少了一个数量级”,足见其技术路线在成本控制上的巨大潜力。

二、Hailuo02:突破物理极限 实现电影级AI视频创作

在M1搅动语言模型市场的同时,MiniMax近期的另一款发布——新一代视频生成模型Hailuo 02,则在多模态领域投下了一颗更具视觉冲击力的“炸弹”。

据介绍,这是目前全球唯一一个可以实现类似高复杂物理场景的视频大模型。一经发布,海外社交媒体上便充满了Hailuo 02生成的高难度动作视频,其中一个猫咪跳水的视频5 小时就引得超过全球上亿人围观。

具体来说,Hailuo 02的核心突破,在于其创新的Noise-aware Compute Redistribution(NCR)架构,在将模型参数和训练数据量分别提升3倍和4倍的同时,实现了2.5倍的效率飞跃。

在国际权威测评榜单Artificial Analysis视频竞技场中,Hailuo-02一经发布便迅速拿下全球第二的宝座,领先于Google Veo3和快手可灵(Kling)。

可以看出,最终呈现的效果是惊人的,原生1080P高清画质直接输出电影级的视频画面;极限复杂运动场景的实现体操运动员在空中连续翻转的流畅身姿、马戏演员喷火时火花与光影的逼真互动,轻松实现这些对时空一致性和物理逻辑性要求极高的场景。同时,受益于模型架构创新,海螺02模型官方价格显著低于Runway、可灵等国内外同行,实现行业底价。

总结来说,Hailuo-02在对物理世界规律的理解和表现上,已经实现了全球性的突破,更以“世界一流的效果”和“颠覆性的成本效益”,直接叫板Veo3等国际顶尖模型。

三、发布MiniMax Agent “解放用户手脚”

如果说M1和Hailuo-02是MiniMax强大的“发动机”和“眼睛”,那么同步官宣的通用智能体产品——MiniMax Agent,则是这家公司对“AI能力”的深刻思考和交付回答。

这个可以完成长程复杂任务(Long Horizon Complex Tasks)的通用智能体,不仅能多步规划出专家级解决方案、灵活拆解任务需求,还能执行多个子任务,从而交付最终结果。

比如面对“Mag 7投资组合双移动平均线策略收益率分析”这类需要大量信息搜集、筛选和验证的开放式任务,MiniMax Agent能够活用多种工具,进行深度的网络研究,并最终给出精准、可靠的建议。

无论是做一套中学物理课件,还给《长安的荔枝》做一个剧情介绍网站,MiniMax Agent所制作的PPT均是排版灵活、视觉美观,网页更像是文化机构做的宣传站点,甚至能用3D 动态演示发动机的四个冲程,效果能直接用于教学。

“做一套中学物理课件,讲冲量和动量,要带动画演示”

“根据马伯庸小说《长安的荔枝》,做一个剧情介绍网站,风格设计自己定”

这些案例,仅仅是MiniMax Agent强大交付能力的冰山一角。

据悉,在MiniMax 内部,该产品已经被使用了两个月,逐渐成为内部超过50%的员工日常使用的产品。

四、Hailuo Video Agent 开启“Vibe Videoing”创作时代

为了大幅降低视频创作门槛,让用户以自然语言输入即可一键生成专业级成片,MiniMax推出了国内首个实现“成片直出”的视频创作智能体——Hailuo Video Agent,开启“零门槛Vibe Videoing”创作时代,用户可以自动分析、构思并生成具有专业水准、富有观看价值的完整视频内容。

曾经奉行“规模至上”的Scaling Law教条正被多元创新路径瓦解。具体来说,MiniMax在视频Agent中实现了以下技术创新:

  • 自然语言驱动全局:抛弃传统工作流+节点的工具模式,通过LLM语言模型,AI自动拆解任务并调用最佳工具链,创新性地支持用户在自然语言描述中构建完整视频,从而降低创作门槛、提升普通用户的创意空间。
  • 全流程工具集:打造视频构思、资料收集、分镜制作、剪辑、配音等视频制作全流程工具集,并通过Agent模型在不同阶段实现自动调用,根据创作阶段智能匹配最优方案,从而Agent在自动化创作的同时保证视频质量。
  • 创作过程可视化:通过Agent思维链实时展示AI工作逻辑,为自定义编辑提供可视窗口与操作空间。Agent创作的透明化可操作窗口,让用户不仅可以有效监控AI创作流程,还能有效介入,实现可控的视频创作。

可以说,这款视频创作智能体不仅降低了用户创作门槛、保证视频的专业级质量,在更大程度地提升普通用户创作自由度的同时,可以让人与AI更好地进行双向协同。

据MiniMax透露,海螺视频Agent将通过三阶段进化,打开用户的创作自由度。目前已经实现第一阶段能力,第二阶段的视频Agent创作工具将于2025年夏季面世。

五、Voice design上新

此外,MiniMax同期发布的模型还包含语音模型Speech 02上的一个功能更新——Voice Design 音色设计。

用户可以通过自然语言来描述自己心中所想的音色,实现对多个维度的精准控制,甚至生成世界上不存在的音色。还能与Speech 02语音模型在链路上相配合,用户在文字转语音中可真正实现“所需即所得”,以“任意语言 × 任意口音 × 任意音色”,实现可全自定义的无限组合。

实际上,早在今年5月中旬,语音模型 Speech-02一经发布,即登顶国际权威语音评测榜单Artificial Analysis,收获了全球用户的广泛肯定。Speech-01/02两代模型已经帮助用户生成了累计超过1.5亿小时的语音,并与超过30个国家的客户实现了合作落地。

据悉,通过Voice Design的方式生成声音,解决了语音合成模型行业的两个挑战:精准匹配细分场景下的多样需求、无需复刻他人声音即可无风险实现脑海中音色表达。这将持续降低全球用户使用AI技术的门槛,让说各种语言的人都能感受到语音模型所带来的价值。

总结:一场“中国震撼”背后的自主创新之路

当我们回望那些闪耀于历史长河中的科技成果时会发现:真正伟大的不是某项具体发明本身,而是创造者们不懈追求卓越精神所带来的启示,影响深远的价值远超物质层面的成就。

从全球首个开源大规模混合架构推理模型MiniMax-M1、到实现极致物理表现的视频模型Hailuo-02、定义“靠谱”生产力的MiniMax Agent、国内首个成片创作助手Hailuo Agent、再到音色设计Voice Design,这一系列密集发布不仅是对其技术积累的集中展示,更是在这场全球AI竞赛中,为行业发展路径和竞争格局注入了全新的、颠覆性的变量。

技术的边界,从未是束缚的枷锁,而是激发挑战自我、突破极限的战场。

正如业内对MiniMax的评价,其创新之路为全球AI发展提供了第二条道路。面对外部的算力限制和技术封锁,MiniMax没有选择跟随和模仿,而是坚定地走了“自主创新”这条更艰难的路。

从底层基础模型优化,到开创性的线性注意力混合架构,再到CISPO和NCR等算法与架构的持续迭代,MiniMax的创新呈现出一种“环环相扣、层层递进”的良性循环。这种“倒逼出来的创新能力”,证明了通过算法和架构的深度优化,完全可以打破“算力-资本”的壁垒。

所有这些令人惊叹的突破都在提醒着我们一件事,没有绝对不可逾越的技术障碍, 只有尚未被发掘出来的解决方案。

其开源策略更具深意。在全球AI巨头纷纷转向闭源以构建技术壁垒的当下,MiniMax选择向世界开放其大语言模型的核心能力,这不仅是对技术封锁的有力反击,更彰显了中国新一代AI企业的技术自信和开放胸怀。

在AI文明向多极化演进的新开端,未来的技术史诗,将由东西方共同书写。

分享到: 更多

为您推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注