网站导航

MiniMax发布新一代模子AI大模子合作转向长上下文

　　M3采用全新的自研稀少留意力架构MiniMax Sparse Attention（MSA），正在编程及智能体能力、超长上下文及原生多模态等多个环节标的目的，都实现代际冲破。新平易近晚报记者获悉，M3是国内首个同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项焦点能力的大模子，也是目前全球独一具备完整能力组合的开源选项。相较保守全留意力机制，MSA可以或许显著降低长上下文下的计较成本，并将上下文窗口提拔至100万Token。这意味着模子正在处置长文档、复杂代码仓库、多轮使命协做等场景时，MiniMax披露，正在100万上下文规模下，M3单Token计较量仅为上一代模子的约1/20，推理效率显著提拔。除模子架构升级外，MiniMax正在底层推理算子层面也做了进一步优化。相关机能较支流开源方案提拔4倍以上。正在业内看来，这也是全球大模子竞赛的主要新变量——跟着Agent使命复杂度不竭提高，“更长上下文、更不变回忆、更低成本推理”正正在成为决定产物可用性的环节能力。据领会，M3正在智能体编程（Coding&Agentic）能力上较着提拔，正在涵盖软件工程、终端施行、效率取和谈理解等多个维度的国际权势巨子评测中，均达到国际领先程度。MiniMax暗示，M3从锻炼起点便采用文本、图片、视频等多模态夹杂锻炼，并正在数据规模和锻炼管线长进一步扩展。模子不只支撑图像取视频理解，也具备桌面操做能力，可正在复杂跨使用中施行计较机利用（Computer Use）使命。M3是一个从Step 0起头进行多模态夹杂锻炼的模子。交织数据（Interleaved data）——文本和图像等其他模态正在序列中交替天然陈列的数据——对模子机能带来的提拔，比一般认为的愈加环节。正在为这些数据沉构整套数据管线后，MiniMax已能够将锻炼数据Token规模提拔至100万亿的量级。这意味着模子能力正正在从言语理解进一步向实正在数字延长。无论是办公从动化、企业软件操做，仍是更复杂的出产力场景，AI进入现实施行层的速度正正在较着加速。研发人员丢给M3一篇ICLR 2025精采论文，让它复现。M3持续运转近12小时，全程自从产出18次commit取23张尝试图表，成功跑通焦点尝试同日，MiniMax Code也送来更新：做为专为M3设想、并取M3一路锻炼的Agent产物，MiniMax Code可以或许充实阐扬M3正在长上下文、原生多模态方面的能力，是搭配MiniMax M3的首选Agent。正在长程复杂使命上，MiniMax Code的Agent Team能够将大型使命拆解为多阶段、可并发、可动态调整的Workflow，由Agent集群协做推进。业内人士认为，跟着M3发布，MiniMax正在全球AI竞赛中的定位正正在进一步清晰：以“开源+多能力合一”的前沿模子为差同化定位，填补国内AI生态正在这一维度的空白。值得一提的是，MiniMax已正在上周向上海证监局提交了上市存案演讲，A股上市历程，冲刺A股大模子第一股。

发布于 : 2026-06-08 07:55

MiniMax发布新一代模子AI大模子合作转向长上下文

联系我们

关于我们

产品中心