
联系我们
400-8768208
不过之前霸榜的DeepSeek和Qwen来自杭州,现在变成上海的Minimax了。
![]()
官方介绍,Minimax M2专为智能体和编程而生,编程才能和Agent体现拔尖。
Minimax表明,智能水平、速度和本钱在曩昔被视为“不或许三角”,但随着M2的出生,这个三角被打破了。
现在,M2的完好模型权重现已开源,选用MIT协议,在线Agent渠道和API也限时免费。
![]()
Minmax M2是一个稀少度较高的MoE模型,总参数量230B,激活参数量仅有10B。
网友表明10B的激活参数运转起来会非常快,假如配上Cerebras或许Groq这样的推理加快渠道,有望跑到每秒上千Token。
![]()
另一个特征是选用了交织的思想格局,使得模型可以规划和验证跨多个对话的操作过程,这关于Agent推理至关重要。
如最初介绍,Minimax官方将M2界说为一个专为智能体和编程而生的模型。
它专为端到端开发作业流程而构建,并且体现出对杂乱、长链东西调用使命的超卓规划和安稳履行才能,支撑Shell、浏览器、Python代码解说器和各种MCP东西的调用。
在Agent最要害的三个才能——编程才能、东西运用才能和深度查找才能上,M2在东西运用和深度查找方面上都不逊于海外顶尖模型,编程才能也在国内独占鳌头。
![]()
归纳体现上,M2在Artificial Analysis的测验中,获得了总排名第五、开源榜首的效果。
![]()
以Artificial Analysis的效果为基准,Minimax制造了一张图来比较各大模型性价比(横轴越向右本钱越低)。
![]()
在线推理服务的速度则可达每秒100Token,Minimax也画了一张图体现以速度衡量的性价比。
![]()
一起,Minimax团队还针对智能体、全站开发和Terminal Use三项使命对M2和其他模型进行了1对1比拼。
![]()
为了更直观地体现M2的Agent才能,Minimax现已把M2布置到了Agent渠道,限时免费运用,按官方说法,免费期直到服务器扛不住停止。
乃至有网友创造的在线五子棋游戏渠道,不只有游戏本体,还引进了在线对战、观战、在线谈天,乃至是用户注册等功能。
![]()
![]()
在X上,也有网友展现了自己用M2 Agent编程的实战效果,仅经过三轮反应就完成了一个足球小游戏的制造。
![]()
有网友从vllm的代码傍边看出了M2的更多技术细节,表明M2选用相似GPT-OSS的全注意力和滑动窗口注意力(SWA)的混合机制,
![]()
不过Minimax NLP负责人纠正,表明一开始的确想在预练习阶段引进SWA,但发现会形成功能丢失,所以最终运用的是全注意力。
![]()
Falcon团队的技术人员看了之后表明,他们在练习模型的时分也发现了相同的现象,SWA混合注意力会下降模型功能,这和一些论文的研讨不符。
![]()
在部分论文和实践中,SWA在提高功率的一起能坚持功能,如Mistral和谷歌Gemma模型的相关研讨均支撑此观念。
![]()
一起,M2也没有选用Lightning Attention(线性注意力的一种变体),原因也是因功能丢失。
![]()
究竟哪种道路更优,或许仍是要看详细需求,但至少从M2的体现上看,Minimax挑选的的确是一种对自己最合适的方法。