6月17日,MiniMax开源混合架构推理模型M1。M1模型采用MoE与lightning attention相结合架构,模型大小为456B ,单token激活参数为45.9 B,M1原生支持100万token的上下文长度,包含40K和80K思维预算两个推理模型。(钛媒体AGI)
更新时间:2026-02-02
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号