6月17日,MiniMax开源混合架构推理模型M1。M1模型采用MoE与lightning attention相结合架构,模型大小为456B ,单token激活参数为45.9 B,M1原生支持100万token的上下文长度,包含40K和80K思维预算两个推理模型。(钛媒体AGI)
更新时间:2025-06-18
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号