神速!千问3凌晨刚发布,华为昇腾已连夜适配

潮新闻客户端 记者 张云山

在阿里通义千问模型Qwen3(简称千问3)模型开源数小时后,华为官方宣布昇腾支持千问3全系列模型部署,开发者在MindSpeed和MindIE中开箱即用,实现千问3的0Day适配。

阿里云资料照片 张云山/摄

据悉,千问3是国内首个“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,大大节省算力消耗。华为官方表示,千问3的旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现出极具竞争力的结果。此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

华为昇腾宣布适配千问3

此前华为昇腾就一直同步支持千问系列模型。昇腾MindSpeed训练、MindIE推理支持千问2.5、兼容主流生态的分布式并行接口等,千问3系列模型一发布即实现低代码无缝迁移。

“转载请注明出处”

展开阅读全文

更新时间:2025-05-04

标签:科技   华为   神速   凌晨   模型   阿里   代码   系列   官方   分布式   基准   开发者   旗舰

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top