【中国人工智能开发商DeepSeek推出实验性大模型,成本显著降低】中国人工智能开发商DeepSeek推出一款实验性大型语言模型,号称训练与推理能力显著提升,且能低成本运行。总部位于杭州的DeepSeek称,该模型采用稀疏注意力技术,可让API调用价格降低一半,API是企业和开发者接入AI模型主要付费方式。 DeepSeek在开发者社区HuggingFace发文,称新模型是“下一代AI产品线的重要进展”。随着国内外竞争加剧,中国科技企业不断升级自研大模型,上周阿里巴巴推出迄今最大最强新一代旗舰模型。 其实,谷歌与OpenAI等国际巨头2019年就探索过稀疏注意力技术。OpenAI当时指出,“稀疏模式”关注部分关键输入,可大幅提高超大规模输入效率。 DeepSeek在论文中介绍,新模型采用“闪电索引器”与“精细化的token选择机制”,确保注意力计算用于最相关token。周一晚间,华为云确认已“快速完成”对DeepSeek - V3.2 - Exp模型的适配工作。 目前,DeepSeek的V3.1版本与阿里巴巴通义千问Qwen3系列,在人工智能分析平台全球LLM排名中列中国前两名,仅次于国际厂商。
本文由 AI 算法生成,仅作参考,不涉投资建议,使用风险自担
本文来自和讯财经,更多精彩资讯请下载“和讯财经”APP
更新时间:2025-10-05
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号