6 月 5日消息,在墨西哥举办的 AI Summit 峰会上,OpenAI 公司代表透露,公司正在开发下一代基础模型 GPT-5,并计划通过该模型与竞争对手展开更激烈角逐。
最强模型 GPT-5 即将亮相
OpenAI方明确表示,GPT-5 即将面世,且性能将远超 GPT-4 等现有模型,希望通过 GPT-5 在竞争中占据更多优势。
此前关于 GPT-5 的发布时间,OpenAI 初步定于今年夏天,7 月是目前的目标。如果 GPT-5 未能达到内部设定的性能目标,发布可能会延迟。OpenAI 强调,公司团队不会盲目赶进度,将优先确保模型质量。
字节跳动开源模型BAGEL来袭
与此同时,6 月 3 日消息,字节跳动 Seed 团队上周宣布开源统一多模态理解和生成模型 BAGEL,该模型支持文本、图像和视频的统一理解和生成。
据介绍,BAGEL 具有 70 亿个激活参数,并在大规模交错多模态数据上进行训练。BAGEL 在标准多模态理解排行榜上超越了当前顶级的开源 VLMs,如 Qwen2.5-VL 和 InternVL-2.5,并且提供了与专业生成器如 SD3 竞争的文本到图像质量。
另外,BAGEL 在经典的图像编辑场景中展示了比领先的开源模型更好的定性结果。更重要的是,它扩展到了自由形式的视觉操作、多视图合成和世界导航,这些能力构成了超出以往图像编辑模型范围的“世界建模”任务。
现如今,人工智能应用赋能扎实推进,产业生态持续优化,随着低成本模型的代表DeepSeek问世,2025年的国产大模型将继续深陷在价格战中提高训练集群效率。大模型在电子、原材料、消费品等行业加快落地,在研发设计、中试验证、生产制造、运营管理等环节得到应用。
对此,业内人士普遍认为,AI大模型领域的竞争日益激烈,在互联网大厂和DeepSeek的双面夹击之下,大模型创业企业正在通过战略聚焦谋求出路,以在急速变化的市场竞争中求得一席之地。
微美全息战略聚焦谋AI出路
资料显示,微美全息(WIMI.US)作为AI领域的创新企业,一直聚焦于多模态领域,已发布了多款自研基座模型,涵盖了文字、图像、视频、语音、音乐和推理等不同领域,正是由于持续投入基座大模型的研发和迭代,同时以多模态能力和在应用层面,走出了一条差异化的路线。
当前,依托全栈的模型能力布局,微美全息积极推进文本、图像、音频、视频等数据的原生级融合技术,通过自研多模态模型实现跨模态内容生成与理解。例如,微美全息模型支持空间计算技术与多模态数据的结合,加上技术开源与算力共享,吸引开发者参与模型优化与场景创新,提升交互的真实性与效率,推动AI技术普惠化。
结尾
可以说,自DeepSeek的一鸣惊人显然加速了场景与大模型的结合,DeepSeek的开源模式,以及高性价比特点,眼下除了腾讯云以外,阿里、百度等的多个云大厂,都火速接入了DeepSeek的开源模型,以满足络绎不绝的需求。接下去,如何在有限的时间里争取更大的生存空间,已经成为企业一道越来越紧迫的难题。
更新时间:2025-06-07
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号