OpenAI现场演示翻车?GPT-5发布会现神图,奥尔特曼自嘲图表失误

(爱云资讯消息)在北京时间8月8日凌晨举行的GPT-5重磅直播发布会上,OpenAI展示的多组数据图表看似彰显了模型的卓越性能,但细看之下,部分图表却出现了令人啼笑皆非的乌龙。

最具讽刺意味的是一张展示各模型欺骗评估表现的图表:纵坐标刻度混乱不堪。例如在代码欺骗指标中,现场演示显示GPT-5思考版取得50.0%的欺骗率,但对比参照的OpenAI自家o3小模型47.4%的数值时,o3小模型柱状图反而显示更长。有趣的是,OpenAI在官方博客中公布的准确数据显示,GPT-5实际欺骗率应为16.5%。

在这张引发争议的图表中,OpenAI现场演示出现了一个明显悖论:GPT-5某项评分明明低于o3模型,对应的柱状图却显示更长。更离谱的是,o3与GPT-4o的评分数值不同,图表中却呈现为等长柱状。如此严重的可视化失误,连CEO萨姆·奥尔特曼都忍不住吐槽这是史诗级图表翻车,不过他随即澄清官网博客已发布正确版本。

目前,OpenAI尚未就此事置评。虽然尚不确定这些图表是否由GPT-5生成,但在新品发布的重要时刻出现如此纰漏,对公司形象着实不利,尤其当OpenAI正大力宣传其新模型在减少幻觉方面取得重大突破之际,这样的失误显得格外讽刺。

展开阅读全文

更新时间:2025-08-09

标签:科技   翻车   图表   演示   发布会   现场   模型   柱状   数值   纵坐标   评分   数据   萨姆

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top