AI“学神”再下一城!天文奥赛金牌被GPT-5、Gemini 2.5 Pro包揽

当人类选手还在为国际天文与天体物理奥林匹克(IOAA)的金牌拼尽全力时,人工智能已经提前“交卷”并刷新历史。北京时间11日,俄亥俄州立大学联合IOAA组委会发布的测评结果显示:GPT-5与谷歌Gemini 2.5 Pro双双以远超金牌线的成绩完赛,其中GPT-5综合得分高达88.5%,是近三届人类冠军平均得分的2.7倍。这也是继数学奥赛(IMO)、信息奥赛(IOI)之后,AI夺下的又一块“国字号”金牌。

一、AI成“考场大魔王”,人类学霸被全线压制

IOAA被誉为“天文界的高考”,考题涵盖球面三角、恒星物理、宇宙学、轨道力学等大学甚至研究生阶段的内容,全球仅200-300名顶尖中学生入围。今年,研究人员把2022-2025年四套真题原卷喂给五款大模型,再按官方评分细则双盲批改,结果如下:

换算成人类奖牌规则,GPT-5与Gemini 2.5 Pro均稳拿金牌,且GPT-5在2022、2023、2025三届理论卷中连续击败当届人类最高分,成为首位“三连冠学神”。

二、AI强在哪?多模态“看图”+物理直觉双引擎

1. 读图能力:数据分析卷包含大量星图、光变曲线、色指数图,GPT-5的多模态版本在“看图说话”环节几乎满分,直接把第二名拉开13个百分点。

2. 物理推理:在“中子星吸积流”“日地引力平衡点”等计算题上,GPT-5能自动调用N体数值代码,输出与人类标准答案一致的数值解。

3. 极速解题:人类选手平均用时4小时的理论卷,GPT-5仅用6分42秒完成,且草稿纸为零。

三、AI弱在哪?空间几何仍是“阿克琉斯之踵”

别看总分逆天,AI在“天球仪上画大圆”“恒星时与太阳时换算”这类空间可视化题目上集体翻车。2024年几何题占比高达60%,Gemini 2.5 Pro虽拿到74.7%的最佳成绩,仍比物理类题目低12个百分点。研究团队指出:

“大模型无法像人类在草稿纸上画球面三角形,导致球面三角公式经常写错;时间计量系统也混淆 tropical year 与 sidereal year。”

四、IOAA组委会主席 E. de Gouveia Dal Pino 评价:

“AI 的表现提醒我们,下一代望远镜的海量数据不再需要‘人海战术’,而是‘算法先发现、人类再验证’。”

国家天文台研究员邓李才则表示:

“AI 已具备从LAMOST、FAST等巡天数据里直接挖‘新物理’的潜力,未来3-5年可能出现AI主导的天文大发现。”

五、一些人会问:AI都考满分了,人类还学天文干嘛?

论文通讯作者、俄亥俄州立大学天文系教授 David Weinberg 回应:

“AI 解决的是‘已知问题’,而科学前沿永远充满‘未知问题’。人类的好奇心、质疑与审美,仍是机器无法替代的燃料。”

六、下一步:把AI送进“望远镜机房”

研究团队已开源全部测评数据与错题本(GitHub: IOAA-AI-2025),并联合ESO、国家天文台启动“AI天文分析师”计划,预计2026年让大模型直接接手FAST、JWST的实时数据流,目标只有一个:

让AI不只是考满分,而是发现下一个‘黑洞’。

展开阅读全文

更新时间:2025-10-13

标签:科技   天文   金牌   人类   物理   俄亥俄   球面   满分   数据   天文台   模型

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top