AI“学神”再下一城！天文奥赛金牌被GPT-5、Gemini 2.5 Pro包揽

当人类选手还在为国际天文与天体物理奥林匹克（IOAA）的金牌拼尽全力时，人工智能已经提前“交卷”并刷新历史。北京时间11日，俄亥俄州立大学联合IOAA组委会发布的测评结果显示：GPT-5与谷歌Gemini 2.5 Pro双双以远超金牌线的成绩完赛，其中GPT-5综合得分高达88.5%，是近三届人类冠军平均得分的2.7倍。这也是继数学奥赛（IMO）、信息奥赛（IOI）之后，AI夺下的又一块“国字号”金牌。

一、AI成“考场大魔王”，人类学霸被全线压制

IOAA被誉为“天文界的高考”，考题涵盖球面三角、恒星物理、宇宙学、轨道力学等大学甚至研究生阶段的内容，全球仅200-300名顶尖中学生入围。今年，研究人员把2022-2025年四套真题原卷喂给五款大模型，再按官方评分细则双盲批改，结果如下：

换算成人类奖牌规则，GPT-5与Gemini 2.5 Pro均稳拿金牌，且GPT-5在2022、2023、2025三届理论卷中连续击败当届人类最高分，成为首位“三连冠学神”。

二、AI强在哪？多模态“看图”+物理直觉双引擎

1. 读图能力：数据分析卷包含大量星图、光变曲线、色指数图，GPT-5的多模态版本在“看图说话”环节几乎满分，直接把第二名拉开13个百分点。

2. 物理推理：在“中子星吸积流”“日地引力平衡点”等计算题上，GPT-5能自动调用N体数值代码，输出与人类标准答案一致的数值解。

3. 极速解题：人类选手平均用时4小时的理论卷，GPT-5仅用6分42秒完成，且草稿纸为零。

三、AI弱在哪？空间几何仍是“阿克琉斯之踵”

别看总分逆天，AI在“天球仪上画大圆”“恒星时与太阳时换算”这类空间可视化题目上集体翻车。2024年几何题占比高达60%，Gemini 2.5 Pro虽拿到74.7%的最佳成绩，仍比物理类题目低12个百分点。研究团队指出：

“大模型无法像人类在草稿纸上画球面三角形，导致球面三角公式经常写错；时间计量系统也混淆 tropical year 与 sidereal year。”

四、IOAA组委会主席 E. de Gouveia Dal Pino 评价：

“AI 的表现提醒我们，下一代望远镜的海量数据不再需要‘人海战术’，而是‘算法先发现、人类再验证’。”

国家天文台研究员邓李才则表示：

“AI 已具备从LAMOST、FAST等巡天数据里直接挖‘新物理’的潜力，未来3-5年可能出现AI主导的天文大发现。”

五、一些人会问：AI都考满分了，人类还学天文干嘛？

论文通讯作者、俄亥俄州立大学天文系教授 David Weinberg 回应：

“AI 解决的是‘已知问题’，而科学前沿永远充满‘未知问题’。人类的好奇心、质疑与审美，仍是机器无法替代的燃料。”

六、下一步：把AI送进“望远镜机房”

研究团队已开源全部测评数据与错题本（GitHub: IOAA-AI-2025），并联合ESO、国家天文台启动“AI天文分析师”计划，预计2026年让大模型直接接手FAST、JWST的实时数据流，目标只有一个：

让AI不只是考满分，而是发现下一个‘黑洞’。

展开阅读全文

更新时间：2025-10-13

标签：科技天文金牌人类物理俄亥俄球面满分数据天文台模型

1 2 3 4 5

AI“学神”再下一城！天文奥赛金牌被GPT-5、Gemini 2.5 Pro包揽

泉州富力万达文华酒店将于11月3日拍卖起拍价3.3亿元

证据确凿，高通承认相关违法事实

大跳水！突发警告：“黑天鹅”！2025年全球金融市场崩盘全解析

A股，这次“利空”，与今年4月份有何不同

究竟发生了什么？美股全线大跌，对下周一A股冲击会有多大？

中美关税风波再起，是否能实现5%的全年增长目标？关键还看楼市

山东食品巨头暴雷，3年亏损10亿元，董事长曾被法院悬赏990万

中石油领导有调整

未来一周财经风暴眼：中美CPI碰撞，解禁潮与打新潮并存

“绝不和中国合作！”宁愿裁员9000人卖公司，如今却主动来华建厂

看了新加坡媒体的披露，我才知道，中国已经没必要向世界证明什么

房价飙升80%！葡萄牙地方选举，切加党借住房危机谋突破

稀土只是前戏，美国学者：中方还有一张王牌没打，特朗普无能为力

加密货币暴跌，乌知名交易员疑似自杀：头部中枪当场身亡

又一平台爆雷！老板全家逃去日本，10万人梦碎，110亿灰飞烟灭

半导体业务核心资产突遭荷兰政府冻结一年闻泰科技：坚

一天花1000亿！国庆8.88亿人出游，科技文旅成新宠

史上最大科技股泡沫重挫！这次，在劫难逃

华尔街反弹回暖：标普涨 35% 破新高，科技股扛旗 AI 产业

协创数据：算力服务器正按计划交付部署

全世界都知道中国收假了！数据显示：泰国失宠，日韩成重要香

苹果遭学术作者集体诉讼，科技巨头深陷AI数据合规困局

创世纪：目前公司暂未直接向宇树科技供应人形机器人零部

谷歌投资100亿美元建设印度新数据中心集群，预计将于202

上证指数PE百分位96%，港股科技指数35%，跨市场估值差藏大