分析师：GPT-5.2看起来是又一次“质的飞跃”

12月12日，Investinglive分析师Adam Button表示，萨姆·阿尔特曼发布了GPT-5.2模型的思维能力测评结果，坦白说，这些数字简直令人震惊。这并非渐进式提升，而是质的飞跃。对于追求通用人工智能纯粹主义的研究者而言，ARC-AGI-2是关键指标。GPT-5.2在此项测试中的表现从GPT-5.1的17.6%跃升至52.9%。这标志着大语言模型在抽象推理与泛化能力这一长期短板上取得了巨大突破。

GDPval是衡量模型经济价值的重要指标，分数从38.8%飙升至70.9%。这凸显了模型扩展能力与推理能力的同步突破，因为该测试模型已启用最大推理效能。近期OpenAI因Gemini模型的成功扩展而显得措手不及，但此次数据表明，其推理能力正在实现以往看似不可能的任务。

本文源自：格隆汇

展开阅读全文

更新时间：2025-12-15

标签：科技模型能力萨姆人工智能研究者措手不及效能抽象分数重要指标

1 2 3 4 5

分析师：GPT-5.2看起来是又一次“质的飞跃”

三星Galaxy S26 Ultra入网骁龙8E5+60W快充

炸裂！英伟达H100冲上太空，人类算力首次突破大气层！

“中东有石油，中国有稀土”！中国捏住全球军工的“稀土命门”

小米公司回应“小米公司不让卖小米”一事

官宣！中国九天无人机成功首飞，外媒惊叹“无人机母舰”时代来临

Bose SoundLink Micro推出花瓣粉、碧青蓝、沙丘灰配色

vivo S50系列发布定档12月15日：定义轻薄旗舰的“六边形战士”

110秒看懂万亿消费风口：不是只有老板能赚，咱普通人也沾光

中国手机市场迎来洗牌：vivo第四，苹果第二，第一名你猜对了吗？

钉钉文档出现服务问题，官方称正在积极处理

微信群崩了？官方致歉：服务器轻微抖动，现已恢复

马克龙来华进货疯了！80人天团狂揽200亿，法国经济靠中国续命？

立即整改！广东一加油站请衣着暴露模特“站岗”，执法部门：模特已被劝离

A股三大指数集体转绿，摩尔线程跌15％，贵金属逆市大涨

收评：A股集体收涨，大幅放量2351亿！不出意外，下周行情这样走

特朗普签署行政命令，建立统一的人工智能监管框架，限制各

道指新高与科技股跳水同天发生芯片巨头集体失血钱到

大疆Neo 2无人机更新固件，解锁苹果Apple Watch操控与图

热门科技赛道龙头+华为+液冷服务器+算力三大主线+卫星

Runway深夜炸场：一口气发布5大更新，首个通用世界模型来

黄金狂飙、科技股崩了！道指创新高背后藏着什么信号？

夜盘，科技股暴跌！AI泡沫被戳破了吗？

湖南人文科技学院师生成为娄底队征战湘超“关键力量”

TCL闫晓林：将开放显示材料研发模型给上游伙伴

AI安全监管亟待加强，头部科技公司评分不及格