最近这阵子,Claude 用户群里的画风挺魔幻的。
一边是此起彼伏的"账号又没了"。
各种关于风控规则的猜测在社群里流传:IP 跳动、设备指纹、登录环境不一致,都可能成为触发点。

具体机制官方从没说清楚过,大家基本靠踩坑经验互相安慰。
然后就在昨天,Anthropic 一声不吭放了个大招。
Claude Sonnet 5 正式上线,而且价格直接砍到让人意外。

一边收紧口子,一边放出更便宜的新模型,这波操作确实容易让人产生联想。
那么这次的 Sonnet 5,到底是不是一次真材实料的升级?
在 Claude 的产品序列里,Sonnet 一直是那个"够用、够快、够便宜"的中间选项。
Haiku 太小,Opus 太贵,Sonnet 卡在中间负责走量。
但过去一年多,Anthropic 几乎把所有能力跃升都堆给了 Opus。
Sonnet 系列被落下一大截,很多重度用户不得不咬牙升级到 Opus,才能跑通复杂的 agent 任务。
Sonnet 5 想解决的,正是这个问题。
官方给它的定调很直接:这是目前 agent 能力最强的 Sonnet 模型。
能够自主做计划、调用浏览器和终端等工具,并且把复杂任务坚持执行到底,而不是像以前那样跑一半就卡壳。
用 Anthropic 自己的话说,几个月前还得靠更大更贵的模型才能干的活,现在 Sonnet 就能扛。
小P的理解是:这次不是小修小补,是想把 Opus 的看家本领,下放到更多人用得起的价位上。
光说不练没意思,直接上数据。
以下是官方公布及多家媒体报道整理出的核心跑分对比:
测试项 | Sonnet 4.6 | Sonnet 5 | Opus 4.8 |
Agentic Coding(软件工程基准) | 58.1% | 63.2% | 69.2% |
Terminal-Bench 2.1(终端操作) | 67.0% | 80.4% | 82.7% |
Humanity’s Last Exam(带工具) | — | 57.4% | 57.9% |
OSWorld-Verified(电脑操控) | — | 81.2% | 83.4% |
几个信息量很大的点,小P挑出来说说:
换句话说,Sonnet 5 已经把自己跑到了 Opus 90% 以上的水平区间。
用中杯的钱,买到了接近大杯的脑子。
Zapier 的工程师在 Anthropic 官方博客里提到过一个案例。
交给 Sonnet 5 一个"改 Salesforce 账户等级 + 给企业客户发上线通知"的两段式任务,它能一口气端到端做完。
这种以前经常卡壳的活,现在不用人工介入了。
这次真正的杀招在价格。

即日起到 2026 年 8 月 31 日,Sonnet 5 走的是限时优惠价:
输入每百万 token 2 美元,输出每百万 token 10 美元。
促销期结束后,恢复到标准价 3 美元 / 15 美元。
作为对比,Opus 4.8 是 5 美元 / 25 美元。
标准价也只要 Opus 的六成,促销期更是只要四成,确实划算。
但这里有个容易被忽略的坑,小P必须提醒一下:
Sonnet 5 换了一套全新的 tokenizer。
同样一段文字被拆分出来的 token 数量,可能是原来的 1 到 1.35 倍,具体取决于内容类型。
也就是说,单价便宜不等于账单一定便宜,真实成本还要看你的任务里 token 到底怎么消耗的。
Anthropic 把促销价定得比较低,某种程度上也是在对冲这部分"隐形涨价"。
所以别只盯着标价爽,跑一遍自己的真实任务再下结论比较靠谱。
System Card 里的数据挺有意思。
相比 Sonnet 4.6,Sonnet 5 在拒绝恶意请求、抵抗提示注入攻击上明显更强。
幻觉和一味迎合用户的倾向,也降低了不少。
不过要泼盆冷水:
在自动化行为审计中,它的"不良行为率"虽然比上一代好,但依然高于 Opus 4.8,也高于还处于内测阶段的 Mythos Preview。
说白了,更听话了,但没到旗舰模型那个段位。
网络安全能力上,Anthropic 明确说没有专门针对高风险网络安全任务训练 Sonnet 5。
在 Firefox 漏洞利用这类高危测试里,它基本交了白卷,能干点常规的、无害的网络安全活儿,仅此而已。
为了兜底,官方默认给它开了实时的网络安全防护机制。
但防护强度比对外几乎不开放的 Fable 5 要低,毕竟风险等级本来就不在一个量级。
Sonnet 5 从今天起是所有 Free 和 Pro 用户的默认模型。
Max、Team、Enterprise 也都能用。
同时进驻 Claude Code、Claude Platform,以及 AWS Bedrock。
开发者调用模型 ID 是 claude-sonnet-5。
同一天,Anthropic 还顺手放出了面向科研场景的 Claude Science 工作台。
预置了基因组学、蛋白质组学等 60 多个科学技能和数据库连接器,算是这次发布的一个彩蛋。
感兴趣的可以自己去扒一扒,这里就不展开了。
至于很多人关心的 Fable 5——目前普通用户还是摸不到。
据了解是卡在出口管制相关的政策上,Anthropic 表示在推进恢复,具体什么时候回来,暂时没有准信。
单看产品力,Sonnet 5 是一次很扎实的升级。
几乎每一项硬指标都在往 Opus 那条线上贴,价格却只要大杯的一半左右。
对于要跑多 agent、要控制成本的开发者来说,这个性价比是真实存在的,不是营销话术。
但账号这件事,小P还是想多说一句。
Claude 目前依然没有正式面向中国大陆用户开放,这是绕不开的现实。
模型越做越强、价格越来越亲民,跟账号说没就没之间的落差,确实会让人一言难尽。
工具是好工具,但用之前建议先掂量一下自己能承受的风险。
重要的对话和工作流,记得随手备份,别把鸡蛋都放在一个说封就封的篮子里。
技术在往前跑,规则也在收得更紧。
这大概就是现阶段用 Claude 最真实的体感——爱得深沉,也得留个心眼。
好了,今天就聊到这儿。
你们要是也用上了 Sonnet 5,评论区聊聊体感怎么样呗。
更新时间:2026-07-02
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号