
年前,达里奥·阿莫迪在OpenAI主导了一次罕见的自我克制,他坚持认为GPT-2太危险,不能贸然发布。
那次警告最终被历史证明是过于谨慎的,GPT-2上线后并没有引发任何灾难性后果。但七年后的今天,当这位已经创立了Anthropic的人再次举起"暂停"的牌子时,全球科技界的反应明显不同,这一次,连最挑剔的批评者也开始认真倾听。
2026年4月7日,Anthropic正式宣布其最新模型Claude Mythos Preview具备前所未有的网络安全攻击能力,并明确表示该模型暂时不适合向公众开放。
这不是公关话术,而是一份来自Anthropic内部的正式风险评估报告所得出的结论。报告指出,Mythos在发现软件漏洞和自动化漏洞利用方面展现出"代际跃升"级别的性能,远超此前任何已公开的AI模型。
简单来说,Mythos不仅能像顶级安全研究员一样找到系统漏洞,还能以接近自动化的方式加以利用。这意味着,一个掌握了Mythos的普通人,可能具备此前只有国家级黑客团队才拥有的网络攻击能力。CNN的报道已经注意到,在Mythos发布之前,就已经有案例显示,一般水平的黑客借助AI工具完成了过去需要高超技术才能实施的攻击。
面对这一局面,Anthropic选择了一条极不寻常的路径,他们没有直接发布,也没有彻底封存。
Anthropic发起了一项名为"玻璃翼计划"(Project Glasswing)的倡议,将Mythos Preview的访问权限限定于经过严格筛选的合作伙伴,包括亚马逊云服务、谷歌、苹果以及超过45个安全机构和科技公司。这些合作伙伴将被允许使用Mythos来主动检测和修复全球最关键基础软件中的漏洞,也就是说,用"矛"来铸"盾"。
这个逻辑听起来自洽,但执行起来充满风险。一位参与评估的安全专家在接受采访时坦言,问题不在于Anthropic的初衷,而在于一旦模型访问渠道扩展,信息泄露或被滥用的可能性便会几何级数增加。
Wired的报道也指出,这次联盟阵容本身就颇具戏剧性,Anthropic将自己的竞争对手谷歌也拉入了合作框架,这在硅谷竞争白热化的当下实属罕见。这种"敌友共治"的格局,折射出整个行业对Mythos潜在影响已经形成了某种共识,即这件事太大,不能由任何一家公司单独承担。
批评者可能会说,这不过是一场精心策划的营销事件,用"危险"的标签反而激起了更大的关注和期待。
这种质疑并非没有道理,科技公司对"AI安全"话题的操弄由来已久。然而,此次情况有几个细节值得认真对待。其一,Anthropic公开了详细的技术风险报告,而不是仅仅依靠高管的一句声明;其二,VentureBeat和《华尔街日报》等多家媒体的独立安全专家在审阅报告后,均证实了模型在网络攻击任务上的突破性表现;其三,包括Google在内的竞争对手选择加入Glasswing计划,这在商业逻辑上只有一个解释,他们也认为威胁是真实存在的。
人工智能发展到今天,我们已经走过了"它会不会写诗"的阶段,也走过了"它会不会抢走工作"的焦虑期。现在面对的,是一个更为具体、更为紧迫的问题:当一个AI模型的能力已经触及国家安全和关键基础设施的边界,谁来负责,如何监管,又由谁来设定这条边界?
阿莫迪没有给出答案。但他愿意在竞争最激烈的时刻主动踩下刹车,本身已经是一个值得整个行业深思的信号。
更新时间:2026-04-10
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号