2万美元几小时,最强AI模型攻破27年无敌系统!暴力破解时代来了

本期要点:AI带来了解题新思路——遍历式求解


你好,我是王煜全,这里是王煜全要闻评论。

先问你一个问题,假如在IT产业,AI模型只需要2万美元就能找到一个隐藏了27年的重大系统漏洞,那你的行业又会如何被AI颠覆?

据媒体透露,上周,Anthropic启动了一项名为“玻璃之翼”(Project Glasswing)的内部计划。

他们将自己最前沿的Claude Mythos模型,提供给了包括微软、谷歌、英伟达等约40家核心公司与机构,让他们去发掘自己系统中的漏洞。因为据Anthropic称,这个模型能力过强,如果直接贸然公开,可能带来不可控的网络安全风险。

比如Claude Mythos只用了几个小时,就在OpenBSD系统的核心代码中识别出了一个此前从未被发现的关键漏洞。

简单介绍一下,OpenBSD是一个以极致安全著称的开源操作系统。从1999年发布以来,它的代码经过全球开发者数十年的反复审计,广泛应用于对安全要求极高的网络设备、防火墙和服务器中。

然而,Claude Mythos发现,攻击者只需要发送两个精心构造的网络数据包,就能导致主机系统崩溃。这意味着,全球无数基于此系统的关键网络节点,都可能因此瘫痪。而更令人惊讶的是,完成这次深度挖掘任务的整体成本,只有大约2万美元。

不过,当所有人的注意力都放在网络安全问题这个层面时,我们不妨把镜头拉得更远一些。类似的情节,在另一个领域就曾上演。

今年1月,我们就曾报道,清华大学智能产业研究院在《Science》杂志上发表了一项名为DrugCLIP的研究。

他们训练了一个深度神经网络,只花了24小时,就在人类2万个蛋白质与5亿个药物分子所构成的、接近10万亿种配对中找到了大量药物组合。经过实验验证,其中不少组合都是有效的。

在硅谷,一个AI模型用2万美元和几小时就从曾被人们认为无懈可击的的系统中找到了漏洞。在北京,一个AI系统用24小时就从10万亿种可能性中定位了新的候选药物。

两件事看似无关,但都表明了,AI给我们带来了解决问题的全新方法,也就是用算力对某个领域的所有可能性进行系统性的遍历与筛查。我们可以称其为 “遍历式求解”,而且这种范式变革可能会重塑每个行业。


遍历式求解

首先,这种“遍历式求解”的内核到底是什么?又有什么价值?

过去,我们试图通过理解原理机制或天才的灵光一现来解决复杂问题。但在现实世界巨大的可能性面前,这种方法必然会碰到天花板,成本也高得令人望而却步。

比如,在网络安全领域,专家要在代码所有的可能执行路径中,凭借经验去猜测漏洞可能藏在哪里。可是对一个百万行级的代码库进行一次全面的人工渗透测试通常需要数万乃至十几万美元,且耗时数月。

在药物研发领域,研发一款新药,平均要投入26亿美元和超过十年时间,但最终成功率不到10%。

于是,新的解题逻辑应运而生,也就是将问题转化成计算机可以高速、低成本、并发处理的形式。

一条路径是特征提取与匹配。

清华大学将蛋白质口袋的形状以及药物分子的结构转换成两组高维的向量,这样一来,判断两者能否结合,就从模拟相互作用的繁重计算,转变为计算两个向量的相似度。

另外一条路径就是并行探索与测试。

虽然没有太多公开的细节,但我们也可以合理推测,Claude Mythos很可能是将人类安全专家的渗透测试工作流程自动化了。从而可以让成百上千个Agent同时测试,对代码进行地毯式的扫描。

模型会阅读代码,理解其结构;再基于学到的知识,提出测试假设;之后,模型还会行动,生成测试代码,去验证这个假设,并观察结果;当测试失败后,它还能修改方案,重新测试。

无论是哪条路径,它们都不再依赖人类专家的直觉,而是通过构建一套可以自动运行的系统来解决问题。

这种“遍历式求解”范式的核心价值在于重构了探索未知的成本结构。

旧模式下,一个项目启动起来确实相对容易,但每多测试一个分子,每多审查一行代码,成本都会累积。

新范式下,主要成本集中于前期系统的构建。一旦系统建成,增加探索广度和深度的边际成本就只不过是算力而已。

这就像福特把流水线用于汽车的生产,通过规模标准化生产的方式改变了汽车的成本结构,从而给汽车产业带来了根本性的改变。


扩散

可以预见,这个新范式必然不会只停在网络安全和药物研发,一定会流向所有类似的、过程可以工程化的领域。

许多行业已经呈现出可被遍历的潜力。

例如芯片设计,本质就是在海量的晶体管级微架构组合中,寻找特定约束下的最优解。传统设计依赖工程师的经验,未来的EDA工具,可能会让AI Agent并发探索,快速锁定最优方案。

再如材料科学中,寻找新材料的過程,就是在元素、晶体结构、合成工艺构成的庞大组合中进行搜索。

传统模式依赖研究人员像炒菜一样试错,未来也可以借鉴清华大学筛药的思路,将材料特征向量化,进行大规模筛选,从而缩短研发周期。

此外,你也别以为这一范式只是研发人员的专属工具,其实平时很多日常工作也可以工程化,并通过“遍历式求解”的方式破解。

前段时间,我的合伙人贺志刚老师就分享了一个内容工程化的思路。

过去,策划爆款内容依赖策划者的敏感度和灵感。但其实,可以将内容解构为场景、年龄、痛点、情绪、解决方案等多个维度,再进行组合。随随便便就能得到数十万个组合,一辈子也做不完。

那么,我们也可以进一步思考,创作者也可以用“遍历式求解”的方式,基于这个结构化清单批量生成内容,再投入社交平台进行A/B测试。数据会迅速揭示哪些组合是具有潜力的方向,值得进行深挖。

所以,关键是你能否把思维打开,能否用AI构建工程化的流程来探索自己领域里的复杂问题。

那么,你得到了什么启发?又准备怎么做呢?欢迎在评论区分享你的思考。


以上就是今天的内容,王煜全要闻评论,我们明天见。

展开阅读全文

更新时间:2026-04-15

标签:科技   几小时   暴力   最强   模型   时代   系统   万美元   遍历   组合   测试   范式   代码   成本   药物   领域

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top