龙虾已死,Codex 新生

Codex 昨天更新了一个新功能,叫 Appshots,中文翻译叫「应用快照」。

这个名字起得有点亏。

因为你第一眼看到它,会以为它就是个截图功能。我一开始也是这么理解的,按两下 Command,把当前窗口截一下,丢给 Codex,让它知道我在看什么。

听起来挺普通,对吧。

但我认真玩了一天之后,发现完全不是这么回事。

它不是截图。

它更像是给 Codex 开了一扇窗,让它能直接看见你此刻正在用的应用,然后顺着这个上下文,把后面的活儿接过去。

你光标在哪个应用,按两下 Command,Codex 输入框里就会出现这个应用的快照。官方说这里面包含截图和可用文本。你再把任务丢给它,它就知道你在看什么、要处理什么,不用你写一大段背景说明。

真正恐怖的地方在后面。

如果你给了它 browser use、computer use、文件系统、终端这些权限,它就不只是「看见」了。

它开始干活。

Appshots 不是截图,而是通向应用上下文的一扇门

我第一个试的是 Twitter。

我打开 Twitter,按两下 Command,回到 Codex 跟它说,从我关注的博主里挑出今天有价值的 AI 新闻,整理成一份简短报告。

然后我就看着它操作浏览器。

滚动、点击、打开帖子、返回、继续找。

一开始有点像刚进别人家厨房做饭,锅在哪儿、盐在哪儿,都要摸一下。但几分钟之后,它明显熟了,动作开始变快。

没多久,一份报告就出来了。

质量还行,重点也没跑偏。

这事我自己干,至少一个小时。因为你得刷、得筛、得判断,还得把碎片整理成能看的东西。它干完之后,我第一反应是,太好了,这种活儿以后我大概不会自己干了。

这里有个很微妙的变化。

以前用 Codex、Claude Code、Cursor,你会很在意它怎么做。它改了哪个文件,跑了什么命令,为什么这么写。因为它还主要在代码世界里,程序员天然会盯着过程。

但 Appshots 加上 computer use 之后,你的心态会变。

你会越来越像一个老板。

不是那种油腻老板,就是很朴素地把活儿交出去,然后等结果。

「管它怎么干的,干成不就行了。」

这句话听着有点危险,但它真的会慢慢变成你的内心潜台词。

下午我把这个功能推荐给一个做数据分析的同事。

他打开公司的 BI 系统,Web 端的那种,按两下 Command,把今天和本周要做的几份分析报告需求直接丢给 Codex。

过了一会儿,他开始喊我。

「你看,它在按逻辑查数据。」

「我靠,它觉得数据不够,自己换了查询条件。」

「它还知道找这个。」

「这干得很专业啊。」

「太爽了,这一会儿干了我一天的活儿。」

我站在旁边看,其实也有点懵。

因为这不是演示视频里那种精心设计的 demo。就是一个公司里普通的数据后台,一堆筛选条件,一堆报表入口,一堆只有业务同事才熟的路径。

它不可能天生知道。

但它会看,会试,会改条件,会根据结果继续往下走。

这就很要命了。

Codex 在 BI 页面里自己查询、筛选和对比数据

惊喜了一阵之后,我同事突然不说话了。

他盯着屏幕看了几秒,转过头跟我说,那这样的话,很多人就不需要了。

我说,是的。

基础的、高重复的、流程清楚的、没有太多壁垒的工作,会被拿走很多。

他说完这句之后,我们俩都沉默了一会儿。

那一刻比功能本身更沉重。

因为如果只是程序员说「AI 要改变世界」,那多少还有点圈内自嗨。但一个每天在真实 BI 系统里做报表的人,亲眼看到 Codex 把他的日常工作吃掉一块,然后说出这句话,这感觉完全不一样。

晚上我又试了 PDF。

网上看到一份英文资料,写得很好,想转给同事。但它只有 PDF,而且全是英文。

换以前,这活儿挺烦。

现在有了 agent 好多了,我把文件下载下来或用可访问的 url 给 claude code 让他自己干,我觉得这就算到头儿了。

但这次我用 Codex 来做,感觉就不太一样了。

我把 PDF 阅读器切到前台,按两下 Command,告诉 Codex,帮我把这份文件翻译成中文,生成一份新的 PDF,存到桌面。

几分钟之后,桌面上多了一个中文 PDF。

倒不是说结果有多惊人,而是这个体验太棒了,两下 command,然后告诉 codex 你要干什么,问题就解决了,相信我,你只要用过一次就回不去了。

但真正让我把它和龙虾联系起来,是另一个很小的实验。

旁边同事看我玩得起劲,问了一句,这东西能发微信不。

我说试试。

没成。

我没试成功,可能是微信自己的问题,可能是权限和兼容问题。反正我没跑通。

但飞书可以。

我把光标点到飞书窗口,按两下 Command,跟 Codex 说给某个同事发条消息。

它做到了。

然后我们又让它写一段文档,写进 Obsidian 里。

也做到了。

这一下我突然反应过来。

这不就是龙虾吗。 OpenClaw。

OpenClaw 当时最让人兴奋的点,不是它会聊天,不是它能写代码,而是它真的想做一个会操作电脑、会跨应用干活儿的个人 agent。

它的口号大概就是那个味儿,一个真的能做事的 AI。

这里顺手把两个东西说清楚。

Manus 也是 agent 产品,而且当时也给很多人看到了「AI 自己拆任务、自己浏览网页、自己交付结果」的想象力。它更像一个跑在云端环境里的通用任务 agent,你把目标丢进去,看它在自己的工作区里跑。

但龙虾不是 Manus。

它给我的记忆点,是更贴近个人电脑、更贴近桌面应用、更贴近「替你操作你手边这些软件」。

所以 Manus 可以作为同一波 agent 浪潮里的参照物,但不能把它和 OpenClaw 混成一个东西。

OpenClaw、Manus、Codex 是同一波 agent 浪潮里的三条不同路线

所以我看到 Codex 这次 Appshots 的时候,第一感觉不是「OpenAI 做了个截图」。

第一感觉是,OpenClaw 那条更贴近个人电脑的路线,被放进 Codex 里了。

而且不是玩具版。

OpenClaw 的作者 Peter Steinberger 今年加入 OpenAI,这事公开报道过。这里我不想过度解读成 OpenAI 收购了 OpenClaw,公开信息不是这么说的,OpenClaw 也还是独立开源项目。

但你很难不把这两件事连起来看。

一个想做「个人 agent」的人去了 OpenAI。几个月后,Codex 开始越来越像一个长在你电脑上的个人 agent。

这就很有意思。

以前的 Codex 更像一个很强的程序员。

你把仓库给它,它读代码、改代码、跑测试、提 diff。这个阶段已经很猛了,但它的世界主要还在代码库里。

现在不是了。

它能看浏览器。

能看 PDF。

能看飞书。

能看 Obsidian。

能看 DataGrip、VSCode、iTerm。

它不再只是在一个代码仓库里工作,而是在你的电脑上工作。

前者是开发工具。

后者是工作工具。

我后来又打开 DataGrip 试,打开 VSCode 试,打开 iTerm 试,甚至打开 Claude Code 让它去操作另一个 agent。

都能跑。

当然不是每次都完美。它也会卡,也会点错,也会遇到它不熟的界面。你要给它一点时间摸索,还要愿意在关键步骤打断它。

但方向已经很清楚了。

它不是在等你把上下文翻译成文字,它在自己读现场。

这个变化特别大。

顺着这个体验,我也理解了最近 Codex 官方分享出来的内容。里面讲了很多高级用法,目标模式、自动化、侧边栏、共享记忆、从代码往外延伸。

如果只看功能名,很像手册。

但你真用过 Appshots 之后,会发现这些东西其实在拼同一个闭环。

Appshots 负责把现场交给 Codex。

Goal 负责告诉它终点在哪里。

Automations 负责让它隔一段时间自己回来查进度。

侧边栏负责让它把结果摊在你旁边,方便你检查。

记忆和 AGENTS.md 负责让它下次别从零开始。

这些东西单独看都不吓人。

拼起来就吓人了。

Appshots 之后的 Codex 工作闭环,现场、目标、自动化和人工刹车

它像是在把一个普通人的工作日拆成一段一段,然后问你,哪一段可以交给我。

所以我现在给朋友推荐 Codex,不会只说你去试试 Appshots,太牛了。

我会说,你试的时候别只让它回答问题。

让它真干个活儿。

比如别说「帮我看看这个 BI 页面」。你要说「根据这个页面生成今天的销售异常简报,异常项要有原因猜测,最后给我一版可以直接发给老板的飞书消息,但不要替我发送」。

别说「帮我翻译这个 PDF」。你要说「把这份 PDF 翻译成中文,保留标题层级,生成新 PDF 到桌面,如果排版不稳,先输出 Markdown 让我确认」。

别说「帮我整理 Twitter」。你要说「只看我关注的人,筛掉转发和情绪输出,找 5 条今天值得技术团队关注的 AI 进展,每条给一句为什么重要」。

这才是它擅长的姿势。

你给它一个可以验收的结果,而不是给它一个泛泛的问题。

这点特别重要。

因为 agent 最怕的不是任务难,是终点线模糊。

人类说「你随便看看」,它就真的只能随便看看。人类说「最后给我一个能发出去的报告,保存到桌面,重要操作前先问我」,它才知道自己该往哪里跑,什么时候停。

还有一个提醒。

权限别一上来全放飞。

我自己是因为想测上限,给了它很多权限。但如果你真的在公司环境里用,凡是发消息、删文件、改生产数据、提交代码、发邮件这种动作,最好都加一句「先生成草稿,不要直接执行」。

这不是怂。

是你得带个刹车,别把油门踩死。

Codex 现在越来越像一个会开车的同事,但方向盘不能完全撒手。至少现在不能。

说到这里,其实我有点能理解为什么 OpenAI 要把 Codex 做成现在这个样子。

如果只是写代码,它迟早要跟 Cursor、Claude Code、各种 IDE 插件卷到很窄的地方。

但如果它能接管你的电脑工作流,那它的边界就突然大了。

程序员只是第一批用户。

后面是数据分析、运营、产品、财务、研究员、内容创作者,所有每天在一堆软件之间来回切的人。

这些人的工作里都有大量「我知道怎么做,但做起来很烦」的部分。

而 Appshots 刚好切在这里。

你不需要搭 MCP,不需要写脚本,不需要把公司内部系统做成 API。

你打开那个破旧的后台,按两下 Command,说清楚你要的结果,它就开始看着屏幕干活。

这很粗暴。

也很有效。

我那天反复试了一整天,最后最大的感受不是兴奋。

是后背有点凉。

因为我突然意识到,过去我们总觉得很多工作不会那么快被替代,是因为它们不在标准 API 里,不在干净的数据表里,不在代码仓库里。

它们藏在各种乱七八糟的软件界面里。

藏在一个按钮后面。

藏在一个下拉框里。

藏在一个只有老员工才知道的页面入口里。

以前这些东西确实是护城河。因为机器进不去。

现在机器开始看屏幕了。

这条护城河就开始漏水了。

所以我不想把这篇写成一篇「Codex 使用教程」。教程以后会很多,功能也会变。

我更想记录的是这个瞬间。

OpenClaw 当时给大家展示过一个方向,AI 不应该只会聊天,它应该真的帮你操作世界。

Codex 这次让我感觉,这个方向终于被一个超级大厂当个事儿办了。

龙虾没有白来。

它只是换了一副身体。

我真的建议你今晚就去试一下 Appshots。

不要看介绍,不要看别人截图,自己打开一个你每天都用、但每天都烦的软件。

可能是 BI。

可能是飞书。

可能是浏览器。

可能是 Obsidian。

然后按两下 Command,给 Codex 一个具体任务。

要有结果,要有格式,要有保存位置,要有不能越过的边界。

用过之后,你很快会意识到,真正的红利不是「Codex 会不会用」。

真正的红利是,你能不能把自己手里的工作拆清楚,拆到它能「稳稳接住」。

能拆清楚的人,会越来越像指挥官。

拆不清楚的人,会越来越像被流程推着走的人。

科技红利和危机感从来都是一起到的。

我现在想的是下一件事,这样搞的话,再过两年,我应该干点儿什么?

展开阅读全文

更新时间:2026-05-25

标签:科技   龙虾   新生   代码   活儿   工作   截图   数据   同事   东西   操作   桌面

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top