谷歌杀疯了！新AI操控浏览器碾压OpenAI，浏览器自动化迎来变革

前脚大家还在热议OpenAI的“电脑操控助手”多神奇，谷歌10月8号凌晨就扔出了王炸：Gemini 2.5 Computer Use模型。

这玩意最牛的地方在于，能像人一样玩转浏览器，点鼠标、滚页面、输文字。

一套动作下来丝毫不含糊，说是“AI 自己当网管”都不夸张。

说起来这发布时机挺有讲究，前几天谷歌刚更新Chrome的开发工具，转头就亮出这个模型，明显是早有准备。

跟OpenAI的CUA、Anthropic的Claude Computer Use比，三者思路差不多。

都是让AI直接上手操作浏览器，但谷歌这次的表现确实有点东西。

官方演示看得人眼前一亮：从网站上扒加州所有宠物的信息，填进宠物水疗的客户系统。

最后还能约好10月10号早上8点后跟专家Anima Lavar的复诊，整个流程顺得像老员工干活。

还有整理混乱的便签板，把零散笔记拖进对应分类，准确率也很高。

数据更亮眼，WebVoyager测试里准确率88.9%，比OpenAI的同类模型高 1.9 个百分点；

Online-Mind2Web测试里，把OpenAI和Anthropic的Claude Sonnet 4.5都甩在了后面。

225秒就能在关键测试里冲到70%以上准确率，速度比对手快不少。

不过有网友试验之后发现，这AI有点“偏科”。

简单任务比如“找维基百科的John Wick页面”，秒完成；

可一旦加了难度，比如“找页面还得总结成中文”，直接卡壳。

让它查今年诺贝尔奖的宣布时间表，也没能成功打开官网完成任务。

而且演示版最多只能用5分钟，还不能中途接手，这点挺受限。

说实话，这状况挺真实的。

现在的AI智能体就像刚学开车的新手。

直线加速没问题，遇到复杂路况就慌神。

毕竟多步骤、跨网站的任务需要精准的逻辑衔接。

这正是目前AI的短板，也难怪这些模型都还藏在“预览版”里不敢正式上线。

AI当“电脑管家”怕翻车？

可能有人会问：让AI直接操控电脑，万一乱点付款链接、改系统设置怎么办？

这问题谷歌确实想到了，Gemini 2.5 Computer Use的安全设计藏了不少小心思。

毕竟是要直接碰用户设备的东西，安全这块不能马虎。

先说说它到底是怎么干活的。

这模型靠Gemini API里新增的“computer_use”工具实现功能。

说白了就是个“看、想、动” 的循环：先通过截图“看见”屏幕上的内容。

结合用户需求和之前的操作记录琢磨下一步，然后生成点击、输入这类动作指令。

执行完再看新截图继续循环，直到任务完成或者出问题停下。

有意思的是，要是涉及购买这类敏感操作，它会主动找用户确认。

不过它目前主要针对浏览器优化，虽然在“AndroidWorld”测试里显示出操控手机界面的潜力，但还没法好好搞定电脑桌面系统。

这其实是个聪明的选择，先聚焦浏览器这个高频场景练手，比一下子贪多求全要稳妥。

安全防护上，谷歌下了双保险。

一方面训练时就植入了安全机制，专门对付恶意使用、模型误操作这些风险；

另一方面给开发者准备了“安全开关”。

像损害系统、绕开验证码、控制医疗设备这些高危操作。

要么直接禁止，要么必须让用户点头确认。

更关键的是有个“步步安检”服务，AI每想做个动作，都得先过独立安全系统的审核。

不过有一点值得注意的是，等AI能力再强点，要是被用来搞诈骗、注入恶意指令，光靠技术手段未必够。

这已经不只是谷歌一家的事了，而是整个行业都得面对的考题。

现在巨头们都在AI智能体赛道上发力，谷歌这次算是暂时领跑，但基准测试的输赢不算终局。

就像当年智能手机刚出来时，谁也没想到现在的样子。

虽说眼下的AI还会 “翻车”，但键盘鼠标被自然语言取代的趋势，已经越来越明显了。

展开阅读全文

更新时间：2025-10-10

标签：科技浏览器模型操作测试用户翻车系统准确率动作页面

1 2 3 4 5

2017年，中国收购乌克兰航空发动机企业，俄罗斯专家：高兴的太早

马达西奇扎根乌克兰扎波罗热，从上世纪初就干航发这行。苏联时候，它是军工骨干，生产AI-25和D-18T这些宝贝，出口到中东和非洲，订单堆成山。解体后，乌克兰接手，企业私有化，维塔利·博古

皮尤研究中心：美国12岁以下孩子约10%使用过AI聊天机器人

“教培小史记”：268万字，1000场对话，见证十年！多知图书十年大礼包，人手一套。多知10月9日消息，皮尤研究中心对美国家长进行的一项调查揭示了科技在12岁及以下儿童中的普及程度，以及

好消息！我国取得突破！

中国科学院金属研究所日前消息，该所科研团队在固态锂电池领域取得突破，为解决固态电池界面阻抗大、离子传输效率低的关键难题提供了新路径。该研究成果已于近日发表在国际学术

389MB！鸿蒙4.2节后全新版本来了，更新内容简单却很实用

现在华为的鸿蒙5/6系统进展是非常快的，像鸿蒙5的终端数量早已突破2000万，不过还有大量老机型只能待在鸿蒙4.2，那么在这种情况下，华为也没有放弃维护。最近鸿蒙4.2推送了HarmonyO

太炸裂了！外网主播直播生子引热议

国外直播平台Twitch有各种奇奇怪怪，甚至反人类的直播内容，包括但不限于有人假装将叉子插进烤面包机、用闪光弹自虐甚至直播虐己，更有人直播撞狗后逃逸的恶劣行径。现如今，竟然有

长城钻探给储气库植入“永久神经网”

9月30日，记者从长城钻探公司西部钻井分公司获悉，随着榆37-3ZH5井光纤信号回传正常，标志着该公司“储气库管外永置式光纤完井”技术首次现场试验圆满成功。“该井完钻井深4223米

3年倒闭6万家！利润暴跌2.36亿，中产“白月光”为啥没人买单了？

打开二手交易平台，一台标注“9成新”的珠江118M2钢琴赫然在列，标价仅800元，页面顶端的“急售自提”四个字格外扎眼。谁能想到，这款钢琴在2017年巅峰时售价高达2.3万元，如今连原价

黄金股大涨国内品牌金饰价格最高涨至1170元/克

湖北日报讯（记者王艳华）国庆假期期间，国际金价和国内各品牌金饰价格持续上涨。10月9日，节后第一天A股黄金股集体大涨，国内品牌金饰克价最高上涨至1170元。周生生金价近期走势。10

明起，巴彦淖尔这些地方计划停电→

10月10日起巴彦淖尔这些地方计划停电快来看看有没有你家？来源：内蒙古电力公司编辑：张文宇校对：王畅初审：石政勇审核：吕园监审：王剑终审：韦嘉

迟迟等不到中方订单后，特朗普开始另寻出路，却又收到一个坏消息

2025年7月，美国农业部的仓库负责人在接受采访时透露，今年中西部地区的大豆库存已达到过去十年最高值，这一幕让人不禁回想起几年前的场景——那时候的美国大豆，是全球市场上的“

10年来首次！A股实现重大突破，黄金继续狂飙，有色金属掀起上涨潮

国庆假期，全球大宗商品市场被金属板块“霸榜”。10月9日，沪指突破3900点整数关口，为10年来首次，截至午盘涨1.24%。深成指涨1.75%，创业板指涨1.77%。科创50更是大涨超5%，半导体产业

可控核聚变：百利电气、融发核电、远东股份、精达股份，潜力谁大

在假期可控核聚变国内外两大利好之下，周三A股可控核聚变板块再度出现大涨。不仅涨幅排名概念板块第一，且板块内，涨停家数高达19家，可以说是当天最靓的仔了。那么，今天就来看看可

善恶终有报：疫情时对中国一毛不拔，却大方捐美国6亿，如今咋样

曾经是叱咤地产界的“风云伉俪”，如今却成为人人喊打的“过街老鼠”。原本一个是甘肃贫困山区走出来的“寒门贵子”；一个是14岁就出来打工靠苦学逆袭剑桥的“灰姑娘”。相识几

收评：沪指跳空破3900！大三浪冲4025近在咫尺，钝化隐忧这样应对

10月首个交易日，A股走出教科书级突破行情！沪指早盘跳空高开直破3900点，短暂回补缺口后一路向上，午后连创新高至3936点，尾盘仍稳守高位，最终收出光头中阳线。伴随成交量显著放大，1

港股速报 | 港股突发！ 2500亿港元市值银行巨头爆拉40%

每经记者：曾子建每经编辑：袁东今日（10月9日），港股市场迎来小幅反弹。截至发稿，恒生指数报26862点，上涨32点，涨幅0.12%。恒生科技指数报6540点，上涨26点，涨幅0.41%。焦点公司方面，市值

上滑加载更多 ↓

谷歌杀疯了！新AI操控浏览器碾压OpenAI，浏览器自动化迎来变革

AI当“电脑管家”怕翻车？

2017年，中国收购乌克兰航空发动机企业，俄罗斯专家：高兴的太早

皮尤研究中心：美国12岁以下孩子约10%使用过AI聊天机器人

好消息！我国取得突破！

389MB！鸿蒙4.2节后全新版本来了，更新内容简单却很实用

太炸裂了！外网主播直播生子引热议

长城钻探给储气库植入“永久神经网”

3年倒闭6万家！利润暴跌2.36亿，中产“白月光”为啥没人买单了？

黄金股大涨国内品牌金饰价格最高涨至1170元/克

明起，巴彦淖尔这些地方计划停电→

迟迟等不到中方订单后，特朗普开始另寻出路，却又收到一个坏消息

10年来首次！A股实现重大突破，黄金继续狂飙，有色金属掀起上涨潮

可控核聚变：百利电气、融发核电、远东股份、精达股份，潜力谁大

善恶终有报：疫情时对中国一毛不拔，却大方捐美国6亿，如今咋样

收评：沪指跳空破3900！大三浪冲4025近在咫尺，钝化隐忧这样应对

港股速报 | 港股突发！ 2500亿港元市值银行巨头爆拉40%

腾讯光子测试了一款三消+经营游戏，美术卷出了新高度

武网第18战，“虎妞”差一点翻车

联合国发言人都惊了！央视记者用小米17 Pro背屏秀操作

苹果原厂充电器选购指南：iPhone 17 Pro Max 用户必看

科技成时尚新“宠儿” 柒牌将引领传统男装设计理念

野村：阿里巴巴盈利能力或受累于对大语言模型的投资维

五冶集团、机器人等在四川成立科技公司

10.9操作：黄金、白酒、半导体以及医疗等板块操

央行今日大动作！专家称第四季度或将陆续出台新一轮稳增

央行大动作！1.1万亿元+6120亿元