AI手机之战开打:智谱清言通用Agent略尴尬,起了大早赶个晚集?

大家可能都没想到,在2025年年终节点,AI领域被这么一款AI手机给撼动了一下。

事情大家应该也大概听说了,12月1日,字节跳动旗下豆包团队联手中兴通讯推出“豆包手机助手”技术预览版,搭载于努比亚M153工程样机。

这款售价3499元的设备,一夜之间售罄3万台,二手价飙升至6000元以上,引发资本市场狂欢。中兴通讯股价当日涨停,带动天音控股、福蓉科技等AI手机概念股集体封板。

这场变革的核心,是大模型与硬件的深度融合,让AI不再是聊天工具,而是能“看懂”屏幕、模拟人类操作的“数字分身”。

然而,这场“AI手机元年”的舆论热度中,笔者也突然注意和察觉到,相较于豆包×中兴AI手机的短暂爆火(尽管迅速遇阻),智谱清言(Zhipu AI)作为比较早发布号称“全球首个能操作手机和电脑的通用 Agent”的公司,却显得“不温不火”,先发优势显得黯淡,甚至有种“起个大早赶个晚集”的即视感。

豆包发布后,智谱迅速官宣开源可操控手机的智能体模型AutoGLM,这不仅是技术回应,更是战略反击。我们也试图通过本文剖析一下这一事件链,聊聊其背后的动机与影响。

豆包×中兴:AI手机的“引爆点”,从实验室到客厅

豆包手机助手的亮相,像一枚深水炸弹。

不同于传统语音助手(如Siri或小爱),它基于豆包大模型的GUI(图形用户界面)Agent能力,嵌入操作系统底层,获得高权限(如INJECT_EVENTS),能跨App执行复杂任务:用户只需说“帮我在全平台比价下单奶茶和鸡排,送到公司”,AI就会自动搜索淘宝、美团、抖音等App,比价、领券、下单,甚至处理支付确认。

演示视频中,AI还支持屏幕问答、智能录音、通话摘要,甚至全局记忆:记住用户偏好,避免重复输入。豆包官方称,其图形界面操作在权威评测中位居业界首位,能“像人类一样操作手机”。


硬件上,努比亚M153搭载骁龙8至尊版处理器、6.78英寸屏、6000mAh电池,16GB+512GB配置,专为开发者与极客设计。

豆包强调,这不是自研手机,而是“生态合作”:正与多家厂商洽谈,预计2026年渗透率超35%。

抢跑者的尴尬为何AutoGLM没能率先引爆?

过去半年,我们看惯了智谱AutoGLM的各种演示视频:自动点外卖、自动整理表格、甚至是在微信里自动互动。技术确实很炫,愿景也很宏大:让AI接管一切屏幕操作。

但豆包与努比亚的合作揭示了一个残酷的真相:在现阶段,脱离了硬件厂商深度整合的Agent,大多只是空中楼阁。

智谱的AutoGLM虽然手握先进的GUI Agent技术(通过视觉识别UI并模拟点击),但它本质上还是一个“外人”。

智谱AutoGLM的痛点: 甚至需要通过ADB(Android Debug Bridge)这种开发者调试接口来实现控制,或者依赖不稳定的无障碍权限。这对普通用户来说,门槛极高且体验割裂。

豆包的精准降维打击: 豆包通过与中兴的OS层级合作,直接拿到了“注入事件”的高级权限,成为了系统的“原住民”。用户不需要看懂复杂的Github教程,不需要忍受不稳定的弹窗,买来手机就能用。

这就是“产品力”对“技术力”的一次降维打击。 所谓的通用Agent,在没有解决“入口”问题之前,只能是极客的玩具,而无法成为大众的工具。

拒绝神话:发红包Agent是创新还是炒冷饭?

在我的印象里,智谱AutoGLM在早期的宣传中,似乎总是将“第一个给人类发红包的手机Agent”作为核心噱头,试图用这种极具中国特色的场景来证明其“拟人化”的能力。

但如果我们拨开AI的迷雾,回顾科技史,会发现这不过是一次“新瓶装旧酒”的营销包装。

图注:三星语音助手Bixby指令微信发红包过程(出处:ifanr)▲


早在2017年,三星发布的Bixby就已经能够通过语音指令实现“打开微信,给XX发一个红包”的一连串复杂操作。

虽然技术路径从“死记硬背”进化到了“自主理解”,但在用户体验端(User End),两者的交付结果是完全一致的。

我们当时也发文对三星的语音助手进行过分析。股价大涨55%、人工智能渗透至毛细血管,三星AI平台Bixby的底气和气质

如果不谈技术实现的路径差异,单论“发红包”这个功能本身,将其包装为2024年的重大AI突破,无疑是对用户记忆的一种轻视。

这更像是一种为了展示技术而找的蹩脚场景,真正的智能体,应该去解决人类无法高效完成的复杂决策(比如跨APP比价、复杂行程规划),而不是仅仅为了证明“我有手指”而去重复Bixby七年前就能做的事。

突然开源的背后:是普惠还是焦虑?

更有意思的博弈发生在豆包AI手机引发热议之后。我们看到智谱AutoGLM,迅速官宣开源其可操控手机的智能体模型(AutoGLM-Phone-9B)及框架


在这个时间节点选择开源,其动机值得玩味,这并非单纯的“技术普惠”,更像是一场焦虑的自救

防御性护城河的构建:既然在硬件预装(Pre-install)的赛道上暂时落后于“豆包+中兴”这种联合的模式,那么唯一的破局之道就是发动群众战争。

智谱试图通过开源,让更多的开发者、甚至其他二三线手机厂商(没有能力自研OS大模型的厂商)能够低成本地接入其Agent能力。

数据的饥渴:手机操作的GUI场景极其复杂(不同的APP版本、弹窗、UI布局)。单靠智谱一家公司的测试团队无法覆盖所有Corner Case(长尾场景)。

开源是为了利用社区的力量,免费帮其测试各种APP的适配数据,以此来反哺模型的鲁棒性。

应对“入口”危机:所有的Agent如果不与硬件绑定,最终都将沦为APP里的一个功能。智谱的开源是在向硬件厂商示好:“看,我的技术免费且强大,你们不想自己研发的话,可以直接用我的。”

这是一种以退为进的生态策略,试图在被巨头(字节、华为、小米等)瓜分殆尽的手机OS市场中,硬挤出一张牌桌入场券。

新芒xAI如是说

智谱作为“大模型六小龙”之一,技术自研强,但缺少字节般的流量帝国、华为般的硬件生态。ToB/ToG虽稳健,却难以制造C端爆款。

豆包事件证明,AI手机落地需“硬件+模型+生态”三位一体,智谱的“纯模型”路径,在当前阶段注定慢半拍。

智谱的“起大早赶晚集”,本质是资源不对等下的战略失衡。先驱往往吃亏,探索成本高、试错多,却易被后发者(如豆包)抄近道抢果实。若开源未能快速转化为生态主导,智谱可能在Agent浪潮中渐趋边缘化。

当然,AutoGLM虽然在落地策略上略显焦灼,但它确实是国内最早在“Phone Use”这一无人区进行大规模探索的产品。是智谱率先描绘了“手机自动驾驶”的愿景,启发了行业对于未来终端形态的想象。

在AI探索的荒原上,先行者往往要承担试错的成本。智谱走过的弯路,或许正是整个行业通向成熟的必经之路。我们期待智谱在开源战略下,能不仅贡献代码,更贡献出真正颠覆时代的交互范式。


【免责声明】

本文内容仅代表作者作为行业观察者的个人观点与深度分析,基于公开市场信息进行逻辑推演,不代表任何官方机构、投资建议或绝对事实陈述。

文中提及的各项数据均来源于互联网公开渠道。若相关公司技术细节或合作模式有未公开的更新,以官方最新公告为准。

本文旨在探讨AI技术落地路径与行业发展趋势,对特定产品的分析属于正常的科技评论范畴,旨在推动行业良性讨论,绝无恶意抹黑、商业诋毁或误导公众之意图。我们对所有推动中国AI技术进步的企业保持高度尊重。

如文中存在关键事实性错误,欢迎相关权利方通过官方渠道联系指正,我们将基于事实依据进行核实与修正。本号不承担任何连带法律责任。

展开阅读全文

更新时间:2025-12-16

标签:数码   尴尬   手机   三星   豆包   技术   模型   硬件   操作   努比亚   助手   生态

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top