代码翻17倍，软件只多了三成

上周三晚上十一点，一个做了七年开发的朋友发了条消息：「哥们，我们组这个月AI生成了四万多行代码，但版本发布比上个月还晚了三天。」

这不是个案。MIT和宾夕法尼亚大学的研究人员今年5月在NBER发了一篇工作论文，追踪了十万名开发者。结论很刺眼：AI编程工具让代码行数变成了原来的17.3倍，但实际发布的软件版本只提升了30%。

17倍的代码，30%的软件。

中间的差值去哪了？

不是AI写得慢，是人审不过来

安托万是我认识的一个后端架构师。他们团队年初全面接入了Claude Code，刚上手那阵子，所有人都很兴奋。一个登录模块，以前两个人写三天，现在一个人加AI，半天搞定。

但两个月后，问题冒出来了。

「AI一天能给十几个PR，每个PR少则三四百行，多则一两千行。」他说，「我们组就三个能做深度审查的人，根本审不过来。」

他们做了个统计：AI提的PR中，平均审查延迟从年初的4小时拉长到了现在的26小时。有将近三分之一的PR因为排队太久，合并进去的时候已经和其他代码产生了冲突，又要额外花时间修。

Cursor今年春季的报告证实了这个趋势不是孤例。未经人工逐行审核就自动进入提交的AI代码，从年初到现在增长了超过5倍。不是因为这些代码质量高到不需要审，而是因为——审不过来了。

Anthropic自己的数据更直接。Claude Code的代码可运行率确实在提升，开放式任务的可用率半年内从54%冲到了76%。但另一个指标在报警：AI代码在被接受后60分钟内保留在代码库的比例，从76%升到了81%。这个数字看起来是好事，但你反过来看——有近20%的AI代码，提交之后很快就被回滚或替换掉了。

代码多了，但「有用的代码」没多

MIT那篇论文里藏着一个更深的发现。

研究人员把代码产出拆成两类：样板代码和核心逻辑代码。样板代码——配置文件、依赖声明、路由注册、重复的CRUD——增长了23倍。核心逻辑代码只增长了2.7倍。

AI在疯狂生产你不应该手写的东西，但它没有在解决你真正需要解决的问题。

这就解释了为什么代码17倍、软件只多三成。多出来的那十几倍代码，大部分是AI替你生成的「胶水」。胶水多了，系统确实能跑起来，但系统复杂度也同步膨胀。

Stack Overflow 2025年开发者调查印证了这一点。66%的开发者表示AI编程最大的痛点是「几乎对但不完全对」——AI给你的代码看起来像模像样，跑起来也没报错，但它处理边界条件的方式是错的、它的异常处理路径是漏的、它的性能假设是不成立的。你要花时间去发现这些问题，发现之后要花更多时间去修。

45%的开发者认为调试AI代码比调试自己写的更耗时。

管理债务：一个没人讨论的隐形杀手

代码审查的拥堵只是表面现象。更深层的问题在管理层面。

去年底，一家中型SaaS公司做了一个尝试：三个月内，所有业务代码全部由AI生成，工程师只做审查和架构决策。

结果让CTO失眠。

「第三个月月末我要做一个架构评审，我问团队某个微服务的数据库连接池配置为什么设成了50。没人能回答。最后翻了三个月前的AI对话记录，发现是Claude在第一次生成代码的时候自己决定的，后面所有迭代都在这个基础上继续改，但从来没有人去质疑过这个数字。」

这不是技术债，这是知识债。

当一个团队里80%的代码是AI写的，而工程师只在审查层面介入时，系统是怎么运作的、某个决策为什么这样做、哪些地方埋了假设——这些隐性知识正在从团队中消失。

Anthropic在自己的内部报告中也承认了这一点。他们的一位员工说，自己已经快五个月没亲手写过一行代码了。这听起来很酷，但细想是可怕的：如果连做出AI编程工具的人自己都不写代码了，那未来谁来理解系统？

Cursor的报告里有一个数据很能说明问题：AI代码行数的基尼系数高达0.77。意思是，极少数人用AI产出了绝大部分代码。P99开发者的代码产出是中位用户的46倍。

但这些超级产出的代码，有多少被真正理解、被妥善维护？没人统计过。

另一个容易被忽略的数据来自Google。他们在今年的Cloud Next大会上透露，Google内部新代码的AI生成比例已经达到75%——从2024年底的25%、2025年秋的50%一路攀升。但与此同时，Google工程师用在代码审查和调试上的时间同比增加了42%。

这不是巧合。当AI帮你省下了写代码的时间，这些时间没有变成你的空闲时间——它们变成了更多代码审查的时间、更多调试的时间、更多因为你没亲手写所以看不懂的代码需要你花时间去理解的时间。

写代码的边际成本降到零之后，审查和维护的边际成本反而升上去了。

你的团队，正在经历什么

软件工程有一句老话：写代码只占开发总时间的10%到20%。

AI编程工具确实把写代码这件事加速了。但理解需求、设计架构、评审代码、联调集成、修复缺陷、维护系统——这些事情没有加速，甚至因为代码量暴增而变得更重了。

一个具体的例子。去年一家做支付系统的团队统计过一组数据：AI编程工具全面接入前，平均每个需求从PRD到上线的总时长是8.2天。接入半年后，代码编写从3.1天降到了1.6天。但需求澄清从1.2天变成了1.9天——因为AI生成的需求拆解常常过于机械，反而催生了更多回炉讨论。代码评审从0.8天变成了2.1天——因为AI吐出来的代码量太大了。联调测试从1.5天变成了1.3天——变化不大。

总的来看，端到端交付时长从8.2天变成了7.3天，只快了11%。代码编写环节加速了48%，但被其他环节的膨胀吃掉了大半。

一个来自德国咨询公司adesso的2026年GenAI影响报告显示，使用AI做软件开发的企业中，有21%实现了超过26%的生产力提升——相当于一个五人团队多出了一个虚拟成员。但34%的企业表示「缺乏技能」制约了进一步扩展，38%觉得「合规要求」是瓶颈。

AI让你写得快，但不能让你理解得快、决策得快、协作得快。

上周那个发消息的朋友最后说了一句话：「我们现在最大的瓶颈不是写代码的速度。是理解代码的速度。」

方向对了。AI编程的下半场，比的不是谁产出多，比的是谁能审得过来、管得清楚、睡得着觉。

不管你的团队现在AI代码占比是多少，有三个迹象值得你留意：审查队列是不是在积压、技术决策记录是不是越来越薄、出问题之后是不是越来越难定位到根因。这三样东西比代码行数更能告诉你，你的AI编程是在加速还是在添乱。

展开阅读全文

更新时间：2026-06-21

标签：科技代码软件时间团队开发者更多系统需求发现数据架构

1 2 3 4 5

代码翻17倍，软件只多了三成

不是AI写得慢，是人审不过来

代码多了，但「有用的代码」没多

管理债务：一个没人讨论的隐形杀手

你的团队，正在经历什么

桑德斯要向AI巨头"收股"：7万亿国家基金每位美国人年领1000美元

“智”造新地标启航融瓴机器人联盟基地19日“圈粉”试营业

Meta和沃尔玛开始限制员工使用AI

英媒：若是欧洲继续用ASML光刻机卡中国脖子，那会造成什么后果？

电动车或将要被取代？多地开始大批投放！新型代步车已经正式登场

香港全球竞争力排名跃升至世界第二

金价突然跳水又拉回，普通人到底该不该买

铝银粉售价仅为同行零头？旭阳新材收二轮问询，部分客户应收账款回款金额为0引关注

CPI破4%标普将跌7%！美银牛熊指8.8亮卖出信号，科技股创纪录流入

中科闻歌将在港交所上市：募资9亿港元，持续亏损与高管高薪并存

曾被全网群嘲的5万亿巨债，如今竟成中国铁路腾飞的坚实底座？

孕妇不能吃海鲜？这几种关于水产品的误区，你被坑了多久？

儿童dha哪个牌子好？2026年最新高口碑儿童dha权威汇总：充盈脑部营养

越催越不学越逼越躺平：90%青春期厌学根源都不在学习，而是内耗

浓情端午，“粽”享好孕！邯郸市妇幼保健院孕妇学校端午主题活动温情落幕

CPI破4%标普将跌7%！美银牛熊指8.8亮卖出信号，科技股创纪

亏了，科技股涨上天，散户的钱都去了哪？

回暖之下存短板，中小游戏开发者如何突围？

世界遗产地中华行系列科技护航多边协作探索世界遗产

央视直播排球时间表：6月19日CCTV5直播女排有变！中国队决

当叙利亚文物常年在华巡展，世界才发现，中国成了文明的避

AI编程工具正在向你的代码库植入假依赖，而你浑然不觉

涨价最凶的“五大金刚”！科技涨价风暴，谁能拔得头筹？

一周降900万桶？美国公开数据：石油储备见底，创40年新低

A股:大家系好安全带,不出意外的话,下周一6.22或迎更大