当除夕夜每秒处理633亿Tokens：火山引擎如何让AI“接管”春晚

将时钟拉回到5年前，在那时除夕夜人们热议的话题就是抢红包，那是一场关于手指速度与网络延迟的竞赛。回到2026年除夕，央视春晚正式开播，一场更为深刻的变革正在发生，这时人们不再只是盯着屏幕“摇一摇”，而是开始在豆包APP上生成自己的新春头像，或是让AI为自己写一段独一无二的祝福语。

数据是变革最好的记录者，在除夕当晚，豆包AI总互动达19亿次，生成超5000万张头像，写下超1亿条拜年祝福，庞大的数据处理与算力消耗，震惊整个技术界，如果过去的春晚是流量的“洪峰”，那么今年的春晚则是算力的“核爆”。

而这场算力核爆的支持者正是火山引擎背后的火山方舟平台。根据春晚的特殊流量场景，火山方舟给出了自己的解法，分别在资源调度层和推理系统层进行优化。资源调度层负责分好流量，为此方舟平台打破了物理隔离，将几十个机房组成一个大的“集群联盟”，再结合自研的扩缩容系统，实现跨机房、跨地区秒级扩容和调度，并且将模型加载的时间从几分钟压到了几秒钟，配合分布式缓存和高速网络，应对流量暴增时，既不会卡顿，也不会造成浪费。为了确保春晚互动流畅进行，在这个层面还做了更精细化的流量分级，对于底层资源的调度极其灵活。此外，方舟平台还加入了服务质量分级管理，确保资源动态调整时也能稳定服务。

另一个推理系统层负责解决让算力跑得快的问题，在这个层面分别针对架构、算法、系统这三部分做了优化。在架构层，为了应对春晚这个特定场景，重新优化硬件储存网络的搭配，在性能、成本、能耗之间的寻找最优解法。算法层对AI核心计算逻辑做专家级手写优化，搭配自动编译系统，让硬件性能被极致的发挥。系统层则是通过存算分离、动态负载等方案，让大模型集群的协同效率更稳更高。

通俗来讲，他们解决了两个核心难题：一是让每一张显卡的性能都被“榨干”，没有空闲等待；二是让成百上千张卡在应对流量突发时，步调一致，如同一个大脑在思考，而不是一群各自为战的散兵游勇。最终，这套系统成功承接了除夕当天每分钟633亿Tokens的流量峰值。

值得一提的是，在支撑豆包AI互动的同时，火山方舟还有另一条战线：保障1.8亿人在抖音直播间丝滑观看《竖屏看春晚》。这相当于一边在指挥一场复杂的交响乐，一边还要维持一个巨大体育场馆的秩序。

时间倒回2021年，同样的春晚舞台，抖音完成了703亿次红包互动，而过去五年对春晚的技术保障，让火山引擎积累了应对“超级流量”的基因。从703亿次红包到633亿Tokens，变的是技术形态，不变的是对“稳定”与“快速”的极致追求。

当亿万用户在除夕夜收获了AI生成的新春惊喜时，很少有人知道，背后是一场关于算力调度与推理优化的“超级工程”。而这场工程的完工，标志着春晚互动正式迈入了由大模型定义的新阶段。

展开阅读全文

更新时间：2026-02-25

标签：科技除夕夜火山引擎方舟流量系统豆包除夕核爆解法资源

1 2 3 4 5

当除夕夜每秒处理633亿Tokens：火山引擎如何让AI“接管”春晚

一周热闻回顾（2026年2月15日）

机器人的春晚“成人礼”

文旅发展直击一线丨“数字秦陵”服务平台上线

春晚机器人开挂！后空翻秀功夫，太全面了

马年春晚机器人“霸屏”，不是抢戏

大年初一，人民日报客户端继续送您50万个现金红包

一键获取！微信又上春节新功能

有了火山引擎加持，春晚这些机器人口才居然比我还好？！

太疯狂了！每秒一百万亿亿次运算！中国要在太空建超级计算机？

为什么说你与父母的战争，从来不是孝与不孝，而是你活不活的问题

独生子女这代人，注定不适合结婚

出生人口持续走低！都说是年轻人不想生，其实能生的人早就变少了

大艺一家新年亮相，妈妈太漂亮，爷爷家书香门第，原来都不简单

母乳喂养，藏着孩子一生的专注力与学习力

孕晚期出现这 4 种情况，立刻去医院

有了火山引擎加持，春晚这些机器人口才居然比我还好？！

iOS 26.4 Beta 终于发力！热点能看单设备流量，安卓用户早

除夕夜，你希望谁陪在你身边？

除夕拜大年，马年纳万福

除夕收工日：与自己和解，向未来奔赴

拜年了拜年了今日除夕 | 骐骥驰骋，万事顺遂

广东人过年吃鸡，可以从除夕一直吃到……

除夕年夜饭，这8道菜再馋也别端上桌！老辈人忌讳不吉利

蔡明时隔30年再演机器人，撒贝宁的眉毛又上热搜了！宇树科

除夕良宵，岁岁皆安