苏姿丰的饭盒放了个大招:128GB统一内存把本地大模型门槛砸穿了

一台精装书大小的迷你主机,单手就能拎起来,苏姿丰站在台上用它现场跑了两千多亿参数的大模型——不连云,不租卡,不通数据中心。这件事的本质不是"AMD赢了"这么简单,而是个人AI算力的账,被逼着要重算了。

主角:Ryzen AI Max+ 395,统一内存才是杀招

这台小机器的心脏是一颗看上去不像会搞出这么大动静的芯片——AMD Ryzen AI Max+ 395,代号 Strix Halo

参数层面大家可能看过很多遍了:Zen 5 架构,16核32线程,集成 RDNA 3.5 核显(40个计算单元),再加一颗 50 TOPS 的 XDNA 2 NPU。但这些都不是重点。

真正的狠活是这四个字:128GB 统一内存

CPU 和 GPU 共享同一块内存池,不再分什么"系统内存"和"显存"两套账。Linux 下可以给 GPU 分配大约 110GB 的可寻址空间。对比一下你可能就有感觉了——

不是多一点,是三倍多。而且这是 x86 架构上的统一内存,不是苹果那种封闭生态,你能跑 Windows,也能跑 Linux,工具链该有的都有。

为什么"显存大"比"算力猛"更致命?

很多人第一反应是:核显再大也比不上独显带宽啊?

说得对。但你说错了场景。

跑 7B、14B 这种小模型,RTX 5090 的 GDDR6X/7 显存带宽接近 1800 GB/s,生成速度能把 Strix Halo 甩开几倍。这个没争议。

但问题在于:当你要跑的模型一大,显存装不下的时候,独显的优势瞬间归零。 模型权重溢出到系统内存,数据要跨 PCIe 总线来回搬运——实测场景下,RTX 5090 跑一个放不进 32GB 显存的模型,token 速度可以从每秒几十个直接跌到每秒一两个,你打字都比它快

这时候 Strix Halo 的逻辑就清楚了:我不跟你比谁短跑快,我比你根本跑得完跑不完。 128GB 统一内存 = 模型住平层,不用爬楼梯搬数据。

AMD 给出的 DeepSeek R1 推理基准里,当模型大小超出 RTX 5080 的 16GB VRAM 限制后,Ryzen AI Max+ 395 的速度是 RTX 5080 的 3 倍以上

这不是"AMD 干翻了英伟达"的爽文——准确说法是:在大模型容量这个维度上,Strix Halo 打开了一个独显至今够不到的价格-容量窗口。

价格怎么算?一次性投入 vs 永远订阅

AMD 官方的 Ryzen AI Halo Developer Platform(第一方迷你主机,128GB + 2TB SSD,149×149×43mm)定价 3999 美元,目标直指 NVIDIA DGX Spark 的 4679 美元。

而第三方厂商的 Strix Halo 迷你主机(比如极摩客 EVO-X2 这类)根据不同内存配置,落点在 1700~2500 美元 的区间。

不管取哪个数字,算一笔最朴素的账:

你每个月花在 Claude Pro、各种 API 额度、云 GPU 租赁上的钱,滚一年可能就三四千美元出去了。而这台机器买回来,电费一个月几块钱,跑多少次都不加价,数据一字节不出你的房间。

部署也谈不上多折腾——Ollama 或 LM Studio 拉一个 Qwen3-235B 的量化版本,指向本地地址,你熟悉的对话界面照常用,只是后端换成你自己的硬件。

冷静一下:它也不是万能钥匙

得说实话:Strix Halo 的统一内存带宽是瓶颈,大约 256 GB/s 的量级,跟高端独显差着一个数量级。所以如果你主要跑小模型追求最快响应,一块二手 4090 可能体验更好。

它真正的战场是:70B+ 级别的模型本地部署、私有文档 RAG、需要数据不离本的合规场景、不想被 API 限流掐脖子的开发工作。这些地方,过去你要么忍云服务的成本,要么搞一柜子服务器——现在一个饭盒大小的东西放桌上就行。

苏姿丰把这台机器拎上台的时候,台下炸的不只是"AMD 牛逼",而是更多人突然意识到:本地大模型的硬件门槛,在 2026 年这个节点,已经不是技术问题,是价格和形态问题了。

而 AMD 用统一内存这条路,绕开了英伟达用显存容量和带宽筑了十年的墙——不一定推倒它,但至少凿了个够一个人钻过去的洞。

下一步就看软件生态(ROCm 的稳定性、框架兼容性)能不能跟上。硬件这边,牌已经亮出来了。

展开阅读全文

更新时间:2026-06-17

标签:数码   饭盒   门槛   模型   内存   显存   带宽   英伟   美元   数据   场景   容量   大小

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top