

提到 AI 时期的最大赢家,差友们的第一响应,确定是英伟达吧?
毕竟老黄这两年靠着给 AI 厂商"卖铲子",营收和市值都"遥遥跨越"。而这一切,都收获于 20 年前老黄千真万确,坚捏 CUDA 生态——这一把,真让他赌对了。

但你可能念念不到,还有一家公司,左手拿着性颖异不外英伟达的显卡,右手攥着 "过时" 的 4nm 工艺,竟然也在 AI 竞争里赚得盆满钵满。
而它就是——A M D!
等会,这是怎样作念到的?
前段时刻,托尼受邀参加了AMD的AI开荒者大会,归来后,我对这个问题有了一些谜底。

不外这事儿嘛。。。得从十多年前苏妈靠锐龙翻身那会儿提及。
锐龙出身之前,AMD 的处理器一直活在 "i3 默秒全" 的暗影里。

直到 Zen 架构横空出世——在 "硅仙东说念主" 吉姆·凯勒的率领下,初代锐龙 IPC 性能实打实升迁了 52%,8 核 16 线程的规格,更是在阿谁 4 核称王的年代触动全场,也拉开了芯片厂之间 "核斗争" 的序幕。

到了 2020 年的 Zen 3系列,AMD 终于一雪前耻:单核、多核性能双双干翻了英特尔同期旗舰。
而 AMD 的这场成效,也逐渐从奢华商场膨胀到数据中心 B 端。说到数据中心,好多东说念主刻下的第一响应,应该是老黄和他的 GPU 的世界。
但其实,从早期诬捏机、云处事,到如今的 AI,都离不开 CPU 的协支援愈。
所谓数据中心,其实就是一个超等物流中心,施行是百万级的 "小快递" 同期配送。

即使单核 CPU 再快,靠近百万小件,那亦然分身乏术;而多核 CPU,就像雇了一支稠密的“司机车队”同期开赴,还能通过“拼车”(诬捏化)处事更多客户,把遵循拉满。
也就是说,到了数据中心这边,别管这那的,我就要阿谁核多的超大杯。
尤其是刻下 AI 智能体兴起,器具调用、任务编排,还得靠 CPU 来干活。以至于前段时刻的 GTC ( GPU 时刻大会 )上,老黄也掏出属于英伟达的 CPU 来。

可这事儿呢,反倒是 AMD 的老本行了。在锐龙处理器讲明了 Zen 架构的实力之后,AMD 的下一步,就是剑指数据中心。
十年前,数据中心的 x86 处理器,如故英特尔的一言堂:2016 年至强 Broadwell 最高 24 核,2017 年至强 Skylake-SP 最高 28 核。
可就在同庚,AMD 驱动爆种,掏出了 32 核的初代 EPYC 处理器。
而在接下来的十年里,AMD 把 EPYC 的中枢数一说念堆到了 256 核 512 线程!英特尔也被迫跟进,作念出了 128 个大核、288 个小核的产物……

谁说英特尔不会堆中枢?这不是挺会的嘛。
是以一又友们,不是英特尔倏得有了良心,仅仅因为苏妈来过。。。
天然,光靠"低廉大碗"给家东说念主们谋福利还不够,AMD 还祭出了杀手锏——
3D V-Cache。
所谓 3D V-Cache,指的是在CPU上加一块大容量缓存。像是最早的 5800X3D,把 L3 缓存加到了 96M,对比广博版翻了 3 倍。
缓存大,关于打游戏来说,意味着帧数更高、更牢固。

但缓存大可不单对游戏有效,在数据中心雷同能大杀四方。无论是需要超低延长的金融交往,如故仿真野心、有限元分析这类重野心任务,都能靠 3D V-Cache 赢得夸张的性能升迁。
就拿 EPYC 9684X 来说,96 中枢塞了足足 1152MB 三级缓存,比拟竞品(至强 8490H)的上风简直达到了 3 倍。
这些功能特色方面的干预,让 AMD 在本年透顶收到了答复。事到如今,哪个数据中心会不心爱 AMD 的 EPYC 处理器呢?
这种心爱,在商场份额上就体现得尽头真实:2019 年之前,Intel 在数据中心的份额一度高达 97%;可跟着 EPYC 的崛起,这个数字在 2025 年降到了 70% 阁下。

换句话说,AMD 只用了短短 6 年,就从零拿下了 30% 的商场份额。
看来真香定律,在数据中心这亦然能成就的。。。

靠着向数据中心卖 CPU,AMD 再也不会像依然一样风雨飘飖,大厦将倾了。
天然了,各人也都知说念,AMD 除了 CPU,也作念显卡买卖的,买球赛的正规app然则 AMD 的显卡 —— 也就是 GPU 业务,这两年过的则是。。。

其实在 2018 年之前,AMD 如故能跟英伟达掰掰手腕的。2006 年收购的 ATi(也就是如今 AMD 的图形部门),商场发扬一直透着一股 "神鬼二相性":神的时候王牌对王牌,旗舰卡甚而能小胜英伟达;鬼的时候呢,旗舰卡只可免强和老黄的中端卡过过招。
可移动点,在于老黄的神之一手:2018年,老黄驱动在奢华级 GPU 当中集成 RT Core 和 Tensor Core,况兼同步推出了光辉跟踪和 DLSS 超分时刻,如今这两项时刻,每个臭打游戏的差友,应该都不会生分。

可恰是这两项颠覆传统光栅化渲染的时刻,让 AMD 一下子堕入了被迫:在这之后,两年后的 6000 系、四年后的 7000 系显卡,都没能拿出像样的光追和超分撑捏。
直到 2025 年 9000 系显卡的发布,AMD 才算有了可以的光追发扬。而 A 卡的超分超帧时刻——FSR,早期更是用传统算法乱来。FSR 能用,但成果跟 N 卡的 DLSS 差着一截。雷同,直到跟着 9000 系一同推出的 FSR4,才是确切基于 AI 的超分时刻,能和 DLSS 在画面发扬上掰掰手腕了。

换句话说,AMD 在图形时刻方面,花了 7 年时刻才追上老黄的布局。
到了处事器端,剧情就更是各人熟习的滋味了:对 AI 撑捏最佳、坐拥 CUDA 生态的 N 卡奏凯卖爆。AMD 这边照实没老黄那么有前瞻性,对标 CUDA 的 ROCm 直到 2016 年才出现,万般算法的撑捏和优化功底,也没 CUDA 那么深厚。
总结下来就是:无论是光追、超分超帧,如故大模子时期的软硬件撑捏,又巧合是硬件性能,AMD 的 GPU 照实不是英伟达的敌手。

也正因如斯,很长一段时刻里,AMD 的 GPU 都是靠"性价比"这一招,吃着老黄看不上的订单。
而 AMD 守护性价比上风的要害其实挺肤浅:又不是什么芯片都得用 2nm 先进制程,更低廉的 4nm,甚而 5nm 工艺其实也够用了嘛。
资本更低,卖的天然也可以更低廉。
而倒有点“无心插柳”的嗅觉:跟着智能体引爆了商场对 CPU 和 GPU 的搀和需求,AMD 恰好是左口袋 CPU、右口袋 GPU,都能掏出东西来。

既然双方都能自研,那就可以整点不一样的花活了。于是,AMD 尝试偷师苹果,把更大规模的 CPU 和 GPU 都塞进统一块芯片,再把内存也整合进去。
AI Max+ 395 应时而生。这颗 U 在一颗芯片里,塞入了 16 核 CPU 和 40CU 的 “核显”,性能堪比独显的同期,又可以分享系统内存,用超大内存奏凯跑大模子。

依然这个活只消苹果颖异,可一台大内存的 Mac Studio 动辄三五万,而一台 395 的小主机只消一万多。天然依旧未低廉,但关于那些重度使用大模子、同期又有阴私挂牵的小伙伴来说,这个价格其实……挺合算的。

天然了,AMD 如今的问题也不少。
就拿 AI Max+ 395来说,生态短板依旧彰着。托尼有共事一直用它跑腹地大模子:靠近主流的 LLM 模子,AMD 的兼容性没啥问题;可一朝念念试试图片巧合视频生成模子,又巧合念念进行模子微调,就不好说了。
靠近生态弱势,一方面 AMD 把 ROCm 开源,念念要借社区的力量来完了对 CUDA 的"弯说念超车"。

另一方面,在此次 AMD AI 开荒者大会上,苏妈给出了一个更合适 AMD 的谜底——围绕性价比,构建一套属于我方的 AI 生态。

具体来说就是:开荒者可以在 AI Max+ 395 这类末端上快速完了念念法,再用 AMD 显卡的职责站作念微调测试,终末在数据中心用 AMD GPU 完成坐褥部署。整套经由都跑在 AMD 的软件生态里,转移起来天然顺畅得多。

表面归表面,施行用起来怎样样?
大会上给出了谜底:单台 AI Max+ 395 最大撑捏 128GB 协调内存,能把 Qwen 122B 模子跑在腹地;

4 台 395 互联,还能管理更大更复杂的任务。同期,AMD 还文告了与魔搭社区的合营,每东说念主有 100 小时的云霄算力体验时刻——好不好用,我方试试就知说念。

无论是拿下"过时"产能,在硬件上坚捏性价比;如故上个月规则的 AI 开荒者大会,如今 AMD 的各样算作,亦然在尝试打造属于我方的软硬件生态。
本年 AMD AI 开荒者大会,选在了对 AI 开源孝顺最大的中国,足以见得 AMD 对生态的青睐。

当补王人生态这块最短的板之后,即使 AMD 顶着"落伍"工艺,性能也比不外的双重 Debuff,只怕也能在商场杀出属于我方的一派天。
买球赛的正规app
