挡不住TPU,黄仁勋200亿美元买断前核心团队:AI算力生态的攻防与重构

日期:2025-12-29 19:45:13 / 人气:3



去年初,Groq初露峥嵘,以独特的LPU技术同时向英伟达的GPU霸权与谷歌的TPU生态发起挑战。今年底,当谷歌TPU凭借Gemini 3模型完成“算力+模型”双引擎突破,重写AI行业竞争叙事之际,黄仁勋给出了一记重磅回应——以200亿美元天价收编Groq核心团队,而这支团队的底子,正是谷歌第一代TPU的研发班底,这场交易自带几分宿命般的轮回感。

这是英伟达32年发展史中最大手笔的收购,远超2019年近70亿美元收购迈络思的纪录,本质是一场精准的人才与技术双收并购。根据协议,英伟达支付200亿美元获得Groq推理技术的非排他性许可,Groq创始人兼CEO乔纳森·罗斯、总裁Sunny Madra及多名核心工程师悉数加入英伟达,而被掏空核心资产的Groq公司及其云业务则由CFO主导继续独立运营。这种“摘核心、留空壳”的操作,直指AI算力竞争的核心——顶尖人才与底层架构能力。

市场对此次收购的解读呈现多元视角,攻防交织的战略意图愈发清晰。其一为防御性收购论,Cerebras产品营销总监James Wang直言,Groq的微架构并非玄学,核心只是押注了SRAM(静态随机存取存储器)技术,英伟达此举本质是为了规避未来潜在的2000亿美元市场损失。当下HBM(高带宽存储)价格持续飙升,在AI服务器成本中占比不断攀升,已严重侵蚀英伟达利润率,而Groq的LPU无需依赖HBM,恰好为英伟达提供了结构性对冲方案。

其二为技术与战略扩张论。随着AI产业从训练端向推理端加速转型,低延迟、高能效的差异化服务成为竞争关键,LPU正是这一领域的佼佼者。Groq的LPU基于SRAM构建,无需像GPU那样频繁从外部内存加载数据,配合TSP(张量流处理)架构实现多单元无缝连接,不仅规避了GPU集群的瓶颈问题,更号称在自然语言处理场景下速度是英伟达GPU的10倍,能耗却更低。这种能力对英伟达的AI工厂生态是重要补强,正如当年收购的迈络思,如今已成长为年营收约200亿美元的核心网络业务,为其开辟新增长曲线。

其三则涉及监管与人脉考量。白宫AI主管大卫·萨克斯的好友查马斯,以及小特朗普均为Groq的投资人,这场收购或隐含着英伟达讨好监管层、缓解政策压力的深层意图。

无论解读如何,一个明确的趋势是:AI算力行业正进入加速整合期,能对英伟达构成威胁的潜在挑战者持续减少。今年下半年以来,Meta收购了Rivos,Marvell将Celestial AI纳入麾下,英特尔虽一度竞购Groq,最终转向SambaNova,目前仅剩Cerebras仍计划推进上市。这一系列并购背后,绝非单纯的防御行为,而是整个算力生态在推理时代到来前的系统性扩张与重构。

谷歌TPU的崛起是这场重构的核心变量,它彻底改变了AI竞争的底层逻辑——从单一模型比拼转向基础设施能力的全栈对抗。谷歌最新的第七代TPU(Ironwood)算力较前代提升10倍,能效大幅优化,成本仅为同等英伟达GPU的1/10至1/2,已吸引Meta洽谈2027年大规模采购,Anthropic更是达成100万片TPU的合作协议。而乔纳森·罗斯曾是谷歌第一代TPU核心元素的设计者,2016年离职时带走了10人核心团队中的7人,正是这支团队为Groq打造了挑战行业巨头的LPU技术,如今重回英伟达麾下,无疑是对谷歌TPU生态的精准反击。

LPU的核心竞争力源于SRAM的创新应用,这与当前AI存储的“超级周期”趋势高度契合。随着AI推理场景爆发,存力已从幕后成本项升级为战略性物资,行业正形成HBM“求带宽”与SRAM“求近距”两条技术路径。有“HBM之父”之称的金正浩教授公开的路线图显示,HBM5阶段嵌入SRAM缓存将成为行业标准,英伟达收购Groq,正是提前布局这一技术方向,验证SRAM与HBM融合的可行性。相较于HBM扩产的重资产冒险与封装技术依赖,SRAM在代工、封装环节更具灵活性,这也成为英伟达对冲存储成本压力的重要筹码。

这场收购更折射出英伟达对推理时代“token经济学”的深刻洞察。在智能体等场景中,低延迟比峰值吞吐量更重要,Jonathan Ross曾提出“每100毫秒加速带来8%转化率提升”的观点,恰是对这种“多巴胺经济学”的生动诠释。短期内,LPU能在差异化场景中创造更高token价值;长期来看,英伟达可将SRAM与TSP架构技术内化,进一步完善AI工厂的系统级解决方案,从软件、网络到机架电源的全链条布局中,新增降本增效的核心抓手。

值得注意的是,Groq团队的人才流动早已显现行业趋势。收购前,Groq首席架构师Dennis Abts已提前加盟英伟达,前战略总监Thomas Sohmers离职后创办Positron,押注低延迟推理赛道并兼顾ASIC与FPGA路线,另有多名工程师流向同样侧重SRAM架构的d-Matrix。这种人才分散与聚合,本质是推理时代技术路径分化的缩影。而英伟达今年以来的并购动作频频,从网络技术企业Enfabrica、芯片设计软件商新思科技,到通信巨头诺基亚,均围绕算力生态上下游补全短板。

当前英伟达账上躺着数百亿美元现金,在AI存储超级周期即将于2026年全面开启的背景下,其持续收购、吸纳挑战者为“队友”的步伐大概率不会停歇。但行业格局已难回垄断时代,谷歌TPU凭借“芯片+模型+云”全栈能力撕开缺口,三星加码ASIC代工与自研GPU,供应链各环节都在试图摆脱英伟达的统治。

大洋彼岸,中国AI芯片企业仍深陷碎片化竞争,面对英伟达通过并购不断强化的技术壁垒与生态护城河,如何在SRAM、HBM等关键技术领域实现突破,如何构建差异化的应用场景与生态联盟,成为摆在行业面前的核心命题。AI算力的“三国杀”已然白热化,这场围绕人才、技术与生态的博弈,将定义下一代人工智能的产业边界。

作者:恒达娱乐




现在致电 5243865 OR 查看更多联系方式 →

COPYRIGHT 恒达娱乐 版权所有