颠覆记忆体需求!TurboQuant引爆Google版DeepSeek时刻

Google 週二 (23 日) 盘后发布新一代压缩演算法TurboQuant,可能颠覆记忆体需求结构,成为引爆週三 (25 日) 记忆体族群卖压的关键因素。

Google Research 週二盘后发布的新技术TurboQuant。该演算法针对大型语言模型 (LLM) 推论过程中的记忆体瓶颈进行最佳化,可将记忆体使用量降低约 6 倍,并在相同 GPU 配置下提升最高 8 倍运算速度,同时维持零準确度损失。


TurboQuant 主要针对 GPU 中的KV cache进行压缩。该区块用于储存模型推论过程中的暂存资料,随着 AI 上下文长度增加,其记忆体需求急速膨胀,已成为主要瓶颈。

TurboQuant 可以把 KV cache 从 32 位元压到只剩 3 位元 (图:google research)

Google 表示,TurboQuant 透过新型量化方式,移除传统压缩所需的额外参数,提升效率并降低记忆体负担。在 Gemma 与 Mistral 等模型测试中,即使在高压缩情境下,仍能维持完整效能。

此消息迅速引发市场关注,Cloudflare 执行长 Matthew Prince 更将其形容为Google 的 DeepSeek 时刻,意指 AI 技术效率出现重大突破。

华尔街分析指出,若该技术成功落地,意味 AI 模型在相同运算需求下,所需记忆体资源将大幅下降,可能削弱原本因 AI 热潮而大幅提升的 DRAM 与 NAND Flash 需求。

此前,记忆体价格曾因供给紧张与 AI 应用爆发而大幅上涨,成为推升相关个股的重要动能。

受此消息冲击,资金急速撤出记忆体族群,美光 (MU-US) 週三跌幅 3.40%,收 382.09 美元。威腾电子 (WDC-US) 收黑 1.63%,收 296.14 美元。SanDisk (SNDK-US) 跌幅超 3%,收 677.86 美元。希捷科技 (STX-US) 下滑 2.59%,收 413.22 美元。

高盛科技专家 Peter Callahan 指出,市场虽未出现极大恐慌,但投资人对记忆体股近期走势进行合理性检验。其中,美光过去 5 个交易日相对费城半导体指数 (SOX-US) 落后约 20%,创 2011 年以来最大幅度的短期相对落后,即便公司甫公布强劲财报,股价仍持续承压。

不过,市场也关注该技术仍处于研究阶段,尚未在大规模商业环境验证,且仅适用于推论过程的暂存记忆体,并不涉及模型权重本身。

法人指出,未来若出现更多类似技术,记忆体需求成长预期可能下修,短期内族群波动恐持续扩大。

发布于 2026-03-26 12:21
收藏
1
上一篇:年薪30万美元猎才!量化巨头锁定顶尖高中生 全球智力军备赛开打 下一篇:美伊要和谈了?华尔街大咖齐泼冷水:市场过于自满