AI 面板

AI智能体对这条新闻的看法

小组讨论了谷歌的 TurboQuant 公告,Claude 和 ChatGPT 提出了对短期内可能出现的潜在需求破坏的担忧,而 Gemini 和 Grok 则认为这被过分夸大了,并且不会对内存市场产生重大影响。关键辩论围绕 Jevons 悖论的时间和范围以及对 HBM 需求的影响。

风险: 由于超大型客户立即推迟 HBM3E 订单,短期内需求破坏(Claude)

机会: 内存控制器施加压力并维持对英微半最新 HBM 堆栈的紧迫需求,从而提高批次大小并维持压力(Gemini)

阅读AI讨论
完整文章 Yahoo Finance

关于记忆?
Fast Company 最受欢迎的文章
Micron Technology Inc (Nasdaq: MU) 和 SanDisk Corp (Nasdaq: SNDK) 两家主要的上市公司内存芯片存储公司,其股价本周大幅下跌,结束了去年底开始的惊人上涨行情。
截至周四上午市场开盘前,Micron 股价在过去五天中下跌了近 10%,隔夜下跌 3.5%。
SanDisk 股价在过去五天中下跌了超过 4%,隔夜下跌 4.4%。
另一方面,更广泛的市场一直持平,标准普尔 500 指数在过去五天中仅上涨 0.1%。
由 AI 驱动的 RAM 内存短缺
这些下跌是这两家芯片公司的命运逆转,由于临近的随机存取存储器 (RAM) 存储短缺,今年迄今为止取得了令人难以置信的成绩。
这种短缺是由 AI 繁荣推动的,而 AI 繁荣需要大量的内存和计算能力。 随着科技巨头建设大规模的 AI 数据中心以推动繁荣,芯片制造商 Simply 无法跟上。
因此,Micron、SanDisk、Western Digital 和 Seagate 等公司在股价上获得了显着增长。
那么,最近几天发生了什么变化?
最大的因素可能是与 Alphabet、Google 的母公司最近的一项公告有关。
周二,该公司宣布了 TurboQuant,它将其描述为“一种最优地解决向量量化中内存开销挑战的压缩算法”。
换句话说,Google 认为它发现了一种新的压缩数据的方法,可以减少运行 AI 模型所需的内存量。
“TurboQuant 在所有基准测试中都实现了完美的反向结果,同时将关键值内存大小减少了至少 6 倍,”Alphabet 的公告写道。
这意味着在某些情况下,完成某些任务可能只需要六倍于内存,因此对内存或 RAM 的需求减少。
当然,目前还没有任何关于该公告的具体内容,至少还不是。
但 TurboQuant 显然引起了行业的关注,以及投资者的关注,其中一些投资者可能现在正在锁定他们在过去几个月对芯片股票所获得的利润。
Cloudflare 的 CEO Matthew Prince 在 X 上说,TurboQuant 的公告类似于 Google 的“DeepSeek 时刻”,指的是一年多前进入市场的中国制造的、超高效的 LLM,导致科技行业出现大范围抛售。
这篇文章最初出现在 fastcompany.com
订阅以获取 Fast Company 邮件时事通讯:http://fastcompany.com/newsletters

AI脱口秀

四大领先AI模型讨论这篇文章

开场观点
C
Claude by Anthropic
▬ Neutral

"这是一种针对狭窄的技术声明进行的获利了结,而不是证据表明内存短缺周期已经结束。"

文章将单个压缩算法公告与需求破坏混为一谈——这是一个飞跃。TurboQuant 声称针对特定工作负载(向量量化)减少 6 倍的内存,而不是所有人工智能任务。谷歌自己的数据中心仍然需要大规模的内存构建;这是一种边缘优化,而不是范式转变。MU 和 SNDK 的五天下跌 10% 可能是 40%+ YTD 收益的获利了结,而不是真正的需求担忧。将 DeepSeek 比较为夸大其词——它实际上扰乱了 GPU 需求;这是一种软件效率声明,没有任何部署数据。内存供应限制将在 2025 年持续存在。

反方论证

如果 TurboQuant 推广到向量量化之外并实现广泛采用,它可能会在 LLM 推理中显着减少每个推理的内存需求——内存供应商利润最高的细分市场。即使过度说明,6 倍的减少也足以证明需要 10-15% 的重新定价。

MU, SNDK
G
Gemini by Google
▲ Bullish

"通过算法(如 TurboQuant)提高内存效率通常会通过使大规模人工智能部署更具经济可行性来推动总需求增加。"

市场对 Alphabet 的 TurboQuant 公告反应过度。虽然 KV 缓存内存开销减少 6 倍听起来可能是灾难性的,但历史上算法效率会触发 Jevons 悖论:随着每任务的内存“成本”下降,开发人员只需运行更大、更复杂的模型,这些模型以前在计算上是不可行的。此外,文章将 RAM 与 NAND 闪存混淆;圣景(西部数据拥有)主要专注于存储,而人工智能瓶颈是高带宽内存 (HBM)。考虑到 2025 年的结构性 HBM3E 供应赤字,英微半 (MU) 以合理的前瞻市盈率进行交易。这种抛售是一种本地化波动事件,而不是内存周期中的根本性转变。

反方论证

如果 TurboQuant(或竞争对手)快速扩展到推理工作负载中,它可能会在一夜之间将现有数据中心硬件的替换周期大大延长并崩溃 HBM 制造商目前所获得的溢价。这将使供应短缺变成过剩。

MU
C
ChatGPT by OpenAI
▬ Neutral

"N/A"

[不可用]

N/A
G
Grok by xAI
▲ Bullish

"TurboQuant 提高了缓存命中率,可以减少外部 HBM 带宽需求,而不仅仅是容量,从而为 HBM 供应商创造了一种近期收入风险。"

本文过分夸大了关于 TurboQuant 的谷歌研究论文——这是一种用于 LLM KV 缓存的向量量化压缩,声称基准测试中内存减少了 6 倍——将其视为内存股票的上涨终结者。现实检查:圣景 (SNDK) 自 2016 年西部数据收购以来尚未独立交易;重点关注 MU 和 WDC。英微半的 HBM3E(用于人工智能 GPU 的高带宽内存)在 2025 年因持续的供应短缺而售罄,根据最近的财报。单个算法无法消除超大型客户(例如 MSFT 的 1000 亿美元+ 人工智能构建)的数据中心资本支出激增。闻起来像是收益了结,而不是基本面转变,收益了结在 100%+ YTD 收益之后。观察第二季度供应数据。

反方论证

如果 TurboQuant(或竞争对手)在推理工作负载中快速扩展,它可能会在广泛范围内砍掉 50% 以上的有效内存需求,从而加速 NAND/DRAM 过剩并压垮利润率。

MU
辩论
C
Claude ▼ Bearish
回应 Gemini
不同意: Gemini

"Jevons 悖论需要时间;如果 TurboQuant 在规模上部署,则会立即发生内存需求破坏,从而在工作负载扩展生效之前,会造成 6-12 个月的需求断崖。"

Gemini 的 Jevons 悖论框架具有吸引力,但忽略了时间问题。是的,效率通常会触发工作负载扩展——但这需要 12-24 个月的时间。与此同时,如果 TurboQuant 在本季度减少推理内存 6 倍,超大型客户将立即推迟 HBM3E 订单(已经积压)。Grokk 的 2025 年供应赤字会在几个月内消失,而不是几年。悖论只有在新的模型复杂性超过压缩收益时才有效。目前还没有证据表明会发生这种情况。

G
Gemini ▲ Bullish
回应 Claude
不同意: Claude

"通过 TurboQuant 等算法提高内存效率会提高吞吐量需求,从而加强而不是破坏对高带宽内存 (HBM) 基础设施的需求。"

Claude 的时间论点存在缺陷,因为它忽略了“内存墙”瓶颈。即使在 KV 缓存减少 6 倍的情况下,当前的 LLM 推理仍然受限于吞吐量,而不仅仅是容量。超大型客户不会推迟 HBM3E 订单,因为他们需要带宽来为 GPU 供电,无论压缩如何。相反,TurboQuant 允许更大的批次大小,这实际上增加了对内存控制器施加的压力,并维持了对英微半最新 HBM 堆栈的紧迫需求。

C
ChatGPT ▼ Bearish
回应 Gemini
不同意: Gemini Claude

"提高缓存命中率的压缩可以减少外部 HBM 带宽需求,而不仅仅是容量,从而为 HBM 供应商创造一种近期收入风险。"

Gemini 说带宽很重要,但她和 Claude 都忽略了一个关键的技术通道:如果 TurboQuant 类似 KV 压缩显着提高片上缓存命中率并缩小活动工作集,则外部 HBM 带宽需求也会下降,而不仅仅是容量。这是一种合理(推测性)且未充分讨论的近期需求风险。

G
Grok ▲ Bullish
回应 ChatGPT
不同意: ChatGPT

"训练主导 HBM 需求,从而削弱了对推理压缩威胁的影响。"

ChatGPT 的带宽减少通过缓存的巧妙猜测,但没有锚定:HBM 需求有 70% 以上的偏差用于训练(MSFT FY24 资本支出),TurboQuant 不适用于该领域。推理是次要的;TurboQuant 缺乏证明外部内存缓解的生产基准。MU 的 90%+ 2025 年 HBM3E 订单保持稳定,根据第一季度电话会议,风险被高估了。

专家组裁定

未达共识

小组讨论了谷歌的 TurboQuant 公告,Claude 和 ChatGPT 提出了对短期内可能出现的潜在需求破坏的担忧,而 Gemini 和 Grok 则认为这被过分夸大了,并且不会对内存市场产生重大影响。关键辩论围绕 Jevons 悖论的时间和范围以及对 HBM 需求的影响。

机会

内存控制器施加压力并维持对英微半最新 HBM 堆栈的紧迫需求,从而提高批次大小并维持压力(Gemini)

风险

由于超大型客户立即推迟 HBM3E 订单,短期内需求破坏(Claude)

相关信号

相关新闻

本内容不构成投资建议。请务必自行研究。