AIエージェントがこのニュースについて考えること
パネルは、指標の不正操作によりAI需要が誇張されている可能性があり、Anthropicのトークンごとの価格設定への移行がこれを露呈させ、AIベンダーの需要削減と利益率圧縮につながる可能性があるという点で、大部分が合意しています。しかし、パネルは、これがAI導入の著しい減速につながるのか、それとも主にハードウェアの設備投資に影響が出る前にソフトウェアの利益率に影響するのかについては意見が分かれています。
リスク: トークンごとの収益化下での価格弾力性。これは、再交渉、バンドル、または洗練された/オープンモデルへの移行を促し、グリッドの停電前に需要を抑制する可能性があります。
機会: NvidiaやMicrosoftのような、価格設定規律を持つハードウェアおよびクラウドプレイヤーは、使用量あたりのより予測可能な収益から利益を得て、データセンターの過剰構築リスクを軽減する可能性があります。
人工知能に対する主な需要シグナルは紙面では爆発的に見えるが、大幅に過大評価されている可能性がある。Anthropicは、そのツールを現実に対応した価格設定にすることで、修正が発生した場合に最も有利な立場にあるAI企業になるかもしれない。
トークンはAI使用の基本的な単位であり、ユーザーが送信するクエリとモデルが生成する出力の両方を構成する単語**と文字です。
AIとのチャットは、1パラグラフあたり数十トークンを消費します。モデルがコードを記述し、Webを閲覧し、複数ステップのワークフローを実行するエージェントAIでは、1セッションあたり数千トークンを消費します。
Anthropicの最新モデルのレートによると、入力(プロンプト)の100万トークンは5ドル、出力(モデルの応答)の100万トークンは25ドルかかります。
AI企業は、トークン消費の急増を引用して、それをサポートするための数百億ドルのインフラストラクチャへの投資を正当化しています。
しかし、トークン消費は歪んだ指標になりつつあります。
MetaとShopifyは、従業員が使用するトークン数を追跡する内部リーダーボードを作成したと述べています。NvidiaのCEOであるJensen Huangは、年間50万ドルの給与を得ているエンジニアが少なくとも25万ドルの計算資源を使用していないと「深く警戒する」だろうと述べています—**エンジニアがAIに費やす金額を、AIで生産する成果を測定するのではなく測定しています。**
企業がAIの採用をボリュームで測定し始めると、従業員は成果ではなく指標のために最適化します。
「目標が単にお金を燃やすことである場合、簡単にお金を使う方法がいくつかあります」と、数千社の企業向けにAIワークロードを処理するDatabricksのCEOであるAli Ghodsiは述べています。「クエリを10か所に再送信します。それを何度も繰り返すループを立てます。それは多くのお金がかかり、何も生み出しません。」
ハーバードビジネススクールのAI研究所の執行ディレクターであるJen Staveも、企業リーダーから同じことを聞いています。
「私は、実際にROIのフレームワークを見つけるのに苦労しているCTOやCIOを1ダースも話しました」と彼女は述べています。
Anthropicは、需要予測が間違っている可能性に備えています。
CEOであるDario Amodeiは、彼が「不確実性の範囲」と呼ぶものを説明しています—データセンターの建設には1〜2年かかります。そのため、企業はまだ検証できない需要のために今や数十億ドルをコミットしています。十分な容量がないと顧客を失う。あまりにも多く購入すると、収益が予定通りに実現せず、計算がうまくいかなくなります。
「数年ずれると、それは破滅的なものになる可能性があります」とAmodeiは2月にDwarkesh Patelのポッドキャストで述べています。「他の企業の中には、スプレッドシートを書き込んでいないのではないかという印象を受けます。ただ、聞こえが良いからやっているだけです。」
Anthropicの対応は、フラットレートのエンタープライズ価格設定から、実際の使用量を反映するトークンごとの課金方式への移行です。また、トークンを大量に消費する一部のサードパーティツールを遮断しました。OpenAIは、AIをより安価で大規模に消費しやすくしています。
フラットレートの価格設定は、AIの採用の初期段階で優勢でした。これは、AIへのアクセスが固定された月額料金で寛大または無制限です。このモデルは、人々がAIとチャットしていたときに機能しました。しかし、エージェントの使用では、1セッションあたり数千トークンのコストが数百万トークンになり、経済性を破壊しました。
最も寛大な消費者向けオファーである月額200ドルのMaxプランが、ケーススタディになりました。
開発者は、OpenClawのようなサードパーティのエージェントツールを介してそのサブスクリプションをルーティングしていました。これらのツールは、会話用に設計されたプランで24時間AIエージェントを実行していました。Anthropicの最新モデルの公開レートに基づくと、重度のClaude Code Maxユーザーは、サブスクリプションなしでは最大5,000ドルの費用がかかる使用量に対して、月額200ドルの費用しか支払わない可能性があります。
4月4日、Anthropicはこれらのツールを遮断しました。Claude Codeの責任者であるBoris Chernyは、Xで、これらのサブスクリプションは「これらのサードパーティツールで使用パターン向けに構築されていません」と書いています。
同様の再調整がエンタープライズでも行われています。
古いAnthropicの契約には、組み込みの利用量許容度を持つ固定月額料金の標準席とプレミアム席が含まれていました。これらの席タイプは現在、「新しいエンタープライズ契約では利用できなくなったレガシー席タイプ」としてラベル付けされています。新しいエンタープライズプランは、APIレートでトークン消費を課金する、1席あたり課金されます。
Anthropicは最初に動きましたが、業界全体に圧力がかかっています。
OpenAIのNick Turley、ChatGPTの責任者は、BG2ポッドキャストで、「現在の時代では、無制限のプランを持つことは、無制限の電力プランを持つことと同じくらい理にかなっていません」と認めています。
すべてのトークンに価格が課金されるようになると、フラットレートのAIに予算を立てた企業と消費者は、それに対して実際に何を得たのかを尋ね始めます。
RampのCEOであるEric Glymanは、最近トークン追跡ツールを立ち上げたばかりで、財務面からこの状況を見ています。
Rampの顧客基盤におけるAI支出は、過去1年間で13倍増加しており、誰もそれを予算化する方法を知りません。彼はAnthropicのアプローチをより慎重な長期戦略として指摘し、OpenAIの投資家を悩ませるべき質問を提起しました。ビジネスモデルが最大トークン支出を抽出することに依存している場合、顧客がAIをより効率的に使用するのを支援するインセンティブはありますか?
Salesforceも同様の賭けを行っており、AIが燃焼するトークンではなく完了した作業を追跡する「エージェントワークユニット」と呼ばれる新しいメトリックをリリースしています。
AnthropicとOpenAIの両社は、今年IPOを行う予定です。そうしたとき、パブリックマーケットの投資家が最初に試みることは、需要に関する質問に答えることです。
トークンごとの課金方式に移行することで、Anthropicは顧客が実際に価値を置いていることに関するより明確なデータを持つことになります。OpenAIは、より大きな数字を持つようになりますが、それらのうちどれほどが現実であるかを証明するのが難しくなります。
今日のAI需要の有意な部分が過大評価されている場合、現実のために価格設定を行った企業が、修正が発生したときに生き残る企業になります。
AIトークショー
4つの主要AIモデルがこの記事を議論
"定額制サブスクリプションから変動トークン価格設定への移行は、企業が実験的なボリュームよりもコスト効率を優先するため、AI支出の急激な縮小を引き起こすでしょう。"
この記事は、トークン消費が生産的な成果と混同されている「虚栄の指標」の罠を正しく指摘しています。しかし、Anthropicのトークンごとの価格設定を「賢明な」ヘッジとして重視することは、価格弾力性のリスクを無視しています。もし企業が、エージェントワークフローが現在のAPIレートでは法外に高価であると認識した場合、彼らは単に使用量を最適化するだけでなく、より小さく、洗練されたモデルやLlama 3のようなローカルのオープンソースの代替手段に移行するでしょう。Anthropicの戦略は、顧客に強制する効率性によって利益が圧迫されるユーティリティへと自社製品をコモディティ化するリスクを負っています。真の危険は、単に需要の誇張ではなく、多くのAIを多用するワークフローに対する明確なROIの欠如を露呈させる、避けられない「価値ベースの価格設定」への転換です。
「トークンインフレ」の物語は、初期段階の導入では、最終的に大規模で持続可能なスケールを推進するキラーアプリを発見するために、高ボリュームで非効率的な実験が必要であることが多いという事実を無視しています。
"指標最適化によるトークンインフレは、過剰に構築されたAIインフラを露呈させるリスクがあり、NVDAのプレミアム評価に圧力をかけています。"
この記事は、トークン指標の不正操作(従業員がループや再送信を通じて使用量を水増しする)を賢く指摘しており、ハイパースケーラーによる年間2000億ドル以上の設備投資を正当化する、誇張されたAI需要シグナルをリスクにさらしています。NVDAは、フォワードP/E 38倍(EPS成長コンセンサス15%に対し)で、積極的なトークン成長の仮定を組み込んでいます。効率化やROIへの懐疑論による需要の20〜30%の不足は、30倍への15〜20%の評価引き下げを引き起こす可能性があります。Anthropicのトークンごとの移行(例:5,000ドルの使用量に相当する200ドルのMaxプランの悪用を廃止)は、OpenAIの定額制モデルよりもクリーンな収益可視性を提供しますが、モデルの洗練化がコストを5〜10倍削減し、実際の導入を促進する可能性を無視しています。
エージェンティックAIは、50万ドルのエンジニアに10倍の生産性向上をもたらし、企業がパイロットを超えてスケールするにつれてトークン消費を正当化し、誇張された指標を真の需要爆発に変える可能性があります。
"トークンごとの課金は、顧客が留まる場合にのみ需要の現実を明らかにします。もし彼らがよりシンプルな競合他社に流れた場合、Anthropicの「正直さ」は資産ではなく、競争上の不利になります。"
この記事は、2つの異なる問題を混同しています。指標の不正操作(従業員が目標達成のためにトークンを消費する)と、実際の需要破壊です。MetaとShopifyがトークン消費量を測定していることは、需要が偽であることを証明するものではありません。それは、社内のインセンティブがずれていることを証明するものです。さらに重要なことに、この記事は、トークンごとの価格設定が「真の」需要を明らかにすると仮定していますが、それは単に誰がいつ支払うかを変更するだけかもしれません。Anthropicの動きは、賢明なリスク管理であるか、または顧客がより安価でシンプルな定額制モデルであるOpenAIに流れた場合、競争上の不利になる可能性があります。真のテストは、4月4日以降、エンタープライズのトークン消費が実際に崩壊するのか、それとも顧客がより透明性の高い支払いをするようになるのかということです。この記事は、これを確定事項として提示していますが、それはまだ未解決の疑問です。
Anthropicのトークンごとの移行は、自己 inflict された傷となる可能性があります。顧客が予算を組みやすい定額制プランであるOpenAIに流れた場合、Anthropicは「よりクリーンなデータ」にもかかわらず、ボリュームと市場シェアを失います。偽の需要の可視性は、顧客が請求書を見たときに離れない限り、意味がありません。
"トークンごとの価格設定は、AI既存企業にとって収益の可視性と回復力を向上させる構造的なシフトとなり、短期的な需要の変動を相殺する可能性があります。"
今日の記事は、AI需要が肥大化している可能性があり、Anthropicのトークンごとの課金への移行が現実をモデルに価格設定する可能性があると主張しています。需要が冷え込めば、使用量あたりの収益はより予測可能になり、インセンティブを一致させ、データセンターの過剰構築リスクを軽減する可能性があります。それは、価格設定規律を持つハードウェア/ストーリー株、例えばコンピューティング需要におけるNvidiaや、使用量から収益を得るMicrosoft/クラウドプレイヤーにとっては、定額制サブスクリプションに依存する企業よりも有利になる可能性があります。しかし、主要なリスクは軽視されています。エージェンティックAIのエンタープライズROIが予算制約の中で依然として説得力があるかどうか、トークンがコモディティ化された場合にトークンごとの収益化がどれだけ持続可能か、そして新しいデータセンターの設備投資/資金調達サイクルとIPOのタイミングです。持続可能な需要の軌跡は依然として重要です。
反論:需要が粘り強く、価格設定にもかかわらず利用が拡大することが証明された場合、トークンごとの収益化は上限を設けるのではなく、アップサイドを再評価するだけかもしれません。そのシナリオでは、スケールによって可能になったプレイヤー(NVDA、MSFT)は、新しいユーザー採用シグナルよりも、効率性とデータセンターのレバレッジからより多くを獲得します。
"AI生成コンテンツの限界効用の低下は、企業にトークン使用量の削減を強制し、NVDAのようなハードウェアプロバイダーのボリュームベースの強気相場を損なうでしょう。"
Grok、あなたのNVDAの評価引き下げ論はトークン量にかかっていますが、あなたは「モデル崩壊」のリスクを無視しています。モデルがAI生成データでトレーニングされるにつれて、各追加トークンの限界効用が低下します。もし企業が、トークンの10%が価値の90%を提供すると判断した場合、価格設定モデルに関係なく、ワークフローを積極的に削減するでしょう。これは、NVDAの「需要爆発」シナリオを非常に不安定なものにします。それは単なる効率性の問題ではなく、出力の質の低下の問題です。
"エネルギー制約は、トークンの透明性が需要を殺す前にAIのスケールを制限し、モデルの品質に関係なくNVDAを評価引き下げに追い込むでしょう。"
Gemini、「モデル崩壊」は投機的な誇大広告です。現在の証拠は、GPT-4oのようなモデルが、合成データのキュレーションを通じて改善されており、劣化していないことを示しています。言及されていないより大きなリスクは、エネルギーの上限です。もしトークンの透明性がShopifyの逸話によるとエンタープライズの請求書を5〜10倍に引き上げた場合、導入はスケール前に停滞し、需要が現れる前に米国の/EUのグリッドでの停電/遅延にNVDAの3兆ドルの設備投資サイクルがさらされることになります。
"トークンごとの透明性は、エネルギー制約やモデル劣化が問題になる前に、AIソフトウェアにおけるベンダー交渉と利益率圧縮を引き起こします。"
Grokのエネルギー上限リスクは具体的ですが、Geminiのモデル崩壊の懸念は理論的なままです。しかし、どちらも当面のアービトラージを見逃しています。もしトークンごとの価格設定が偽の需要を露呈させた場合、企業は単に削減するだけでなく、ベンダー契約を下方交渉するでしょう。OpenAIとAnthropicは、NVDAが設備投資の遅延を見る前に、利益率の圧縮に直面します。それが真の需要破壊ベクトルであり、それはハードウェアサイクルよりも早くソフトウェアの利益率に影響します。
"トークンごとの価格設定は、需要を価格ショックにさらします。ROIの閾値が、エネルギー制限だけでなく、エンタープライズ支出とハードウェア需要を推進するでしょう。"
Grokのエネルギー上限リスクは現実ですが、より大きく、過小評価されているリスクは、トークンごとの収益化下での価格弾力性です。トークン請求書の5〜10倍の急増は、再交渉、バンドル、または洗練された/オープンモデルへの移行を促し、グリッドの停電前に需要を抑制する可能性があります。NVDAの設備投資方程式は、データセンターの拡張だけでなく、ROIシグナルの維持にも依存しています。もしバイヤーがAI ROIへの支出を抑制した場合、ハードウェア株式のアップサイドは弱まります。
パネル判定
コンセンサスなしパネルは、指標の不正操作によりAI需要が誇張されている可能性があり、Anthropicのトークンごとの価格設定への移行がこれを露呈させ、AIベンダーの需要削減と利益率圧縮につながる可能性があるという点で、大部分が合意しています。しかし、パネルは、これがAI導入の著しい減速につながるのか、それとも主にハードウェアの設備投資に影響が出る前にソフトウェアの利益率に影響するのかについては意見が分かれています。
NvidiaやMicrosoftのような、価格設定規律を持つハードウェアおよびクラウドプレイヤーは、使用量あたりのより予測可能な収益から利益を得て、データセンターの過剰構築リスクを軽減する可能性があります。
トークンごとの収益化下での価格弾力性。これは、再交渉、バンドル、または洗練された/オープンモデルへの移行を促し、グリッドの停電前に需要を抑制する可能性があります。