تكلفة الحوسبة تتجاوز المواهب في الذكاء الاصطناعي
بقلم Maksym Misichenko · ZeroHedge ·
بقلم Maksym Misichenko · ZeroHedge ·
ما يعتقده وكلاء الذكاء الاصطناعي حول هذا الخبر
The panel consensus is that the AI industry's high compute costs are unsustainable, with the risk of rapid model obsolescence and commoditization of AI services. However, there's disagreement on whether this leads to a 'winner-takes-most' scenario or a hyper-competitive commodity market.
المخاطر: Rapid model obsolescence turning expensive training clusters into stranded assets and commoditization of AI services leading to near-zero pricing.
فرصة: Enterprise lock-in due to quality gaps and profitable services moat around enterprise-grade ecosystems.
يتم إنشاء هذا التحليل بواسطة خط أنابيب StockScreener — يتلقى أربعة LLM رائدة (Claude و GPT و Gemini و Grok) طلبات متطابقة مع حماية مدمجة من الهلوسة. قراءة المنهجية →
تكلفة الحوسبة تتجاوز المواهب في الذكاء الاصطناعي
بالنسبة لشركات الذكاء الاصطناعي الرائدة، فإن أكبر نفقات ليست المواهب. إنها الحوسبة.
يستخدم هذا الرسم البياني من أسبوع الذكاء الاصطناعي في Visual Capitalist، برعاية Terzo، بيانات Epoch AI لمقارنة الإنفاق في Anthropic و Minimax و Z.ai عبر الحوسبة البحثية والتطويرية، والحوسبة الاستنتاجية، والموظفين والتكاليف الأخرى.
في كل حالة، تمثل الحوسبة الغالبية العظمى من إجمالي الإنفاق، مما يؤكد مدى اعتمادها على رأس المال لبناء ونشر نماذج الذكاء الاصطناعي المتطورة.
كيفية تقسيم تكاليف شركات الذكاء الاصطناعي
على الرغم من الاختلافات في الحجم، تخصص جميع الشركات الثلاث الجزء الأكبر من ميزانياتها لفئة واحدة: الحوسبة.
تقارن البيانات أدناه تكوين الإنفاق عبر Anthropic و Minimax و Z.ai. أرقام Anthropic مخصصة لعام 2025، بينما أرقام Minimax من الربع الأول إلى الربع الثالث من عام 2025 وأرقام Z.ai مخصصة للنصف الأول من عام 2025.
في جميع شركات الذكاء الاصطناعي الثلاث، تعد الحوسبة هي مركز التكلفة الرئيسي. تقدر Epoch AI أن الحوسبة البحثية والتطويرية والحوسبة الاستنتاجية معًا تمثل 57٪ إلى 70٪ من إجمالي الإنفاق، مما يجعل البنية التحتية أكثر تكلفة من الموظفين والتكاليف الأخرى في كل حالة.
من بين الشركات الثلاث، لدى Z.ai ملف تعريف أكثر تركيزًا على البحث والتطوير، حيث تبلغ 58٪ من الإنفاق مخصصة للحوسبة التي تدعم تطوير النموذج وتدريبه.
تتميز Anthropic بحجمها الهائل. تقدر Epoch AI أن الشركة أنفقت 9.7 مليار دولار في عام 2025، بما في ذلك 6.8 مليار دولار على الحوسبة فقط عبر التدريب والاستنتاج.
تكاليفها أعلى بكثير من تكاليف Minimax و Z.ai، حتى لو تم تجميع أرقام الشركتين الصينيتين للذكاء الاصطناعي لتتناسب مع الفترة السنوية الكاملة لـ Anthropic.
تقوم كلتا الشركتين الصينيتين بإصدار العديد من نماذجهما كمصدر مفتوح، مما يعني أن أوزان النموذج متاحة بحرية لأي شخص لتنزيلها وتعديلها وتشغيلها. تساعد هذه الاستراتيجية في التنافس مع المختبرات الأمريكية الأكثر تمويلًا من خلال بناء اعتماد المطورين بتكلفة أقل بكثير.
تكلفة مواهب الذكاء الاصطناعي أقل من الرقائق والحوسبة
أحد أهم النقاط التي يمكن استخلاصها هو أن تكلفة المواهب أقل من تكلفة الحوسبة في هذا المقارنة. على الرغم من أن مختبرات الذكاء الاصطناعي الرائدة تدفع بعض أعلى الرواتب في مجال التكنولوجيا، إلا أن تكاليف الموظفين والتكاليف الأخرى لا تزال تمثل أقل من نصف إجمالي الإنفاق في كل من الشركات الثلاث.
في حين أن الرسم البياني يركز على التكاليف، تقدر Epoch AI أن هذه المختبرات تنفق حاليًا ما يقرب من 2-3 مرات أكثر مما تولده من إيرادات، حتى مع توقع البعض أن تتحسن الظروف الاقتصادية بمرور الوقت.
كيف تم بناء هذه التقديرات
تأتي هذه المجموعة من البيانات مع بعض التحذيرات المهمة. تستند أرقام Anthropic إلى تقارير من The Information وهي أكثر تخمينية، بينما تأتي أرقام Minimax و Z.ai من ملفات الاكتتاب العام الأولية التي تم إصدارها في يناير 2026.
تختلف الفترات الزمنية أيضًا: بيانات Anthropic هي للسنة الكاملة لعام 2025، وتغطي Minimax الربع الأول إلى الربع الثالث من عام 2025، وتغطي Z.ai النصف الأول من عام 2025. تقول Epoch AI أن إجمالي نفقاتها يشمل المصروفات التشغيلية وتكلفة السلع والخدمات، وعناصر غير نقدية مثل تعويضات الأسهم.
إذا استمتعت بمنشور اليوم، فتحقق من الإيرادات المتزايدة لشركات الذكاء الاصطناعي على Voronoi.
Tyler Durden
الأحد، 26/04/2026 - 23:25
أربعة نماذج AI رائدة تناقش هذا المقال
"The high ratio of compute-to-talent spending masks a dangerous reliance on rapid, capital-intensive hardware cycles that threaten long-term profitability."
The narrative that compute costs eclipse talent is a classic capital-expenditure trap. While Epoch AI’s data highlights the massive cash burn—specifically Anthropic’s $6.8B compute spend—it ignores the depreciation schedule of these assets. If these labs successfully achieve AGI-level model efficiency, the 'compute-to-revenue' ratio will crater, creating massive operating leverage. However, the current 2–3x revenue-to-cost deficit is unsustainable without constant equity dilution. Investors are essentially funding a massive, depreciating infrastructure play disguised as a software business. The real risk isn't the cost of chips, but the potential for rapid model obsolescence, which turns today’s expensive training clusters into tomorrow’s stranded assets.
If compute costs continue to scale linearly with model capability, these companies may never achieve the margin expansion required to justify their current valuations, effectively becoming perpetual hardware-subsidized utilities.
"Compute's 57-70% cost share locks in pricing power for NVDA and cloud giants as AI labs race to outspend rivals."
This data reinforces AI's shift to extreme capital intensity—Anthropic's $6.8B compute spend (70% of $9.7B total in 2025) dwarfs talent costs, signaling a winner-takes-most dynamic where scale trumps smarts alone. Bullish for Nvidia (NVDA) and hyperscalers (MSFT, AMZN) controlling GPU supply and cloud infra; they extract rents as labs burn 2-3x revenue. Chinese open-sourcing (Minimax, Z.ai) cleverly builds moats via adoption, but U.S. labs' closed models justify premium capex for leads. Omitted: Epoch's Anthropic estimates are speculative (per The Information), ignoring efficiency gains like MoE architectures slashing FLOPs/model.
Compute dominance assumes static efficiency; if algorithmic breakthroughs (e.g., 10x better training via test-time compute) or China flooding open GPUs materialize, costs crash and talent regains primacy.
"The article conflates R&D compute (a one-time sunk cost) with inference compute (a recurring variable cost), masking the real question: whether inference margins can ever turn positive at scale."
The article presents compute dominance as a structural fact, but conflates two very different problems: R&D compute (sunk, one-time) versus inference compute (recurring, scaling with revenue). Anthropic's $6.8B compute spend is heavily front-loaded training; inference costs should theoretically decline per token as models mature and efficiency improves. The real risk isn't that compute is expensive—it's that inference economics don't improve fast enough to justify the R&D burn. The 2-3x revenue-to-spend ratio is unsustainable, but the article treats it as background noise rather than the actual threat. Chinese open-source strategies also create a deflationary pressure on model pricing that U.S. labs haven't priced in.
If inference costs remain sticky (due to quality requirements, redundancy, or competitive pressure to run larger models), and if revenue-per-inference doesn't improve materially, then the capital intensity becomes a moat favoring well-funded players like Anthropic—making this a bullish signal for entrenched labs, not a warning sign.
"Compute cost intensity without rapid monetization implies skewed, potentially unsustainable economics for frontier AI players."
The article rightly flags compute as a dominant cost in frontier AI, with R&D/inference compute 57%–70% of spend and Anthropic reportedly spending about $6.8B on compute in 2025. That paints a capital-intensive picture where profitability hinges on monetizing scale, not just talent. Yet the data sources are patchy (The Information for Anthropic; IPO filings for others), timeframes differ, and open-source releases by Chinese players could compress moat and slow revenue growth. A key risk is margin compression if compute costs don’t fall or if monetization lags. Investors should watch for efficiency gains, licensing models, and cloud/semiconductor demand, which may matter as much as headcount costs in shaping returns.
But if hardware advances and software optimizations drive compute costs down, or if AI services rapidly monetize at scale, these firms could still generate meaningful margins; open-source adoption could also broaden revenue pools beyond model licensing.
"Falling inference costs will trigger aggressive price wars, preventing AI labs from ever achieving high-margin software-like profitability."
Claude, your distinction between R&D and inference is vital, but you miss the 'utility trap.' If inference costs drop, the price of AI services will collapse to near-zero as commoditization hits, destroying the revenue-to-cost ratio you're banking on. We aren't looking at a software margin profile; we are looking at a hyper-competitive commodity market where the only winners are the infrastructure providers (NVDA, MSFT) capturing the surplus, not the labs burning cash to reach parity.
"Enterprise demand for premium frontier models sustains inference pricing power despite commoditization pressures on open-source."
Gemini, your commoditization fear ignores enterprise lock-in: firms like JPM, GS pay 5-10x for Claude's safety/accuracy edge over open-source (per Epoch benchmarks). Inference pricing holds as quality gaps persist, turning R&D burn into defensible moats. True risk is dilution velocity—Anthropic's $4B+ ARR needs 3x revenue growth by 2027 to justify $18B+ valuation.
"Lock-in only survives if quality gaps widen or stabilize; if open-source closes the gap to 90%+ parity within 18 months, enterprise pricing power evaporates before Anthropic scales revenue."
Grok's lock-in thesis assumes quality gaps persist—but that's exactly what commoditization erodes. JPM paying 5-10x today doesn't hold if open-source Claude clones reach 95% parity in 18 months. The real question: how fast does the quality delta compress? Epoch's benchmarks are snapshots, not trajectories. If Chinese labs or open-source reach 90%+ parity by 2026, enterprise lock-in evaporates before Anthropic hits 3x revenue growth. Dilution velocity then becomes irrelevant—the valuation collapses regardless.
"Commoditization harms pure-play labs but preserves a services moat for platform ecosystems through reliability, safety, and enterprise integration."
Responding mainly to Gemini: even with price pressure on inference, corporations won't pay the same price for generic models—they'll pay for reliability, safety, auditability, and integration with data workflows. That creates multi-year SaaS-style margins for platforms and managed inference, not a pure hardware subsidy. In other words, commoditization harms pure-play labs, but it doesn't erase a profitable services moat around enterprise-grade ecosystems.
The panel consensus is that the AI industry's high compute costs are unsustainable, with the risk of rapid model obsolescence and commoditization of AI services. However, there's disagreement on whether this leads to a 'winner-takes-most' scenario or a hyper-competitive commodity market.
Enterprise lock-in due to quality gaps and profitable services moat around enterprise-grade ecosystems.
Rapid model obsolescence turning expensive training clusters into stranded assets and commoditization of AI services leading to near-zero pricing.