Rechenkosten sind mehr als Talent in KI
Von Maksym Misichenko · ZeroHedge ·
Von Maksym Misichenko · ZeroHedge ·
Was KI-Agenten über diese Nachricht denken
Der Konsens des Panels ist, dass die hohen Compute-Kosten der KI-Branche nicht nachhaltig sind, mit dem Risiko einer schnellen Modellobsoleszenz und Kommodifizierung von KI-Diensten. Es gibt jedoch Uneinigkeit darüber, ob dies zu einem 'Winner-takes-most'-Szenario oder einem hyperkompetitiven Rohstoffmarkt führt.
Risiko: Schnelle Modellobsoleszenz, die teure Trainingscluster in gestrandete Vermögenswerte verwandelt, und die Kommodifizierung von KI-Diensten, die zu nahezu Null-Preisen führt.
Chance: Unternehmensbindung aufgrund von Qualitätslücken und profitabler Dienstleistungsgraben um Enterprise-Grade-Ökosysteme.
Diese Analyse wird vom StockScreener-Pipeline generiert — vier führende LLM (Claude, GPT, Gemini, Grok) erhalten identische Prompts mit integrierten Anti-Halluzinations-Schutzvorrichtungen. Methodik lesen →
Compute Kosten Übersteigen Talent In AI
Für führende AI-Unternehmen ist die größte Ausgabe nicht Talent. Es ist Compute.
Dieses Diagramm aus Visual Capitalist’s AI Week, gesponsert von Terzo, verwendet Epoch AI Daten, um die Ausgaben bei Anthropic, Minimax und Z.ai über R&D Compute, Inference Compute und Personal sowie andere Kosten zu vergleichen.
In jedem Fall machen Compute die Mehrheit der Gesamtausgaben aus, was unterstreicht, wie kapitalintensiv es geworden ist, Frontier AI Modelle zu entwickeln und bereitzustellen.
Wie AI-Unternehmen ihre Kosten aufteilen
Trotz Unterschiede im Maßstab stellen alle drei Unternehmen den größten Teil ihrer Budgets einer einzigen Kategorie zu: Compute.
Die unten stehenden Daten vergleichen die Ausgabenzusammensetzung bei Anthropic, Minimax und Z.ai. Anthropics Zahlen sind für 2025, während Minimax’ Zahlen von Q1 bis Q3 2025 und Z.ais Zahlen für H1 2025 sind.
Bei allen drei AI-Unternehmen ist Compute das Hauptkostenmerkmal. Epoch AI schätzt, dass R&D Compute und Inference Compute zusammen 57 % bis 70 % der Gesamtausgaben ausmachen, was die Infrastruktur in jedem Fall teurer macht als Personal und andere Kosten.
Von den drei hat Z.ai das am stärksten forschungsorientierte Profil, mit 58 % der Ausgaben, die auf Compute für die Modellentwicklung und das Training entfallen.
Anthropic zeichnet sich durch schiere Größe aus. Epoch AI schätzt, dass das Unternehmen im Jahr 2025 9,7 Milliarden US-Dollar ausgegeben hat, davon 6,8 Milliarden US-Dollar allein für Compute für Training und Inference.
Seine Kosten sind deutlich höher als die von Minimax und Z.ai, selbst wenn die Zahlen der beiden chinesischen AI-Unternehmen annualisiert würden, um Anthropics Jahreszeitraum abzugleichen.
Beide chinesischen Unternehmen veröffentlichen viele ihrer Modelle als Open Source, was bedeutet, dass die Modellgewichte für jeden frei verfügbar sind, um sie herunterzuladen, zu modifizieren und auszuführen. Diese Strategie hilft ihnen, mit besser finanzierten US-Laboren zu konkurrieren, indem sie die Entwicklerakzeptanz zu einem Bruchteil der Kosten aufbauen.
AI Talent Kosten Weniger als Chips und Compute
Eine der deutlichsten Erkenntnisse ist, dass Talent in diesem Vergleich weniger kostet als Compute. Obwohl die Top-AI-Labore einige der höchsten Gehälter in der Tech-Branche zahlen, machen Personal und andere Kosten immer noch weniger als die Hälfte der Gesamtausgaben bei jedem der drei Unternehmen aus.
Während das Diagramm sich auf Kosten konzentriert, schätzt Epoch AI, dass diese Labore derzeit 2–3-mal mehr ausgeben als sie an Einnahmen generieren, selbst wenn einige erwarten, dass sich die Wirtschaft im Laufe der Zeit verbessern wird.
Wie diese Schätzungen erstellt wurden
Dieser Datensatz enthält einige wichtige Einschränkungen. Anthropics Zahlen basieren auf Berichten von The Information und sind spekulativer, während die Zahlen von Minimax und Z.ai aus IPO-Anträgen stammen, die im Januar 2026 veröffentlicht wurden.
Die Zeiträume unterscheiden sich ebenfalls: Anthropic-Daten sind für das gesamte Jahr 2025, Minimax deckt 2025 Q1–Q3 ab und Z.ai deckt 2025 H1 ab. Epoch AI sagt, dass seine Aufwendungssummen Betriebsausgaben, Waren- und Dienstleistungskosten sowie nicht zahlungswirksame Posten wie aktienbasierte Vergütung umfassen.
Wenn Ihnen der heutige Beitrag gefallen hat, schauen Sie sich The Soaring Revenues of AI Companies auf Voronoi an.
Tyler Durden
So, 26/04/2026 - 23:25
Vier führende AI-Modelle diskutieren diesen Artikel
"Das hohe Verhältnis von Compute- zu Talentausgaben verschleiert eine gefährliche Abhängigkeit von schnellen, kapitalintensiven Hardwarezyklen, die die langfristige Rentabilität gefährden."
Die Vorstellung, dass Compute-Kosten Talent übersteigen, ist eine klassische Investitionsfalle. Während die Daten von Epoch AI die massiven Cash-Burn-Raten – insbesondere die 6,8 Milliarden US-Dollar von Anthropic für Compute – hervorheben, ignorieren sie den Abschreibungsplan dieser Vermögenswerte. Wenn diese Labore erfolgreich eine AGI-Modelleffizienz erreichen, wird das Verhältnis von 'Compute zu Umsatz' drastisch sinken und eine massive operative Hebelwirkung erzeugen. Das aktuelle Defizit von 2–3x Umsatz zu Kosten ist jedoch ohne ständige Kapitalverwässerung nicht nachhaltig. Investoren finanzieren im Wesentlichen ein massives, abschreibungsbehaftetes Infrastrukturprojekt, das als Software-Geschäft getarnt ist. Das eigentliche Risiko sind nicht die Kosten für Chips, sondern das Potenzial für eine schnelle Modellobsoleszenz, die die teuren Trainingscluster von heute in die gestrandeten Vermögenswerte von morgen verwandelt.
Wenn die Compute-Kosten weiterhin linear mit der Modellkapazität steigen, können diese Unternehmen möglicherweise nie die Margenerweiterung erreichen, die erforderlich ist, um ihre aktuellen Bewertungen zu rechtfertigen, und werden effektiv zu permanenten Hardware-subventionierten Versorgungsunternehmen.
"Der Anteil von Compute an den Kosten von 57–70 % sichert die Preissetzungsmacht für NVDA und Cloud-Giganten, da KI-Labore darum wetteifern, ihre Konkurrenten auszugeben."
Diese Daten bestätigen den Wandel der KI hin zu extremer Kapitalintensität – die 6,8 Milliarden US-Dollar von Anthropic für Compute (70 % der 9,7 Milliarden US-Dollar im Jahr 2025) übersteigen die Talentkosten bei weitem und signalisieren eine 'Winner-takes-most'-Dynamik, bei der Skalierung intelligenter ist als Intelligenz allein. Bullisch für Nvidia (NVDA) und Hyperscaler (MSFT, AMZN), die das GPU-Angebot und die Cloud-Infrastruktur kontrollieren; sie ernten Mieten, während die Labore das 2- bis 3-fache ihres Umsatzes verbrennen. Chinesisches Open-Sourcing (Minimax, Z.ai) baut clever Gräben über die Akzeptanz auf, aber die geschlossenen Modelle der US-Labore rechtfertigen höhere Kapitalausgaben für Führungspositionen. Ausgelassen: Die Schätzungen von Epoch für Anthropic sind spekulativ (laut The Information) und ignorieren Effizienzgewinne wie MoE-Architekturen, die FLOPs/Modell reduzieren.
Compute-Dominanz setzt statische Effizienz voraus; wenn algorithmische Durchbrüche (z. B. 10-fach besseres Training über Testzeit-Compute) oder China Open-Source-GPUs überflutet, brechen die Kosten ein und Talent gewinnt die Oberhand.
"Der Artikel verwechselt F&E Compute (einmalige versunkene Kosten) mit Inference Compute (wiederkehrende variable Kosten) und verschleiert die eigentliche Frage: ob die Inference-Margen jemals im großen Maßstab positiv werden können."
Der Artikel stellt die Compute-Dominanz als strukturelle Tatsache dar, verwechselt aber zwei sehr unterschiedliche Probleme: F&E Compute (versunken, einmalig) versus Inference Compute (wiederkehrend, skaliert mit dem Umsatz). Die 6,8 Milliarden US-Dollar von Anthropic für Compute sind stark in das anfängliche Training investiert; die Inference-Kosten sollten theoretisch pro Token sinken, wenn die Modelle reifen und die Effizienz steigt. Das eigentliche Risiko besteht nicht darin, dass Compute teuer ist – sondern dass sich die Inference-Wirtschaftlichkeit nicht schnell genug verbessert, um die F&E-Verbrennung zu rechtfertigen. Das Verhältnis von 2–3x Umsatz zu Ausgaben ist nicht nachhaltig, aber der Artikel behandelt es als Hintergrundgeräusch und nicht als die eigentliche Bedrohung. Die Open-Source-Strategien der chinesischen Unternehmen üben auch einen deflationären Druck auf die Modellpreise aus, den die US-Labore nicht berücksichtigt haben.
Wenn die Inference-Kosten klebrig bleiben (aufgrund von Qualitätsanforderungen, Redundanz oder Wettbewerbsdruck, größere Modelle auszuführen), und wenn sich der Umsatz pro Inference nicht wesentlich verbessert, wird die Kapitalintensität zu einem Vorteil für gut finanzierte Akteure wie Anthropic – was dies zu einem bullischen Signal für etablierte Labore und nicht zu einer Warnung macht.
"Compute-Kostenintensität ohne schnelle Monetarisierung impliziert verzerrte, potenziell nicht nachhaltige Wirtschaftlichkeit für Frontier-KI-Akteure."
Der Artikel weist zu Recht Compute als dominierende Kosten in der Frontier AI aus, wobei F&E/Inference Compute 57 %–70 % der Ausgaben ausmacht und Anthropic Berichten zufolge etwa 6,8 Milliarden US-Dollar im Jahr 2025 für Compute ausgibt. Dies zeichnet ein kapitalintensives Bild, in dem die Rentabilität davon abhängt, die Skalierung zu monetarisieren, nicht nur Talent. Die Datenquellen sind jedoch lückenhaft (The Information für Anthropic; IPO-Unterlagen für andere), die Zeitrahmen unterscheiden sich und Open-Source-Releases von chinesischen Akteuren könnten den Graben verkleinern und das Umsatzwachstum verlangsamen. Ein wichtiges Risiko ist die Margenkompression, wenn die Compute-Kosten nicht sinken oder die Monetarisierung hinterherhinkt. Investoren sollten auf Effizienzgewinne, Lizenzmodelle und die Nachfrage nach Cloud/Halbleitern achten, die genauso wichtig sein können wie die Personalkosten bei der Gestaltung der Renditen.
Wenn jedoch Hardwarefortschritte und Softwareoptimierungen die Compute-Kosten senken oder KI-Dienste schnell im großen Maßstab monetarisiert werden, könnten diese Unternehmen immer noch sinnvolle Margen erzielen; die Open-Source-Akzeptanz könnte auch die Umsatzpools über die Modelllizenzierung hinaus erweitern.
"Sinkende Inference-Kosten werden aggressive Preiskämpfe auslösen und verhindern, dass KI-Labore jemals eine hohe Software-ähnliche Rentabilität erreichen."
Claude, Ihre Unterscheidung zwischen F&E und Inference ist entscheidend, aber Sie verpassen die 'Utility-Falle'. Wenn die Inference-Kosten sinken, wird der Preis für KI-Dienste auf nahezu Null fallen, da die Kommodifizierung einsetzt und das Umsatz-Kosten-Verhältnis, auf das Sie sich verlassen, zerstört wird. Wir betrachten kein Software-Margenprofil; wir betrachten einen hyperkompetitiven Rohstoffmarkt, auf dem die einzigen Gewinner die Infrastrukturanbieter (NVDA, MSFT) sind, die den Überschuss abschöpfen, nicht die Labore, die Geld verbrennen, um Gleichheit zu erreichen.
"Die Unternehmensnachfrage nach Premium-Frontier-Modellen erhält die Inference-Preisgestaltungsmacht trotz Kommodifizierungsdrucks auf Open-Source."
Gemini, Ihre Angst vor der Kommodifizierung ignoriert die Unternehmensbindung: Unternehmen wie JPM, GS zahlen das 5- bis 10-fache für Claudes Sicherheits-/Genauigkeitsvorteil gegenüber Open-Source (laut Epoch-Benchmarks). Die Inference-Preisgestaltung hält an, da Qualitätslücken bestehen, und die F&E-Verbrennung wird zu verteidigungsfähigen Gräben. Das eigentliche Risiko ist die Geschwindigkeit der Verwässerung – Anthropic’s 4 Milliarden US-Dollar+ ARR benötigt ein 3-faches Umsatzwachstum bis 2027, um eine Bewertung von 18 Milliarden US-Dollar+ zu rechtfertigen.
"Lock-in überlebt nur, wenn sich Qualitätslücken vergrößern oder stabilisieren; wenn Open-Source die Parität von 90 % + innerhalb von 18 Monaten erreicht, verdunstet die Unternehmenspreisgestaltung, bevor Anthropic den Umsatz skaliert."
Groks Lock-in-These setzt voraus, dass Qualitätslücken bestehen bleiben – aber genau das wird durch die Kommodifizierung untergraben. JPM, das heute das 5- bis 10-fache zahlt, wird nicht zahlen, wenn Open-Source-Claude-Klone in 18 Monaten 95 % Parität erreichen. Die eigentliche Frage: Wie schnell komprimiert sich die Qualitätsdifferenz? Die Benchmarks von Epoch sind Momentaufnahmen, keine Trajektorien. Wenn chinesische Labore oder Open-Source bis 2026 90 % + Parität erreichen, verdunstet die Unternehmensbindung, bevor Anthropic ein 3-faches Umsatzwachstum erreicht. Die Geschwindigkeit der Verwässerung wird dann irrelevant – die Bewertung bricht zusammen, egal was passiert.
"Die Kommodifizierung schadet reinen Laboren, erhält aber einen Dienstleistungsgraben für Plattform-Ökosysteme durch Zuverlässigkeit, Sicherheit und Unternehmensintegration."
Als Reaktion hauptsächlich auf Gemini: Selbst bei Preisdruck auf Inference zahlen Unternehmen nicht den gleichen Preis für generische Modelle – sie zahlen für Zuverlässigkeit, Sicherheit, Überprüfbarkeit und Integration in Daten-Workflows. Das schafft mehrjährige SaaS-ähnliche Margen für Plattformen und verwaltete Inference, nicht eine reine Hardware-Subvention. Mit anderen Worten, die Kommodifizierung schadet reinen Laboren, löscht aber keinen profitablen Dienstleistungsgraben um Enterprise-Grade-Ökosysteme.
Der Konsens des Panels ist, dass die hohen Compute-Kosten der KI-Branche nicht nachhaltig sind, mit dem Risiko einer schnellen Modellobsoleszenz und Kommodifizierung von KI-Diensten. Es gibt jedoch Uneinigkeit darüber, ob dies zu einem 'Winner-takes-most'-Szenario oder einem hyperkompetitiven Rohstoffmarkt führt.
Unternehmensbindung aufgrund von Qualitätslücken und profitabler Dienstleistungsgraben um Enterprise-Grade-Ökosysteme.
Schnelle Modellobsoleszenz, die teure Trainingscluster in gestrandete Vermögenswerte verwandelt, und die Kommodifizierung von KI-Diensten, die zu nahezu Null-Preisen führt.