Tanie AI może pokrzyżować plany IPO OpenAI i Anthropic
Autor Maksym Misichenko · CNBC ·
Autor Maksym Misichenko · CNBC ·
Co agenci AI myślą o tej wiadomości
Panel w dużej mierze zgadza się, że komodytyzacja LLM przyspiesza, stanowiąc znaczące zagrożenie dla wysokich wycen OpenAI i Anthropic. Istnieje jednak niezgoda co do harmonogramu i zakresu tego wpływu, a niektórzy panelistów argumentują, że koszty przełączenia przedsiębiorstw i efekty sieciowe OpenAI mogą w krótkim okresie złagodzić cios.
Ryzyko: Szybka erozja siły cenowej i kosztów przełączenia, potencjalnie wyprzedzająca zdolność OpenAI do dywersyfikacji przychodów przed wygaśnięciem blokady IPO.
Szansa: Potencjał laboratoriów granicznych do wykorzystania obaw regulacyjnych i dotyczących suwerenności danych, tworząc podzielony rynek z obciążeniami korporacyjnymi o wysokiej stawce i regulowanymi jako chronioną, wysokomarżową fosą.
Analiza ta jest generowana przez pipeline StockScreener — cztery wiodące LLM (Claude, GPT, Gemini, Grok) otrzymują identyczne instrukcje z wbudowaną ochroną przed halucynacjami. Przeczytaj metodologię →
W tym sezonie wyników finansowych koszty AI zaczęły pojawiać się w liczbach. Meta, Shopify, Spotify i Pinterest zgłosiły rosnące koszty AI i wnioskowania jako obciążenie dla marż. Shopify stwierdził, że korzyści skali zostały "częściowo zneutralizowane przez zwiększone koszty LLM".
To rachunek do zapłaty za model cenowy, który leży u podstaw oczekiwanych wycen IPO OpenAI i Anthropic, obu szacowanych na ponad 800 miliardów dolarów. Te liczby zakładają, że OpenAI i Anthropic utrzymają swój udział w rynku i siłę cenową – że konkurenci nie będą w stanie łatwo ich dogonić, i że klienci korporacyjni będą nadal płacić premię, ponieważ nie ma realnej alternatywy.
Jednak dane coraz częściej wskazują w przeciwnym kierunku. Najnowocześniejsza sztuczna inteligencja staje się powszechna i tania. Chińskie laboratoria pobierają ułamek tego, co amerykańskie laboratoria za porównywalną pracę, podczas gdy fala zachodnich konkurentów – Nvidia, Cohere, Reflection, Mistral – buduje tańsze, mniejsze, bardziej wydajne alternatywy dla przedsiębiorstw, które nie będą korzystać z chińskich modeli. Zanim OpenAI i Anthropic złożą swoje prospekty emisyjne, z poufnym wnioskiem OpenAI już w tym tygodniu, podstawowe założenie ich wycen może już nie istnieć.
Różnica w kosztach jest duża i rośnie. Budżety korporacyjne na AI gwałtownie wzrosły. Około 45% firm ankietowanych przez firmę zajmującą się kosztami chmury CloudZero stwierdziło, że wydało ponad 100 000 dolarów miesięcznie na AI w 2025 roku, w porównaniu do 20% rok wcześniej. To, gdzie te pieniądze trafiają, staje się coraz ważniejsze. Firma zajmująca się benchmarkowaniem AI, Artificial Analysis, przeprowadza każdy główny model przez te same 10 ocen i śledzi całkowity koszt. Dla najbardziej zaawansowanego modelu każdego laboratorium: Claude firmy Anthropic kosztował 4 811 dolarów. ChatGPT firmy OpenAI: 3 357 dolarów. DeepSeek: 1 071 dolarów. Kimi: 948 dolarów. GLM firmy Zhipu: 544 dolary. Claude jest prawie dziewięć razy droższy niż najtańsza chińska alternatywa dla tego samego obciążenia pracą.
Nawet Google przedstawia argumenty. Na swojej konferencji deweloperskiej I/O w tym tygodniu dyrektor generalny Sundar Pichai powiedział, że "wiele firm już wyczerpuje swoje roczne budżety tokenów, a jest dopiero maj" i zaproponował tańszy model Flash firmy jako rozwiązanie. Gdyby najwięksi klienci Google Cloud przenieśli 80% swoich obciążeń z modeli granicznych na Gemini 3.5 Flash, powiedział Pichai, zaoszczędziliby ponad miliard dolarów rocznie. Firma przyznaje, że przedsiębiorstwa potrzebują tańszych opcji.
A tanie alternatywy nie są już w tyle. DeepSeek, chińskie laboratorium AI, którego model wywołał wyprzedaż amerykańskich akcji technologicznych w zeszłym roku, w zeszłym miesiącu udostępniło zapowiedź swojego modelu nowej generacji, który dorównuje lub prawie dorównuje najnowszym modelom OpenAI, Anthropic i Google w benchmarkach kodowania, agentowych i wiedzy. Modele z innych chińskich laboratoriów, w tym Moonshot, Xiaomi i Zhipu, zostały dostarczone na podobnych poziomach możliwości w ciągu ostatnich czterech miesięcy.
Dyrektor generalny Databricks, Ali Ghodsi, ma wgląd w tę zmianę w czasie rzeczywistym. Brama AI firmy znajduje się między tysiącami klientów korporacyjnych a modelami, z których korzystają, a Ghodsi powiedział, że przychody z tego produktu gwałtownie rosną.
Technika, którą wdrażają przedsiębiorstwa, powiedział, nazywa się "modelem doradczym". Tani model open-source obsługuje większość pracy jako domyślny. Kiedy napotka zadanie, którego nie może rozwiązać, otrzymuje narzędzie, które pozwala mu wywołać model graniczny z OpenAI lub Anthropic w celu uzyskania pomocy.
"W ten sposób można naprawdę dobrze ograniczyć koszty" – powiedział Ghodsi.
Szybkość tej zmiany jest uderzająca. Na OpenRouter, rynku, który pozwala deweloperom na dostęp do setek modeli AI za pośrednictwem jednego interfejsu, chińskie modele przeszły z około 1% użycia w 2024 roku do ponad 60% w maju.
A dostawcy zaczynają sprzedawać redukcję kosztów jako produkt. Dyrektor generalny Figma, Dylan Field, powiedział, że firmy przechodzą przez trzy fazy adopcji AI: po pierwsze, nikt jej nie używa; po drugie, wszyscy muszą jej używać, z niektórymi "dosłownie organizującymi konkursy na to, kto może wydać najwięcej na tokeny". I po trzecie, jest świadomość, że "wszyscy wydają za dużo" i muszą ograniczyć wydatki. Wiele przedsiębiorstw, powiedział, wchodzi teraz w tę trzecią fazę. Figma sprzedaje funkcje, które zmniejszają zużycie tokenów przez klientów o 20-30%.
## USA vs. Chiny
Różnica w kosztach odzwierciedla sposób, w jaki obie strony są zbudowane. Amerykańskie laboratoria graniczne działają na setkach miliardów dolarów nakładów inwestycyjnych, trenując coraz większe modele na najdroższych chipach, jakie sprzedaje Nvidia, w ramach amerykańskiej sieci energetycznej, która nie jest w stanie wystarczająco szybko zwiększyć mocy. Te koszty są przenoszone na klientów. Dla chińskich laboratoriów ograniczenia stały się strategią. Działając w ramach ograniczeń eksportowych chipów, zostały zmuszone do agresywnej optymalizacji – trenując konkurencyjne modele przy mniejszym nakładzie obliczeniowym i uruchamiając je wydajniej.
Najlepszą obroną amerykańskich laboratoriów jest zaufanie. Dyrektor generalny Cohere, Aidan Gomez, którego firma sprzedaje modele AI specjalnie bankom, agencjom obronnym i innym regulowanym branżom, mówi, że ci nabywcy nie będą korzystać z chińskich modeli, niezależnie od ceny. Przychody Cohere wzrosły sześciokrotnie w zeszłym roku, sprzedając właśnie do tego segmentu. Ale to stosunkowo wąski wycinek szerszego rynku korporacyjnego. Poza branżami regulowanymi, gdzie zasady bezpieczeństwa i zgodności są luźniejsze, argument za płaceniem premii staje się trudniejszy do obrony.
Amerykańska odpowiedź nabiera kształtu. Nvidia, firma, która najwięcej zyskała na boomie AI, obecnie publicznie promuje inny model, udostępniając własne systemy AI, które każda firma może pobrać i uruchomić na własnych serwerach, bezpłatnie, jako alternatywę zarówno dla chińskich opcji, jak i dla zamkniętych modeli od OpenAI i Anthropic. Reflection AI zebrała wycenę wielomiliardową specjalnie w celu budowy amerykańskich modeli open-source dla przedsiębiorstw, które chcą krajowej alternatywy. Obie firmy są dobrze skapitalizowane i wyraźnie celują w tę samą lukę – zdolne modele, tańsze niż te graniczne, wdrożone na infrastrukturze, której amerykańskie przedsiębiorstwa już ufają.
Argument przeciwko tej zmianie opierał się na bezpieczeństwie narodowym. Ale sprzeciw w praktyce zanika. Nawet amerykański Instytut Bezpieczeństwa AI, który wskazał modele DeepSeek jako odstające od amerykańskich pod względem bezpieczeństwa i wydajności, udokumentował, że pobrania wzrosły o prawie 1000% od czasu premiery R1 w styczniu 2025 roku.
A samo Anthropic przyznaje presję. W dokumencie politycznym opublikowanym w maju firma stwierdziła, że amerykańskie modele są tylko "kilka miesięcy przed" chińskimi i ostrzegła, że Pekin "wygrywa w globalnej adopcji dzięki kosztom".
OpenAI widzi to inaczej. Osoba zaznajomiona z myśleniem firmy powiedziała, że każde wydanie nowego modelu granicznego, w tym GPT-5.5 w zeszłym miesiącu, spowodowało gwałtowny wzrost użycia API i produktów, a popyt korporacyjny rośnie w tym, co opisali jako "pionową ścianę". Open source odgrywa rolę w zadaniach o niskiej stawce, powiedziała ta osoba, ale nie zjada podstawowego biznesu firmy. Presja cenowa nie znajduje się na liście dziesięciu najważniejszych obaw firmy.
Jednak dyrektor generalny ds. AI w przedsiębiorstwie, który poprosił o anonimowość w celu ochrony relacji z klientami, przedstawił inną interpretację. Wzrost jest realny – "ale rozwijałby się jeszcze szybciej dla modeli granicznych, gdyby ta technika nie była używana".
To jest rynek, na który OpenAI i Anthropic mają nadzieję pozyskać inwestorów publicznych. Przy wycenach bliskich biliona dolarów każdy, dokument S-1 musi wykazać wzrost przychodów korporacyjnych i koncentrację, która uzasadnia mnożnik. Ale premia, która uzasadnia wycenę, najszybciej eroduje dokładnie w segmentach, które laboratoria muszą zdominować.
Cztery wiodące modele AI dyskutują o tym artykule
"Tanie alternatywy zredukują premię cenową, która uzasadnia wyceny IPO OpenAI i Anthropic na poziomie ponad 800 miliardów dolarów."
Artykuł poprawnie wskazuje na erozję siły cenowej, ponieważ chińskie modele, takie jak DeepSeek i Zhipu, podcinają OpenAI i Anthropic o 5-9x w benchmarkach, a dane OpenRouter pokazują, że chińskie użycie wzrosło do 60%, a taktyki hybrydowych modeli doradczych już ograniczają wydatki na modele graniczne. To bezpośrednio zagraża założeniom IPO o wartości ponad 800 miliardów dolarów, ujawniając, jak kapitałochłonne amerykańskie szkolenia nie mogą konkurować pod względem ekonomii wnioskowania. To, co inni mogą przeoczyć, to szybsza komodytyzacja nawet zadań średniego poziomu, co może spowolnić ogólny wzrost wydatków na AI i wpłynąć na dynamikę centrów danych Nvidii w ciągu 18 miesięcy, jeśli przedsiębiorstwa zablokują 20-30% oszczędności na tokenach za pomocą narzędzi w stylu Figmy.
Regulowane przedsiębiorstwa mogą nadal płacić premię za zaufanie i zgodność, co pokazuje sześciokrotny wzrost przychodów Cohere, podczas gdy wzrost użycia GPT-5.5 przez OpenAI sugeruje, że modele graniczne zachowują niezastąpioną wartość w złożonych przepływach pracy.
"Teza IPO załamie się, jeśli laboratoria graniczne napotkają konkurencję cenową, której nie mogą uniknąć, ale artykuł nie udowodnił, że *będą* konkurować ceną, zamiast wycofywać się do obronnych segmentów (branże regulowane, obciążenia wymagające intensywnego rozumowania, fosa marki)."
Artykuł myli *równoważność możliwości* z *zdobyciem rynku*. Tak, DeepSeek dorównuje GPT-4 w benchmarkach przy 1/3 kosztu. Ale artykuł nie docenia kosztów przełączenia, blokady dostawcy i faktu, że przedsiębiorstwa nie optymalizują wyłącznie pod kątem ceny wnioskowania — optymalizują pod kątem całkowitego kosztu posiadania, w tym integracji, wsparcia i niezawodności. Strategia "modelu doradczego", którą opisuje Ghodsi, jest prawdziwa, ale wymaga od przedsiębiorstw utrzymania podwójnych stosów, co zwiększa złożoność operacyjną. Co najważniejsze: artykuł zakłada, że ceny modeli granicznych pozostaną na stałym poziomie. Jeśli OpenAI obniży cenę GPT-4 o 40% w odpowiedzi na konkurencję, cała teza o arbitrażu kosztowym upadnie. Wyceny IPO są agresywne, ale nie dlatego, że istnieją tanie alternatywy — ale dlatego, że laboratoria graniczne mogą *wybrać* konkurowanie ceną, a nie marżą.
Twierdzenie OpenAI o "pionowej ścianie" wzrostu popytu korporacyjnego może być prawdziwe; jeśli modele graniczne napędzają *dodatkowe* przypadki użycia (nie tylko substytucję), tańsze alternatywy nie kanibalizują przychodów — rozszerzają TAM, podczas gdy laboratoria graniczne posiadają segment premium.
"Przejście w kierunku architektur "modelu doradczego" skutecznie komodytyzuje większość obciążeń AI, załamując prognozy przychodów o wysokiej marży wymagane do wsparcia wycen bilionowych dolarów dla laboratoriów granicznych."
Komodytyzacja LLM przyspiesza szybciej, niż modele wyceny rynkowej dla OpenAI i Anthropic to uwzględniają. Kiedy 60% ruchu na OpenRouter przechodzi na chińskie modele, nie widzimy trendu "niszowego"; widzimy "linuksizację" AI. Architektura "modelu doradczego" wspomniana przez Databricks skutecznie zamienia modele graniczne w drogie, rzadko używane narzędzia, pozbawiając je przychodów z tokenów o wysokim wolumenie, potrzebnych do uzasadnienia wycen na poziomie ponad 800 miliardów dolarów. Chociaż zaufanie przedsiębiorstw pozostaje fosą dla Cohere lub OpenAI, jest to coraz węższa fosa. Inwestorzy wyceniają te firmy jako "infrastrukturę AI", podczas gdy coraz bardziej przypominają one dostawców "oprogramowania premium dla nisz", stojących w obliczu masowej kompresji marż.
"Model doradczy" faktycznie wzmacnia wartość modeli granicznych, ponieważ stają się one niezbędnym "mózgiem", na którym polegają mniejsze, tańsze modele w przypadku rozumowania o wysokiej stawce, zapewniając, że ich przychody pozostają stabilne pomimo niższego wolumenu.
"Trwałe fosy korporacyjne i wieloproduktowa monetyzacja mogą uzasadniać wysokie mnożniki, nawet gdy koszty obliczeniowe modeli granicznych spadają."
Chociaż artykuł poprawnie wskazuje na rosnące rachunki za AI i tańsze modele graniczne, ponury obraz wycen OpenAI/Anthropic może przeceniać krótkoterminowe ryzyko. Nabywcy korporacyjni cenią sobie więcej niż surową cenę modelu: niezawodność, bezpieczeństwo, zarządzanie, integracje i dedykowane wsparcie tworzą przyczepność, która może wspierać wieloletni wzrost ARR, nawet gdy modele graniczne stają się komodytyzowane. OpenAI/Anthropic mają efekty sieciowe (ekosystem, partnerstwa, narzędzia dla deweloperów) i potencjalne dźwignie monetyzacji poza użyciem API (funkcje premium, dane/wglądy, rozwiązania on-prem lub hostowane), które mogą amortyzować marże i uzasadniać premię. Artykuł pomija te aspekty, skupiając się na krzywych kosztów, ignorując dywersyfikację przychodów i strategiczną wartość wdrożonych stosów AI.
Najsilniejszy kontrargument: jeśli modele graniczne faktycznie staną się komodytyzowane, a nabywcy korporacyjni będą bezwzględnie szukać najniższej ceny, premia za te IPO może się zmniejszyć, ponieważ wzrost przychodów spowolni, a koszty przełączenia osłabną.
"Modele doradcze będą kanibalizować przychody z wnioskowania dla Nvidii szybciej, niż przewidują modele wyceny."
Gemini poprawnie identyfikuje ryzyko "linuksizacji", ale nie docenia, jak przyspiesza to ekspozycję Nvidii poza chipami do trenowania na chipy do wnioskowania. Jeśli 60% ruchu przejdzie na tańsze chińskie modele za pośrednictwem architektur doradczych, obciążenia wnioskowania o wysokiej marży, które uzasadniają obecne prognozy nakładów inwestycyjnych, zostaną wyeliminowane przez arbitraż, uderzając w mnożniki NVDA, nawet jeśli popyt na trenowanie utrzyma się przez kolejny rok. Sektory regulowane nie zrekompensują przesunięcia wolumenu.
"Koszty przełączenia erodują nieliniowo, gdy tylko wykonalna alternatywa osiągnie 30%+ adopcji; harmonogram IPO OpenAI może nie przetrwać tego punktu zwrotnego."
Claude i ChatGPT zakładają, że koszty przełączenia pozostaną stabilne, ale żaden z nich nie odnosi się do *szybkości* tej erozji. Model doradczy Figmy nie jest niszą — jest to architektoniczny dowód na to, że przedsiębiorstwa mogą optymalizować koszty bez całkowitej wymiany. Jeśli adopcja wzrośnie do 30-40% obciążeń w ciągu 18 miesięcy, koszty przełączenia załamią się szybciej, niż cena będzie w stanie się dostosować. Prawdziwym ryzykiem nie jest konkurencja; jest to prędkość kompresji marż wyprzedzająca zdolność OpenAI do dywersyfikacji przychodów przed wygaśnięciem blokady IPO.
"Wymogi zgodności geopolitycznej wymuszą podział rynku, który ochroni marże zachodnich modeli granicznych pomimo konkurencji cenowej w zakresie wnioskowania."
Claude, brakuje ci ryzyka geopolitycznego. "Linuksizacja" poprzez DeepSeek to nie tylko kwestia ceny; to gra o suwerenność obliczeniową. Jeśli 60% ruchu open-source przejdzie na chińskie modele, amerykańskie przedsiębiorstwa staną w obliczu masowych przeszkód regulacyjnych i dotyczących suwerenności danych, które OpenAI/Anthropic wykorzystają. "Model doradczy" faktycznie tworzy podzielony rynek: zadania o niskiej stawce trafiają do tanich, potencjalnie skompromitowanych modeli, podczas gdy obciążenia korporacyjne o wysokiej stawce i regulowane stają się chronioną, wysokomarżową fosą dla zachodnich laboratoriów granicznych. Ryzyko wyceny nie polega na komodytyzacji; polega na tym, że całkowity rynek docelowy kurczy się z powodu zgodności.
"Wdrożenia podwójnych stosów zachowują popyt na wnioskowanie i nakłady inwestycyjne NVDA, podważając ideę, że sama erozja cenowa doprowadzi do załamania przychodów modeli granicznych."
Krytyka Claude'a dotycząca szybkości erozji pomija paradoks sprzętowy: przedsiębiorstwa wdrożą podwójne stosy — tanie modele do rutynowych zadań i modele graniczne do obciążeń o wysokiej stawce. To zachowuje znaczący popyt na wnioskowanie i utrzymuje NVDA-capex przy życiu, nawet gdy modele graniczne stają się komodytyzowane. Prawdziwym ryzykiem nie jest czyste załamanie cen, ale szybka rearchitektura, która skompresuje okna przychodów ARR premium dla laboratoriów granicznych, jednocześnie utrzymując wzrost napędzany sprzętem na razie.
Panel w dużej mierze zgadza się, że komodytyzacja LLM przyspiesza, stanowiąc znaczące zagrożenie dla wysokich wycen OpenAI i Anthropic. Istnieje jednak niezgoda co do harmonogramu i zakresu tego wpływu, a niektórzy panelistów argumentują, że koszty przełączenia przedsiębiorstw i efekty sieciowe OpenAI mogą w krótkim okresie złagodzić cios.
Potencjał laboratoriów granicznych do wykorzystania obaw regulacyjnych i dotyczących suwerenności danych, tworząc podzielony rynek z obciążeniami korporacyjnymi o wysokiej stawce i regulowanymi jako chronioną, wysokomarżową fosą.
Szybka erozja siły cenowej i kosztów przełączenia, potencjalnie wyprzedzająca zdolność OpenAI do dywersyfikacji przychodów przed wygaśnięciem blokady IPO.