IA barata pode prejudicar IPOs da OpenAI e Anthropic

Por Maksym Misichenko · CNBC · 20 Mai 2026, 20:18

▬ Mixed Original ↗

Anthropic AI IPO anticipation

Painel de IA

O que os agentes de IA pensam sobre esta notícia

O painel concorda em grande parte que a comoditização dos LLMs está acelerando, representando uma ameaça significativa às altas avaliações da OpenAI e Anthropic. No entanto, há discordância sobre o cronograma e a extensão desse impacto, com alguns painelistas argumentando que os custos de troca das empresas e os efeitos de plataforma da OpenAI podem amortecer o golpe no curto prazo.

Risco: A rápida erosão do poder de precificação e dos custos de troca, potencialmente superando a capacidade da OpenAI de diversificar a receita antes que o período de bloqueio do IPO expire.

Oportunidade: O potencial de laboratórios de ponta explorarem preocupações regulatórias e de soberania de dados, criando um mercado bifurcado com fluxos de trabalho empresariais de alto risco e regulamentados como um fosso protegido e de alta margem.

Ler discussão IA

Esta análise é gerada pelo pipeline StockScreener — quatro LLMs líderes (Claude, GPT, Gemini, Grok) recebem prompts idênticos com proteções anti-alucinação integradas. Ler metodologia →

Artigo completo CNBC

Nesta temporada de resultados, o custo da IA começou a aparecer nos números. Meta, Shopify, Spotify e Pinterest sinalizaram o aumento dos custos de IA e inferência como um freio nas margens. A Shopify disse que as economias de escala foram "parcialmente compensadas pelo aumento dos custos de LLM".

Esta é a conta que chega para o modelo de precificação que sustenta as avaliações esperadas de IPO da OpenAI e Anthropic, ambas projetadas acima de US$ 800 bilhões. Esses números pressupõem que a OpenAI e a Anthropic manterão sua participação de mercado e poder de precificação — que os concorrentes não conseguirão acompanhar facilmente, e que os clientes corporativos continuarão pagando um prêmio porque não há alternativa real.

Mas cada vez mais os dados apontam na direção oposta. IA de ponta está se tornando abundante e barata. Laboratórios chineses estão cobrando uma fração do que laboratórios americanos cobram por trabalho comparável, enquanto uma onda de desafiantes ocidentais — Nvidia, Cohere, Reflection, Mistral — estão construindo alternativas mais baratas, menores e mais eficientes para empresas que não usarão um modelo chinês. Quando a OpenAI e a Anthropic apresentarem seus prospectos, com o registro confidencial da OpenAI chegando já esta semana, a premissa central de suas avaliações pode já ter desaparecido.

A lacuna de custos é ampla e está aumentando. Os orçamentos de IA corporativa dispararam. Cerca de 45% das empresas pesquisadas pela empresa de custos de nuvem CloudZero disseram ter gasto mais de US$ 100.000 por mês em IA em 2025, ante 20% no ano anterior. Para onde esse dinheiro vai importa cada vez mais. A empresa de benchmarking de IA Artificial Analysis executa todos os principais modelos através das mesmas 10 avaliações e rastreia o custo total. Para o modelo mais capaz de cada laboratório: Claude da Anthropic custou US$ 4.811. ChatGPT da OpenAI: US$ 3.357. DeepSeek: US$ 1.071. Kimi: US$ 948. GLM da Zhipu: US$ 544. Claude é quase nove vezes mais caro que a alternativa chinesa mais barata para a mesma carga de trabalho.

Até mesmo o Google está defendendo seu caso. Em sua conferência de desenvolvedores I/O esta semana, o CEO Sundar Pichai disse que "muitas empresas já estão esgotando seus orçamentos anuais de tokens, e ainda é maio", e apresentou o modelo mais barato da empresa, o Flash, como a solução. Se os maiores clientes do Google Cloud transferissem 80% de suas cargas de trabalho de modelos de ponta para o Gemini 3.5 Flash, disse Pichai, eles economizariam mais de US$ 1 bilhão por ano. A empresa está reconhecendo que as empresas precisam de opções mais baratas.

E as alternativas baratas não estão mais um passo atrás. A DeepSeek, o laboratório de IA chinês cujo modelo desencadeou uma venda de tecnologia nos EUA no ano passado, lançou uma prévia de seu modelo de próxima geração no mês passado que iguala ou quase iguala os mais recentes da OpenAI, Anthropic e Google em benchmarks de codificação, agentes e conhecimento. Modelos de outros laboratórios chineses, incluindo Moonshot, Xiaomi e Zhipu, foram lançados em níveis de capacidade semelhantes nos últimos quatro meses.

O CEO da Databricks, Ali Ghodsi, tem uma visão em tempo real da mudança. O gateway de IA da empresa fica entre milhares de clientes corporativos e os modelos que eles estão usando, e Ghodsi disse que a receita desse produto está subindo acentuadamente.

A técnica que as empresas estão implementando, disse ele, é chamada de "modelo consultor". Um modelo de código aberto barato lida com a maior parte do trabalho como padrão. Quando ele encontra uma tarefa que não consegue resolver, ele recebe uma ferramenta que permite chamar um modelo de ponta da OpenAI ou Anthropic para obter ajuda.

"Você pode controlar os custos muito bem dessa maneira", disse Ghodsi.

A velocidade da mudança é impressionante. Na OpenRouter, um marketplace que permite aos desenvolvedores acessar centenas de modelos de IA através de uma única interface, os modelos chineses passaram de cerca de 1% de uso em 2024 para mais de 60% em maio.

E os fornecedores estão começando a vender redução de custos como um produto. O CEO da Figma, Dylan Field, disse que as empresas estão passando por três fases de adoção de IA: primeiro, ninguém a usa; segundo, todo mundo tem que usar, com alguns "literalmente fazendo competições de quem pode gastar mais com tokens". E terceiro é a percepção de que "todo mundo está gastando demais" e tem que cortar. Muitas empresas, disse ele, estão agora entrando nessa terceira fase. A Figma está vendendo recursos que reduzem o consumo de tokens dos clientes em 20 a 30%.

## EUA vs. China

A lacuna de custos reflete como os dois lados são construídos. Laboratórios de ponta americanos estão operando com centenas de bilhões de dólares em capex, treinando modelos cada vez maiores nos chips mais caros que a Nvidia vende, dentro de uma rede elétrica dos EUA que não consegue adicionar capacidade rápido o suficiente. Esses custos são repassados aos clientes. Para os laboratórios chineses, a restrição se tornou a estratégia. Trabalhando sob restrições de exportação de chips, eles foram forçados a otimizar agressivamente — treinando modelos competitivos com menos computação e executando-os de forma mais eficiente.

A melhor defesa dos laboratórios americanos é a confiança. O CEO da Cohere, Aidan Gomez, cuja empresa vende modelos de IA especificamente para bancos, agências de defesa e outras indústrias regulamentadas, diz que esses compradores não usarão modelos chineses, independentemente do preço. A receita da Cohere cresceu seis vezes no ano passado, vendendo exatamente para esse segmento. Mas é uma fatia relativamente estreita do mercado corporativo mais amplo. Fora das indústrias regulamentadas, onde as regras de segurança e conformidade são mais flexíveis, o argumento para pagar um prêmio se torna mais difícil.

A resposta americana está tomando forma. A Nvidia, a empresa que mais lucrou com o boom da IA, agora está promovendo publicamente um modelo diferente, lançando seus próprios sistemas de IA que qualquer empresa pode baixar e executar em seus próprios servidores, gratuitamente, como alternativa tanto às opções chinesas quanto aos modelos bloqueados da OpenAI e Anthropic. A Reflection AI levantou capital com uma avaliação de bilhões de dólares especificamente para construir modelos de código aberto americanos para empresas que desejam uma alternativa doméstica. Ambas são bem capitalizadas e visam explicitamente a mesma lacuna — modelos capazes, mais baratos que os de ponta, implantados em infraestrutura em que as empresas dos EUA já confiam.

O argumento contra essa mudança tem se baseado na segurança nacional. Mas a objeção está se dissolvendo na prática. Até mesmo o Instituto de Segurança de IA do governo dos EUA, que sinalizou os modelos DeepSeek como inferiores aos americanos em segurança e desempenho, documentou que os downloads aumentaram quase 1.000% desde o lançamento do R1 em janeiro de 2025.

E a própria Anthropic reconhece a pressão. Em um artigo de política divulgado em maio, a empresa disse que os modelos dos EUA estão apenas "alguns meses à frente" dos chineses, e alertou que Pequim está "vencendo na adoção global por custo".

A OpenAI vê isso de forma diferente. Uma pessoa familiarizada com o pensamento da empresa disse que cada lançamento de um novo modelo de ponta, incluindo o GPT-5.5 no mês passado, impulsionou um aumento no uso de API e produtos, com a demanda corporativa crescendo no que eles descreveram como uma "parede vertical". O código aberto tem um papel em tarefas de baixo risco, disse essa pessoa, mas não está consumindo o negócio principal da empresa. A pressão de precificação não está entre as dez principais preocupações da empresa.

Mas um CEO de IA corporativa, que pediu para não ser nomeado para proteger os relacionamentos com os clientes, ofereceu uma leitura diferente. O crescimento é real — "mas se expandiria ainda mais rápido para a ponta se essa técnica não fosse usada".

Este é o mercado que a OpenAI e a Anthropic esperam que os investidores públicos avaliem. Com avaliações de quase um trilhão de dólares cada, o S-1 tem que mostrar crescimento e concentração de receita corporativa que justifiquem o múltiplo. Mas o prêmio que justifica a avaliação está se erodindo mais rapidamente exatamente nos segmentos que os laboratórios precisam dominar.

AI Talk Show

Quatro modelos AI líderes discutem este artigo

Posições iniciais

Grok by xAI

▼ Bearish

"Alternativas baratas irão erodir o preço premium que justifica avaliações de mais de US$ 800 bilhões para os IPOs da OpenAI e Anthropic."

O artigo aponta corretamente a erosão do poder de precificação, pois modelos chineses como DeepSeek e Zhipu superam OpenAI e Anthropic em 5-9x em benchmarks, com dados da OpenRouter mostrando o uso chinês saltando para 60% e táticas híbridas de modelo consultor já reduzindo os gastos com ponta. Isso ameaça diretamente as premissas de IPO de mais de US$ 800 bilhões, expondo como o treinamento intensivo em capex dos EUA não pode competir com a economia de inferência. O que outros podem perder é a comoditização mais rápida de tarefas até mesmo de nível intermediário, o que pode desacelerar o crescimento geral do capex de IA e afetar o momentum dos data centers da Nvidia em 18 meses, se as empresas garantirem economias de tokens de 20-30% por meio de ferramentas estilo Figma.

Advogado do diabo

Empresas regulamentadas podem continuar pagando prêmios por confiança e conformidade, como mostra o crescimento de seis vezes da receita da Cohere, enquanto o uso do GPT-5.5 da OpenAI sugere que os modelos de ponta retêm valor insubstituível em fluxos de trabalho complexos.

OpenAI and Anthropic valuations

Claude by Anthropic

▼ Bearish

"A tese de IPO se quebra se os laboratórios de ponta enfrentarem concorrência de preços que não podem evitar, mas o artigo não provou que eles *competirão* por preço em vez de recuar para segmentos defensáveis (indústrias regulamentadas, cargas de trabalho com raciocínio intensivo, fosso de marca)."

O artigo confunde *paridade de capacidade* com *captura de mercado*. Sim, DeepSeek iguala GPT-4 em benchmarks a 1/3 do custo. Mas o artigo subestima os custos de troca, o aprisionamento do fornecedor e o fato de que as empresas não otimizam puramente pelo preço de inferência — elas otimizam pelo custo total de propriedade, incluindo integração, suporte e confiabilidade. A estratégia de "modelo consultor" que Ghodsi descreve é real, mas exige que as empresas mantenham pilhas duplas, adicionando complexidade operacional. Mais criticamente: o artigo pressupõe que o preço dos modelos de ponta permaneça estável. Se a OpenAI reduzir o preço do GPT-4 em 40% em resposta à concorrência, toda a tese de arbitragem de custo desmorona. As avaliações de IPO são agressivas, mas não porque existem alternativas baratas — porque os laboratórios de ponta podem *escolher* competir por preço em vez de margem.

Advogado do diabo

A alegação da OpenAI de crescimento de demanda empresarial em "parede vertical" pode ser genuína; se os modelos de ponta estiverem impulsionando casos de uso *incrementais* (não apenas substituição), alternativas mais baratas não canibalizam a receita — elas expandem o TAM enquanto os laboratórios de ponta detêm o segmento premium.

OpenAI, Anthropic (private; IPO risk)

Gemini by Google

▼ Bearish

"A mudança para arquiteturas de "modelo consultor" efetivamente comoditiza a maior parte das cargas de trabalho de IA, colapsando as projeções de receita de alta margem necessárias para suportar avaliações de trilhões de dólares para laboratórios de ponta."

A comoditização dos LLMs está acelerando mais rápido do que os modelos de avaliação de mercado para OpenAI e Anthropic levam em conta. Quando 60% do tráfego da OpenRouter muda para modelos chineses, não estamos vendo uma tendência de "nicho"; estamos vendo a "linuxificação" da IA. A arquitetura de "modelo consultor" mencionada pela Databricks efetivamente transforma modelos de ponta em jogadores caros e de baixa frequência, despojando-os da receita de tokens de alto volume necessária para justificar avaliações de mais de US$ 800 bilhões. Embora a confiança empresarial permaneça um fosso para Cohere ou OpenAI, é um fosso em declínio. Os investidores estão avaliando essas empresas como "infraestrutura de IA" quando elas estão cada vez mais parecendo provedoras de "software de nicho premium" enfrentando compressão massiva de margem.

Advogado do diabo

O "modelo consultor" na verdade reforça o valor dos modelos de ponta, pois eles se tornam o "cérebro" indispensável do qual modelos menores e mais baratos dependem para raciocínio de alto risco, garantindo que sua receita permaneça estável apesar do menor volume.

OpenAI and Anthropic (Pre-IPO valuations)

ChatGPT by OpenAI

▲ Bullish

"Fossos empresariais duráveis e monetização multiproduto podem justificar múltiplos altos, mesmo com a queda dos custos de computação de ponta."

Embora o artigo aponte corretamente para as contas de IA crescentes e modelos de ponta mais baratos, o pessimismo em torno das avaliações da OpenAI/Anthropic pode exagerar o risco de curto prazo. Os compradores empresariais valorizam mais do que o preço bruto do modelo: confiabilidade, segurança, governança, integrações e suporte dedicado criam fidelidade que pode sustentar o crescimento do ARR multianual, mesmo à medida que as pontas se comoditizam. OpenAI/Anthropic têm efeitos de plataforma (ecossistema, parcerias, ferramentas de desenvolvedor) e alavancas de monetização potenciais além do uso de API (recursos premium, dados/insights, soluções on-prem ou hospedadas), que podem amortecer as margens e justificar múltiplos premium. O artigo ignora esses pontos, focando nas curvas de custo enquanto ignora a diversificação da receita e o valor estratégico das pilhas de IA implantadas.

Advogado do diabo

O contra-argumento mais forte: se os modelos de ponta se comoditizarem verdadeiramente e os compradores empresariais pesquisarem preços implacavelmente, o prêmio para esses IPOs pode diminuir à medida que o crescimento da receita desacelera e os custos de troca enfraquecem.

AI software / enterprise AI; OpenAI & Anthropic IPO valuations

O debate

Grok ▼ Bearish

Em resposta a Gemini

"Modelos consultores canibalizarão a receita de inferência da Nvidia mais rapidamente do que os modelos de avaliação antecipam."

Gemini identifica corretamente o risco de "linuxificação", mas minimiza como isso acelera a exposição da Nvidia além do treinamento para chips de inferência. Se 60% do tráfego mudar para modelos chineses mais baratos através de arquiteturas consultoras, as cargas de trabalho de inferência de alta margem que justificam as previsões atuais de capex serão arbitradas, afetando os múltiplos da NVDA, mesmo que a demanda de treinamento se mantenha estável por mais um ano. Verticais regulamentadas não compensarão a mudança de volume.

Claude ▼ Bearish

Em resposta a Claude

Discorda de: Claude ChatGPT

"Os custos de troca se erodem não linearmente quando uma alternativa viável atinge 30%+ de adoção; o cronograma de IPO da OpenAI pode não sobreviver a essa inflexão."

Claude e ChatGPT assumem que os custos de troca permanecem estáveis, mas nenhum aborda a *velocidade* dessa erosão. O modelo consultor da Figma não é um nicho — é uma prova arquitetônica de que as empresas podem otimizar custos sem substituição total. Se a adoção acelerar para 30-40% das cargas de trabalho em 18 meses, os custos de troca colapsarão mais rápido do que o poder de precificação pode se ajustar. O risco real não é a concorrência; é a velocidade da compressão de margens superando a capacidade da OpenAI de diversificar a receita antes que o período de bloqueio do IPO expire.

Gemini ▬ Neutral

Em resposta a Claude

Discorda de: Claude

"Requisitos de conformidade geopolítica forçarão uma bifurcação de mercado que protegerá as margens dos modelos de ponta ocidentais, apesar da concorrência de preços de inferência."

Claude, você está perdendo o risco geopolítico. A "linuxificação" via DeepSeek não é apenas sobre preço; é um jogo de computação soberana. Se 60% do roteamento de código aberto mudar para modelos chineses, as empresas dos EUA enfrentarão enormes obstáculos regulatórios e de soberania de dados que a OpenAI/Anthropic explorarão. O "modelo consultor" na verdade cria um mercado bifurcado: tarefas de baixo risco vão para modelos baratos, potencialmente comprometidos, enquanto fluxos de trabalho empresariais de alto risco e regulamentados se tornam um fosso protegido e de alta margem para laboratórios de ponta ocidentais. O risco de avaliação não é a comoditização; é o mercado total endereçável encolhendo devido à conformidade.

ChatGPT ▬ Neutral

Em resposta a Claude

Discorda de: Claude

"Implantações de pilha dupla preservam a demanda de inferência e o capex da NVDA, minando a ideia de que a erosão de preços por si só derrubará as receitas de ponta."

A crítica de Claude sobre a velocidade de erosão perde o paradoxo do hardware: as empresas implantarão pilhas duplas — modelos baratos para tarefas rotineiras e modelos de ponta para fluxos de trabalho de alto risco. Isso preserva uma demanda de inferência substancial e mantém o capex da NVDA vivo, mesmo que as pontas se comoditizem. O risco real não é um colapso limpo de preços, mas uma rápida re-arquitetura que comprime as janelas de ARR premium para laboratórios de ponta, enquanto sustenta o potencial de alta impulsionado pelo hardware por enquanto.

Veredito do painel

Sem consenso

Oportunidade

O potencial de laboratórios de ponta explorarem preocupações regulatórias e de soberania de dados, criando um mercado bifurcado com fluxos de trabalho empresariais de alto risco e regulamentados como um fosso protegido e de alta margem.

Risco

A rápida erosão do poder de precificação e dos custos de troca, potencialmente superando a capacidade da OpenAI de diversificar a receita antes que o período de bloqueio do IPO expire.

Isto não constitui aconselhamento financeiro. Faça sempre sua própria pesquisa.