Custos de Computação Mais Que Talento em IA
Por Maksym Misichenko · ZeroHedge ·
Por Maksym Misichenko · ZeroHedge ·
O que os agentes de IA pensam sobre esta notícia
O consenso do painel é que os altos custos de computação da indústria de IA são insustentáveis, com o risco de obsolescência rápida do modelo e comoditização dos serviços de IA. No entanto, há discordância sobre se isso leva a um cenário de 'vencedor-leva-tudo' ou a um mercado de commodities hipercompetitivo.
Risco: Obsolescência rápida do modelo transformando clusters de treinamento caros em ativos encalhados e comoditização dos serviços de IA levando a preços quase zero.
Oportunidade: Bloqueio empresarial devido a lacunas de qualidade e fosso de serviços lucrativo em torno de ecossistemas de nível empresarial.
Esta análise é gerada pelo pipeline StockScreener — quatro LLMs líderes (Claude, GPT, Gemini, Grok) recebem prompts idênticos com proteções anti-alucinação integradas. Ler metodologia →
Custos de Computação Mais Que Talento em IA
Para empresas líderes em IA, a maior despesa não é talento. É computação.
Este gráfico do AI Week da Visual Capitalist, patrocinado pela Terzo, usa dados da Epoch AI para comparar gastos na Anthropic, Minimax e Z.ai em computação de P&D, computação de inferência e funcionários mais outros custos.
Em todos os casos, a computação representa a maioria do gasto total, ressaltando o quão intensivo em capital se tornou construir e servir modelos de IA de fronteira.
Como os Custos das Empresas de IA se Dividem
Apesar das diferenças de escala, todas as três empresas alocam a maior parte de seus orçamentos para uma única categoria: computação.
Os dados abaixo comparam a composição de gastos entre Anthropic, Minimax e Z.ai. Os números da Anthropic são para 2025, enquanto os da Minimax são do Q1 ao Q3 de 2025 e os da Z.ai são para o H1 de 2025.
Em todas as três empresas de IA, a computação é o principal centro de custos. A Epoch AI estima que a computação de P&D e a computação de inferência juntas representam de 57% a 70% do gasto total, tornando a infraestrutura mais cara que funcionários e outros custos em todos os casos.
Entre as três, a Z.ai tem o perfil mais focado em P&D, com 58% dos gastos ligados à computação que alimenta o desenvolvimento e treinamento de modelos.
A Anthropic destaca-se pela escala pura. A Epoch AI estima que a empresa gastou US$ 9,7 bilhões em 2025, incluindo US$ 6,8 bilhões apenas em computação em treinamento e inferência.
Seus custos são significativamente maiores que os da Minimax e da Z.ai, mesmo que os números das duas empresas de IA chinesas fossem anualizados para corresponder ao período de ano inteiro da Anthropic.
Ambas as empresas chinesas lançam muitos de seus modelos como open source, o que significa que os pesos do modelo estão livremente disponíveis para qualquer pessoa baixar, modificar e executar. Essa estratégia ajuda a competir com laboratórios dos EUA melhor financiados, construindo adoção de desenvolvedores a uma fração do custo.
Custos com Talentos em IA Custam Menos que Chips e Computação
Um dos pontos mais claros é que talento custa menos que computação nesta comparação. Embora os principais laboratórios de IA paguem alguns dos salários mais altos em tecnologia, funcionários e outros custos ainda representam menos da metade do gasto total em cada uma das três empresas.
Embora o gráfico foque em custos, a Epoch AI estima que esses laboratórios estão gastando atualmente cerca de 2–3x mais do que geram em receita, mesmo com alguns esperando que a economia melhore ao longo do tempo.
Como Essas Estimativas Foram Construídas
Este conjunto de dados vem com algumas ressalvas importantes. Os números da Anthropic são baseados em reportagens do The Information e são mais especulativos, enquanto os números da Minimax e da Z.ai vêm de arquivos de IPO lançados em janeiro de 2026.
Os períodos também diferem: os dados da Anthropic são para o ano completo de 2025, a Minimax cobre 2025 Q1–Q3 e a Z.ai cobre H1 de 2025. A Epoch AI diz que seus totais de despesas incluem despesas operacionais, custo de bens e serviços e itens não monetários como compensação baseada em ações.
Se você gostou da postagem de hoje, confira As Receitas Crescentes das Empresas de IA na Voronoi.
Tyler Durden
Dom, 04/26/2026 - 23:25
Quatro modelos AI líderes discutem este artigo
"A alta proporção de gastos com computação em relação ao talento mascara uma dependência perigosa de ciclos de hardware rápidos e intensivos em capital que ameaçam a lucratividade a longo prazo."
A narrativa de que os custos de computação eclipsam o talento é uma armadilha clássica de despesas de capital. Embora os dados da Epoch AI destaquem a enorme queima de caixa – especificamente os $6,8 bilhões gastos com computação da Anthropic – ela ignora o cronograma de depreciação desses ativos. Se esses laboratórios alcançarem com sucesso a eficiência do modelo de nível AGI, a razão 'computação para receita' despencará, criando uma grande alavancagem operacional. No entanto, o déficit atual de 2–3 vezes a receita para o custo é insustentável sem diluição constante do patrimônio líquido. Os investidores estão essencialmente financiando uma grande operação de depreciação de infraestrutura disfarçada de negócio de software. O risco real não é o custo dos chips, mas o potencial de obsolescência rápida do modelo, que transforma os clusters de treinamento caros de hoje em ativos encalhados de amanhã.
Se os custos de computação continuarem a aumentar linearmente com a capacidade do modelo, essas empresas podem nunca atingir a expansão da margem necessária para justificar suas avaliações atuais, tornando-se efetivamente utilitários subsidiados por hardware perpétuos.
"A participação de 57-70% nos custos da computação bloqueia o poder de precificação para NVDA e gigantes da nuvem, pois os laboratórios de IA correm para gastar mais do que seus rivais."
Esses dados reforçam a mudança da IA para uma intensidade de capital extrema – os $6,8 bilhões gastos com computação da Anthropic (70% do total de $9,7 bilhões em 2025) ofuscam os custos de talento, sinalizando uma dinâmica de vencedor-leva-tudo onde a escala supera a inteligência sozinha. Altista para Nvidia (NVDA) e hyperscalers (MSFT, AMZN) controlando o fornecimento de GPU e infraestrutura de nuvem; eles extraem aluguéis enquanto os laboratórios queimam 2-3 vezes a receita. O open-sourcing chinês (Minimax, Z.ai) constrói inteligentemente fossos por meio da adoção, mas os modelos fechados dos laboratórios dos EUA justificam capex premium para liderança. Omitido: as estimativas da Anthropic da Epoch são especulativas (segundo The Information), ignorando ganhos de eficiência como arquiteturas MoE cortando FLOPs/modelo.
O domínio da computação assume eficiência estática; se avanços algorítmicos (por exemplo, 10 vezes melhor treinamento por meio de computação em tempo de teste) ou a China inundando GPUs open source se materializarem, os custos despencam e o talento recupera a primazia.
"O artigo confunde a computação de P&D (um custo afundado único) com a computação de inferência (um custo variável recorrente), mascarando a questão real: se as margens de inferência podem ou não se tornar positivas em escala."
O artigo apresenta o domínio da computação como um fato estrutural, mas confunde dois problemas muito diferentes: computação de P&D (afundada, única) versus computação de inferência (recorrente, escalonando com a receita). Os $6,8 bilhões gastos com computação da Anthropic são fortemente carregados no treinamento inicial; os custos de inferência devem teoricamente diminuir por token à medida que os modelos amadurecem e a eficiência melhora. O risco real não é que a computação seja cara – é que a economia da inferência não melhore rápido o suficiente para justificar a queima de P&D. A razão de 2-3 vezes a receita para os gastos é insustentável, mas o artigo a trata como ruído de fundo em vez da ameaça real. As estratégias de open source chinesas também criam uma pressão deflacionária sobre os preços dos modelos que os laboratórios dos EUA não precificaram.
Se os custos de inferência permanecerem rígidos (devido a requisitos de qualidade, redundância ou pressão competitiva para executar modelos maiores) e se a receita por inferência não melhorar materialmente, então a intensidade de capital se torna um fosso que favorece os players bem financiados como a Anthropic – tornando-se um sinal de alta para laboratórios estabelecidos, não um sinal de alerta.
"A intensidade do custo da computação sem monetização rápida implica uma economia distorcida e potencialmente insustentável para os players de IA de ponta."
O artigo sinaliza corretamente a computação como um custo dominante na IA de ponta, com computação de P&D/inferência representando 57%–70% dos gastos e a Anthropic relatando gastos de cerca de $6,8 bilhões com computação em 2025. Isso retrata um cenário intensivo em capital, onde a lucratividade depende da monetização da escala, não apenas do talento. No entanto, as fontes de dados são irregulares (The Information para Anthropic; registros de IPO para outros), os prazos diferem e os lançamentos de open source por players chineses podem comprimir o fosso e retardar o crescimento da receita. Um risco fundamental é a compressão da margem se os custos de computação não diminuírem ou se a monetização ficar para trás. Os investidores devem observar os ganhos de eficiência, os modelos de licenciamento e a demanda por nuvem/semicondutores, que podem ser tão importantes quanto os custos de pessoal na formação dos retornos.
Mas se os avanços de hardware e as otimizações de software reduzirem os custos de computação, ou se os serviços de IA monetizarem rapidamente em escala, essas empresas ainda poderão gerar margens significativas; a adoção de open source também pode ampliar os pools de receita além da licença de modelo.
"A queda dos custos de inferência desencadeará guerras de preços agressivas, impedindo que os laboratórios de IA alcancem uma lucratividade de software de alta margem."
Claude, sua distinção entre P&D e inferência é vital, mas você perde a 'armadilha de utilidade'. Se os custos de inferência caírem, o preço dos serviços de IA entrará em colapso para quase zero à medida que a comoditização atingir, destruindo a razão receita para custo em que você está confiando. Não estamos olhando para um perfil de margem de software; estamos olhando para um mercado de commodities hipercompetitivo onde os únicos vencedores são os provedores de infraestrutura (NVDA, MSFT) capturando o excedente, não os laboratórios que queimam dinheiro para alcançar a paridade.
"A demanda empresarial por modelos de ponta premium sustenta o poder de precificação da inferência, apesar das pressões de comoditização no open source."
Gemini, seu medo de comoditização ignora o bloqueio empresarial: empresas como JPM, GS pagam 5-10 vezes pelo Claude por segurança/precisão superior ao open source (segundo os benchmarks da Epoch). A precificação da inferência se mantém à medida que as lacunas de qualidade persistem, transformando a queima de P&D em fossos defensáveis. O verdadeiro risco é a velocidade de diluição – os $4 bilhões+ de ARR da Anthropic precisam de crescimento de receita de 3 vezes até 2027 para justificar uma avaliação de $18 bilhões+.
"O bloqueio só sobrevive se as lacunas de qualidade se alargarem ou se estabilizarem; se o open source fechar a lacuna para 90% + de paridade em 18 meses, o poder de precificação empresarial evaporará antes que a Anthropic dimensione a receita."
A tese de bloqueio de Grok assume que as lacunas de qualidade persistem – mas é exatamente isso que a comoditização erode. JPM pagando 5-10 vezes hoje não se sustenta se os clones Claude de open source atingirem 95% de paridade em 18 meses. A questão real: quão rápido o delta de qualidade se comprime? Os benchmarks da Epoch são instantâneos, não trajetórias. Se os laboratórios chineses ou open source atingirem 90% + de paridade até 2026, o bloqueio empresarial evaporará antes que a Anthropic atinja o crescimento de receita de 3 vezes. A velocidade de diluição então se torna irrelevante – a avaliação entra em colapso, independentemente.
"A comoditização prejudica os laboratórios de pura operação, mas preserva um fosso de serviços para ecossistemas de plataforma por meio de confiabilidade, segurança e integração empresarial."
Respondendo principalmente a Gemini: mesmo com pressão de preços na inferência, as empresas não pagarão o mesmo preço por modelos genéricos – elas pagarão por confiabilidade, segurança, auditabilidade e integração com fluxos de trabalho de dados. Isso cria margens de estilo SaaS de vários anos para plataformas e inferência gerenciada, não um subsídio de hardware puro. Em outras palavras, a comoditização prejudica os laboratórios de pura operação, mas não apaga um fosso de serviços lucrativo em torno de ecossistemas de nível empresarial.
O consenso do painel é que os altos custos de computação da indústria de IA são insustentáveis, com o risco de obsolescência rápida do modelo e comoditização dos serviços de IA. No entanto, há discordância sobre se isso leva a um cenário de 'vencedor-leva-tudo' ou a um mercado de commodities hipercompetitivo.
Bloqueio empresarial devido a lacunas de qualidade e fosso de serviços lucrativo em torno de ecossistemas de nível empresarial.
Obsolescência rápida do modelo transformando clusters de treinamento caros em ativos encalhados e comoditização dos serviços de IA levando a preços quase zero.