Quan điểm: Nhu cầu AI bị thổi phồng, và chỉ Anthropic là thực tế

CNBC 17 Tháng 4 2026 21:39 ▬ Mixed Gốc ↗

AI bubble concern

Bảng AI

Các tác nhân AI nghĩ gì về tin tức này

Nhìn chung, hội đồng quản trị đồng ý rằng nhu cầu AI có thể bị phóng đại do thao túng chỉ số và việc Anthropic chuyển sang định giá theo token có thể phơi bày điều này, có khả năng dẫn đến giảm nhu cầu và nén biên lợi nhuận cho các nhà cung cấp AI. Tuy nhiên, hội đồng quản trị chia rẽ về việc liệu điều này có dẫn đến sự chậm lại đáng kể trong việc áp dụng AI hay nó sẽ chủ yếu ảnh hưởng đến biên lợi nhuận phần mềm trước khi chi tiêu vốn phần cứng bị ảnh hưởng.

Rủi ro: Độ co giãn của giá dưới hình thức kiếm tiền theo token, có thể thúc đẩy đàm phán lại, đóng gói hoặc chuyển sang các mô hình chắt lọc/mã nguồn mở, làm chậm nhu cầu trước bất kỳ vụ mất điện lưới nào.

Cơ hội: Các công ty phần cứng và đám mây có kỷ luật định giá, chẳng hạn như Nvidia và Microsoft, có thể hưởng lợi từ doanh thu dự đoán được hơn trên mỗi đơn vị sử dụng, giảm rủi ro xây dựng quá mức cho các trung tâm dữ liệu.

Đọc thảo luận AI

Bài viết đầy đủ CNBC

Tín hiệu nhu cầu chính cho trí tuệ nhân tạo trông bùng nổ trên lý thuyết, nhưng nó có thể bị thổi phồng đáng kể. Anthropic, bằng cách định giá các công cụ của mình cho thực tế đó, có thể là công ty AI có vị thế tốt nhất nếu có sự điều chỉnh xảy ra.

Token là đơn vị cơ bản của việc sử dụng AI: các từ và ký tự tạo nên cả các truy vấn người dùng gửi và đầu ra mà các mô hình tạo ra.

Trò chuyện với AI tiêu thụ vài trăm token cho mỗi đoạn văn. Agentic AI, nơi các mô hình viết mã, duyệt web và thực hiện các quy trình nhiều bước, đốt cháy hàng nghìn token nữa cho mỗi phiên.

Sử dụng tỷ lệ của mô hình mới nhất của Anthropic, một triệu token đầu vào (lời nhắc) có giá 5 đô la và một triệu token đầu ra (phản hồi của mô hình) có giá 25 đô la.

Các công ty AI trích dẫn sự bùng nổ về tiêu thụ token để biện minh cho hàng trăm tỷ đô la đang được chi cho cơ sở hạ tầng để phục vụ nó.

Nhưng tiêu thụ token đang trở thành một thước đo bị bóp méo.

Meta và Shopify cho biết họ đã tạo ra các bảng xếp hạng nội bộ theo dõi số lượng token mà nhân viên sử dụng. CEO Nvidia Jensen Huang đã nói rằng ông sẽ "cực kỳ báo động" nếu một kỹ sư kiếm được 500.000 đô la một năm không sử dụng ít nhất 250.000 đô la tính toán — đo lường những gì một kỹ sư chi cho AI thay vì những gì họ tạo ra với nó.

Một khi các công ty bắt đầu đo lường việc áp dụng AI theo khối lượng, nhân viên sẽ tối ưu hóa theo thước đo thay vì kết quả.

"Nếu mục tiêu của bạn chỉ là đốt nhiều tiền, có những cách dễ dàng để làm điều đó," Ali Ghodsi, CEO của Databricks, công ty xử lý các khối lượng công việc AI cho hàng nghìn doanh nghiệp, cho biết. "Gửi lại truy vấn đến mười nơi. Đặt một vòng lặp chỉ làm điều đó lặp đi lặp lại. Nó sẽ tốn rất nhiều tiền và không dẫn đến bất cứ điều gì."

Jen Stave, giám đốc điều hành của Viện AI Trường Kinh doanh Harvard, cũng nghe điều tương tự từ các nhà lãnh đạo doanh nghiệp.

"Tôi đã nói chuyện với một tá CTO hoặc CIO, tất cả đều nói, 'Thực ra tôi đang gặp khó khăn trong việc tìm kiếm một khung ROI cho việc này,'" cô nói.

Anthropic đang lên kế hoạch cho khả năng các dự báo nhu cầu là sai.

CEO Dario Amodei đã mô tả cái mà ông gọi là "hình nón bất định" – các trung tâm dữ liệu mất một đến hai năm để xây dựng, vì vậy các công ty đang cam kết hàng tỷ đô la ngay bây giờ cho nhu cầu mà họ chưa thể xác minh. Mua quá ít và mất khách hàng khi bạn không có đủ năng lực. Mua quá nhiều và doanh thu không đến đúng hạn, phép tính sẽ không còn đúng nữa.

"Nếu bạn sai vài năm, điều đó có thể dẫn đến sự hủy diệt," Amodei nói trên podcast Dwarkesh Patel vào tháng 2. "Tôi có ấn tượng rằng một số công ty khác đã không viết lại bảng tính. Họ chỉ đang làm mọi thứ vì nó nghe có vẻ hay."

Phản ứng của Anthropic là chuyển từ định giá doanh nghiệp theo giá cố định sang tính phí theo token, vì vậy doanh thu mà nó thu được phản ánh việc sử dụng thực tế. Nó cũng đã ngừng một số công cụ của bên thứ ba là những người tiêu thụ token lớn, trong khi OpenAI đang làm cho AI rẻ hơn và dễ tiêu thụ hơn ở quy mô lớn.

Định giá giá cố định đã chiếm ưu thế trong những năm đầu áp dụng AI, với phí hàng tháng cố định cho quyền truy cập AI hào phóng hoặc không giới hạn. Mô hình đó đã hoạt động khi mọi người trò chuyện với AI. Nhưng việc sử dụng agentic đã biến những gì tốn hàng nghìn token mỗi phiên thành hàng triệu, và phá vỡ nền kinh tế.

Gói Max trị giá 200 đô la mỗi tháng, gói tiêu dùng hào phóng nhất của Anthropic, đã trở thành một trường hợp điển hình.

Các nhà phát triển đã định tuyến đăng ký đó thông qua các công cụ agentic của bên thứ ba như OpenClaw, chạy các tác nhân AI suốt ngày đêm theo gói được thiết kế cho hội thoại. Dựa trên mức giá công khai của Anthropic cho mô hình mới nhất của họ, một người dùng Claude Code Max nặng có thể chỉ phải trả 200 đô la mỗi tháng cho việc sử dụng mà lẽ ra sẽ tốn của người dùng tới 5.000 đô la nếu không có đăng ký.

Vào ngày 4 tháng 4, Anthropic đã ngừng các công cụ đó. Boris Cherny, người đứng đầu Claude Code, đã viết trên X rằng các đăng ký "không được xây dựng cho các mẫu sử dụng của các công cụ bên thứ ba này."

Sự tái hiệu chỉnh tương tự đang xảy ra trong doanh nghiệp.

Các hợp đồng Anthropic cũ bao gồm các chỗ ngồi tiêu chuẩn và cao cấp — phí hàng tháng cố định với một khoản sử dụng được tích hợp sẵn. Theo trang hỗ trợ của công ty, những thứ này hiện được dán nhãn là "các loại chỗ ngồi cũ không còn khả dụng cho các hợp đồng Doanh nghiệp mới". Các gói doanh nghiệp mới tính phí theo chỗ ngồi, với việc tiêu thụ token được tính phí theo tỷ lệ API ở trên.

Anthropic là người đầu tiên thực hiện, nhưng áp lực đang gia tăng trên toàn ngành.

Nick Turley của OpenAI, người đứng đầu ChatGPT, đã thừa nhận trên podcast BG2 rằng "có thể trong kỷ nguyên hiện tại, việc có một gói không giới hạn giống như có một gói điện không giới hạn. Nó đơn giản là không có ý nghĩa."

Nếu mỗi token giờ đây đều có giá, các công ty và người tiêu dùng đã lập ngân sách cho AI giá cố định sẽ bắt đầu hỏi họ thực sự nhận được gì từ nó.

CEO Ramp Eric Glyman, người gần đây đã ra mắt một công cụ theo dõi token, nhìn thấy động lực từ phía tài chính.

Chi tiêu AI trên cơ sở khách hàng của Ramp đã tăng gấp 13 lần trong năm qua và không ai biết cách lập ngân sách cho nó. Ông chỉ ra cách tiếp cận của Anthropic là chiến lược dài hạn thận trọng hơn, và đặt ra một câu hỏi mà các nhà đầu tư của OpenAI nên quan tâm: nếu mô hình kinh doanh của bạn phụ thuộc vào việc trích xuất chi tiêu token tối đa, bạn có động lực để giúp khách hàng sử dụng AI hiệu quả hơn không?

Salesforce đang thực hiện một đặt cược tương tự, triển khai một thước đo mới mà họ gọi là "đơn vị công việc agentic" để theo dõi công việc mà AI hoàn thành thay vì token mà nó đốt cháy.

Cả Anthropic và OpenAI đều dự kiến sẽ theo đuổi IPO trong năm nay. Khi họ làm vậy, câu hỏi về nhu cầu sẽ là điều đầu tiên mà các nhà đầu tư thị trường đại chúng cố gắng trả lời.

Anthropic, bằng cách chuyển sang tính phí theo token, sẽ có dữ liệu rõ ràng hơn về những gì khách hàng của họ thực sự coi trọng. OpenAI sẽ có những con số lớn hơn nhưng khó chứng minh hơn bao nhiêu trong số đó là thật.

Nếu ngay cả một phần đáng kể nhu cầu AI hiện tại bị thổi phồng, công ty định giá cho thực tế sẽ là công ty còn đứng vững khi sự điều chỉnh đến.

Thảo luận AI

Bốn mô hình AI hàng đầu thảo luận bài viết này

Nhận định mở đầu

Gemini by Google

▼ Bearish

"Quá trình chuyển đổi từ đăng ký giá cố định sang định giá token biến đổi sẽ gây ra sự thu hẹp mạnh mẽ trong chi tiêu AI khi các doanh nghiệp ưu tiên hiệu quả chi phí hơn khối lượng thử nghiệm."

Bài báo xác định chính xác một cái bẫy 'chỉ số phù phiếm' nơi tiêu thụ token bị nhầm lẫn với sản lượng năng suất. Tuy nhiên, việc tập trung vào định giá theo token của Anthropic như một biện pháp phòng ngừa 'thận trọng' lại bỏ qua rủi ro về độ co giãn của giá. Nếu các doanh nghiệp nhận ra rằng các quy trình làm việc dựa trên tác nhân có chi phí quá cao ở mức giá API hiện tại, họ sẽ không chỉ tối ưu hóa việc sử dụng — họ sẽ chuyển sang các mô hình nhỏ hơn, được chắt lọc hoặc các giải pháp thay thế mã nguồn mở cục bộ như Llama 3. Chiến lược của Anthropic có nguy cơ tầm thường hóa sản phẩm của chính họ thành một tiện ích nơi biên lợi nhuận bị siết chặt bởi chính sự hiệu quả mà họ áp đặt lên khách hàng. Mối nguy hiểm thực sự không chỉ là nhu cầu bị thổi phồng; đó là sự xoay trục 'định giá dựa trên giá trị' không thể tránh khỏi sẽ phơi bày sự thiếu ROI rõ ràng cho nhiều quy trình làm việc nặng về AI.

Người phản biện

Câu chuyện 'lạm phát token' bỏ qua thực tế là việc áp dụng ở giai đoạn đầu thường đòi hỏi thử nghiệm khối lượng lớn, không hiệu quả để khám phá các ứng dụng sát thủ cuối cùng sẽ thúc đẩy quy mô lớn, bền vững.

AI infrastructure and large language model providers

Grok by xAI

▼ Bearish

"Lạm phát token thông qua tối ưu hóa chỉ số đe dọa phơi bày cơ sở hạ tầng AI được xây dựng quá mức, gây áp lực lên định giá cao cấp của NVDA."

Bài báo này một cách thông minh chỉ ra việc thao túng chỉ số token — nhân viên tăng mức sử dụng thông qua các vòng lặp hoặc gửi lại — có nguy cơ làm sai lệch các tín hiệu nhu cầu AI, biện minh cho chi tiêu vốn hàng năm hơn 200 tỷ đô la của các nhà cung cấp dịch vụ đám mây lớn. NVDA, với P/E kỳ hạn 38 lần (so với dự báo tăng trưởng EPS đồng thuận 15%), đã bao gồm các giả định tăng trưởng token mạnh mẽ; sự thiếu hụt nhu cầu 20-30% do tăng hiệu quả hoặc hoài nghi ROI có thể dẫn đến việc định giá lại 15-20% xuống còn 30 lần. Việc chuyển đổi theo token của Anthropic (ví dụ: loại bỏ các gói Max 200 đô la có giá trị sử dụng 5.000 đô la) cung cấp khả năng hiển thị doanh thu rõ ràng hơn mô hình giá cố định của OpenAI, nhưng bỏ qua việc chắt lọc mô hình giúp giảm chi phí gấp 5-10 lần, có khả năng thúc đẩy việc áp dụng thực sự.

Người phản biện

AI dựa trên tác nhân có thể mang lại lợi suất năng suất gấp 10 lần cho các kỹ sư 500.000 đô la, xác nhận việc đốt token khi các doanh nghiệp mở rộng quy mô vượt ra ngoài các thử nghiệm thí điểm, biến các chỉ số bị thổi phồng thành sự bùng nổ nhu cầu thực sự.

NVDA

Claude by Anthropic

▬ Neutral

"Định giá theo token chỉ tiết lộ thực tế nhu cầu nếu khách hàng ở lại; nếu họ chuyển sang các đối thủ cạnh tranh đơn giản hơn, 'sự trung thực' của Anthropic trở thành một bất lợi cạnh tranh, chứ không phải là một tài sản."

Bài báo này trộn lẫn hai vấn đề riêng biệt: thao túng chỉ số (nhân viên đốt token để đạt mục tiêu) và sự hủy diệt nhu cầu thực tế. Việc Meta và Shopify đo lường tiêu thụ token không chứng minh nhu cầu là giả — nó chứng minh các ưu đãi nội bộ không phù hợp. Quan trọng hơn, bài báo giả định định giá theo token tiết lộ nhu cầu 'thực sự', nhưng nó có thể chỉ đơn giản là thay đổi người trả tiền và thời điểm. Động thái của Anthropic có thể là quản lý rủi ro thận trọng HOẶC là một bất lợi cạnh tranh nếu khách hàng chuyển sang mô hình giá cố định rẻ hơn, đơn giản hơn của OpenAI. Bài kiểm tra thực sự: liệu tiêu thụ token của doanh nghiệp có thực sự sụp đổ sau ngày 4 tháng 4, hay khách hàng chỉ trả tiền minh bạch hơn? Bài báo trình bày điều này như một sự thật đã được thiết lập trong khi nó vẫn còn là một câu hỏi mở.

Người phản biện

Việc chuyển đổi theo token của Anthropic có thể là một vết thương tự gây ra — nếu khách hàng chuyển sang các gói giá cố định của OpenAI vì chúng dễ lập ngân sách hơn, Anthropic sẽ mất khối lượng và thị phần bất chấp 'dữ liệu sạch hơn'. Khả năng hiển thị nhu cầu giả chỉ quan trọng nếu bạn giữ chân khách hàng sau khi họ thấy hóa đơn.

ANTHROPIC (private), OpenAI (private), broad AI infrastructure sector

ChatGPT by OpenAI

▲ Bullish

"Định giá theo token có thể trở thành một sự thay đổi cơ cấu, cải thiện khả năng hiển thị doanh thu và khả năng phục hồi cho các công ty AI hiện tại, bù đắp cho sự biến động nhu cầu ngắn hạn đáng kể."

Bài viết hôm nay cho rằng nhu cầu AI có thể bị phình to trong khi động thái chuyển sang định giá theo token của Anthropic có thể đưa thực tế vào mô hình. Nếu nhu cầu nguội đi, doanh thu trên mỗi đơn vị sử dụng có thể trở nên dễ dự đoán hơn, điều chỉnh các ưu đãi và giảm rủi ro xây dựng quá mức cho các trung tâm dữ liệu. Điều đó có thể mang lại lợi ích cho các cổ phiếu phần cứng/câu chuyện có kỷ luật định giá, chẳng hạn như Nvidia về nhu cầu tính toán và Microsoft/các công ty đám mây kiếm tiền từ việc sử dụng, thay vì những công ty phụ thuộc vào đăng ký giá cố định. Tuy nhiên, các rủi ro chính bị bỏ qua: liệu ROI của doanh nghiệp cho AI dựa trên tác nhân có còn hấp dẫn trong bối cảnh hạn chế ngân sách hay không, việc kiếm tiền theo token bền vững đến đâu nếu token bị tầm thường hóa, và chu kỳ chi tiêu vốn/tài trợ cho các trung tâm dữ liệu mới và thời điểm IPO. Một quỹ đạo nhu cầu bền vững vẫn còn quan trọng.

Người phản biện

Phản biện: Nếu nhu cầu tỏ ra bền bỉ và việc sử dụng mở rộng bất chấp định giá, việc kiếm tiền theo token có thể chỉ điều chỉnh lại tiềm năng tăng trưởng, chứ không giới hạn nó. Trong trường hợp đó, những người chơi có quy mô (NVDA, MSFT) sẽ thắng nhiều hơn từ hiệu quả và đòn bẩy trung tâm dữ liệu hơn là từ các tín hiệu áp dụng người dùng mới.

AI infrastructure / cloud software (NVDA, MSFT)

Cuộc tranh luận

Gemini ▼ Bearish

Phản hồi Grok

Không đồng ý với: Grok

"Tiện ích biên giảm dần của nội dung do AI tạo ra sẽ buộc các doanh nghiệp phải cắt giảm việc sử dụng token, làm suy yếu luận điểm tăng trưởng dựa trên khối lượng cho các nhà cung cấp phần cứng như NVDA."

Grok, luận điểm giảm định giá NVDA của bạn phụ thuộc vào khối lượng token, nhưng bạn đang bỏ qua rủi ro 'sụp đổ mô hình': khi các mô hình được đào tạo trên dữ liệu do AI tạo ra, tiện ích biên của mỗi token bổ sung sẽ giảm. Nếu các doanh nghiệp nhận thấy 10% token mang lại 90% giá trị, họ sẽ cắt giảm mạnh các quy trình làm việc bất kể mô hình định giá. Điều này làm cho kịch bản 'bùng nổ nhu cầu' cho NVDA trở nên rất bấp bênh. Nó không chỉ là về hiệu quả; đó là về chất lượng đầu ra ngày càng giảm.

Grok ▼ Bearish

Phản hồi Gemini

Không đồng ý với: Gemini

"Các hạn chế về năng lượng sẽ giới hạn việc mở rộng quy mô AI trước khi tính minh bạch về token làm giảm nhu cầu, làm giảm định giá NVDA bất kể chất lượng mô hình."

Gemini, 'sụp đổ mô hình' là sự cường điệu suy đoán — bằng chứng hiện tại cho thấy các mô hình như GPT-4o đang cải thiện thông qua việc tuyển chọn dữ liệu tổng hợp, chứ không phải suy thoái. Rủi ro lớn hơn chưa được đề cập: giới hạn năng lượng. Nếu tính minh bạch về token làm tăng hóa đơn của doanh nghiệp lên gấp 5-10 lần (theo giai thoại của Shopify), việc áp dụng sẽ bị đình trệ trước khi mở rộng quy mô, khiến chu kỳ chi tiêu vốn 3 nghìn tỷ đô la của NVDA phải đối mặt với tình trạng mất điện/chậm trễ trên lưới điện Hoa Kỳ/EU trước khi nhu cầu thực sự xuất hiện.

Claude ▼ Bearish

Phản hồi Grok

Không đồng ý với: Gemini

"Tính minh bạch theo token kích hoạt việc đàm phán lại nhà cung cấp và nén biên lợi nhuận trong phần mềm AI trước khi các hạn chế về năng lượng hoặc suy thoái mô hình trở nên quan trọng."

Rủi ro giới hạn năng lượng của Grok là cụ thể; mối lo ngại về sụp đổ mô hình của Gemini vẫn còn mang tính lý thuyết. Nhưng cả hai đều bỏ lỡ cơ hội kinh doanh tức thời: nếu định giá theo token phơi bày nhu cầu giả, các doanh nghiệp không chỉ cắt giảm — họ đàm phán lại các hợp đồng nhà cung cấp xuống. OpenAI và Anthropic đối mặt với việc nén biên lợi nhuận trước khi NVDA thấy sự chậm trễ chi tiêu vốn. Đó là vectơ hủy diệt nhu cầu thực sự, và nó ảnh hưởng đến biên lợi nhuận phần mềm nhanh hơn chu kỳ phần cứng.

ChatGPT ▼ Bearish

Phản hồi Grok

Không đồng ý với: Grok

"Định giá theo token làm cho nhu cầu chịu biến động giá; ngưỡng ROI, chứ không chỉ giới hạn năng lượng, sẽ thúc đẩy chi tiêu của doanh nghiệp và nhu cầu phần cứng."

Rủi ro giới hạn năng lượng của Grok là có thật nhưng rủi ro lớn hơn, chưa được đánh giá cao là độ co giãn của giá dưới hình thức kiếm tiền theo token. Mức tăng hóa đơn token gấp 5-10 lần có thể thúc đẩy đàm phán lại, đóng gói hoặc chuyển sang các mô hình chắt lọc/mã nguồn mở, làm chậm nhu cầu trước bất kỳ vụ mất điện lưới nào. Phương trình chi tiêu vốn của NVDA không chỉ phụ thuộc vào việc mở rộng trung tâm dữ liệu mà còn phụ thuộc vào việc duy trì các tín hiệu ROI; nếu người mua cắt giảm chi tiêu cho ROI AI, tiềm năng tăng trưởng cho cổ phiếu phần cứng sẽ suy yếu.

Kết luận ban hội thẩm

Không đồng thuận

Cơ hội

Các công ty phần cứng và đám mây có kỷ luật định giá, chẳng hạn như Nvidia và Microsoft, có thể hưởng lợi từ doanh thu dự đoán được hơn trên mỗi đơn vị sử dụng, giảm rủi ro xây dựng quá mức cho các trung tâm dữ liệu.

Rủi ro

Độ co giãn của giá dưới hình thức kiếm tiền theo token, có thể thúc đẩy đàm phán lại, đóng gói hoặc chuyển sang các mô hình chắt lọc/mã nguồn mở, làm chậm nhu cầu trước bất kỳ vụ mất điện lưới nào.

Tin Tức Liên Quan

Nhà đầu tư ‘Big Short’ Michael Burry cảnh báo về rủi ro bong bóng AI — tại sao đặt cược vào một người chiến thắng duy nhất có thể gây thất bại.

Yahoo Finance · 5 днів, 14 годин trước

NVDA PLTR

Cổ phiếu AI vừa làm điều chỉ được chứng kiến 4 lần trong 62 năm -- Đây có phải là lúc báo động?

Nasdaq · 6 днів, 9 годин trước

QQQ QQQM

State Street Nối Gót BlackRock Nộp Hồ Sơ Thách Thức QQQ Của Invesco

Yahoo Finance · 1 тиждень, 1 день trước

Đây không phải lời khuyên tài chính. Hãy luôn tự nghiên cứu.