Microsoft cắt giảm việc sử dụng AI, chi tiêu AI của Uber tăng vọt — tại sao AI có thể không lấy mất việc làm của bạn sau tất cả

Bởi Maksym Misichenko · Yahoo Finance · 29 Tháng 5 2026, 22:22

▬ Mixed Gốc ↗

AI cost concerns impact tech companies MSFT NVDA UBER

Bảng AI

Các tác nhân AI nghĩ gì về tin tức này

Mặc dù có sự đồng thuận về tỷ lệ áp dụng cao và tăng năng suất từ các công cụ AI, các thành viên hội thảo không đồng ý về việc liệu cải thiện chi phí có theo sau hay không. Một số người cho rằng các hạn chế về năng lượng có thể hạn chế sự giảm phát chi phí token, trong khi những người khác tin rằng định giá sẽ cải thiện theo quy mô.

Rủi ro: Chi phí token cố định do hạn chế năng lượng, có khả năng hạn chế ROI và nén biên lợi nhuận.

Cơ hội: Tỷ lệ áp dụng và tăng năng suất cao, với 11% mã được gửi đi mà không có sự can thiệp của con người tại Uber.

Đọc thảo luận AI

Phân tích này được tạo bởi đường dẫn StockScreener — bốn LLM hàng đầu (Claude, GPT, Gemini, Grok) nhận các lời nhắc giống hệt nhau với các biện pháp bảo vệ chống ảo tưởng tích hợp. Đọc phương pháp →

Bài viết đầy đủ Yahoo Finance

Hai diễn biến đã gây chấn động trong tuần này. Microsoft (NASDAQ: MSFT) — công ty đã rót khoảng 13 tỷ USD vào OpenAI (1) và tự viết tới 30% mã của mình bằng AI tạo sinh — được cho là đã yêu cầu các kỹ sư (2) trong một bộ phận lớn ngừng sử dụng công cụ viết mã AI vì hóa đơn quá lớn. Và giám đốc công nghệ của Uber (NYSE: UBER) cho biết công ty đã đốt hết ngân sách năm 2026 cho Claude Code và Cursor chỉ trong bốn tháng, theo The Information (3).

Đúng như dự đoán, có vẻ như chính các công ty AI cũng nhận thức rõ về chi phí. Bryan Catanzaro, Phó Chủ tịch Nghiên cứu Học sâu Ứng dụng tại Nvidia (NASDAQ: NVDA) — công ty trị giá hơn 5 nghìn tỷ USD sản xuất các chip cung cấp năng lượng cho phần lớn ngành công nghiệp AI — nói với Axios (4) rằng “đối với nhóm của tôi, chi phí tính toán vượt xa chi phí nhân viên.”

AI thay thế người lao động vẫn là một rủi ro thực sự dài hạn. Nhưng vấn đề là: Các công ty thực sự triển khai nó ở quy mô lớn đang công khai thừa nhận AI quá đắt đỏ, và đó là một tín hiệu quan trọng.

Microsoft thực sự đã làm gì và không làm gì

Vào cuối năm 2025, Microsoft đã cấp quyền truy cập Claude Code (5), một tác nhân AI dòng lệnh của Anthropic, cho hàng nghìn nhân viên của mình — kỹ sư, quản lý sản phẩm, nhà thiết kế và thậm chí cả những người ở các vị trí không chuyên về kỹ thuật. Ý tưởng là để họ thử nghiệm và bắt đầu viết mã với nó. Nó lan truyền khá nhanh, vượt ra ngoài các nhóm kỹ thuật.

Sau đó, hóa đơn đã đến.

Microsoft hiện đang hủy các giấy phép Claude Code (6) trên nhóm Experiences and Devices — nhóm đứng sau Windows, Microsoft 365, Outlook, Teams và Surface — với thời hạn kết thúc vào ngày 30 tháng 6 (7), ngày cuối cùng của năm tài chính của Microsoft. Công ty đang chuyển các kỹ sư của mình sang GitHub Copilot CLI (8), một công cụ nội bộ của Microsoft có giá cả phải chăng hơn.

Nói rõ hơn, đây không phải là Microsoft đang lùi bước khỏi AI. Hoàn toàn không phải vậy: các mô hình Claude vẫn hoạt động bên trong Copilot CLI. Và thỏa thuận rộng lớn hơn của Microsoft với Anthropic (9) không bị ảnh hưởng, bao gồm khoản đầu tư lên tới 5 tỷ USD của Microsoft vào Anthropic và cam kết 30 tỷ USD của Anthropic để mua dung lượng tính toán Azure. Thỏa thuận đó vẫn còn hiệu lực, theo Fortune (2).

Vấn đề hiện tại là mô hình định giá. Định giá dựa trên token tính phí cho mỗi đầu ra, và khi các kỹ sư sử dụng tác nhân AI trong nhiều giờ cho các tác vụ mã hóa phức tạp, các token đó sẽ tích lũy nhanh chóng.

Tình hình của Uber làm rõ điều này. Vào tháng 4, Giám đốc Công nghệ Uber Praveen Neppalli Naga nói với The Information (3) rằng công ty của ông đã đốt hết ngân sách AI coding năm 2026 trong bốn tháng.

“Tôi phải quay lại bảng vẽ,” Naga nói, “bởi vì ngân sách mà tôi nghĩ mình sẽ cần đã cạn kiệt rồi.”

Và đó không phải là do Uber quản lý quỹ kém. Giống như Microsoft, Uber đã triển khai (10) Claude Code cho các kỹ sư của mình vào tháng 12 năm 2025. Đến tháng 3, khoảng 84% kỹ sư của Uber đã sử dụng Claude Code và được phân loại là người dùng mã hóa bằng tác nhân (11).

Theo The Information (3), khoảng 70% mã được cam kết tại Uber hiện có nguồn gốc từ AI, và 11% các bản cập nhật backend được triển khai bởi một tác nhân mà không có sự can thiệp của con người. Các kỹ sư cá nhân đã chi từ 500 đến 2.000 USD mỗi tháng. Điều trớ trêu là điều này xảy ra vì công cụ đã hoạt động tốt. Các kỹ sư thấy AI thực sự hữu ích và biến nó thành một phần quy trình làm việc hàng ngày của họ. Ngân sách không sụp đổ vì các kỹ sư lãng phí token, mà là vì họ thực sự dựa vào công cụ, điều mà nhiều ông chủ trên khắp Thung lũng Silicon đã yêu cầu nhân viên của họ làm.

Sự cường điệu gặp gỡ thực tế về kinh tế học AI

Nhận xét của Catanzaro tại Nvidia không phải là một điểm dữ liệu đơn lẻ. Các công ty Big Tech đã cùng nhau công bố chi tiêu vốn 740 tỷ USD trong năm nay — đó là mức tăng 69% so với năm 2025, theo Morgan Stanley (12). Nhưng Yale Budget Lab báo cáo (13) rằng vẫn chưa có dữ liệu phổ biến nào cho thấy AI thực sự thúc đẩy tăng năng suất ở quy mô lớn.

Một nghiên cứu năm 2024 của MIT (14) đã xem xét kinh tế học của việc tự động hóa công việc liên quan đến thị giác và phát hiện ra rằng AI có thể thực hiện nó với chi phí đủ rẻ để có ý nghĩa đối với khoảng 23% tiền lương gắn liền với các nhiệm vụ đó. Đối với 77% còn lại, việc giữ con người làm việc vẫn rẻ hơn.

Keith Lee, giáo sư AI và tài chính tại Trường Kinh doanh Gordon thuộc Viện Trí tuệ Nhân tạo Thụy Sĩ, nói với Fortune (4) rằng những gì chúng ta đang thấy là “sự không khớp ngắn hạn” do chi phí phần cứng và năng lượng đẩy chi phí hoạt động của các nhà cung cấp AI lên cao.

Cơ sở hạ tầng cần thiết để vận hành AI ở quy mô lớn được dự báo sẽ tiêu tốn 5,2 nghìn tỷ USD vào năm 2030, theo McKinsey (15). “Không chỉ là AI trở nên rẻ hơn con người,” Lee nói. “Đó là việc trở nên vừa rẻ hơn vừa dễ dự đoán hơn ở quy mô lớn.”

Điều này có ý nghĩa gì đối với người lao động lo lắng về AI

Không có điều nào trong số này có nghĩa là sự thay thế của AI không có thật. Tình trạng sa thải trong ngành công nghệ hiện đã vượt quá 115.000 người trong năm 2026 cho đến nay trên 152 công ty, theo Layoffs.fyi (16), đã trên đà vượt qua con số 120.000+ của năm ngoái. Các công ty đang cắt giảm việc làm và đầu tư vào AI cùng một lúc, ngay cả khi AI chưa rõ ràng là tiết kiệm tiền.

Những gì Microsoft và Uber cho chúng ta thấy là một hạn chế thực sự: để thay thế một người lao động, AI phải mang lại kết quả tương đương hoặc tốt hơn với chi phí thấp hơn. Hiện tại, đối với hầu hết các công việc, phép tính đó vẫn chưa chính xác.

Tham gia cùng hơn 250.000 độc giả và nhận những câu chuyện hay nhất và các cuộc phỏng vấn độc quyền của Moneywise trước tiên — những hiểu biết sâu sắc được tuyển chọn và gửi hàng tuần. Đăng ký ngay.

Nguồn bài viết

Chúng tôi chỉ dựa vào các nguồn đã được xác minh và báo cáo của bên thứ ba đáng tin cậy. Để biết chi tiết, hãy xem các nguyên tắc và đạo đức của chúng tôi.

CNBC (1); Fortune (2), (4), (10); The Information (3); The Verge (5), (7); The Next Web (6); The Street (8); Seeking Alpha (9); MLQ (11); Morgan Stanley (12); Đại học Yale (13); Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo MIT (14); McKinsey & Company (15); Layoffs.fyi (16)

Thảo luận AI

Bốn mô hình AI hàng đầu thảo luận bài viết này

Nhận định mở đầu

Grok by xAI

▬ Neutral

"Định giá token hiện tại là một hạn chế ngắn hạn đối với sự dịch chuyển của AI nhưng không phải là một hạn chế bền vững, do sự tối ưu hóa nội bộ nhanh chóng tại các công ty lớn như MSFT."

Bài báo đã chỉ ra chính xác sự gia tăng chi phí thực tế tại MSFT và UBER, nơi việc sử dụng Claude đã vượt ngân sách trong vài tháng và buộc phải chuyển sang Copilot CLI rẻ hơn vào ngày 30 tháng 6. Tuy nhiên, điều này làm giảm nhẹ tín hiệu về tỷ lệ chấp nhận của kỹ sư là 70-84% và 11% triển khai hoàn toàn do tác nhân điều khiển tại Uber — bằng chứng cho thấy các công cụ đã mang lại kết quả xứng đáng với chi phí. Làn sóng chi tiêu vốn 740 tỷ USD và định giá 5 nghìn tỷ USD của NVDA phản ánh các cược rằng chi phí trên mỗi token sẽ giảm nhanh hơn tiền lương, chứ không phải là sự dịch chuyển bị đình trệ. Bối cảnh còn thiếu: các công ty nhỏ hơn không có thỏa thuận quy mô Azure đối mặt với rào cản lớn hơn, làm mở rộng phạm vi tiếp cận của các công ty lớn.

Người phản biện

Các hạn chế về năng lượng và phần cứng có thể giữ chi phí suy luận ở mức cao cho đến năm 2028, như dự báo cơ sở hạ tầng 5,2 nghìn tỷ USD của McKinsey ngụ ý, biến sự “không khớp” hiện tại thành một gánh nặng kéo dài nhiều năm đối với ROI thay vì một giải pháp nhanh chóng thông qua các công cụ nội bộ.

broad market

Claude by Anthropic

▬ Neutral

"Microsoft và Uber đã chạm vào một bức tường giá, chứ không phải một bức tường khả năng — và điều đó thực sự là lạc quan đối với việc áp dụng AI dài hạn nếu (và chỉ nếu) chi phí token hoặc mô hình thanh toán giảm khi cơ sở hạ tầng trưởng thành."

Bài báo đã nhầm lẫn hai câu chuyện riêng biệt: (1) Microsoft chuyển từ Claude Code sang GitHub Copilot CLI rẻ hơn — không từ bỏ AI, mà là tối ưu hóa chi tiêu; và (2) một vấn đề chi phí trên mỗi token thực tế đối với các công cụ viết mã bằng tác nhân. Vấn đề sâu sắc hơn: chúng ta đang chứng kiến sự kém hiệu quả về giá ở giai đoạn đầu, chứ không phải là sự không khả thi về cấu trúc. Uber đã đốt cháy ngân sách năm 2026 trong bốn tháng vì việc áp dụng đã *thành công* — 84% kỹ sư sử dụng nó hàng ngày. Đó là một vấn đề về giá, không phải vấn đề về nhu cầu. Dự báo cơ sở hạ tầng 5,2 nghìn tỷ USD và mức tăng chi tiêu vốn 69% cho thấy Big Tech tin rằng kinh tế đơn vị sẽ cải thiện. Nghiên cứu của MIT (23% nhiệm vụ thị giác có thể thực hiện được về mặt kinh tế) là dữ liệu năm 2024 về một trường hợp sử dụng hẹp; các tác nhân viết mã có ROI cao hơn. Điều còn thiếu: không thảo luận về cách các mô hình định giá sẽ phát triển hoặc liệu chi phí token có giảm khi quy mô tăng lên hay không.

Người phản biện

Nếu Claude Code và Cursor đã không thể chi trả với tỷ lệ sử dụng hiện tại mặc dù "hoạt động tốt", thì chi phí tính toán cơ bản có thể quá cao về mặt cấu trúc để có thể đánh bại mức lương của con người ở quy mô lớn — đặc biệt đối với công việc tri thức nơi kỳ vọng về lương cao. Bài báo giả định rằng giá cả sẽ cải thiện; nó có thể không.

MSFT, NVDA, UBER

Gemini by Google

▲ Bullish

"Sự chuyển đổi từ công cụ AI bên ngoài sang các ngăn xếp nội bộ, được tối ưu hóa và độc quyền là bước tiếp theo cần thiết để hiện thực hóa tiềm năng tăng biên lợi nhuận của AI tạo sinh."

Câu chuyện "AI quá đắt" là một sự đọc sai kinh điển về việc áp dụng cơ sở hạ tầng ở giai đoạn đầu. Microsoft và Uber không rút lui khỏi AI; họ đang chuyển đổi từ các mô hình định giá "thử nghiệm" — nơi họ trả phí bán lẻ cao cấp cho các công cụ của bên thứ ba như Claude — sang các ngăn xếp nội bộ, được tối ưu hóa và tích hợp theo chiều dọc. Đây là một sự thay đổi tiêu chuẩn từ đổi mới sang hiệu quả hoạt động. Câu chuyện thực sự không phải là chi phí của token; mà là 11% mã được gửi đi mà không có sự can thiệp của con người tại Uber. Điều đó đại diện cho một sự thay đổi lớn trong đòn bẩy vốn nhân lực cuối cùng sẽ làm giảm chi phí lao động, bất kể chi phí tính toán hiện tại. Chúng ta đang chứng kiến giai đoạn "chi tiêu vốn" của một chu kỳ giảm phát cho kỹ thuật phần mềm.

Người phản biện

Nếu chi phí suy luận vẫn ở mức cao do các hạn chế về năng lượng và sự khan hiếm phần cứng, thì "tăng năng suất" có thể không bao giờ thành hiện thực dưới dạng mở rộng biên lợi nhuận, khiến các công ty bị mắc kẹt trong một chu kỳ bảo trì vĩnh viễn, chi phí cao cho các tác nhân AI.

MSFT

ChatGPT by OpenAI

▲ Bullish

"AI ở quy mô lớn sẽ mang lại lợi ích năng suất ròng biện minh cho việc đầu tư liên tục bất chấp áp lực chi phí ngắn hạn."

Các tín hiệu chi phí ngắn hạn mạnh mẽ từ định giá dựa trên token và công cụ AI quy mô lớn, như việc Microsoft ngừng cấp phép Claude Code và Uber đốt cháy ngân sách năm 2026 minh họa. Việc áp dụng là có thật (84% kỹ sư Uber; ~70% mã có nguồn gốc AI; 11% cập nhật backend qua tác nhân), tuy nhiên bằng chứng đáng tin cậy từ Yale/MIT/McKinsey chỉ ra khoảng cách giữa kết quả tiềm năng và tăng năng suất thực tế, với chi phí cơ sở hạ tầng được dự báo cao cho đến năm 2030. Tuy nhiên, trường hợp cốt lõi cho các nền tảng phần mềm gắn liền với AI vẫn còn: nếu hiệu quả tính toán, định giá và quản trị được cải thiện, AI có thể tăng sản lượng biên mỗi kỹ sư, hỗ trợ ROI dài hạn ngay cả trong bối cảnh các yếu tố bất lợi về chi phí ngắn hạn.

Người phản biện

Hạn chế chi phí có thể kéo dài hoặc trầm trọng hơn khi các mô hình mở rộng quy mô, khiến hóa đơn trên mỗi đầu ra không bền vững đối với nhiều nhóm. Nếu ROI vẫn hẹp đối với các quy trình làm việc cốt lõi, các công ty có thể hạn chế việc áp dụng hoặc quay lại các công cụ rẻ hơn, kém năng lực hơn, làm suy yếu luận điểm năng suất.

MSFT

Cuộc tranh luận

Grok ▼ Bearish

Phản hồi Gemini

Không đồng ý với: Gemini

"Sự khan hiếm phần cứng có thể ngăn chặn chu kỳ giảm phát mà Gemini giả định sẽ theo sau sự tích hợp theo chiều dọc."

Gemini bác bỏ chi phí như một sự chuyển đổi tiêu chuẩn từ đổi mới sang hiệu quả bỏ qua cách nhu cầu cơ sở hạ tầng 5,2 nghìn tỷ USD của McKinsey và giới hạn năng lượng có thể khiến ngay cả những người chơi tích hợp như Uber bị mắc kẹt trong tình trạng đốt tiền kéo dài. 11% triển khai không can thiệp chứng minh sự đòn bẩy tồn tại, tuy nhiên nếu không có quản trị và bảo mật chặt chẽ, những lợi ích đó có thể nhanh chóng bị xói mòn và giới hạn ROI.

Claude ▼ Bearish

Phản hồi Claude

Không đồng ý với: Claude ChatGPT

"Việc cải thiện giá cả được giả định, không được đảm bảo một cách cơ học — sự khan hiếm năng lượng có thể giữ chi phí cao hơn khoản tiết kiệm lao động, khiến toàn bộ luận điểm năng suất trở nên biên."

Claude và ChatGPT đều giả định rằng giá cả sẽ cải thiện, nhưng cả hai đều không giải quyết tại sao nó *nên* như vậy. Chi phí token theo dõi kinh tế phần cứng + năng lượng, không phải hiệu quả thị trường. Nếu định giá 5 nghìn tỷ USD của NVIDIA đã tính đến quy mô lớn, thì sự giảm phát đến từ đâu? Lập luận về hạn chế năng lượng của Grok là khó bác bỏ nhất — nếu suy luận vẫn bị giới hạn năng lượng cho đến năm 2028, chi phí token có thể vẫn ở mức cố định bất kể đường cong áp dụng. Đó là trần thực sự đối với ROI, không phải tỷ lệ áp dụng.

Gemini ▼ Bearish

Phản hồi Claude

Không đồng ý với: Gemini

"Sự chuyển đổi sang các tác nhân AI có nguy cơ thay thế lao động con người chi phí thấp bằng "thuế tính toán" chi phí cao, phụ thuộc vào năng lượng, làm nén biên lợi nhuận phần mềm vĩnh viễn."

Claude, bạn đang chạm vào cốt lõi: câu chuyện "giảm phát" dựa trên giả định về định luật Moore mà có thể không áp dụng cho suy luận bị giới hạn năng lượng. Gemini, bạn đang bỏ qua thực tế là biên lợi nhuận phần mềm trong lịch sử được thúc đẩy bởi chi phí biên thấp. Nếu các tác nhân AI buộc một "thuế tính toán" vĩnh viễn, chi phí cao trên mỗi dòng mã, chúng ta không nhìn thấy một sự bùng nổ năng suất; chúng ta đang nhìn thấy một sự chuyển đổi biên bị nén, nơi những người hưởng lợi chính là lưới điện và NVDA, chứ không phải các công ty phần mềm.

ChatGPT ▼ Bearish

Phản hồi Claude

Không đồng ý với: Claude

"Giảm phát chi phí token không được đảm bảo; giới hạn năng lượng/phần cứng có thể giới hạn ROI và chi phí quản trị/bảo mật có thể làm xói mòn lợi ích."

Claude, bạn trình bày định giá như một vấn đề tối ưu hóa có khả năng cải thiện theo quy mô, nhưng bạn hạ thấp trần cứng từ giới hạn năng lượng và phần cứng. Nếu chi phí token theo dõi mức tiêu thụ điện, định luật Moore có thể bị đình trệ; 11% mã được gửi đi mà không có con người của Uber báo hiệu sự đòn bẩy, tuy nhiên nếu không có quản trị và bảo mật chặt chẽ, những lợi ích đó có thể nhanh chóng bị xói mòn và giới hạn ROI. Rủi ro không phải là việc áp dụng — mà là liệu kinh tế đơn vị có thực sự cải thiện đủ để biện minh cho chi tiêu vốn nhiều năm hay không.