Google ra mắt các mô hình AI mới, tác nhân AI cá nhân trong nỗ lực theo kịp OpenAI và Anthropic
Bởi Maksym Misichenko · CNBC ·
Bởi Maksym Misichenko · CNBC ·
Các tác nhân AI nghĩ gì về tin tức này
Hội đồng chuyên gia chia rẽ về chiến lược AI Gemini của Google. Trong khi một số người nhìn thấy tiềm năng trong việc tăng cường sự tương tác của người dùng và các cơ hội kiếm tiền mới, những người khác lại cảnh báo về rủi ro nén biên lợi nhuận, thiếu số liệu về việc người dùng chấp nhận và các rào cản pháp lý.
Rủi ro: Nén biên lợi nhuận do tự động hóa đại lý làm giảm lượt hiển thị và lượt nhấp quảng cáo, cũng như các thách thức pháp lý đối với các tác vụ được đại lý hóa và phương tiện tổng hợp.
Cơ hội: Tăng cường sự tương tác của người dùng, các kênh kiếm tiền quảng cáo/sản phẩm mới và các giao dịch doanh nghiệp tiềm năng được thúc đẩy bởi kinh tế AI rẻ hơn.
Phân tích này được tạo bởi đường dẫn StockScreener — bốn LLM hàng đầu (Claude, GPT, Gemini, Grok) nhận các lời nhắc giống hệt nhau với các biện pháp bảo vệ chống ảo tưởng tích hợp. Đọc phương pháp →
Google đang triển khai phiên bản mới nhất của Gemini và một mô hình trí tuệ nhân tạo mới được thiết kế để mô phỏng thế giới vật lý, khi gã khổng lồ tìm kiếm chạy đua để theo kịp sự phát triển của mô hình, đồng thời cung cấp nhiều dịch vụ mang tính đại lý hơn cho cơ sở người dùng khổng lồ của mình.
Công ty đã đưa ra các thông báo tại hội nghị nhà phát triển Google I/O thường niên vào thứ Ba, thu hút sự chú ý cho các sản phẩm mới ra mắt vào thời điểm thị trường đang tập trung vào mức định giá tăng vọt của OpenAI và Anthropic, cả hai đều đang chuẩn bị IPO ngay trong năm nay.
Trọng tâm chiến lược AI của Google là Gemini, một bộ sưu tập các mô hình và công cụ của họ. Theo CEO Sundar Pichai, công ty đang giới thiệu Gemini 3.5 Flash, một phiên bản nhẹ hơn trong bộ sản phẩm của họ, cung cấp các khả năng tiên tiến với chi phí bằng một nửa, hoặc trong một số trường hợp gần bằng một phần ba, so với các mô hình tiên tiến tương đương.
Trong một buổi họp báo với các phóng viên trước sự kiện hôm thứ Ba, Pichai cho biết Gemini 3.5 Flash "nhanh đáng kinh ngạc". Công ty cho biết 3.5 Flash sẽ là mô hình mặc định cho ứng dụng Gemini và chế độ AI trong tìm kiếm trên toàn cầu.
"Bạn không còn phải đánh đổi chất lượng lấy độ trễ nữa," Google cho biết trong một bài đăng blog. Công ty cho biết họ đã tăng cường các biện pháp phòng thủ an ninh mạng cho Gemini 3.5 Flash, vì vậy nó "ít có khả năng tạo ra nội dung có hại và nhầm lẫn từ chối trả lời các truy vấn an toàn."
Google cho biết Gemini 3.5 Pro, phiên bản nặng hơn của họ, đang được sử dụng nội bộ, nhưng sẽ chưa sẵn sàng để phân phối rộng rãi cho đến tháng tới.
Về AI mang tính đại lý, Google đã công bố Gemini Spark, một tác nhân AI đa mục đích mới trong ứng dụng Gemini có thể suy luận trên thông tin trong các ứng dụng được kết nối. Google cho biết họ muốn giúp người dùng điều hướng cuộc sống kỹ thuật số của họ bằng cách "hành động thay mặt bạn theo chỉ đạo của bạn". Gemini Spark đang trong giai đoạn beta và sẽ có sẵn đầu tiên cho những người thử nghiệm đáng tin cậy và người đăng ký Google AI Ultra, bắt đầu từ tuần tới.
Với ngày càng nhiều người dùng internet chuyển sang chatbot, Google đang cố gắng thuyết phục người dùng tìm kiếm truyền thống rằng họ có thể tin tưởng để giúp họ thực hiện các tác vụ với ít đầu vào nhất. Sau chi tiêu vốn tăng vọt của công ty, Phố Wall đang tìm kiếm Google để chứng minh rằng họ có thể tạo ra các tích hợp sâu hơn trên các sản phẩm của mình, và các tác nhân có thể là một cách để làm điều đó.
Kỳ vọng đối với các công ty AI tiếp tục tăng lên, đặc biệt là khi xem xét mô hình Mythos gần đây của Anthropic, được cho là mạnh mẽ đến mức đã phát hiện ra hàng nghìn lỗ hổng chưa từng được biết đến trong cơ sở hạ tầng phần mềm của thế giới.
Danh mục AI của Google hiện bao gồm Omni, một mô hình thế giới được thiết kế để mô phỏng môi trường vật lý, dự đoán những gì xảy ra tiếp theo dựa trên hành động của người dùng. Các mô hình thế giới thường được sử dụng trong robot và trò chơi và đã được DeepMind nghiên cứu sâu rộng trong nhiều năm.
Công ty cho biết Omni sẽ hoạt động trên Flash, Ứng dụng Gemini, Google Flow và YouTube shorts, hỗ trợ hình ảnh và âm thanh, đồng thời bổ sung trong một bài đăng blog riêng rằng người dùng có thể yêu cầu Omni chỉnh sửa video và tạo ra hình ảnh chân thực hơn.
Bài đăng cho biết: "Hãy lấy một video bạn đã quay và chỉ cần yêu cầu Omni thay đổi những gì đang xảy ra". AI có thể "chỉnh sửa hành động, thêm các nhân vật hoặc đối tượng mới."
Bốn mô hình AI hàng đầu thảo luận bài viết này
"Google đang ưu tiên tích hợp hiệu quả chi phí hơn là sự vượt trội của mô hình tiên phong, điều này giới hạn tiềm năng định giá lại trong ngắn hạn bất chấp các thông báo."
Việc Google triển khai mặc định Gemini 3.5 Flash và bản beta tác nhân Gemini Spark nhắm đến việc tích hợp sâu hơn trên Tìm kiếm và ứng dụng, nhằm mục đích chuyển đổi người dùng truyền thống thành những người hoàn thành tác vụ AI. Tuy nhiên, sự chậm trễ của phiên bản 3.5 Pro nặng hơn cho đến tháng tới, nhấn mạnh vào giá thấp hơn thay vì hiệu suất vượt trội, và sự phụ thuộc vào cơ sở hạ tầng hiện có cho thấy sự tiến bộ theo từng bước thay vì bước nhảy vọt. Các tính năng chỉnh sửa video của Omni trong YouTube Shorts và Flow bổ sung tiện ích sáng tạo nhưng đối mặt với những rào cản về kiếm tiền trong bối cảnh chi tiêu vốn cao liên tục. Phố Wall sẽ xem xét kỹ lưỡng các chỉ số tiếp nhận tác nhân và bất kỳ sự gia tăng doanh thu sớm nào trước khi định giá lại GOOGL cao hơn.
Những bản phát hành có chừng mực này vẫn có thể đẩy nhanh sự tăng trưởng đăng ký và hiệu quả quảng cáo nhanh hơn dự kiến nếu việc sử dụng tác nhân mở rộng nhanh chóng, làm suy yếu quan điểm rằng Google vẫn còn tụt hậu về mặt cấu trúc.
"Google đã công bố các sản phẩm bảo vệ thị phần nhưng không đưa ra bằng chứng nào cho thấy chúng sẽ mở rộng thị phần hoặc biện minh cho việc đốt cháy chi tiêu vốn mà các nhà đầu tư đang xem xét."
Google đang thực hiện phòng thủ sản phẩm có năng lực, không phải tấn công. Gemini 3.5 Flash với chi phí bằng 1/2–1/3 so với đối thủ cạnh tranh nghe có vẻ hay cho đến khi bạn hỏi: liệu rẻ hơn có quan trọng nếu người dùng không chuyển đổi? Dấu hiệu thực sự là bản beta chỉ dành cho người đăng ký của Gemini Spark — đó là sự thận trọng, không phải sự tự tin. Omni (mô hình thế giới) rất thú vị nhưng chậm hơn nhiều năm so với những gì OpenAI và những người khác đang cung cấp. Bài báo trộn lẫn các thông báo với sự thu hút. Phố Wall muốn 'tích hợp sâu hơn' — Google chỉ cho thấy những tích hợp nông hơn. Không có số liệu về việc áp dụng Gemini, doanh thu trên mỗi người dùng hoặc việc sử dụng tác nhân. Câu chuyện chi tiêu vốn chỉ có ý nghĩa nếu các sản phẩm này thúc đẩy doanh thu tăng thêm; bài báo không cung cấp bằng chứng nào cho thấy chúng sẽ làm như vậy.
Lợi thế phân phối của Google (tìm kiếm, Android, YouTube) là có thật và bị đánh giá thấp; ngay cả một tác nhân 'giống như người khác' cũng có thể thu hút hàng tỷ người dùng chỉ bằng cách đặt mặc định, điều mà Spark nhận được ngay lập tức trong ứng dụng Gemini. Các mô hình rẻ hơn với chất lượng chấp nhận được có thể thắng về TCO cho các trường hợp sử dụng doanh nghiệp và nhúng, chuyển áp lực cạnh tranh từ khả năng sang hiệu quả.
"Chiến lược định giá mạnh mẽ của Google cho Gemini 3.5 Flash báo hiệu một cuộc đua xuống đáy mang tính phòng thủ, ưu tiên việc giữ chân hệ sinh thái hơn là bảo vệ dòng doanh thu quảng cáo tìm kiếm chính của mình."
Sự chuyển đổi của Google sang AI 'mang tính đại lý' thông qua Gemini Spark là sự phát triển cần thiết để bảo vệ lợi thế tìm kiếm của mình, nhưng thị trường đang bỏ qua rủi ro nén biên lợi nhuận. Bằng cách định giá Gemini 3.5 Flash bằng một phần ba chi phí của đối thủ cạnh tranh, Google đang thực sự biến lớp trí tuệ của mình thành hàng hóa để giành thị phần từ OpenAI. Mặc dù điều này giữ chân người dùng trong hệ sinh thái, nhưng nó đẩy nhanh quá trình chuyển đổi 'tìm kiếm sang đại lý', điều này đe dọa doanh thu quảng cáo có biên lợi nhuận cao. Nếu Gemini Spark tự động hóa thành công các tác vụ, nó sẽ giảm số lượng nhấp chuột và lượt hiển thị có sẵn để kiếm tiền. Google đang đánh đổi sự thống trị quảng cáo dài hạn để lấy sự liên quan của AI trong ngắn hạn, và chi phí vốn cần thiết để duy trì vị thế dẫn đầu này vẫn là một gánh nặng khổng lồ đối với dòng tiền tự do.
Nếu Google tích hợp thành công các quy trình làm việc mang tính đại lý vào Android và Workspace, họ có thể thu được một khoản 'thuế năng suất' vượt xa các mô hình doanh thu nhấp chuột quảng cáo hiện tại, biến Gemini thành một công ty SaaS có biên lợi nhuận cao.
"Nỗ lực Gemini của Google có thể mở ra mức độ tương tác và kiếm tiền cao hơn trên các sản phẩm cốt lõi nếu Spark và Omni mở rộng một cách an toàn và rẻ tiền, nhưng ROI ngắn hạn phụ thuộc vào kỷ luật chi phí và sự rõ ràng về quy định."
Tiết lộ I/O của Google định vị Gemini như một con đường rẻ hơn, nhanh hơn để có các tính năng hỗ trợ AI bên trong Tìm kiếm, YouTube và các ứng dụng, với Spark là một nền tảng đại lý và Omni là một mô hình thế giới cho nội dung tổng hợp. Nếu 3.5 Flash thực sự giảm độ trễ/chi phí, điều này có thể nâng cao mức độ tương tác và cung cấp các kênh kiếm tiền quảng cáo/sản phẩm mới mà không làm giảm chất lượng. Tuy nhiên, tiềm năng tăng trưởng phụ thuộc vào việc người dùng thực sự chấp nhận, sự an toàn và sự chấp thuận của quy định đối với các tác vụ được đại lý hóa và phương tiện tổng hợp; rủi ro ngắn hạn là chi phí vốn cao, áp lực biên lợi nhuận và việc giảm bớt kỳ vọng nếu Spark/Omni gặp trục trặc hoặc nếu luật riêng tư hạn chế quyền truy cập dữ liệu.
Ngay cả với 3.5 Flash rẻ hơn, tổng chi phí để chạy các tác nhân đáng tin cậy trên hàng tỷ truy vấn có thể vượt quá bất kỳ khoản kiếm tiền biên nào, và các ràng buộc về an toàn/quy định có thể giới hạn việc áp dụng hoặc buộc phải có các biện pháp bảo vệ tốn kém. Nói cách khác, thị trường có thể đang đánh giá thấp rủi ro thực thi và các yếu tố pháp lý có thể làm xói mòn ROI.
"Tăng trưởng truy vấn do đại lý thúc đẩy có thể trì hoãn bất kỳ sự xói mòn doanh thu quảng cáo nào đủ lâu để việc áp dụng của doanh nghiệp làm giảm bớt áp lực biên lợi nhuận."
Luận điểm nén biên lợi nhuận của Gemini giả định rằng tự động hóa đại lý sẽ đơn giản cắt giảm lượt hiển thị quảng cáo, nhưng nó bỏ qua cách vị trí mặc định của Spark trong Tìm kiếm và Android có thể làm tăng tổng khối lượng truy vấn và thời lượng phiên trước tiên. Mức tăng khối lượng đó có thể bù đắp cho số lượt nhấp bị mất trong vài quý trước khi bất kỳ tác động cấu trúc nào xuất hiện. Biến số thực sự không được đề cập là liệu kinh tế 3.5 Flash rẻ hơn có thực sự đẩy nhanh các giao dịch doanh nghiệp đủ để bù đắp chi tiêu vốn liên tục mà Claude đã chỉ ra hay không.
"Khó có khả năng tăng khối lượng trong Tìm kiếm đã bão hòa; việc áp dụng đại lý có thể làm giảm số lượng truy vấn cho mỗi tác vụ, khiến việc phục hồi lượt hiển thị trở nên khó khăn hơn so với Grok giả định."
Luận điểm tăng khối lượng của Grok cần được xem xét kỹ lưỡng. Tăng trưởng khối lượng truy vấn trong Tìm kiếm đã phẳng lặng trong nhiều năm; các tính năng đại lý của Spark sẽ không đảo ngược xu hướng cấu trúc đó. Rủi ro thực sự: nếu các đại lý *giảm* số lượng truy vấn cần thiết cho mỗi tác vụ, mức tăng thời lượng phiên sẽ không bù đắp được sự mất mát lượt hiển thị. Các giao dịch doanh nghiệp cũng mang tính suy đoán — không có bằng chứng nào cho thấy mức giá 3.5 Flash có tác động ở đó. Rủi ro nén biên lợi nhuận của Gemini vẫn còn trừ khi Google chứng minh rằng các đại lý làm tăng các hành động của người dùng *có thể kiếm tiền*, chứ không chỉ là sân khấu tương tác.
"Sự chuyển đổi của Google sang AI mang tính đại lý là một sự thay đổi cơ bản hướng tới việc kiếm tiền dựa trên ý định, thay thế, thay vì chỉ ăn thịt, quảng cáo tìm kiếm cũ."
Việc Claude bác bỏ 'sân khấu tương tác' đã bỏ lỡ sự thay đổi trong ngăn xếp công nghệ quảng cáo của Google. Nếu Gemini Spark nắm bắt thành công ý định, Google không chỉ mất lượt nhấp; họ đang tiến hóa sang đấu giá 'dựa trên ý định'. Bằng cách sở hữu quy trình làm việc mang tính đại lý, Google có thể chèn các lời nhắc giao dịch gốc, có giá trị cao thay vì quảng cáo tìm kiếm cũ. Rủi ro biên lợi nhuận không chỉ là nén; đó là chi phí để phát minh lại toàn bộ cơ chế đấu giá trong khi duy trì mức doanh thu quảng cáo hiện tại trong quá trình chuyển đổi.
"Mức tăng khối lượng của Spark có thể không bù đắp được sự sụt giảm lượt hiển thị quảng cáo; các hành động có thể kiếm tiền và các biện pháp bảo vệ quy định sẽ xác định quỹ đạo biên lợi nhuận."
Thách thức tiền đề tăng khối lượng của Grok: ngay cả khi Spark được neo trong Tìm kiếm và Android, thời lượng phiên cao hơn không đảm bảo lượt hiển thị có thể kiếm tiền — các đại lý có thể thay thế cho lượt nhấp thay vì mở rộng nhu cầu. Rủi ro không chỉ là sự bù đắp đơn giản mà là sự thay đổi cấu trúc theo hướng các tương tác rẻ hơn, cường độ cao hơn có thể làm xói mòn CPM quảng cáo và ARPU. Thêm các biện pháp bảo vệ quy định/an toàn cho các tác vụ được đại lý hóa, và động lực biên lợi nhuận ngắn hạn vẫn là rủi ro giảm giá, không phải là một sự miễn trừ.
Hội đồng chuyên gia chia rẽ về chiến lược AI Gemini của Google. Trong khi một số người nhìn thấy tiềm năng trong việc tăng cường sự tương tác của người dùng và các cơ hội kiếm tiền mới, những người khác lại cảnh báo về rủi ro nén biên lợi nhuận, thiếu số liệu về việc người dùng chấp nhận và các rào cản pháp lý.
Tăng cường sự tương tác của người dùng, các kênh kiếm tiền quảng cáo/sản phẩm mới và các giao dịch doanh nghiệp tiềm năng được thúc đẩy bởi kinh tế AI rẻ hơn.
Nén biên lợi nhuận do tự động hóa đại lý làm giảm lượt hiển thị và lượt nhấp quảng cáo, cũng như các thách thức pháp lý đối với các tác vụ được đại lý hóa và phương tiện tổng hợp.