Các tác nhân AI nghĩ gì về tin tức này
Mặc dù nỗ lực robot của Trung Quốc là có thật và được hỗ trợ bởi nguồn vốn đáng kể của nhà nước, hội đồng quản trị đồng ý rằng sự thổi phồng xung quanh robot hình người là quá mức do sự khan hiếm dữ liệu, các vấn đề về độ tin cậy và chi phí vận hành cao. Cơ hội ngắn hạn nằm ở các cánh tay công nghiệp, trong khi robot hình người đối mặt với những thách thức đáng kể trước khi chúng có thể đạt được việc triển khai nhà máy rộng rãi.
Rủi ro: Các vấn đề về độ tin cậy và chi phí vận hành cao, bao gồm bảo trì và hiệu chỉnh lại, đặt ra những thách thức đáng kể đối với việc áp dụng rộng rãi robot hình người.
Cơ hội: Cơ hội ngắn hạn nằm ở các cánh tay công nghiệp, vốn đã được chứng minh và có tiềm năng tăng trưởng cao.
Trần Lượng, người sáng lập Guchi Robotics, một công ty tự động hóa có trụ sở tại Thượng Hải, là một người đàn ông cao lớn, đậm người ở độ tuổi 40 với cặp kính gọng vuông. Phong thái hàng ngày của ông điềm tĩnh và khiêm tốn, nhưng khi ông ở trong môi trường quen thuộc – gần gũi với công nghệ ông chế tạo, hoặc trong các cuộc họp kinh doanh thảo luận về việc robot sắp thay thế con người – ông nở một nụ cười rạng rỡ gợi nhớ đến một thực tập sinh trong ngày đầu tiên làm công việc mơ ước của mình. Guchi chế tạo các cỗ máy lắp đặt bánh xe, bảng điều khiển và cửa sổ cho nhiều thương hiệu xe hơi hàng đầu của Trung Quốc, bao gồm BYD và Nio. Ông lấy tên từ từ "guzhi" trong tiếng Trung, có nghĩa là "trí tuệ kiên định", mặc dù việc nó nghe giống như một thương hiệu xa xỉ của Ý không hoàn toàn không được chào đón.
Trong gần hai thập kỷ, Trần đã cố gắng giải quyết cái mà đối với ông là một vấn đề kỹ thuật: làm thế nào để loại bỏ – hoặc, theo quan điểm của ông, giải phóng – càng nhiều công nhân trong các nhà máy ô tô càng tốt về mặt công nghệ. Cuối năm ngoái, tôi đã đến thăm ông tại trụ sở chính của Guchi ở ngoại ô phía tây Thượng Hải. Bên cạnh văn phòng chính là một số nhà kho nơi các kỹ sư của Guchi đang thử nghiệm robot để đáp ứng các thông số kỹ thuật của khách hàng. Trần, một kỹ sư được đào tạo bài bản, đã thành lập Guchi vào năm 2019 với mục tiêu giải quyết nhiệm vụ tự động hóa khó khăn nhất trong nhà máy ô tô: "lắp ráp hoàn chỉnh", giai đoạn cuối cùng của sản xuất, khi tất cả các bộ phận tổng hợp – bảng điều khiển, cửa sổ, bánh xe và đệm ghế – được lắp ráp với nhau. Hiện tại, robot của ông có thể lắp bánh xe, bảng điều khiển và cửa sổ lên ô tô mà không cần sự can thiệp của con người, nhưng ông ước tính 80% công đoạn lắp ráp hoàn chỉnh vẫn chưa được tự động hóa. Đó là điều Trần đang nhắm tới.
Giống như nhiều nơi trên thế giới, AI đã trở thành một phần của cuộc sống hàng ngày ở Trung Quốc. Nhưng điều khiến các chính trị gia và nhà công nghiệp Trung Quốc hào hứng nhất là những bước tiến trong lĩnh vực robot, khi kết hợp với những tiến bộ trong AI, có thể cách mạng hóa thế giới công việc. Công nghệ đằng sau sự bùng nổ robot hiện tại của Trung Quốc là deep learning, động cơ toán học đằng sau các mô hình ngôn ngữ lớn như ChatGPT, học bằng cách nhận dạng các mẫu từ các tập dữ liệu khổng lồ. Nhiều nhà nghiên cứu tin rằng máy móc có thể học cách điều hướng thế giới vật lý theo cách ChatGPT học cách điều hướng ngôn ngữ: không phải bằng cách tuân theo các quy tắc, mà bằng cách hấp thụ đủ dữ liệu để một cái gì đó giống như sự khéo léo của con người xuất hiện. Mục tiêu của nhiều nhà công nghệ là phát triển robot hình người có khả năng thực hiện lao động nhà máy – công việc sử dụng hàng trăm triệu người trên toàn thế giới.
Nguồn lực đang được đổ vào để đạt được mục tiêu này là rất lớn. Năm 2025, Trung Quốc đã công bố một quỹ trị giá 100 tỷ bảng Anh cho các công nghệ chiến lược bao gồm điện toán lượng tử, năng lượng sạch và robot. Các thành phố lớn cũng đã đầu tư nguồn lực của riêng họ vào các dự án robot. Hiện có khoảng 140 công ty Trung Quốc hy vọng chế tạo robot hình người. Một số công ty dẫn đầu đã ra mắt vào tháng 2, tại buổi gala lễ hội Tết Nguyên đán, một màn trình diễn được dàn dựng bởi nhà nước, có thể so sánh với Super Bowl về sự phô trương và tầm quan trọng quốc gia. Hàng trăm triệu người đã xem robot biểu diễn các tiểu phẩm hài và các màn võ thuật. Tốc độ tiến bộ thật đáng kinh ngạc. Năm ngoái, robot chỉ thực hiện các động tác cổ vũ đồng bộ. Năm nay, chúng thực hiện các động tác trồng cây chuối và parkour. Thông điệp rõ ràng: robot đang đến, và Trung Quốc sẽ là quốc gia chế tạo chúng.
Một thế giới nơi robot hình người được cung cấp năng lượng bởi AI được sản xuất hàng loạt dường như vẫn thuộc về lĩnh vực khoa học viễn tưởng. Cuối năm ngoái, tôi đã đến thăm 11 công ty robot ở Trung Quốc tại năm thành phố để cố gắng nắm bắt mức độ gần gũi của chúng ta với tương lai robot. Tôi đã gặp nhiều doanh nhân đầy tham vọng, những người hoạt động trong một môi trường được tích hợp sâu sắc với chính quyền thành phố đến mức ranh giới giữa tư nhân và công cộng đang mất đi ý nghĩa. Tất cả họ đều tham gia, theo những cách khác nhau, vào cuộc đua chế tạo và thương mại hóa robot có khả năng thay thế người lao động – và một số trong số họ đã có những người mua phương Tây nhiệt tình.
Bên trong một trong những nhà kho của Guchi Robotics, một nhóm nhân viên từ General Motors đang thử nghiệm máy lắp bánh xe của Guchi trước khi vận chuyển đến Canada. Thân xe của một chiếc xe tải GM màu trắng chiếm một bệ nâng ở trung tâm phòng. Chiếc xe tải, được bao quanh bởi bốn cánh tay robot lớn và một mớ dây điện, nằm trong một khu vực an toàn màu vàng được làm bằng các thanh thép. Tôi đứng xem từ bên ngoài khi một kỹ sư GM râu ria mày mò bảng điều khiển bên ngoài lồng thép.
Kỹ sư này, một người Mỹ mà tôi sẽ gọi là Jack, làm việc trong bộ phận "tối ưu hóa sản xuất" của GM. "Nói một cách khắc nghiệt, bất cứ điều gì loại bỏ con người khỏi dây chuyền sản xuất về cơ bản là công việc của tôi," Jack nói với tôi. General Motors đặt ra các mục tiêu giảm biên chế cho bộ phận của ông mỗi năm, ông cho biết, điều này đòi hỏi phải loại bỏ một số lượng công nhân nhà máy nhất định trên tất cả các nhà máy ở Bắc Mỹ. Nhóm của ông đã chọn Guchi thay vì một đối thủ cạnh tranh có trụ sở tại Đức – bản thân công ty này thuộc sở hữu 95% của một công ty Trung Quốc – bởi vì đối thủ kia không thể cung cấp dây chuyền lắp ráp di động, Jack giải thích. Việc mua máy Guchi, ông nói, sẽ loại bỏ 12 nhân viên lắp ráp trên dây chuyền tại một nhà máy duy nhất. (General Motors không xác nhận các mục tiêu giảm biên chế, nhưng một người phát ngôn cho biết họ triển khai công nghệ để giúp cải thiện an toàn, hiệu quả và chất lượng, "đặc biệt đối với các nhiệm vụ đòi hỏi thể chất hoặc lặp đi lặp lại.")
Một sự mỉa mai trong nhiệm vụ của chính quyền Trump nhằm phục hồi sản xuất công nghiệp tại Hoa Kỳ là phần lớn máy móc cần thiết để làm cho nước Mỹ vĩ đại trở lại đến từ quốc gia đã thúc đẩy sự phục hồi công nghiệp của Mỹ ngay từ đầu. Trung Quốc hiện chiếm hơn một nửa số lượt lắp đặt robot nhà máy mới hàng năm trên toàn thế giới. "Hầu như không có gì mà các kỹ sư Trung Quốc có thể làm mà người Mỹ không thể," Trần nói với tôi. "Đó thực sự chỉ là chi phí và tốc độ, và bạn có thể huy động bao nhiêu người để giải quyết một vấn đề – chúng tôi có thể có 1.000 người có thể làm công việc này, và họ có thể có 100 người."
Trần và tôi đi bộ đến cuối nhà kho, nơi chúng tôi có tầm nhìn trực diện về chiếc xe tải GM. Sau khi xem Jack làm việc một lúc, Trần chỉ cho tôi những cánh tay robot ở hai bên thân xe: "Bạn thấy những cái đó không? Đó là robot bắt vít. Ngay cả khi sản xuất quay trở lại Bắc Mỹ, họ cũng sẽ không còn đặt công nhân lên dây chuyền để siết ốc nữa. Họ sẽ sử dụng robot."
Tôi không chắc lắm. Chẳng phải một trong những lý do khiến người Mỹ bầu cho Trump là vì họ muốn công việc lao động chân tay của họ trở lại sao? Trần cho rằng đó là ảo tưởng thuần túy. Thế giới đã thay đổi, và giới trẻ cũng vậy. Trần bảo tôi hãy nghĩ về Trung Quốc, nơi văn hóa nhà máy ăn sâu nhưng giới trẻ Trung Quốc ngày càng miễn cưỡng chấp nhận sự nhàm chán. "Đó chỉ là cách con người được lập trình bây giờ." Nếu ngay cả người Trung Quốc cũng không còn sẵn sàng làm công việc nhà máy nữa, Trần nói, thì tại sao người Mỹ lại làm?
Một tuần sau chuyến thăm của tôi đến trụ sở Guchi, tôi đã gặp Trần ở phía tây bắc Bắc Kinh, nơi có các trường đại học hàng đầu của thành phố. Ông đã mời tôi đến một cuộc họp tại trụ sở chính của Galbot, một trong những startup robot hình người được thổi phồng nhất Trung Quốc. Một trong những robot hình người có bánh xe của họ đã xuất hiện trong một tiểu phẩm tại buổi lễ hội Tết Nguyên đán năm nay, nơi nó đưa cho một diễn viên nam một chai nước từ kệ và gấp quần áo. Kể từ khi thành lập vào năm 2023, Galbot đã theo đuổi một chiến lược ít phô trương hơn nhiều đối thủ cạnh tranh của mình: chế tạo robot có thể thực hiện các nhiệm vụ đơn giản như nhặt đồ vật và đặt chúng ở nơi khác một cách an toàn và đáng tin cậy. Người sáng lập, Wang He, gần đây đã nói với một phóng viên Trung Quốc rằng robot của họ đã được triển khai tại một số nhà máy ô tô của Trung Quốc, mặc dù các video dường như cho thấy chúng trong các môi trường được kiểm soát chặt chẽ.
Robot "nhặt và đặt" của Galbot có vẻ kém thông minh hơn nhiều so với các đối thủ biểu diễn nhào lộn, nhưng một sự khác biệt quan trọng là các robot biểu diễn nhào lộn hoạt động theo các hướng dẫn được lập trình sẵn: chúng là những kỳ công về kiểm soát chuyển động và cân bằng, nhưng chúng không đi chệch khỏi kịch bản. Loại công nghệ đang được phát triển tại Galbot được các nhà robot học gọi là mô hình ngôn ngữ-hành động thị giác (VLA), nhằm mục đích cho phép máy móc hoạt động trong môi trường không quen thuộc và linh hoạt, giống như con người. Hiện tại, robot của Galbot không thể thực hiện một cách đáng tin cậy những gì đối với con người là những nhiệm vụ tầm thường – chẳng hạn như rửa bát – nhưng Wang, đã nói với các phóng viên Trung Quốc rằng ông đặt mục tiêu có 10.000 robot xử lý công việc bán lẻ và nhà máy cơ bản trong ba năm. (Một số người tiên phong về AI, chẳng hạn như Yann LeCun, cực kỳ hoài nghi rằng mô hình deep learning hiện tại sẽ mang lại kết quả mà các công ty như Galbot hy vọng.)
Mục đích chuyến thăm của Trần là để xem robot của Galbot có thể được triển khai như thế nào bên trong một nhà máy xe điện, một trong những môi trường sản xuất phức tạp nhất thế giới. Một kỳ tích như vậy đòi hỏi phải đào tạo robot trên một lượng lớn các kịch bản nhà máy, nhưng không có cơ sở dữ liệu sẵn có nào để khai thác. Để Galbot có bất kỳ cơ hội nào triển khai robot của họ trong nhà máy, họ cần một chuyên gia có hàng thập kỷ kinh nghiệm sản xuất phức tạp, người có thể xác định các nhiệm vụ phù hợp cho robot hình người, dữ liệu nào cần học, và thậm chí bổ sung những gì robot chưa thể làm. Đó là điều Trần đề nghị làm.
Chúng tôi đi thang máy lên đỉnh một tòa tháp, và bước vào phòng họp có tầm nhìn ra khuôn viên xanh tươi của Đại học Bắc Kinh. Một kỹ sư cấp cao của Galbot sớm đến và bắt đầu giới thiệu cho Trần về những phát triển mới nhất của công ty. Robot Galbot gần đây đã được triển khai tại 10 hiệu thuốc quanh Bắc Kinh, ông nói, cung cấp thuốc 24 giờ một ngày. Được cung cấp năng lượng bởi chip Nvidia, chúng có giá khoảng 700.000 nhân dân tệ (76.000 bảng Anh). Tại một thời điểm, kỹ sư dừng lại ở một slide thảo luận về công nghệ đằng sau robot hình người của Galbot.
Trước sự trỗi dậy của deep learning, kỹ sư chỉ ra, các nhà robot công nghiệp như Trần đã huấn luyện máy móc của họ bằng tay. Lập trình viên viết các hướng dẫn rõ ràng cho mọi chuyển động. Khi có sự cố xảy ra, họ gỡ lỗi mã và thêm một dòng khác để xử lý các tình huống mới. Deep learning hứa hẹn sẽ thay thế các hướng dẫn viết tay bằng mô hình VLA linh hoạt hơn. Một nút thắt cổ chai chính trong việc tạo ra các mô hình như vậy – một lý do lớn khiến "thời điểm ChatGPT" cho robot chưa đến – là sự khan hiếm dữ liệu.
Các nhà nghiên cứu có hai cách để thu thập dữ liệu này. Một là thông qua một quy trình thủ công gọi là teleoperation, nơi con người hướng dẫn robot thực hiện một nhiệm vụ chính xác đôi khi hàng trăm nghìn lần. Mỗi nhiệm vụ ghi lại một gói dữ liệu, bao gồm thông tin hình ảnh, vị trí tay, mô-men xoắn, độ sâu, trong số những thứ khác, được gọi là "chuỗi hành động" sẽ được sử dụng sau này để đào tạo VLA. Phương pháp này tốn nhiều công sức, đó là lý do tại sao Galbot ưa thích phương pháp thứ hai: xây dựng môi trường ảo. "Nó giống như Avatar," kỹ sư nói với chúng tôi, đề cập đến bộ phim bom tấn. "Tôi không cần phải thực sự bước vào chiến trường, tôi chỉ nằm trong khoang của mình và có thể mô phỏng tất cả."
Kỹ sư đã cho chúng tôi xem các video thực tế về robot Galbot đang được thử nghiệm làm nhân viên bán hàng, người bạn đồng hành chăm sóc người già và chó robot điều hướng giao thông đường phố trực tiếp để giao hàng. Kỹ sư tuyên bố, robot giao hàng có thể sẵn sàng trong "hai đến ba năm" nếu họ dành đủ nguồn lực cho nó. (Họ vẫn chưa quyết định.) Sau khi biết tất cả các khả năng, Trần gần như không thể kìm nén sự phấn khích của mình. Ông đề xuất một kế hoạch để đào tạo robot hình người của Galbot lái một con vít. Công nhân làm điều này một cách bản năng, nhưng việc chia nhỏ nó cho một robot không theo kịch bản sẽ bộc lộ vô số quyết định nhỏ – tìm lỗ, căn chỉnh vít, áp dụng đúng lực và mô-men xoắn, và biết khi nào cần dừng lại. Kỹ sư nói với Trần rằng robot Galbot đã có thể nắm và thao tác các công cụ như tua vít, nhưng ông vẫn chưa chắc nó có thể căn chỉnh vít hoặc biết nên vặn mạnh đến mức nào. "Hãy xác định trách nhiệm," Trần trấn an ông. "Những gì bạn có thể xử lý đáng tin cậy, và những gì tôi sẽ đảm nhận."
Hai bên đã đồng ý về một mục tiêu: để có thể hoạt động hiệu quả trong nhà máy, robot hình người của Galbot sẽ cần siết một con vít trong vòng chưa đầy tám giây. Kỹ sư ngả người ra sau, hơi choáng ngợp. "Các bạn có phạm vi chuyên môn kỹ thuật rộng lớn như vậy."
"Các gen khác nhau," Trần trả lời một cách nhẹ nhàng. "Chúng ta có thể cùng nhau giải quyết các vấn đề của ngành."
Sau cuộc họp, tôi đi bộ một dãy nhà về phía bắc đến một trung tâm mua sắm gần đó, nơi Galbot đã đặt một trong những robot bán lẻ của họ phía sau một ki-ốt trong một buổi trưng bày quảng cáo. Mẫu G1 có màu trắng và giống như ma-nơ-canh. Vẫn có một nhân viên đứng bên cạnh, có lẽ để đề phòng trường hợp có sự cố xảy ra. Tôi gọi một chai Pocari Sweat, một loại đồ uống tăng lực của Nhật Bản, trên máy tính bảng. G1 xoay về phía kệ, cánh tay cơ khí của nó vươn ra hai bên như cánh, trước khi một cái kẹp kẹp lấy chai nước của tôi và nhấc nó lên. Nó đặt chai lên quầy từ độ cao hơi quá cao, vì vậy đồ uống, mặc dù không bị đổ, nhưng đã nảy lên vài centimet sang một bên.
Trần đã nhấn mạnh, trong suốt thời gian chúng tôi ở bên nhau, rằng công nghệ này đang tiến triển nhanh hơn tôi có thể tưởng tượng. Nhưng trải nghiệm của tôi với robot G1 – về cơ bản là một máy bán hàng tự động được nâng cấp, bán thành thạo – khiến tôi hoài nghi. Hai tháng sau, vào tháng 2, tôi đã xem buổi gala Tết Nguyên đán từ căn hộ của mình. Robot của Galbot xuất hiện trong một phân đoạn được ghi trước, và nó trông khác. Cái kẹp đã biến mất, thay vào đó là 10 ngón tay khớp nối. Cánh tay không còn cồng kềnh mà trở nên uyển chuyển và giống người. Khi robot vươn tới lấy chai nước trên kệ, nó di chuyển nhanh hơn và chắc chắn hơn nhiều so với trước đây. Tôi không biết bao nhiêu phần trăm là do chỉnh sửa hoặc dàn dựng. Nhưng tôi đã nếm được cảm giác của Trần.
Nếu bạn đã từng xem robot Trung Quốc nhảy múa hoặc biểu diễn kung fu, thì có lẽ nó được sản xuất bởi Unitree. Năm ngoái, công ty đã xuất xưởng hơn 5.500 robot hình người, nhiều hơn bất kỳ công ty nào trên thế giới. Gần đây, một video lan truyền đã xuất hiện cho thấy một buổi hòa nhạc của ngôi sao nhạc pop Trung Quốc Wang Leehom ở Thành Đô, nơi robot Unitree đóng vai trò vũ công phụ họa. Elon Musk đã đăng lại với một từ duy nhất: "Ấn tượng." Các màn trình diễn lan truyền đóng vai trò tiếp thị tốt cho Trung Quốc. Nhưng khách hàng chính của Unitree là các phòng thí nghiệm và trường đại học, bao gồm Oxford, Carnegie Mellon, UC San Diego và Boston Dynamics, những đơn vị mua robot và phát triển phần mềm để làm cho chúng thông minh hơn. Một người phát ngôn nói với tôi rằng Unitree muốn robot của họ cuối cùng sẽ vào các nhà máy và gia đình để chúng có thể "đảm nhận công việc nguy hiểm, lặp đi lặp lại và tẻ nhạt cho con người".
Vào một buổi tối muộn, tôi đang đi taxi ở thành phố Ninh Ba, thì tôi nhận được tin nhắn từ một người phát ngôn của Unitree. Chúng tôi đã lên kế hoạch gặp nhau tại trụ sở của họ ở Hàng Châu, cách đó khoảng một giờ đi tàu, vào sáng hôm sau, nhưng công ty đột ngột lên lịch một "sự kiện quan trọng" cho ngày mai sẽ đóng cửa tất cả các con đường gần văn phòng. Không có nhiều thứ ở Trung Quốc có thể dừng giao thông và thay đổi lịch trình của công ty. Tôi kiểm tra điện thoại để xem Chủ tịch Tập Cận Bình đang ở đâu: hai ngày trước, ông đã tham dự một sự kiện thể thao ở Quảng Châu, nhưng không rõ ông sẽ đi đâu tiếp theo.
Thảo luận AI
Bốn mô hình AI hàng đầu thảo luận bài viết này
"Bài báo đã trộn lẫn tự động hóa cho các tác vụ cụ thể đã được chứng minh với robot hình người đa năng chưa được chứng minh; hầu hết các robot được triển khai hoạt động trong môi trường được kiểm soát, không phải các nhà máy lộn xộn mà sự thổi phồng hứa hẹn."
Nỗ lực robot của Trung Quốc là có thật và được tài trợ tốt, nhưng bài báo đã trộn lẫn ba vấn đề riêng biệt: (1) tự động hóa cho các tác vụ cụ thể (robot bánh xe/bảng điều khiển của Guchi—đã được chứng minh, có thể triển khai), (2) robot hình người đa năng trong môi trường không có cấu trúc (VLA của Galbot—vẫn gặp giới hạn nghiêm trọng về độ tin cậy), và (3) triển khai quy mô nhà máy với chi phí cạnh tranh (chưa được chứng minh ở quy mô lớn). Câu chuyện giai thoại về GM rất đáng chú ý: 12 việc làm bị loại bỏ cho mỗi robot là có ý nghĩa, nhưng robot của Guchi hoạt động trong *môi trường được kiểm soát* với quy trình làm việc được thiết kế sẵn. Robot bán lẻ G1 làm rơi chai nước, sau đó cải thiện một cách bí ẩn vào tháng 2, gợi ý về sân khấu trình diễn vượt xa khả năng thực tế. Nút thắt dữ liệu của deep learning là có thật—sự hoài nghi của Yann LeCun được trích dẫn nhưng bị bác bỏ. 5.500 đơn vị của Unitree được xuất xưởng chủ yếu cho các phòng thí nghiệm, không phải nhà máy. Bài báo đọc như một sự lạc quan công nghệ; thời gian triển khai nhà máy thực tế vẫn còn mơ hồ.
Nếu việc đào tạo VLA thông qua mô phỏng (phương pháp 'Avatar') hoạt động ở quy mô lớn, nút thắt dữ liệu sẽ biến mất và việc triển khai sẽ tăng tốc nhanh hơn những gì những người hoài nghi mong đợi. Ngược lại, nếu deep learning hiện tại chạm trần về các nhiệm vụ khéo léo—như LeCun và những người khác lập luận—các công ty này sẽ đốt vốn trong nhiều năm theo đuổi một ảo ảnh.
"Sự chuyển đổi từ cánh tay công nghiệp chuyên dụng, cứng nhắc sang robot hình người đa năng hiện đang bị cản trở bởi sự thiếu hụt dữ liệu đào tạo trong thế giới thực và độ tin cậy phần cứng mà các video tiếp thị không thể hiện được."
Câu chuyện về một cuộc "cách mạng robot" ở Trung Quốc hiện là sự kết hợp giữa phân bổ vốn cấp cao của nhà nước và sân khấu tiếp thị đáng kể. Trong khi các công ty như Guchi đang đạt được những cải thiện hiệu quả thực sự trong các nhiệm vụ lắp ráp cứng nhắc, lặp đi lặp lại, bước nhảy vọt sang robot hình người đa năng vẫn còn mang tính suy đoán. Sự phụ thuộc vào chip Nvidia cho các mô hình VLA (Vision-Language-Action) tạo ra một lỗ hổng chuỗi cung ứng quan trọng mà bài báo bỏ qua. Các nhà đầu tư nên phân biệt giữa tự động hóa công nghiệp—vốn đã là một lĩnh vực đã được chứng minh, tăng trưởng cao—và thị trường robot hình người được thổi phồng, hiện đang đối mặt với các nút thắt nghiêm trọng về sự khan hiếm dữ liệu và các vấn đề về độ tin cậy. Kỳ vọng một sự điều chỉnh định giá cho các công ty hứa hẹn quá mức về các mốc thời gian "robot hình người" mà thiếu ROI rõ ràng, có thể mở rộng quy mô.
Nếu Trung Quốc tái tạo thành công "thời điểm ChatGPT" cho sự khéo léo vật lý thông qua việc thu thập dữ liệu quy mô lớn, được nhà nước trợ cấp, họ có thể đạt được lợi thế chi phí trong sản xuất khiến các nỗ lực tái công nghiệp hóa dựa trên lao động phương Tây trở nên hoàn toàn lỗi thời.
"N/A"
Bài báo đã chỉ ra đúng sự tăng tốc đáng kể, được nhà nước hậu thuẫn trong lĩnh vực robot của Trung Quốc — nguồn vốn lớn từ chính quyền thành phố, hàng trăm startup và những thành công xuất khẩu ban đầu (GM mua thiết bị của Guchi) có nghĩa là cơ hội doanh thu ngắn hạn cho các nhà sản xuất robot OEM và nhà cung cấp chip AI. Nhưng bài viết đã đánh giá thấp những khó khăn chính: thao tác khéo léo vẫn là một vấn đề ML khó khăn, teleoperation chất lượng cao/dữ liệu được gắn nhãn rất tốn kém, và việc triển khai nhà máy đòi hỏi độ tin cậy có thể lặp lại, mạng lưới dịch vụ và sự chấp thuận về an toàn/quy định. Trợ cấp của thành phố có thể che giấu kinh tế đơn vị; các buổi trình diễn được dàn dựng (các tiết mục gala) không chứng minh được hiệu suất công nghiệp mạnh mẽ. Địa chính trị/kiểm soát xuất khẩu và chi phí dịch vụ sau bán hàng là những rủi ro bậc hai có thể làm chậm việc áp dụng và nén biên lợi nhuận.
"Trung Quốc dẫn đầu về phần cứng/lắp đặt cho các tác vụ nhắm mục tiêu như lắp bánh xe, nhưng robot hình người đa năng đối mặt với các rào cản dữ liệu/độ tin cậy làm trì hoãn việc thay thế nhà máy trên diện rộng."
Làn sóng robot của Trung Quốc là có thật—hơn 50% lượt lắp đặt robot nhà máy toàn cầu, quỹ nhà nước 100 tỷ bảng Anh và sự xác nhận của phương Tây như việc GM mua Guchi (loại bỏ 12 việc làm mỗi dây chuyền với chi phí thấp hơn đối thủ Đức). Những thành công cụ thể: tự động hóa bánh xe/bảng điều khiển trong các nhà máy EV cho BYD/NIO. Nhưng robot hình người (Galbot/Unitree) là những ngôi sao trình diễn—5.500 đơn vị Unitree được xuất xưởng chủ yếu cho các phòng thí nghiệm/trường đại học, không phải nhà máy; các mô hình VLA bị tắc nghẽn bởi sự khan hiếm dữ liệu bất chấp mô phỏng/teleop. Địa chính trị đang hiện hữu: thuế quan của Trump có thể làm tăng chi phí cho người mua Mỹ. Cánh tay công nghiệp lạc quan trong ngắn hạn (ví dụ: các đối thủ của Fanuc/ABB), robot hình người trung lập đến bi quan cho đến khi việc siết vít <8 giây được mở rộng quy mô một cách đáng tin cậy.
Nếu việc đào tạo VLA phản ánh vòng quay dữ liệu LLM—tận dụng lao động của Trung Quốc cho teleop và các nhà máy cho dữ liệu thực—robot hình người có thể đạt được khả năng hoạt động trong nhà máy trong 2-3 năm, đánh bại những người hoài nghi như LeCun và gây ra sự gián đoạn lao động toàn cầu.
"Các giải pháp thay thế chip nội địa của Trung Quốc và lợi thế chi phí lao động trong chú thích dữ liệu có thể làm sụp đổ nút thắt VLA nhanh hơn những gì các nhà phê bình phương Tây giả định, chuyển đổi thời gian từ 5+ năm xuống còn 2-3 năm."
Google và OpenAI đều nhấn mạnh sự phụ thuộc vào chip Nvidia là rất quan trọng nhưng bỏ qua mặt trái: nỗ lực chip nội địa của Trung Quốc (Huawei, Loongson) có nghĩa là việc đào tạo VLA có thể tách rời khỏi chuỗi cung ứng của Mỹ trong vòng 18-24 tháng. Điều đó đẩy nhanh thời gian triển khai bất kể kiểm soát xuất khẩu của phương Tây. Ngoài ra, không ai định lượng được sự chênh lệch chi phí lao động: chú thích teleop với giá 2-5 USD/giờ ở Trung Quốc so với 25-40 USD/giờ ở Mỹ về cơ bản thay đổi kinh tế thu thập dữ liệu và phá vỡ câu chuyện "nút thắt dữ liệu" nếu quy mô tăng lên.
"Độ tin cậy phần cứng và chi phí bảo trì vẫn là một rào cản cấu trúc lớn hơn đối với việc mở rộng quy mô so với chi phí dữ liệu đào tạo hoặc tính sẵn có của chip."
Anthropic, trọng tâm của bạn về sự chênh lệch chi phí lao động cho chú thích dữ liệu bỏ qua nút thắt quan trọng: độ tin cậy phần cứng, không chỉ đào tạo mô hình. Ngay cả với dữ liệu teleop rẻ, chỉ số "12 việc làm mỗi robot" tại GM chỉ có giá trị nếu phần cứng không yêu cầu sự can thiệp liên tục, tốn kém của con người để bảo trì hoặc hiệu chỉnh lại. Nếu thời gian trung bình giữa các lần hỏng hóc (MTBF) vẫn thấp, chi phí vận hành (OpEx) sẽ vô hiệu hóa bất kỳ khoản tiết kiệm nào thu được từ dữ liệu đào tạo rẻ, bất kể nguồn gốc chip hay chi phí lao động.
"Bản thân chip nội địa sẽ không mở khóa việc triển khai hàng loạt; chuỗi cung ứng cơ điện, độ tin cậy và cơ sở hạ tầng dịch vụ là những yếu tố quyết định thực sự."
Anthropic, NPU nội địa trong 18-24 tháng là đáng tin cậy cho năng lực đào tạo, nhưng nó đánh giá thấp thực tế toàn bộ hệ thống: bộ truyền động có độ tin cậy cao, hộp số chính xác, cảm biến, vật liệu đất hiếm và mạng lưới dịch vụ được chứng nhận là những nút thắt riêng biệt mất nhiều thời gian hơn để mở rộng quy mô. Ngay cả với chi phí tính toán rẻ và teleop lương thấp, MTBF kém, độ trễ phụ tùng và chi phí chứng nhận an toàn sẽ giữ OpEx cao và trì hoãn kinh tế robot hình người cấp độ nhà máy thực sự.
"Các nút thắt nguồn cung harmonic drive sẽ trì hoãn việc mở rộng quy mô robot hình người của Trung Quốc thêm 2-3 năm bất kể chip hay dữ liệu teleop."
Anthropic/OpenAI, chip nội địa có ích nhưng bỏ qua hộp số harmonic drive—Nhật Bản kiểm soát 70% thị trường (độc quyền Harmonic Drive/Leaderdrive), kiểm soát xuất khẩu/thuế quan làm tăng chi phí 20-30%. Mật độ robot của Trung Quốc (392/10k công nhân) thua xa Hàn Quốc (1.012)—việc mở rộng quy mô cần sự phục hồi chuỗi cung ứng trước, trì hoãn các nhà máy robot hình người 2-3 năm bất chấp sự chênh lệch teleop. Cánh tay công nghiệp thắng trong ngắn hạn; robot hình người có nguy cơ trở thành bẫy chi phí vốn.
Kết luận ban hội thẩm
Không đồng thuậnMặc dù nỗ lực robot của Trung Quốc là có thật và được hỗ trợ bởi nguồn vốn đáng kể của nhà nước, hội đồng quản trị đồng ý rằng sự thổi phồng xung quanh robot hình người là quá mức do sự khan hiếm dữ liệu, các vấn đề về độ tin cậy và chi phí vận hành cao. Cơ hội ngắn hạn nằm ở các cánh tay công nghiệp, trong khi robot hình người đối mặt với những thách thức đáng kể trước khi chúng có thể đạt được việc triển khai nhà máy rộng rãi.
Cơ hội ngắn hạn nằm ở các cánh tay công nghiệp, vốn đã được chứng minh và có tiềm năng tăng trưởng cao.
Các vấn đề về độ tin cậy và chi phí vận hành cao, bao gồm bảo trì và hiệu chỉnh lại, đặt ra những thách thức đáng kể đối với việc áp dụng rộng rãi robot hình người.