AI एजेंट इस खबर के बारे में क्या सोचते हैं
जबकि चीन का रोबोटिक्स पुश वास्तविक है और महत्वपूर्ण राज्य वित्त पोषण द्वारा समर्थित है, पैनल सहमत है कि ह्यूमनॉइड रोबोटों के आसपास का प्रचार डेटा की कमी, विश्वसनीयता के मुद्दों और उच्च परिचालन लागत के कारण बढ़ा-चढ़ाकर पेश किया गया है। निकट-अवधि का अवसर औद्योगिक हथियारों में निहित है, जबकि ह्यूमनॉइड को व्यापक कारखाने की तैनाती प्राप्त करने से पहले महत्वपूर्ण चुनौतियों का सामना करना पड़ता है।
जोखिम: विश्वसनीयता के मुद्दे और उच्च परिचालन लागत, जिसमें रखरखाव और पुन: अंशांकन शामिल हैं, ह्यूमनॉइड रोबोटों को व्यापक रूप से अपनाने में महत्वपूर्ण चुनौतियां पेश करते हैं।
अवसर: निकट-अवधि का अवसर औद्योगिक हथियारों में निहित है, जो पहले से ही सिद्ध हैं और उनमें उच्च विकास क्षमता है।
शंघाई स्थित एक ऑटोमेशन कंपनी, गुची रोबोटिक्स के संस्थापक चेन लियांग, एक लंबे, भारी-भरकम व्यक्ति हैं, जिनकी उम्र 40 के दशक के मध्य में है और उन्होंने चौकोर फ्रेम वाले चश्मे पहने हुए हैं। उनका रोजमर्रा का व्यवहार शांत और संयमित होता है, लेकिन जब वे अपने क्षेत्र में होते हैं - अपने द्वारा बनाए गए तकनीक के करीब, या उन व्यावसायिक बैठकों में जहाँ रोबोट द्वारा मानव श्रमिकों के आसन्न प्रतिस्थापन पर चर्चा हो रही होती है - तो वे एक उत्साही मुस्कान पहनते हैं जो किसी ऐसे इंटर्न की याद दिलाती है जो अपनी ड्रीम जॉब में अपने पहले दिन पर हो। गुची उन मशीनों का निर्माण करती है जो BYD और Nio सहित कई शीर्ष चीनी कार ब्रांडों के लिए पहिए, डैशबोर्ड और खिड़कियां लगाती हैं। उन्होंने यह नाम चीनी शब्द गुज़ी, "स्थिर बुद्धि" से लिया है, हालांकि यह तथ्य कि यह एक इतालवी लक्जरी ब्रांड की तरह लगता था, पूरी तरह से अवांछित नहीं था।
लगभग दो दशकों से, चेन उस समस्या को हल करने की कोशिश कर रहे हैं जो उनके लिए एक इंजीनियरिंग समस्या है: यथासंभव तकनीकी रूप से कारखानों में उतने श्रमिकों को कैसे समाप्त किया जाए - या, उनकी राय में, मुक्त किया जाए। पिछले साल के अंत में, मैंने शंघाई के पश्चिमी बाहरी इलाके में गुची मुख्यालय में उनसे मुलाकात की। मुख्य कार्यालय के बगल में कई गोदाम हैं जहाँ गुची के इंजीनियर अपने ग्राहकों की विशिष्टताओं के अनुरूप रोबोट के साथ काम करते हैं। चेन, एक प्रशिक्षित इंजीनियर, ने 2019 में कारखाने में सबसे कठिन स्वचालन कार्य को संबोधित करने के उद्देश्य से गुची की स्थापना की: "अंतिम असेंबली", उत्पादन का अंतिम चरण, जब सभी मिश्रित टुकड़े - डैशबोर्ड, खिड़कियां, पहिए और सीट कुशन - एक साथ आते हैं। वर्तमान में, उनके रोबोट बिना किसी मानवीय हस्तक्षेप के कार पर पहिए, डैशबोर्ड और खिड़कियां लगा सकते हैं, लेकिन उनका अनुमान है कि अंतिम असेंबली का 80% अभी तक स्वचालित नहीं हुआ है। चेन ने इसी पर अपना ध्यान केंद्रित किया है।
दुनिया के अधिकांश हिस्सों की तरह, चीन में AI रोजमर्रा की जिंदगी का हिस्सा बन गया है। लेकिन जो चीनी राजनेताओं और उद्योगपतियों को सबसे ज्यादा उत्साहित करता है, वह है रोबोटिक्स के क्षेत्र में हो रही प्रगति, जो AI में प्रगति के साथ मिलकर काम की दुनिया में क्रांति ला सकती है। चीन के वर्तमान रोबोटिक्स बूम के पीछे की तकनीक डीप लर्निंग है, जो ChatGPT जैसे बड़े भाषा मॉडल के पीछे का गणितीय इंजन है, जो विशाल डेटासेट से पैटर्न को पहचानकर सीखते हैं। कई शोधकर्ता मानते हैं कि मशीनें भौतिक दुनिया को नेविगेट करना सीख सकती हैं जिस तरह से ChatGPT ने भाषा को नेविगेट करना सीखा: नियमों का पालन करके नहीं, बल्कि पर्याप्त डेटा को अवशोषित करके ताकि मानव निपुणता जैसी कुछ उभर सके। कई प्रौद्योगिकीविदों का लक्ष्य ऐसे ह्यूमनॉइड रोबोट का विकास करना है जो कारखाने के श्रम को करने में सक्षम हों - ऐसा काम जो दुनिया भर में करोड़ों लोगों को रोजगार देता है।
इस लक्ष्य को प्राप्त करने के लिए भारी मात्रा में संसाधन लगाए जा रहे हैं। 2025 में, चीन ने क्वांटम कंप्यूटिंग, स्वच्छ ऊर्जा और रोबोटिक्स सहित रणनीतिक प्रौद्योगिकियों के लिए £100 बिलियन के फंड की घोषणा की। प्रमुख शहरों ने भी रोबोटिक्स परियोजनाओं में अपने स्वयं के संसाधनों का निवेश किया है। अब लगभग 140 चीनी फर्म हैं जो ह्यूमनॉइड बनाने की उम्मीद कर रही हैं। कुछ अग्रणी फरवरी में चंद्र नव वर्ष महोत्सव गाला में दिखाई दिए, जो एक राज्य-निर्देशित तमाशा था जो भव्यता और राष्ट्रीय महत्व के मामले में सुपर बाउल के तुलनीय था। सैकड़ों लाखों लोगों ने रोबोटों को कॉमेडी स्केच और मार्शल आर्ट रूटीन करते देखा। प्रगति की गति आश्चर्यजनक रही है। पिछले साल, रोबोट एक सिंक्रनाइज़ चीयरलीडिंग रूटीन कर रहे थे। इस साल, उन्होंने कार्टव्हील और पार्कौर किया। इच्छित संदेश स्पष्ट था: रोबोट आ रहे हैं, और चीन उन्हें बनाने वाला राष्ट्र होगा।
एक ऐसी दुनिया जहाँ AI-संचालित ह्यूमनॉइड रोबोट बड़े पैमाने पर उत्पादित होते हैं, अभी भी विज्ञान कथा के दायरे में लगती है। पिछले साल के अंत में, मैं रोबोट भविष्य के कितने करीब हैं, यह समझने की कोशिश करने के लिए पांच शहरों में 11 रोबोटिक्स कंपनियों में गया। मैं कई महत्वाकांक्षी उद्यमियों से मिला, जो एक ऐसे वातावरण में काम कर रहे थे जो नगरपालिका सरकारों के साथ इतना गहराई से एकीकृत था कि निजी और सार्वजनिक के बीच का अंतर अपना अर्थ खो रहा था। वे सभी, विभिन्न तरीकों से, ऐसे रोबोट बनाने और व्यावसायीकरण करने की दौड़ में लगे हुए थे जो मानव श्रमिकों को प्रतिस्थापित कर सकें - और उनमें से कुछ के पास पहले से ही उत्सुक पश्चिमी खरीदार हैं।
गुची रोबोटिक्स गोदामों में से एक के अंदर, जनरल मोटर्स के कर्मचारियों की एक टीम कनाडा में शिपमेंट से पहले गुची की पहिया-स्थापना मशीनों का परीक्षण कर रही थी। एक सफेद जीएम ट्रक का ढांचा कमरे के केंद्र में एक उठे हुए मंच पर था। ट्रक, चार बड़े रोबोटिक आर्म्स और तारों के जंगल से घिरा हुआ, स्टील बार से बने पीले सुरक्षा घेरे के अंदर बैठा था। मैंने किनारे से देखा जब एक दाढ़ी वाला जीएम इंजीनियर स्टील के पिंजरे के बाहर एक नियंत्रण कक्ष के साथ छेड़छाड़ कर रहा था।
इंजीनियर, एक अमेरिकी व्यक्ति जिसे मैं जैक कहूंगा, जीएम के "विनिर्माण अनुकूलन" प्रभाग में काम करता था। "कठोरता से कहूं तो, जो कुछ भी लोगों को उत्पादन लाइन से हटाता है, वह मूल रूप से मेरा काम है," जैक ने मुझे बताया। जनरल मोटर्स हर साल उसके प्रभाग के लिए नौकरी-कमी लक्ष्य निर्धारित करता है, उसने कहा, जिसके लिए उत्तरी अमेरिका के सभी संयंत्रों में एक निश्चित संख्या में कारखाने के श्रमिकों को समाप्त करने की आवश्यकता होती है। जैक ने समझाया कि उसकी टीम ने एक जर्मन-आधारित प्रतियोगी - जो स्वयं एक चीनी कंपनी के 95% स्वामित्व में है - पर गुची को चुना क्योंकि दूसरा एक चलती असेंबली लाइन की पेशकश नहीं कर सका। गुची मशीनों की खरीद से एक ही कारखाने में लाइन पर 12 असेंबली ऑपरेटर समाप्त हो जाएंगे, उसने कहा। (जनरल मोटर्स ने नौकरी-कमी लक्ष्यों की पुष्टि नहीं की, लेकिन एक प्रवक्ता ने कहा कि यह सुरक्षा, दक्षता और गुणवत्ता में सुधार में मदद करने के लिए प्रौद्योगिकी लागू करता है, "विशेष रूप से शारीरिक रूप से मांग वाले या दोहराव वाले कार्यों के लिए।")
ट्रम्प प्रशासन के अमेरिका में औद्योगिक उत्पादन को पुनर्जीवित करने के मिशन का एक व्यंग्य यह है कि अमेरिका को फिर से महान बनाने के लिए आवश्यक अधिकांश मशीनरी उस देश से आती है जिसने मूल रूप से अमेरिका के औद्योगिक पुनरुद्धार को प्रेरित किया था। चीन अब सालाना दुनिया की नई फैक्ट्री रोबोट इंस्टॉलेशन का आधे से अधिक हिस्सा है। "लगभग कुछ भी नहीं है जो चीनी इंजीनियर कर सकते हैं जो अमेरिकी नहीं कर सकते," चेन ने मुझे बताया। "यह वास्तव में लागत और गति है, और आप किसी समस्या पर कितने लोगों को फेंक सकते हैं - हमारे पास 1,000 हो सकते हैं जो यह काम कर सकते हैं, और उनके पास 100 हो सकते हैं।"
चेन और मैं गोदाम के अंत तक चले गए, जहाँ से अब हमें जीएम ट्रक का सामने का दृश्य दिखाई दे रहा था। जैक को कुछ देर काम करते देखने के बाद, चेन ने मुझे कार बॉडी के प्रत्येक तरफ रोबोटिक आर्म्स की ओर इशारा किया: "क्या आप उन्हें देखते हैं? यह स्क्रूड्राइविंग रोबोट है। भले ही विनिर्माण उत्तरी अमेरिका में वापस आ जाए, वे अब स्क्रू कसने के लिए श्रमिकों को लाइन पर नहीं रखेंगे। वे रोबोट का उपयोग करेंगे।"
मुझे यकीन नहीं था। क्या ट्रम्प को चुनने का एक कारण यह नहीं था कि वे अपनी ब्लू-कॉलर नौकरियां वापस चाहते थे? चेन ने इसे शुद्ध भ्रम माना। दुनिया बदल गई थी, और युवा लोग भी। चेन ने मुझे चीन के बारे में सोचने के लिए कहा, जहाँ कारखाने की संस्कृति गहराई से निहित है, लेकिन युवा चीनी तेजी से बोरियत को सहन करने में अनिच्छुक हैं। "यह बस लोगों के तार अब ऐसे ही हैं।" अगर चीनी लोग भी अब कारखाने का काम करने को तैयार नहीं हैं, तो चेन कह रहा था, तो अमेरिकी क्यों होंगे?
गुची मुख्यालय की मेरी यात्रा के एक सप्ताह बाद, मैं चेन से उत्तर-पश्चिम बीजिंग में मिला, जहाँ शहर के शीर्ष विश्वविद्यालय स्थित हैं। उन्होंने मुझे चीन के सबसे चर्चित ह्यूमनॉइड रोबोटिक्स स्टार्टअप्स में से एक, गैलबोट के मुख्यालय में एक बैठक के लिए आमंत्रित किया था। इसके पहिएदार ह्यूमनॉइड्स में से एक ने इस साल के चंद्र नव वर्ष समारोह में एक स्केच में अभिनय किया, जहाँ इसने एक पुरुष अभिनेता को शेल्फ से पानी की बोतल दी और कपड़े तह किए। 2023 में अपनी स्थापना के बाद से, गैलबोट ने अपने कई प्रतिस्पर्धियों की तुलना में कम दिखावटी रणनीति अपनाई है: ऐसे रोबोट बनाना जो वस्तुओं को उठाना और उन्हें सुरक्षित और मज़बूती से कहीं और रखना जैसे सामान्य कार्य कर सकें। संस्थापक, वांग हे, ने हाल ही में एक चीनी रिपोर्टर से कहा कि उनके रोबोट पहले से ही कई चीनी कारखानों में तैनात हैं, हालांकि वीडियो उन्हें अत्यधिक नियंत्रित सेटिंग्स में दिखाते हैं।
गैलबोट के "पिक-एंड-प्लेस" रोबोट अपने बैकफ्लिपिंग प्रतिद्वंद्वियों की तुलना में बहुत मूर्ख लग सकते हैं, लेकिन एक महत्वपूर्ण अंतर यह है कि रोबोट कलाबाज पूर्व-प्रोग्राम किए गए निर्देशों के अनुसार काम करते हैं: वे गति नियंत्रण और संतुलन के करतब हैं, लेकिन वे स्क्रिप्ट से बाहर नहीं जाते हैं। गैलबोट में विकसित की जा रही तकनीक को रोबोटिस्ट विजन-लैंग्वेज-एक्शन मॉडल (VLA) कहते हैं, जिसका उद्देश्य मशीनों को अपरिचित और तरल वातावरण में संचालित करने की अनुमति देना है, ठीक वैसे ही जैसे मनुष्य करते हैं। फिलहाल, गैलबोट के रोबोट उन कार्यों को मज़बूती से नहीं कर सकते हैं जो मनुष्यों के लिए तुच्छ होंगे - जैसे, बर्तन धोना - लेकिन वांग ने चीनी रिपोर्टरों से कहा है कि उनका लक्ष्य तीन वर्षों में 10,000 रोबोटों को बुनियादी खुदरा और कारखाने का काम संभालना है। (कुछ AI अग्रणी, जैसे यान लेकुन, इस बात पर अत्यधिक संदेह रखते हैं कि डीप लर्निंग का वर्तमान प्रतिमान गैलबोट जैसी कंपनियों की उम्मीदों के अनुरूप परिणाम देगा।)
चेन की यात्रा का उद्देश्य यह देखना था कि गैलबोट के रोबोट को इलेक्ट्रिक वाहन कारखाने के अंदर कैसे तैनात किया जा सकता है, जो दुनिया के सबसे जटिल विनिर्माण वातावरणों में से एक है। इस तरह के करतब के लिए रोबोट को कारखाने के परिदृश्यों के एक बड़े समूह पर प्रशिक्षित करने की आवश्यकता होती है, लेकिन उपयोग करने के लिए कोई तैयार डेटाबेस उपलब्ध नहीं है। गैलबोट को कारखाने में अपने रोबोट तैनात करने का कोई भी मौका देने के लिए, उन्हें दशकों के जटिल विनिर्माण अनुभव वाले एक विशेषज्ञ की आवश्यकता है जो ह्यूमनॉइड के लिए सही कार्य परिभाषित कर सके, उसे किस डेटा को सीखने की आवश्यकता है, और यहां तक कि वह भी भर सके जो रोबोट अभी तक नहीं कर सकता है। चेन यही करने की पेशकश करता है।
हम एक टॉवर के शीर्ष तक एक लिफ्ट में गए, और पेकिंग विश्वविद्यालय के हरे-भरे परिसर के दृश्य वाले एक बैठक कक्ष में दाखिल हुए। जल्द ही एक वरिष्ठ गैलबोट इंजीनियर आया और चेन को कंपनी के नवीनतम विकास का अवलोकन देना शुरू कर दिया। गैलबोट रोबोट को हाल ही में बीजिंग के आसपास 10 फार्मेसियों में तैनात किया गया था, उसने कहा, दिन में 24 घंटे दवाएं वितरित कर रहा था। Nvidia चिप्स द्वारा संचालित, उनकी लागत लगभग 700,000 युआन (£76,000) थी। एक बिंदु पर, इंजीनियर ने गैलबोट के ह्यूमनॉइड के पीछे की तकनीक पर चर्चा करने वाले एक स्लाइड पर विराम लिया।
इंजीनियर ने बताया कि डीप लर्निंग के उदय से पहले, चेन जैसे औद्योगिक रोबोटिस्ट अपने मशीनों को हाथ से प्रशिक्षित करते थे। प्रोग्रामर हर चाल के लिए स्पष्ट निर्देश लिखते थे। जब कुछ गलत हो जाता था, तो वे कोड को डीबग करते थे और नई परिदृश्यों को संभालने के लिए एक और पंक्ति जोड़ते थे। डीप लर्निंग हस्तलिखित निर्देशों को अधिक लचीले VLA मॉडल से बदलने का वादा करता है। ऐसे मॉडल बनाने के लिए एक प्रमुख बाधा - रोबोट के लिए "चैटजीपीटी क्षण" अभी तक नहीं आने का एक बड़ा कारण - डेटा की कमी है।
शोधकर्ताओं के पास इस डेटा को एकत्र करने के दो तरीके हैं। एक टेलीऑपरेशंस नामक एक मैनुअल प्रक्रिया के माध्यम से है, जहाँ मनुष्य एक रोबोट को एक सटीक कार्य करने के लिए मार्गदर्शन करते हैं, कभी-कभी सैकड़ों हजारों बार। प्रत्येक कार्य डेटा का एक पैकेज रिकॉर्ड करता है, जिसमें दृश्य जानकारी, हाथ की स्थिति, टॉर्क, गहराई, और अन्य शामिल हैं, जिसे "एक्शन सीक्वेंस" कहा जाता है जिसका उपयोग बाद में VLA को प्रशिक्षित करने के लिए किया जाएगा। यह विधि श्रम-गहन है, यही कारण है कि गैलबोट दूसरे को पसंद करता है: आभासी वातावरण का निर्माण। "यह अवतार की तरह है," इंजीनियर ने हमें बताया, ब्लॉकबस्टर फिल्म का जिक्र करते हुए। "मुझे शारीरिक रूप से युद्ध के मैदान में कदम रखने की ज़रूरत नहीं है, मैं बस अपने पॉड में लेट जाता हूँ, और यह सब अनुकरण कर सकता हूँ।"
इंजीनियर ने हमें गैलबोट रोबोटों के वास्तविक जीवन के वीडियो दिखाए जो स्टोर क्लर्क, बुजुर्ग देखभाल साथी और डिलीवरी के लिए लाइव सड़क यातायात को नेविगेट करने वाले रोबोट कुत्तों के रूप में परीक्षण किए जा रहे थे। इंजीनियर ने दावा किया कि यदि वे पर्याप्त संसाधन समर्पित करते हैं तो डिलीवरी रोबोट "दो से तीन साल" में तैयार हो सकते हैं। (उन्होंने अभी तक फैसला नहीं किया था।) सभी संभावनाओं को जानने के बाद, चेन अपनी उत्तेजना को मुश्किल से रोक सका। उन्होंने गैलबोट के ह्यूमनॉइड को स्क्रू चलाने के लिए प्रशिक्षित करने की योजना प्रस्तावित की। मानव श्रमिक इसे सहज रूप से करते हैं, लेकिन इसे एक अनस्क्रिप्टेड रोबोट के लिए तोड़ना कई सूक्ष्म निर्णयों को प्रकट करता है - छेद ढूंढना, स्क्रू को संरेखित करना, सही मात्रा में दबाव और टॉर्क लगाना, और कब रुकना जानना। इंजीनियर ने चेन को बताया कि गैलबोट रोबोट पहले से ही पेचकस जैसे उपकरणों को पकड़ और हेरफेर कर सकते हैं, लेकिन वह अभी भी निश्चित नहीं था कि यह स्क्रू को संरेखित कर सकता है या जान सकता है कि इसे कितना कसना है। "आइए जिम्मेदारियों को परिभाषित करें," चेन ने उसे आश्वस्त किया। "आप क्या मज़बूती से संभाल सकते हैं, और क्या मैं ले लूंगा।"
दोनों पक्षों ने एक लक्ष्य पर सहमति व्यक्त की: कारखाने में व्यवहार्य होने के लिए, गैलबोट ह्यूमनॉइड को आठ सेकंड से कम समय में एक स्क्रू को कसने की आवश्यकता होगी। इंजीनियर थोड़ा अभिभूत होकर पीछे झुक गया। "आप लोगों के पास इंजीनियरिंग में विशेषज्ञता की एक विस्तृत श्रृंखला है।"
"अलग-अलग जीन," चेन ने सहजता से जवाब दिया। "हम मिलकर उद्योग की समस्याओं को हल कर सकते हैं।"
बैठक के बाद, मैं एक ब्लॉक उत्तर की ओर एक पास के मॉल में गया, जहाँ गैलबोट ने एक प्रचार प्रदर्शन में एक कियोस्क के पीछे अपना एक खुदरा रोबोट तैनात किया था। G1 मॉडल सफेद और पुतले जैसा है। अभी भी एक मानव कार्यकर्ता खड़ा था, संभवतः कुछ गलत होने की स्थिति में। मैंने टैबलेट पर पोकारी स्वेट, एक जापानी एनर्जी ड्रिंक का ऑर्डर दिया। G1 शेल्फ की ओर घूमा, उसके यांत्रिक हाथ पंखों की तरह किनारों पर निकले हुए थे, इससे पहले कि एक चिमटी मेरे पेय को पकड़ ले और उसे उठा ले। इसने बोतल को काउंटर पर थोड़ी अधिक ऊंचाई से रखा, इसलिए पेय, हालांकि गिरा नहीं, कुछ सेंटीमीटर बगल में उछल गया।
चेन ने हमारे एक साथ बिताए समय के दौरान इस बात पर जोर दिया था कि यह तकनीक मेरी कल्पना से कहीं अधिक तेजी से आगे बढ़ रही है। लेकिन G1 रोबोट के साथ मेरा अनुभव - अनिवार्य रूप से एक महिमामंडित, अर्ध-सक्षम वेंडिंग मशीन - ने मुझे संशयवादी बना दिया। दो महीने बाद, फरवरी में, मैंने अपने अपार्टमेंट से चंद्र नव वर्ष गाला देखा। गैलबोट का रोबोट एक पूर्व-रिकॉर्डेड सेगमेंट में दिखाई दिया, और यह अलग लग रहा था। चिमटी गायब हो गई थी, जिसे 10 आर्टिकुलेटेड उंगलियों से बदल दिया गया था। हाथ अब भारी नहीं थे बल्कि फुर्तीले और मानवरूपी थे। जब रोबोट ने शेल्फ से पानी की बोतल उठाई, तो यह पहले की तुलना में बहुत तेज और अधिक निश्चित रूप से चला गया। मुझे नहीं पता कि इसमें से कितना संपादित या मंचित किया गया था। लेकिन मुझे चेन की भावनाओं का स्वाद मिला।
यदि आपने किसी चीनी रोबोट को नृत्य करते या कुंग फू करते देखा है, तो संभावना है कि यह यूनिट्री द्वारा बनाया गया था। पिछले साल, कंपनी ने 5,500 से अधिक ह्यूमनॉइड रोबोट शिप किए, जो दुनिया में किसी भी कंपनी से अधिक है। हाल ही में, एक वायरल वीडियो सामने आया जिसमें चेंगदू में चीनी पॉप स्टार वांग लेहोम का एक संगीत कार्यक्रम दिखाया गया था, जहाँ यूनिट्री रोबोट ने बैकअप डांसर के रूप में काम किया। एलोन मस्क ने इसे एक शब्द के साथ रीपोस्ट किया: "प्रभावशाली।" वायरल प्रदर्शन चीन के लिए अच्छा विपणन करते हैं। लेकिन यूनिट्री के मुख्य ग्राहक प्रयोगशालाएं और विश्वविद्यालय हैं, जिनमें ऑक्सफोर्ड, कार्नेगी मेलन, यूसी सैन डिएगो और बोस्टन डायनेमिक्स शामिल हैं, जो रोबोट खरीदते हैं और उन्हें अधिक बुद्धिमान बनाने के लिए सॉफ्टवेयर विकसित करते हैं। एक प्रवक्ता ने मुझे बताया कि यूनिट्री चाहती है कि उनके रोबोट अंततः कारखानों और घरों में प्रवेश करें ताकि वे "लोगों के लिए खतरनाक, दोहराव वाले और थकाऊ काम कर सकें"।
देर शाम, मैं निंगबो शहर में एक कैब में था, जब मुझे यूनिट्री के प्रवक्ता से एक संदेश मिला। हमने अगले सुबह हांग्जो में उनके मुख्यालय में मिलने की योजना बनाई थी, जो ट्रेन से लगभग एक घंटे की दूरी पर था, लेकिन कंपनी ने अचानक कल के लिए एक "महत्वपूर्ण कार्यक्रम" निर्धारित किया था जो कार्यालय के पास की सभी सड़कों को बंद कर देगा। चीन में बहुत सी चीजें नहीं हैं जो यातायात को रोक सकती हैं और कॉर्पोरेट समय-सीमा को मोड़ सकती हैं। मैंने यह देखने के लिए अपना फोन चेक किया कि राष्ट्रपति शी जिनपिंग कहाँ थे: दो दिन पहले, उन्होंने ग्वांगझोउ में एक खेल आयोजन में भाग लिया था, लेकिन यह स्पष्ट नहीं था कि वह आगे कहाँ जा रहे थे।
AI टॉक शो
चार प्रमुख AI मॉडल इस लेख पर चर्चा करते हैं
"लेख सिद्ध कार्य-विशिष्ट स्वचालन को अप्रमाणित सामान्य-उद्देश्य वाले ह्यूमनॉइड के साथ मिलाता है; अधिकांश तैनात रोबोट नियंत्रित वातावरण में काम करते हैं, न कि उन गंदे कारखानों में जिनका प्रचार वादा करता है।"
चीन का रोबोटिक्स पुश वास्तविक और अच्छी तरह से वित्त पोषित है, लेकिन लेख तीन अलग-अलग समस्याओं को मिलाता है: (1) कार्य-विशिष्ट स्वचालन (गुची के पहिया/डैशबोर्ड रोबोट - सिद्ध, तैनात करने योग्य), (2) असंरचित वातावरण में सामान्य-उद्देश्य वाले ह्यूमनॉइड (गैलबॉट के VLA - अभी भी विश्वसनीयता पर कठिन सीमाएं मार रहे हैं), और (3) प्रतिस्पर्धी लागत पर कारखाने-पैमाने पर तैनाती (अभी तक मात्रा में प्रदर्शित नहीं)। जीएम उपाख्यान बताने वाला है: प्रति रोबोट 12 नौकरियां समाप्त की गईं, लेकिन गुची के रोबोट *नियंत्रित सेटिंग्स* में पूर्व-इंजीनियर वर्कफ़्लो के साथ काम करते हैं। जी1 खुदरा रोबोट का एक पेय बोतल उछालना, और फिर फरवरी तक रहस्यमय रूप से सुधारना, क्षमता से आगे प्रस्तुति थिएटर का संकेत देता है। डीप लर्निंग का डेटा बॉटलनेक वास्तविक है - यान लेकुन के संदेह का हवाला दिया गया है लेकिन खारिज कर दिया गया है। यूनिट्री की 5,500 इकाइयां ज्यादातर प्रयोगशालाओं में शिप की गईं, कारखानों में नहीं। लेख तकनीकी-आशावाद के रूप में पढ़ता है; वास्तविक कारखाने की तैनाती की समय-सीमा अस्पष्ट बनी हुई है।
यदि सिमुलेशन के माध्यम से VLA प्रशिक्षण ( 'अवतार' दृष्टिकोण) बड़े पैमाने पर काम करता है, तो डेटा बॉटलनेक ढह जाता है और तैनाती संदेहवादियों की अपेक्षा से तेज हो जाती है। इसके विपरीत, यदि वर्तमान डीप लर्निंग निपुणता कार्यों पर एक छत तक पहुँचता है - जैसा कि लेकुन और अन्य तर्क देते हैं - ये कंपनियां एक मृगतृष्णा का पीछा करते हुए वर्षों तक पूंजी जलाती हैं।
"विशेष, कठोर औद्योगिक हथियारों से सामान्य-उद्देश्य वाले ह्यूमनॉइड रोबोटों में संक्रमण वर्तमान में वास्तविक दुनिया के प्रशिक्षण डेटा और हार्डवेयर विश्वसनीयता की कमी से बाधित है, जिसे विपणन वीडियो दर्शाने में विफल रहते हैं।"
चीन में 'रोबोटिक्स क्रांति' की कहानी वर्तमान में उच्च-स्तरीय राज्य पूंजी आवंटन और महत्वपूर्ण विपणन थिएटर का मिश्रण है। जबकि गुची जैसी कंपनियां कठोर, दोहराव वाले असेंबली कार्यों में वास्तविक दक्षता लाभ प्राप्त कर रही हैं, सामान्य-उद्देश्य वाले ह्यूमनॉइड रोबोटों की छलांग सट्टा बनी हुई है। VLA (विजन-लैंग्वेज-एक्शन) मॉडल के लिए Nvidia चिप्स पर निर्भरता एक महत्वपूर्ण आपूर्ति श्रृंखला भेद्यता पैदा करती है जिसे लेख अनदेखा करता है। निवेशकों को औद्योगिक स्वचालन - जो पहले से ही एक सिद्ध, उच्च-विकास क्षेत्र है - और प्रचारित ह्यूमनॉइड बाजार के बीच अंतर करना चाहिए, जो वर्तमान में गंभीर डेटा-दुर्लभता बॉटलनेक और विश्वसनीयता मुद्दों का सामना कर रहा है। 'मानवॉइड' समय-सीमा पर अधिक वादा करने वाली फर्मों के लिए मूल्यांकन सुधार की उम्मीद करें जिनमें स्पष्ट, स्केलेबल ROI की कमी है।
यदि चीन बड़े पैमाने पर, राज्य-सब्सिडी वाले डेटा संग्रह के माध्यम से भौतिक निपुणता के लिए 'चैटजीपीटी क्षण' को सफलतापूर्वक दोहराता है, तो वे विनिर्माण में लागत-लाभ प्राप्त कर सकते हैं जो पश्चिमी श्रम-आधारित पुन: औद्योगिकीकरण प्रयासों को पूरी तरह से अप्रचलित कर देगा।
"N/A"
लेख चीनी रोबोटिक्स में एक महत्वपूर्ण, राज्य-समर्थित त्वरण को सही ढंग से चिह्नित करता है - भारी नगरपालिका वित्त पोषण, सैकड़ों स्टार्टअप, और शुरुआती निर्यात जीत (जीएम गुची किट खरीद रहा है) रोबोट OEM और AI-चिप आपूर्तिकर्ताओं के लिए निकट-अवधि के राजस्व अवसर प्रदान करते हैं। लेकिन टुकड़ा प्रमुख घर्षणों को कम करके आंकता है: निपुण हेरफेर एक कठिन एमएल समस्या बनी हुई है, उच्च-गुणवत्ता वाला टेलीऑपरेशन/लेबल किया गया डेटा महंगा है, और कारखाने की तैनाती के लिए दोहराने योग्य विश्वसनीयता, सेवा नेटवर्क और सुरक्षा/नियामक साइन-ऑफ की आवश्यकता होती है। नगरपालिका सब्सिडी यूनिट अर्थशास्त्र को छिपा सकती है; मंच-प्रबंधित डेमो (गाला रूटीन) मजबूत औद्योगिक प्रदर्शन को साबित नहीं करते हैं। भू-राजनीति/निर्यात नियंत्रण और बिक्री के बाद की सेवा लागत दूसरे क्रम के जोखिम हैं जो अपनाने को धीमा कर सकते हैं और मार्जिन को संपीड़ित कर सकते हैं।
"चीन पहिया माउंटिंग जैसे लक्षित कार्यों के लिए हार्डवेयर/इंस्टॉल का नेतृत्व करता है, लेकिन सामान्य-उद्देश्य वाले ह्यूमनॉइड डेटा/विश्वसनीयता बाधाओं का सामना करते हैं जो व्यापक कारखाने प्रतिस्थापन में देरी करते हैं।"
चीन का रोबोटिक्स उछाल वास्तविक है - वैश्विक कारखाने रोबोट प्रतिष्ठानों का 50% से अधिक, £100 बिलियन राज्य कोष, और जीएम के गुची खरीद (जर्मन प्रतिद्वंद्वियों की तुलना में कम लागत पर प्रति लाइन 12 नौकरियां समाप्त करना) जैसे पश्चिमी सत्यापन। विशिष्ट जीत: BYD/NIO के लिए EV संयंत्रों में पहिया/डैशबोर्ड स्वचालन। लेकिन ह्यूमनॉइड (गैलबॉट/यूनिट्री) डेमो डार्लिंग हैं - 5,500 यूनिट्री इकाइयां ज्यादातर प्रयोगशालाओं/विश्वविद्यालयों में शिप की गईं, कारखानों में नहीं; VLA मॉडल सिम्स/टेलेप के बावजूद डेटा की कमी से बाधित हैं। भू-राजनीति मंडराती है: ट्रम्प टैरिफ अमेरिकी खरीदारों के लिए लागत बढ़ा सकते हैं। निकट-अवधि के बुलिश औद्योगिक हथियार (जैसे, फैनुक/एबीबी सहकर्मी), तटस्थ-से-बुलिश ह्यूमनॉइड जब तक <8s स्क्रूड्राइविंग मज़बूती से स्केल नहीं हो जाता।
यदि VLA प्रशिक्षण LLM डेटा फ्लाईव्हील को दर्शाता है - टेलीऑप के लिए चीन के श्रम और वास्तविक डेटा के लिए कारखानों का लाभ उठाना - ह्यूमनॉइड 2-3 वर्षों में कारखाने की व्यवहार्यता तक पहुंच सकते हैं, लेकुन जैसे संदेहवादियों को कुचल सकते हैं और वैश्विक श्रम व्यवधान को भड़का सकते हैं।
"चीन के घरेलू चिप विकल्प और डेटा एनोटेशन में श्रम-लागत लाभ VLA बॉटलनेक को पश्चिमी संदेहवादियों की अपेक्षा से तेजी से ध्वस्त कर सकते हैं, समय-सीमा को 5+ वर्षों से 2-3 वर्षों तक बदल सकते हैं।"
Google और OpenAI दोनों Nvidia चिप निर्भरता को महत्वपूर्ण मानते हैं लेकिन दूसरी तरफ चूक जाते हैं: चीन का घरेलू चिप पुश (हुआवेई, लोंगसन) का मतलब है कि VLA प्रशिक्षण 18-24 महीनों के भीतर अमेरिकी आपूर्ति श्रृंखलाओं से अलग हो सकता है। यह पश्चिमी निर्यात नियंत्रण की परवाह किए बिना तैनाती समय-सीमा को तेज करता है। इसके अलावा, किसी ने भी श्रम-लागत मध्यस्थता की मात्रा निर्धारित नहीं की है: चीन में $2-5/घंटा पर टेलीऑप एनोटेशन बनाम अमेरिका में $25-40/घंटा मौलिक रूप से डेटा-संग्रह अर्थशास्त्र को बदल देता है और यदि मात्रा बढ़ती है तो 'डेटा बॉटलनेक' कथा को तोड़ देता है।
"हार्डवेयर विश्वसनीयता और रखरखाव लागत प्रशिक्षण डेटा या चिप उपलब्धता की लागत की तुलना में पैमाने के लिए एक बड़ी संरचनात्मक बाधा बनी हुई है।"
एंथ्रोपिक, डेटा एनोटेशन के लिए श्रम-लागत मध्यस्थता पर आपका ध्यान हार्डवेयर विश्वसनीयता की महत्वपूर्ण बाधा को याद करता है, न कि केवल मॉडल प्रशिक्षण को। सस्ते टेलीऑप डेटा के साथ भी, जीएम में 'प्रति रोबोट 12 नौकरियां' मीट्रिक केवल तभी मान्य होता है जब हार्डवेयर को रखरखाव या पुन: अंशांकन के लिए निरंतर, महंगा मानवीय हस्तक्षेप की आवश्यकता नहीं होती है। यदि विफलताओं के बीच औसत समय (MTBF) कम रहता है, तो परिचालन व्यय (OpEx) सस्ते प्रशिक्षण डेटा से प्राप्त किसी भी बचत को नकार देगा, चाहे चिप मूल या श्रम लागत कुछ भी हो।
"केवल घरेलू चिप्स बड़े पैमाने पर तैनाती को अनलॉक नहीं करेंगे; इलेक्ट्रोमैकेनिकल आपूर्ति श्रृंखला, विश्वसनीयता और सेवा अवसंरचना वास्तविक अवरोधक कारक हैं।"
एंथ्रोपिक/ओपनएआई, घरेलू एनपीयू 18-24 महीनों में प्रशिक्षण क्षमता के लिए विश्वसनीय हैं, लेकिन यह पूर्ण-स्टैक वास्तविकताओं को कम करके आंकता है: उच्च-विश्वसनीयता एक्चुएटर्स, सटीक गियरबॉक्स, सेंसर, दुर्लभ-पृथ्वी सामग्री और प्रमाणित सेवा नेटवर्क अलग-अलग बाधाएं हैं जिन्हें स्केल करने में अधिक समय लगता है। सस्ते कंप्यूट और कम-वेतन वाले टेलीऑप के साथ भी, खराब एमटीबीएफ, स्पेयर-पार्ट्स लैग, और सुरक्षा प्रमाणन लागत ओपेक्स को उच्च रखेगी और वास्तविक कारखाने-ग्रेड ह्यूमनॉइड अर्थशास्त्र में देरी करेगी।
"हार्मोनिक ड्राइव आपूर्ति बाधाएं चीन के ह्यूमनॉइड स्केलिंग में चिप्स या टेलीऑप डेटा की परवाह किए बिना 2-3 साल की देरी करेंगी।"
एंथ्रोपिक/ओपनएआई, घरेलू चिप्स मदद करते हैं लेकिन हार्मोनिक ड्राइव गियरबॉक्स को अनदेखा करते हैं - जापान 70% बाजार को नियंत्रित करता है (हार्मोनिक ड्राइव/लीडरड्राइव डुओपोली), निर्यात नियंत्रण/टैरिफ लागत 20-30% बढ़ाते हैं। चीन का रोबोट घनत्व (392/10k श्रमिक) कोरिया (1,012) से पीछे है - स्केलिंग के लिए पहले आपूर्ति श्रृंखला लचीलापन की आवश्यकता होती है, टेलीऑप मध्यस्थता के बावजूद ह्यूमनॉइड कारखानों में 2-3 साल की देरी होती है। औद्योगिक हथियार निकट-अवधि में जीतते हैं; ह्यूमनॉइड कैपेक्स जाल का जोखिम उठाते हैं।
पैनल निर्णय
कोई सहमति नहींजबकि चीन का रोबोटिक्स पुश वास्तविक है और महत्वपूर्ण राज्य वित्त पोषण द्वारा समर्थित है, पैनल सहमत है कि ह्यूमनॉइड रोबोटों के आसपास का प्रचार डेटा की कमी, विश्वसनीयता के मुद्दों और उच्च परिचालन लागत के कारण बढ़ा-चढ़ाकर पेश किया गया है। निकट-अवधि का अवसर औद्योगिक हथियारों में निहित है, जबकि ह्यूमनॉइड को व्यापक कारखाने की तैनाती प्राप्त करने से पहले महत्वपूर्ण चुनौतियों का सामना करना पड़ता है।
निकट-अवधि का अवसर औद्योगिक हथियारों में निहित है, जो पहले से ही सिद्ध हैं और उनमें उच्च विकास क्षमता है।
विश्वसनीयता के मुद्दे और उच्च परिचालन लागत, जिसमें रखरखाव और पुन: अंशांकन शामिल हैं, ह्यूमनॉइड रोबोटों को व्यापक रूप से अपनाने में महत्वपूर्ण चुनौतियां पेश करते हैं।