एनवीडिया ने आज घोषणा की कि वह कॉसमॉस नामक मूलभूत एआई मॉडल का एक परिवार जारी कर रहा है जिसका उपयोग ह्यूमनॉइड्स, औद्योगिक रोबोट और सेल्फ-ड्राइविंग कारों को प्रशिक्षित करने के लिए किया जा सकता है। जबकि भाषा मॉडल प्रचुर मात्रा में पुस्तकों, लेखों और सोशल मीडिया पोस्ट पर प्रशिक्षण द्वारा पाठ उत्पन्न करना सीखते हैं, कॉसमॉस को भौतिक दुनिया की छवियां और 3 डी मॉडल उत्पन्न करने के लिए डिज़ाइन किया गया है।
लास वेगास में वार्षिक सीईएस सम्मेलन में एक मुख्य प्रस्तुति के दौरान, एनवीडिया के सीईओ जेन्सेन हुआंग ने गोदामों के अंदर गतिविधियों का अनुकरण करने के लिए कॉसमॉस के उदाहरण दिखाए। जेन्सन ने कहा, कॉसमॉस को “मानवों के चलने, हाथ हिलाने, चीजों में हेरफेर करने” के 20 मिलियन घंटे के वास्तविक फुटेज पर प्रशिक्षित किया गया था। “यह रचनात्मक सामग्री तैयार करने के बारे में नहीं है, बल्कि भौतिक दुनिया को समझने के लिए एआई को सिखाने के बारे में है।”
शोधकर्ताओं और स्टार्टअप को उम्मीद है कि इस प्रकार के मूलभूत मॉडल कारखानों और घरों में उपयोग किए जाने वाले रोबोटों को अधिक परिष्कृत क्षमताएं दे सकते हैं। उदाहरण के लिए, कॉसमॉस किसी गोदाम के अंदर अलमारियों से गिरने वाले बक्सों का यथार्थवादी वीडियो फुटेज तैयार कर सकता है, जिसका उपयोग रोबोट को दुर्घटनाओं को पहचानने के लिए प्रशिक्षित करने के लिए किया जा सकता है। उपयोगकर्ता अपने डेटा का उपयोग करके मॉडल को बेहतर भी बना सकते हैं।
एनवीडिया का कहना है कि कई कंपनियां पहले से ही कॉसमॉस का उपयोग कर रही हैं, जिनमें ह्यूमनॉइड रोबोट स्टार्टअप एजिलिटी और फिगर एआई के साथ-साथ उबर, वाबी और वेव जैसी सेल्फ-ड्राइविंग कार कंपनियां भी शामिल हैं।
एनवीडिया ने विभिन्न प्रकार के रोबोटों को नए कार्यों को अधिक कुशलता से करना सीखने में मदद करने के लिए डिज़ाइन किए गए सॉफ़्टवेयर की भी घोषणा की। नया फीचर एनवीडिया के मौजूदा आइजैक रोबोट सिमुलेशन प्लेटफॉर्म का हिस्सा है जो रोबोट बिल्डरों को किसी वांछित कार्य के उदाहरणों की एक छोटी संख्या लेने की अनुमति देगा, जैसे किसी विशेष वस्तु को पकड़ना, और बड़ी मात्रा में सिंथेटिक प्रशिक्षण डेटा उत्पन्न करना।
एनवीडिया को उम्मीद है कि कॉसमॉस और इसाक उन कंपनियों से अपील करेंगे जो ह्यूमनॉइड रोबोट बनाना और उनका उपयोग करना चाहती हैं। जेन्सेन सीईएस में मंच पर टेस्ला, बोस्टन डायनेमिक्स, एजिलिटी और फिगर सहित कंपनियों द्वारा विकसित 14 अलग-अलग ह्यूमनॉइड रोबोटों की आदमकद छवियों के साथ शामिल हुए थे।
कॉसमॉस के साथ, एनवीडिया ने प्रोजेक्ट डिजिट्स की भी घोषणा की, जो $3,000 का “पर्सनल एआई सुपरकंप्यूटर” है जो एडब्ल्यूएस या माइक्रोसॉफ्ट जैसी क्लाउड सेवाओं की आवश्यकता के बिना 200 बिलियन मापदंडों तक का एक बड़ा भाषा मॉडल चला सकता है। इसने एआई एजेंट बनाने में मदद के लिए अपनी बहुप्रतीक्षित अगली पीढ़ी के आरटीएक्स ब्लैकवेल जीपीयू और आने वाले सॉफ्टवेयर टूल की भी घोषणा की।