एमआईटी की जनरेटिव एआई में क्रांतिकारी 3डी आकृति निर्माण तकनीक
Brief news summary
एमआईटी के शोधकर्ताओं ने, स्नातक छात्र आर्टेम लुकोयानोव के नेतृत्व में, जनरेटिव एआई मॉडल का उपयोग करके उच्च-गुणवत्ता वाले 3डी आकार उत्पन्न करने की एक विधि का अन्वेषण किया है। यह क्रांतिकारी तकनीक स्कोर डिस्टिलेशन की गणितीय कठिनाइयों को दूर करती है, जिससे पुनःप्रशिक्षण और जटिल पोस्ट-प्रोसेसिंग की आवश्यकता समाप्त हो जाती है, और इस प्रकार 3डी मॉडलों की वास्तविकता को अत्यधिक सुधारती है। ऑक्सफोर्ड यूनिवर्सिटी, एमआईटी-आईबीएम वॉटसन एआई लैब, टोयोटा रिसर्च इंस्टीट्यूट और मेटा के साथ सहयोग में, टीम के काम ने 3डी आकारों की सटीकता और गुणवत्ता को बढ़ाया है, जिसका डिज़ाइनरों को व्यापक रूप से लाभ हुआ है। DALL-E जैसे मॉडलों के विपरीत, जो डेटा सीमाओं के कारण 3डी जेनरेशन में संघर्ष करते हैं, यह नई विधि आकारों को परिष्कृत करने के लिए अनुमान तकनीकों का उपयोग करती है और रेंडरिंग संकल्प और मॉडल मापदंडों का अनुकूलन करती है। यद्यपि यह अंतर्निहित पूर्वाग्रहों और सीमाओं वाले पूर्व-प्रशिक्षित प्रसार मॉडलों पर आधारित है, यह अनुसंधान छवि संपादन तकनीकों के भविष्य के लिए आशाजनक है। विभिन्न संगठनों द्वारा समर्थित, इन मूलभूत मॉडलों को व्यापक अनुप्रयोगों के लिए उन्नत करने के लिए आगे के प्रयास जारी हैं।कई विधियाँ जनरेटिव एआई मॉडल्स में 3D आकार की गुणवत्ता के मुद्दों को फिर से प्रशिक्षण या फाइन-ट्यूनिंग के माध्यम से संबोधित करती हैं, जो महंगा और समय लेने वाला हो सकता है। हालांकि, MIT के शोधकर्ताओं ने एक नई तकनीक विकसित की है जो बिना अतिरिक्त प्रशिक्षण या जटिल पश्च-प्रसंस्करण के इन विधियों के साथ या उससे बेहतर गुणवत्ता देती है। समस्या के स्रोत की पहचान करके, उन्होंने स्कोर डिस्टिलेशन और संबंधित तरीकों की गणितीय समझ में सुधार किया है, जिससे बेहतर प्रदर्शन का मार्ग प्रशस्त हुआ है। "हमारा अनुसंधान हमें कुशल, तेज़ और उच्च-गुणवत्ता समाधान की ओर मार्गदर्शित करता है, जो डिजाइनरों को वास्तविक 3D आकार बनाने में सहायता कर सकता है, " कहते हैं अरतैम लुकोयानोव, प्रमुख लेखक और MIT के EECS स्नातक छात्र। उनके सह-लेखकों में ऑक्सफोर्ड यूनिवर्सिटी के हाइत्ज साएज़ डी ओकैरीज़ बोर्डे, MIT-IBM वॉटसन एआई लैब के क्रिस्टजान ग्रीनवाल्ड, टोयोटा रिसर्च इंस्टीट्यूट के वितोर कैम्पग्नोलो ग्विजिलिनी, मेटा के तिमुर बगाउद्दिनोव, और MIT के CSAIL से वरिष्ठ लेखक विंसेंट सिट्जमन और जस्टिन सोलोमन शामिल हैं। DALL-E जैसे जनरेटिव एआई मॉडल शोर से 2D छवियां बनाने के लिए डिफ्यूशन मॉडल का उपयोग करते हैं। सीमित 3D प्रशिक्षण डेटा के कारण, वे 3D आकार उत्पन्न करने में संघर्ष करते हैं। 2022 की एक तकनीक, स्कोर डिस्टिलेशन सैम्पलिंग (SDS), प्रीट्रेन किए गए मॉडल्स का उपयोग शोर के माध्यम से 2D छवियों को 3D आकारों में बदलने के लिए करती है। हालांकि, ये आकार अक्सर धुंधले या अधिक संतृप्त दिखाई देते हैं, जो अब तक एक अनसुलझी समस्या थी। MIT टीम ने SDS में एक महत्वपूर्ण सूत्र असंगति की पहचान की जिसने शोर उत्पन्न किया, जिससे कमजोर 3D आकार बने। उन्होंने सूत्र को सटीक रूप से हल करने के बजाय, अनुकरण तकनीकों का उपयोग करके अनुपस्थित शर्तों को अनुमानित किया, जिसके परिणामस्वरूप स्पष्ट और वास्तविक 3D आकार बने। उन्होंने छवि संकल्प को भी सुधारा और गुणवत्ता को और बढ़ाने के लिए मॉडल के पैरामीटर्स को समायोजित किया। मौजूदा प्रीट्रेन किए गए डिफ्यूशन मॉडल्स का उपयोग करके, उन्होंने उच्च गुणवत्ता वाले 3D आकार बिना महंगे पुनः प्रशिक्षण के हासिल किए। हालांकि, यह विधि आधार मॉडल से पूर्वाग्रहों और सीमाओं को विरासत में लेती है, लेकिन मूल मॉडल में सुधार करके परिणाम को बढ़ाया जा सकता है। भविष्य के काम में छवि संपादन को बढ़ाने के लिए इन तकनीकों की खोज की जा सकती है। इस अनुसंधान को टोयोटा रिसर्च इंस्टीट्यूट, यू. एस.
नेशनल साइंस फाउंडेशन और अन्य संगठनों से वित्त पोषण प्राप्त हुआ।
Watch video about
एमआईटी की जनरेटिव एआई में क्रांतिकारी 3डी आकृति निर्माण तकनीक
Try our premium solution and start getting clients — at no cost to you