एआई अग्रणी सेरेब्रस जेनेरेटिव एआई को खोलता है जहां ओपनएआई अंधेरा हो जाता है

सेरेब्रस-एंड्रोमेडा-दरवाजे-बंद-2022

सेरेब्रस के एंड्रोमेडा सुपरकंप्यूटर का इस्तेमाल ओपनएआई के चैटजीपीटी के समान सात भाषा कार्यक्रमों को प्रशिक्षित करने के लिए किया गया था। 

सेरेब्रस सिस्टम

आर्टिफिशियल इंटेलिजेंस की दुनिया, विशेष रूप से इसका वह कोना जो बेतहाशा लोकप्रिय है जिसे "जेनेरेटिव एआई" के रूप में जाना जाता है - लेखन और छवियों को स्वचालित रूप से बनाना - कंपनियों के द्रुतशीतन प्रभाव के कारण अपने क्षितिज को बंद करने का जोखिम है, जो उनके विवरण प्रकाशित नहीं करने का निर्णय लेते हैं। शोध करना। 

लेकिन गोपनीयता की बारी ने एआई दुनिया में कुछ प्रतिभागियों को कदम उठाने और प्रकटीकरण के शून्य को भरने के लिए प्रेरित किया हो सकता है।

मंगलवार को एआई अग्रणी सेरेब्रस सिस्टम्स, एक समर्पित एआई कंप्यूटर के निर्माता और दुनिया की सबसे बड़ी कंप्यूटर चिप, ओपन-सोर्स के रूप में प्रकाशित बिना किसी प्रतिबंध के उपयोग करने के लिए कई संस्करण जनरेटिव एआई प्रोग्राम। 

कार्यक्रमों को सेरेब्रस द्वारा "प्रशिक्षित" किया जाता है, जिसका अर्थ है, कंपनी के शक्तिशाली सुपरकंप्यूटर का उपयोग करके इष्टतम प्रदर्शन के लिए लाया जाता है, जिससे कुछ ऐसे काम कम हो जाते हैं जो बाहरी शोधकर्ताओं को करने पड़ते हैं। 

सेरेब्रस के सह-संस्थापक और सीईओ एंड्रयू फेल्डमैन ने ZDNET के साथ एक साक्षात्कार में कहा, "कंपनियां एक या दो साल पहले की तुलना में अलग निर्णय ले रही हैं, और हम उन फैसलों से असहमत हैं।" तकनीकी विवरणों को प्रकाशित नहीं करने के लिए जब उसने इस महीने अपने नवीनतम जनरेटिव एआई कार्यक्रम, जीपीटी-4 का खुलासा किया, एक ऐसा कदम जिसकी एआई अनुसंधान जगत में व्यापक रूप से आलोचना की गई थी। 

इसके अलावा: GPT-4 के साथ, OpenAI गोपनीयता बनाम प्रकटीकरण का विकल्प चुनता है

सेरेब्रस-घोषणा-मार्च-2023-वितरण-संस्करण-स्लाइड-2

सेरेब्रस सिस्टम
सेरेब्रस-घोषणा-मार्च-2023-वितरण-संस्करण-स्लाइड-3

सेरेब्रस सिस्टम

"हम एक खुले, जीवंत समुदाय में विश्वास करते हैं - न केवल शोधकर्ताओं का, और न केवल तीन या चार या पांच या आठ एलएलएम लोगों का, बल्कि एक जीवंत समुदाय जिसमें स्टार्टअप, मध्यम आकार की कंपनियां और उद्यम बड़े भाषा मॉडल का प्रशिक्षण दे रहे हैं - है हमारे लिए अच्छा है, और यह दूसरों के लिए अच्छा है," फेल्डमैन ने कहा।

लार्ज लैंग्वेज मॉडल शब्द मशीन लर्निंग प्रिंसिपल्स पर आधारित एआई प्रोग्राम्स को संदर्भित करता है जिसमें एक तंत्रिका नेटवर्क नमूना डेटा में शब्दों के सांख्यिकीय वितरण को कैप्चर करता है। यह प्रक्रिया एक बड़े भाषा मॉडल को अनुक्रम में अगले शब्द की भविष्यवाणी करने की अनुमति देती है। वह क्षमता चैटजीपीटी जैसे लोकप्रिय जनरेटिव एआई कार्यक्रमों को रेखांकित करती है। 

इसी तरह का मशीन लर्निंग दृष्टिकोण अन्य क्षेत्रों में जनरेटिव AI से संबंधित है, जैसे कि OpenAI का Dall*E, जो सुझाए गए वाक्यांश के आधार पर छवियां उत्पन्न करता है। 

इसके अलावा: सर्वोत्तम AI कला जनरेटर: DALL-E2 और अन्य मज़ेदार विकल्प आज़माने के लिए

सेरेब्रस ने सात बड़े भाषा मॉडल पोस्ट किए जो OpenAI के GPT प्रोग्राम के समान शैली में हैं, जिसने 2018 में जनरेटिव AI क्रेज शुरू किया। कोड है वेब साइट पर उपलब्ध है एआई स्टार्टअप हगिंग फेस एंड ऑन GitHub.

कार्यक्रम आकार में भिन्न होते हैं, 111 मिलियन मापदंडों, या तंत्रिका भार से लेकर तेरह बिलियन तक। अधिक पैरामीटर एआई प्रोग्राम को अधिक शक्तिशाली बनाते हैं, आम तौर पर बोलते हैं, ताकि सेरेब्रस कोड प्रदर्शन की एक श्रृंखला प्रदान कर सके। 

कंपनी ने ओपन-सोर्स अपाचे 2.0 लाइसेंस के तहत न केवल प्रोग्राम के स्रोत, पायथन और टेन्सरफ्लो प्रारूप में पोस्ट किया, बल्कि प्रशिक्षण व्यवस्था का विवरण भी दिया, जिसके द्वारा कार्यक्रमों को कार्यक्षमता की एक विकसित स्थिति में लाया गया। 

यह खुलासा शोधकर्ताओं को सेरेब्रस के काम की जांच और पुनरुत्पादन करने की अनुमति देता है। 

सेरेब्रस रिलीज, फेल्डमैन ने कहा, पहली बार जीपीटी-शैली कार्यक्रम को "अत्याधुनिक प्रशिक्षण दक्षता तकनीकों का उपयोग करके" सार्वजनिक किया गया है।

अन्य प्रकाशित AI प्रशिक्षण कार्य में या तो तकनीकी डेटा छुपाया गया है, जैसे कि OpenAI का GPT-4, या, प्रोग्राम को उनके विकास में अनुकूलित नहीं किया गया है, जिसका अर्थ है, प्रोग्राम को फीड किए गए डेटा को प्रोग्राम के आकार में समायोजित नहीं किया गया है, जैसा कि एक सेरेब्रस तकनीकी ब्लॉग पोस्ट में बताया गया है। 

सेरेब्रस-घोषणा-मार्च-2023-वितरण-संस्करण-स्लाइड-11

सेरेब्रस सिस्टम

इस तरह के बड़े भाषा मॉडल कुख्यात रूप से गणना-गहन हैं। मंगलवार को जारी किए गए सेरेब्रस कार्य को उसके CS-2 कंप्यूटरों में से सोलह के एक समूह पर विकसित किया गया था, कंप्यूटर डोरमेट्री रेफ्रिजरेटर के आकार के थे जो विशेष रूप से AI-शैली के कार्यक्रमों के लिए ट्यून किए गए हैं। कंपनी द्वारा पहले प्रकट किए गए क्लस्टर को इसके एंड्रोमेडा सुपरकंप्यूटर के रूप में जाना जाता है, जो हजारों एनवीडिया के जीपीयू चिप्स पर एलएलएम को प्रशिक्षित करने के काम में नाटकीय रूप से कटौती कर सकता है।

इसके अलावा: एआई अग्रणी बेंगियो कहते हैं, चैटजीपीटी की सफलता एआई में गोपनीयता के लिए एक हानिकारक स्विंग का संकेत दे सकती है

मंगलवार की रिलीज के हिस्से के रूप में, सेरेब्रस ने जो कहा वह पहला ओपन-सोर्स स्केलिंग कानून था, ओपन-सोर्स डेटा के आधार पर प्रोग्राम के आकार के साथ ऐसे कार्यक्रमों की सटीकता कैसे बढ़ती है, इसके लिए एक बेंचमार्क नियम। उपयोग किया गया डेटा सेट ओपन-सोर्स है ढेर, ग्रंथों का एक 825-गीगाबाइट संग्रह, ज्यादातर पेशेवर और अकादमिक पाठ, गैर-लाभकारी प्रयोगशाला द्वारा 2020 में पेश किया गया एलुथेर.   

सेरेब्रस-घोषणा-मार्च-2023-वितरण-संस्करण-स्लाइड-12

सेरेब्रस सिस्टम

OpenAI और Google के डीपमाइंड के पूर्व स्केलिंग कानूनों ने प्रशिक्षण डेटा का उपयोग किया जो ओपन-सोर्स नहीं था। 

सेरेब्रस ने अतीत में अपने सिस्टम के दक्षता लाभ के लिए मामला बनाया है। फेल्डमैन ने कहा, मांगलिक प्राकृतिक भाषा कार्यक्रमों को कुशलतापूर्वक प्रशिक्षित करने की क्षमता खुले प्रकाशन के मुद्दों के दिल में जाती है।

फेल्डमैन ने कहा, "यदि आप दक्षता हासिल कर सकते हैं, तो आप चीजों को खुले स्रोत समुदाय में रख सकते हैं।" "दक्षता हमें इसे जल्दी और आसानी से करने और समुदाय के लिए अपना हिस्सा करने में सक्षम बनाती है।"

एक प्राथमिक कारण है कि OpenAI, और अन्य, अपने काम को दुनिया के बाकी हिस्सों से बंद करना शुरू कर रहे हैं, क्योंकि उन्हें एआई की बढ़ती लागत को प्रशिक्षित करने के लिए लाभ के स्रोत की रक्षा करनी चाहिए, उन्होंने कहा। 

इसके अलावा: GPT-4: अवैध सलाह देने और 'जोखिम भरे आकस्मिक व्यवहार' प्रदर्शित करने की एक नई क्षमता

"यह बहुत महंगा है, उन्होंने फैसला किया है कि यह एक रणनीतिक संपत्ति है, और उन्होंने इसे समुदाय से वापस लेने का फैसला किया है क्योंकि यह उनके लिए रणनीतिक है," उन्होंने कहा। "और मुझे लगता है कि यह एक बहुत ही उचित रणनीति है। 

फेल्डमैन ने कहा, "यह एक उचित रणनीति है अगर कोई कंपनी बहुत अधिक समय और प्रयास और धन का निवेश करना चाहती है और बाकी दुनिया के साथ परिणाम साझा नहीं करना चाहती है।" 

हालांकि, "हमें लगता है कि यह एक कम दिलचस्प पारिस्थितिकी तंत्र बनाता है, और लंबे समय में, यह अनुसंधान के बढ़ते ज्वार को सीमित करता है", उन्होंने कहा।

कंपनियां डेटा सेट, या मॉडल विशेषज्ञता जैसे संसाधनों को जमा करके "भंडार" कर सकती हैं, फेल्डमैन ने देखा।

इसके अलावा: एआई चैलेंजर सेरेब्रस ने बड़े भाषा मॉडल को गति देने के लिए मॉड्यूलर सुपरकंप्यूटर 'एंड्रोमेडा' को असेंबल किया

"सवाल यह है कि इन संसाधनों को परिदृश्य में रणनीतिक रूप से कैसे उपयोग किया जाता है," उन्होंने कहा। "यह हमारा विश्वास है कि हम डेटा का उपयोग करके खुले मॉडल को सामने रखकर मदद कर सकते हैं जिसे हर कोई देख सकता है।" 

यह पूछे जाने पर कि उत्पाद ओपन-सोर्स रिलीज़ का क्या हो सकता है, फेल्डमैन ने टिप्पणी की, "सैकड़ों अलग-अलग संस्थान इन GPT मॉडल के साथ काम कर सकते हैं जो अन्यथा सक्षम नहीं हो सकते हैं, और उन समस्याओं को हल कर सकते हैं जो अन्यथा अलग रखी जा सकती हैं।"

स्रोत