এআই অগ্রগামী সেরিব্রাস জেনারেটিভ এআই খুলেছেন যেখানে ওপেনএআই অন্ধকার হয়ে যায়

সেরিব্রাস-এন্ড্রোমিডা-দরজা-বন্ধ-2022

সেরেব্রাসের অ্যান্ড্রোমিডা সুপার কম্পিউটারটি OpenAI-এর ChatGPT-এর মতো সাতটি ভাষা প্রোগ্রাম প্রশিক্ষণের জন্য ব্যবহার করা হয়েছিল। 

সেরিব্রাস সিস্টেমস

কৃত্রিম বুদ্ধিমত্তার জগৎ, বিশেষ করে এর কোণটি যেটি "জেনারেটিভ এআই" নামে পরিচিত - স্বয়ংক্রিয়ভাবে লেখা এবং ছবি তৈরি করে - কোম্পানিগুলির বিশদ প্রকাশ না করার সিদ্ধান্ত নেওয়ার কারণে তাদের দিগন্ত বন্ধ হয়ে যাওয়ার ঝুঁকি রয়েছে। গবেষণা 

তবে গোপনীয়তার পালা এআই বিশ্বের কিছু অংশগ্রহণকারীকে পদক্ষেপ নিতে এবং প্রকাশের শূন্যতা পূরণ করতে প্ররোচিত করেছে।

মঙ্গলবার, এআই অগ্রগামী সেরিব্রাস সিস্টেমস, একটি ডেডিকেটেড এআই কম্পিউটারের নির্মাতা এবং বিশ্বের বৃহত্তম কম্পিউটার চিপ, ওপেন সোর্স হিসাবে প্রকাশিত সীমাবদ্ধতা ছাড়াই ব্যবহার করার জন্য বিভিন্ন সংস্করণ জেনারেটিভ এআই প্রোগ্রাম। 

প্রোগ্রামগুলি সেরেব্রাস দ্বারা "প্রশিক্ষিত" হয়, যার অর্থ, কোম্পানির শক্তিশালী সুপার কম্পিউটার ব্যবহার করে সর্বোত্তম কার্যক্ষমতার জন্য আনা হয়, যার ফলে বাইরের গবেষকদের করতে হয় এমন কিছু কাজ কমিয়ে দেয়। 

"কোম্পানিগুলি এক বা দুই বছর আগে নেওয়ার চেয়ে ভিন্ন সিদ্ধান্ত নিচ্ছে, এবং আমরা সেই সিদ্ধান্তগুলির সাথে একমত নই," ZDNET-এর সাথে একটি সাক্ষাত্কারে Cerebras-এর সহ-প্রতিষ্ঠাতা এবং CEO অ্যান্ড্রু ফেল্ডম্যান বলেছেন, ChatGPT-এর নির্মাতা OpenAI-এর সিদ্ধান্তের প্রতি ইঙ্গিত করে, প্রযুক্তিগত বিবরণ প্রকাশ না করা যখন এটি এই মাসে তার সর্বশেষ জেনারেটিভ এআই প্রোগ্রাম, GPT-4 প্রকাশ করে, একটি পদক্ষেপ যা এআই গবেষণা বিশ্বে ব্যাপকভাবে সমালোচিত হয়েছিল। 

এছাড়াও: GPT-4 এর সাথে, OpenAI গোপনীয়তা বনাম প্রকাশের জন্য বেছে নেয়

সেরেব্রাস-ঘোষণা-মার্চ-2023-বন্টন-সংস্করণ-স্লাইড-2

সেরিব্রাস সিস্টেমস
সেরেব্রাস-ঘোষণা-মার্চ-2023-বন্টন-সংস্করণ-স্লাইড-3

সেরিব্রাস সিস্টেমস

“আমরা বিশ্বাস করি একটি উন্মুক্ত, প্রাণবন্ত সম্প্রদায় - শুধুমাত্র গবেষকদের নয়, এবং শুধুমাত্র তিন বা চার বা পাঁচ বা আটটি এলএলএম ছেলেদের নয়, বরং একটি প্রাণবন্ত সম্প্রদায় যেখানে স্টার্টআপ, মাঝারি আকারের কোম্পানি এবং উদ্যোগগুলি বড় ভাষা মডেলকে প্রশিক্ষণ দিচ্ছে — আমাদের জন্য ভাল, এবং এটি অন্যদের জন্য ভাল,” ফেল্ডম্যান বলেছেন।

বড় ভাষা মডেল শব্দটি মেশিন লার্নিং প্রিন্সিপালের উপর ভিত্তি করে AI প্রোগ্রামগুলিকে বোঝায় যেখানে একটি নিউরাল নেটওয়ার্ক নমুনা ডেটাতে শব্দের পরিসংখ্যানগত বন্টন ক্যাপচার করে। এই প্রক্রিয়াটি একটি বৃহৎ ভাষার মডেলকে ক্রমানুসারে পরবর্তী শব্দের পূর্বাভাস দিতে দেয়। এই ক্ষমতা জনপ্রিয় জেনারেটিভ এআই প্রোগ্রাম যেমন ChatGPT এর অন্তর্নিহিত। 

একই ধরনের মেশিন লার্নিং পদ্ধতি অন্যান্য ক্ষেত্রগুলিতে জেনারেটিভ এআই সম্পর্কিত, যেমন OpenAI এর Dall*E, যা একটি প্রস্তাবিত বাক্যাংশের উপর ভিত্তি করে ছবি তৈরি করে। 

এছাড়াও: সেরা AI আর্ট জেনারেটর: DALL-E2 এবং চেষ্টা করার জন্য অন্যান্য মজার বিকল্প

সেরেব্রাস সাতটি বড় ভাষার মডেল পোস্ট করেছে যেগুলি OpenAI-এর GPT প্রোগ্রামের মতো একই স্টাইলে, যা 2018 সালে জেনারেটিভ এআই ক্রেজ শুরু করেছিল। কোডটি হল ওয়েব সাইটে উপলব্ধ AI স্টার্টআপ Hugging Face এবং অন GitHub.

প্রোগ্রামগুলি আকারে পরিবর্তিত হয়, 111 মিলিয়ন প্যারামিটার বা নিউরাল ওজন থেকে তেরো বিলিয়ন পর্যন্ত। আরও পরামিতি একটি AI প্রোগ্রামকে আরও শক্তিশালী করে তোলে, সাধারণভাবে বলতে গেলে, যাতে সেরিব্রাস কোড বিভিন্ন কর্মক্ষমতা প্রদান করে। 

কোম্পানী ওপেন-সোর্স অ্যাপাচি 2.0 লাইসেন্সের অধীনে পাইথন এবং টেনসরফ্লো ফরম্যাটে শুধুমাত্র প্রোগ্রামের উৎস পোস্ট করেনি, কিন্তু প্রশিক্ষণের বিশদ বিবরণও দেয় যার দ্বারা প্রোগ্রামগুলিকে কার্যকারিতার একটি উন্নত অবস্থায় আনা হয়েছিল। 

এই প্রকাশটি গবেষকদের সেরিব্রাসের কাজ পরীক্ষা এবং পুনরুত্পাদন করতে দেয়। 

সেরেব্রাস রিলিজ, ফেল্ডম্যান বলেন, প্রথমবারের মতো একটি GPT-শৈলী প্রোগ্রাম "অত্যাধুনিক প্রশিক্ষণ দক্ষতা কৌশল ব্যবহার করে" সর্বজনীন করা হয়েছে।

অন্যান্য প্রকাশিত AI প্রশিক্ষণের কাজে হয় প্রযুক্তিগত তথ্য গোপন করা হয়েছে, যেমন OpenAI-এর GPT-4, অথবা, প্রোগ্রামগুলি তাদের বিকাশে অপ্টিমাইজ করা হয়নি, অর্থাৎ, প্রোগ্রামে দেওয়া ডেটা প্রোগ্রামের আকারের সাথে সামঞ্জস্য করা হয়নি, সেরেব্রাস প্রযুক্তিগত ব্লগ পোস্টে ব্যাখ্যা করা হয়েছে। 

সেরেব্রাস-ঘোষণা-মার্চ-2023-বন্টন-সংস্করণ-স্লাইড-11

সেরিব্রাস সিস্টেমস

এই ধরনের বড় ভাষার মডেলগুলি কুখ্যাতভাবে গণনা-নিবিড়। মঙ্গলবার প্রকাশিত সেরিব্রাসের কাজটি তার CS-2 কম্পিউটারগুলির ষোলটির একটি ক্লাস্টারে তৈরি করা হয়েছে, কম্পিউটারগুলি ডরমিটরি রেফ্রিজারেটরের আকারের যা বিশেষভাবে এআই-স্টাইলের প্রোগ্রামগুলির জন্য সুর করা হয়েছে৷ ক্লাস্টার, কোম্পানির দ্বারা পূর্বে প্রকাশ করা হয়, এটির অ্যান্ড্রোমিডা সুপার কম্পিউটার নামে পরিচিত, যা এনভিডিয়ার হাজার হাজার জিপিইউ চিপগুলিতে এলএলএম প্রশিক্ষণের কাজ নাটকীয়ভাবে কাটাতে পারে।

এছাড়াও: ChatGPT-এর সাফল্য এআই-তে গোপনীয়তার জন্য ক্ষতিকর সুইংকে প্ররোচিত করতে পারে, এআই অগ্রগামী বেঙ্গিও বলেছেন

মঙ্গলবারের প্রকাশের অংশ হিসাবে, সেরেব্রাস প্রস্তাব করেছিল যে এটি প্রথম ওপেন-সোর্স স্কেলিং আইন বলেছিল, এটি একটি বেঞ্চমার্ক নিয়ম যাতে এই ধরনের প্রোগ্রামগুলির যথার্থতা ওপেন-সোর্স ডেটার উপর ভিত্তি করে প্রোগ্রামগুলির আকারের সাথে বৃদ্ধি পায়। ব্যবহৃত ডেটা সেটটি ওপেন সোর্স গাদা, টেক্সটের একটি 825-গিগাবাইট সংগ্রহ, বেশিরভাগ পেশাদার এবং একাডেমিক পাঠ্য, 2020 সালে অলাভজনক ল্যাব দ্বারা প্রবর্তিত এলিউথার.   

সেরেব্রাস-ঘোষণা-মার্চ-2023-বন্টন-সংস্করণ-স্লাইড-12

সেরিব্রাস সিস্টেমস

ওপেনএআই এবং গুগলের ডিপমাইন্ডের পূর্বের স্কেলিং আইনগুলি প্রশিক্ষণ ডেটা ব্যবহার করেছিল যা ওপেন-সোর্স ছিল না। 

সেরিব্রাস অতীতে তার সিস্টেমের দক্ষতা সুবিধার জন্য কেস তৈরি করেছে। ফেল্ডম্যান বলেন, দাবিকৃত প্রাকৃতিক ভাষার প্রোগ্রামগুলিকে দক্ষতার সাথে প্রশিক্ষণ দেওয়ার ক্ষমতা উন্মুক্ত প্রকাশনার বিষয়গুলির কেন্দ্রবিন্দুতে যায়।

"যদি আপনি দক্ষতা অর্জন করতে পারেন, আপনি ওপেন সোর্স সম্প্রদায়ের মধ্যে জিনিসগুলি রাখার সামর্থ্য রাখতে পারেন," ফেল্ডম্যান বলেছেন। "দক্ষতা আমাদের দ্রুত এবং সহজে এটি করতে এবং সম্প্রদায়ের জন্য আমাদের অংশ করতে সক্ষম করে।"

ওপেনএআই এবং অন্যান্যরা বিশ্বের অন্যান্য অংশে তাদের কাজ বন্ধ করতে শুরু করার একটি প্রাথমিক কারণ হল প্রশিক্ষণের জন্য এআই-এর ক্রমবর্ধমান ব্যয়ের মুখে তাদের অবশ্যই লাভের উত্স রক্ষা করতে হবে, তিনি বলেছিলেন। 

এছাড়াও: GPT-4: অবৈধ পরামর্শ প্রদান এবং 'ঝুঁকিপূর্ণ উদ্ভূত আচরণ' প্রদর্শনের জন্য একটি নতুন ক্ষমতা

"এটি এত ব্যয়বহুল, তারা সিদ্ধান্ত নিয়েছে এটি একটি কৌশলগত সম্পদ, এবং তারা এটিকে সম্প্রদায়ের কাছ থেকে আটকানোর সিদ্ধান্ত নিয়েছে কারণ এটি তাদের জন্য কৌশলগত," তিনি বলেছিলেন। “এবং আমি মনে করি এটি একটি খুব যুক্তিসঙ্গত কৌশল। 

"এটি একটি যুক্তিসঙ্গত কৌশল যদি একটি কোম্পানি প্রচুর সময় এবং প্রচেষ্টা এবং অর্থ বিনিয়োগ করতে চায় এবং বাকি বিশ্বের সাথে ফলাফলগুলি ভাগ না করে," যোগ করেন ফেল্ডম্যান৷ 

যাইহোক, "আমরা মনে করি এটি একটি কম আকর্ষণীয় ইকোসিস্টেম তৈরি করে এবং, দীর্ঘমেয়াদে, এটি গবেষণার ক্রমবর্ধমান জোয়ারকে সীমিত করে", তিনি বলেন।

কোম্পানীগুলি "স্টকপিল" করতে পারে সম্পদ, যেমন ডেটা সেট, বা মডেল দক্ষতা, সেগুলি মজুদ করে, ফেল্ডম্যান পর্যবেক্ষণ করেছেন।

এছাড়াও: এআই চ্যালেঞ্জার সেরেব্রাস মডুলার সুপার কম্পিউটার 'অ্যান্ড্রোমিডা' একত্রিত করে বৃহৎ ভাষার মডেলের গতি বাড়াতে

"প্রশ্ন হল, কীভাবে এই সম্পদগুলি ল্যান্ডস্কেপে কৌশলগতভাবে ব্যবহার করা যায়," তিনি বলেছিলেন। "এটি আমাদের বিশ্বাস যে আমরা খোলা মডেলগুলিকে সামনে রেখে সাহায্য করতে পারি, এমন ডেটা ব্যবহার করে যা সবাই দেখতে পারে।" 

ওপেন-সোর্স রিলিজের পণ্যটি কী হতে পারে জানতে চাইলে, ফেল্ডম্যান মন্তব্য করেন, "শতশত স্বতন্ত্র প্রতিষ্ঠান এই GPT মডেলগুলির সাথে কাজ করতে পারে যা অন্যথায় সক্ষম নাও হতে পারে এবং সমস্যাগুলি সমাধান করতে পারে যা অন্যথায় আলাদা করা হতে পারে।"

উৎস