يفتح Cerebras ، الرائد في مجال الذكاء الاصطناعي ، الذكاء الاصطناعي التوليدي حيث تصبح OpenAI مظلمة

ابواب ابواب مغلقة 2022

تم استخدام كمبيوتر Cerebras الفائق Andromeda لتدريب سبع برامج لغوية مشابهة لبرنامج ChatGPT الخاص بـ OpenAI. 

نظم Cerebras

عالم الذكاء الاصطناعي ، وخاصة ركنه المشهور على نطاق واسع والمعروف باسم "الذكاء الاصطناعي التوليدي" - إنشاء الكتابة والصور تلقائيًا - معرض لخطر إغلاق آفاقه بسبب التأثير المخيف للشركات التي تقرر عدم نشر تفاصيلها. بحث. 

لكن التحول إلى السرية ربما دفع بعض المشاركين في عالم الذكاء الاصطناعي إلى التدخل وملء الفراغ من الإفشاء.

يوم الثلاثاء ، قامت شركة Cerebras ، الرائدة في مجال الذكاء الاصطناعي ، وصانعي أجهزة كمبيوتر مخصصة للذكاء الاصطناعي ، وأكبر شريحة كمبيوتر في العالم ، نشرت كمصدر مفتوح العديد من الإصدارات التوليدية لبرامج الذكاء الاصطناعي لاستخدامها دون قيود. 

يتم "تدريب" البرامج من قبل Cerebras ، مما يعني أنها تحقق الأداء الأمثل باستخدام الكمبيوتر العملاق القوي للشركة ، مما يقلل من بعض الأعمال التي يتعين على الباحثين الخارجيين القيام بها. 

قال أندرو فيلدمان ، المؤسس المشارك والرئيس التنفيذي لشركة Cerebras في مقابلة مع ZDNET ، في إشارة إلى قرار OpenAI ، مبتكر ChatGPT ، "تتخذ الشركات قرارات مختلفة عما اتخذته قبل عام أو عامين ، ونحن لا نتفق مع هذه القرارات" عدم نشر التفاصيل الفنية عندما كشفت عن أحدث برنامجها التوليدي للذكاء الاصطناعي هذا الشهر ، GPT-4 ، وهي خطوة لاقت انتقادات على نطاق واسع في عالم أبحاث الذكاء الاصطناعي. 

أيضا: مع GPT-4 ، تختار OpenAI السرية مقابل الكشف

إعلان cerebras-March-2023-Distribution-version-slide-2

نظم Cerebras
إعلان cerebras-March-2023-Distribution-version-slide-3

نظم Cerebras

"نعتقد أن المجتمع المفتوح والحيوي - ليس فقط من الباحثين ، وليس فقط من ثلاثة أو أربعة أو خمسة أو ثمانية رجال ماجستير ، ولكن مجتمع نابض بالحياة حيث الشركات الناشئة والشركات متوسطة الحجم والمؤسسات تدرب نماذج لغوية كبيرة - قال فيلدمان.

يشير مصطلح نموذج اللغة الكبيرة إلى برامج الذكاء الاصطناعي القائمة على مبادئ التعلم الآلي حيث تلتقط الشبكة العصبية التوزيع الإحصائي للكلمات في عينة البيانات. تسمح هذه العملية لنموذج لغة كبير بالتنبؤ بالكلمة التالية بالتسلسل. هذه القدرة هي أساس برامج الذكاء الاصطناعي التوليدية الشهيرة مثل ChatGPT. 

يتعلق نفس النوع من نهج التعلم الآلي بالذكاء الاصطناعي التوليدي في مجالات أخرى ، مثل Dall * E من OpenAI ، والذي يولد الصور بناءً على عبارة مقترحة. 

أيضا: أفضل المولدات الفنية للذكاء الاصطناعي: DALL-E2 والبدائل الممتعة الأخرى التي يمكنك تجربتها

نشرت Cerebras سبعة نماذج لغات كبيرة بنفس أسلوب برنامج GPT الخاص بـ OpenAI ، والذي بدأ جنون الذكاء الاصطناعي التوليدي مرة أخرى في عام 2018. الرمز هو متاح على موقع الويب من شركة AI Startup Hugging Face وما إلى ذلك GitHub جيثب:.

تختلف البرامج في الحجم ، من 111 مليون معلمة ، أو أوزان عصبية ، إلى ثلاثة عشر مليارًا. المزيد من المعلمات يجعل برنامج AI أكثر قوة ، بشكل عام ، بحيث يوفر كود Cerebras مجموعة من الأداء. 

لم تنشر الشركة مصدر البرامج فقط ، بتنسيق Python و TensorFlow ، بموجب ترخيص Apache 2.0 مفتوح المصدر ، بل نشرت أيضًا تفاصيل نظام التدريب الذي تم من خلاله نقل البرامج إلى حالة وظيفية متطورة. 

يسمح هذا الكشف للباحثين بفحص وإعادة إنتاج عمل Cerebras. 

قال فيلدمان إن إصدار Cerebras هو المرة الأولى التي يتم فيها الإعلان عن برنامج على غرار GPT "باستخدام تقنيات كفاءة التدريب الحديثة."

لقد أخفت أعمال التدريب الأخرى المنشورة على الذكاء الاصطناعي البيانات التقنية ، مثل GPT-4 الخاصة بـ OpenAI ، أو لم يتم تحسين البرامج في تطويرها ، مما يعني أن البيانات التي يتم تغذيتها للبرنامج لم يتم تعديلها وفقًا لحجم البرنامج ، كما هو موضح في منشور مدونة Cerebras الفني. 

إعلان cerebras-March-2023-Distribution-version-slide-11

نظم Cerebras

تشتهر نماذج اللغة الكبيرة هذه بأنها كثيفة الحوسبة. تم تطوير عمل Cerebras الذي تم إصداره يوم الثلاثاء على مجموعة من ستة عشر من أجهزة الكمبيوتر CS-2 ، وهي أجهزة كمبيوتر بحجم ثلاجات النوم التي تم ضبطها خصيصًا لبرامج على غرار AI. تُعرف المجموعة ، التي كشفت عنها الشركة سابقًا ، باسم الكمبيوتر الفائق Andromeda الخاص بها ، والذي يمكنه قطع العمل بشكل كبير لتدريب LLM على الآلاف من رقائق GPU من Nvidia.

أيضا: يقول بينجيو ، رائد الذكاء الاصطناعي ، إن نجاح ChatGPT قد يؤدي إلى تحول مدمر نحو السرية في الذكاء الاصطناعي

كجزء من إصدار يوم الثلاثاء ، عرض Cerebras ما قال إنه أول قانون توسيع مفتوح المصدر ، وهو قاعدة مرجعية لكيفية زيادة دقة مثل هذه البرامج مع حجم البرامج بناءً على بيانات مفتوحة المصدر. مجموعة البيانات المستخدمة هي المصدر المفتوح كومة، مجموعة نصية تبلغ 825 جيجا بايت ، معظمها نصوص مهنية وأكاديمية ، تم تقديمها في عام 2020 من قبل معمل غير ربحي إليوثر.   

إعلان cerebras-March-2023-Distribution-version-slide-12

نظم Cerebras

استخدمت قوانين التحجيم السابقة من OpenAI و DeepMind من Google بيانات تدريب لم تكن مفتوحة المصدر. 

قامت Cerebras في الماضي بإثبات مزايا الكفاءة التي تتمتع بها أنظمتها. قال فيلدمان إن القدرة على التدريب الفعال لبرامج اللغة الطبيعية الصعبة تدخل في صميم قضايا النشر المفتوح.

قال فيلدمان: "إذا تمكنت من تحقيق الكفاءات ، فيمكنك تحمل وضع الأشياء في مجتمع المصادر المفتوحة". "الكفاءة تمكننا من القيام بذلك بسرعة وسهولة والقيام بدورنا للمجتمع."

وقال إن السبب الرئيسي وراء بدء أوبن إيه آي ، وآخرين ، في إغلاق عملهم مع بقية العالم هو أنه يتعين عليهم حماية مصدر الربح في مواجهة ارتفاع تكلفة تدريب الذكاء الاصطناعي. 

أيضا: GPT-4: قدرة جديدة على تقديم المشورة غير المشروعة وعرض "السلوكيات الناشئة المحفوفة بالمخاطر"

وقال: "إنها مكلفة للغاية ، لقد قرروا أنها أحد الأصول الاستراتيجية ، وقرروا حجبها عن المجتمع لأنها استراتيجية بالنسبة لهم". "وأعتقد أن هذه استراتيجية معقولة للغاية. 

وأضاف فيلدمان: "إنها استراتيجية معقولة إذا كانت الشركة ترغب في استثمار قدر كبير من الوقت والجهد والمال وعدم مشاركة النتائج مع بقية العالم". 

ومع ذلك ، "نعتقد أن هذا يجعل النظام البيئي أقل إثارة للاهتمام ، وعلى المدى الطويل ، فإنه يحد من المد المتصاعد" للبحوث ، قال.

يمكن للشركات "تخزين" الموارد ، مثل مجموعات البيانات ، أو نموذج الخبرة ، عن طريق تخزينها ، كما لاحظ فيلدمان.

أيضا: يقوم متحدي الذكاء الاصطناعي Cerebras بتجميع أجهزة الكمبيوتر العملاقة المعيارية "أندروميدا" لتسريع نماذج اللغات الكبيرة

قال: "السؤال هو ، كيف يتم استخدام هذه الموارد بشكل استراتيجي في المناظر الطبيعية". "نعتقد أنه يمكننا المساعدة من خلال طرح نماذج مفتوحة ، باستخدام البيانات التي يمكن للجميع رؤيتها." 

عند سؤاله عن المنتج الذي يمكن أن يكون من الإصدار المفتوح المصدر ، لاحظ فيلدمان ، "قد تعمل مئات المؤسسات المتميزة مع نماذج GPT هذه التي ربما لم تكن قادرة على حل المشكلات التي كان من الممكن أن يتم وضعها جانبًا بخلاف ذلك."

مصدر