اقتصاد وعملات

ما هي مساعدة Galactica AI؟

Galactica هي الخطوة الأولى نحو إنشاء مساعد شبكة عصبية علمية مثالية

تقدمت نماذج اللغات الكبيرة بشكل ملحوظ في السنوات الأخيرة (ماجستير). تم الكشف عن LLMs المثيرة للإعجاب واحدة تلو الأخرى ، بدءًا من OpenAI’s GPT-3 ، والتي تولد نصوصًا صحيحة بشكل استثنائي وتنتهي بنظيرتها مفتوحة المصدر BLOOM. أصبحت المشكلات المتعلقة باللغة التي كانت غير قابلة للحل في السابق مجرد تحدٍ لهذه الأنظمة.

كل هذا التقدم ممكن بفضل الكم الهائل من البيانات المتاحة على الإنترنت وإمكانية الوصول إلى وحدات معالجة الرسومات القوية. بقدر ما قد يبدو الأمر جذابًا ، فإن تدريب ماجستير في القانون يعد إجراءً مكلفًا للغاية من حيث البيانات واحتياجات التكنولوجيا. نحن نتحدث عن أنظمة الذكاء الاصطناعي ذات المليارات من المعلمات ، لذا فإن تغذية هذه النماذج ببيانات كافية ليس بالأمر السهل. ومع ذلك ، بمجرد القيام بذلك ، فإنهم يمنحونك أداءً مذهلاً.

هل تساءلت يومًا من أين بدأ تطوير أدوات “الحوسبة”؟ لماذا كرس الأفراد الكثير من الوقت والطاقة لتصميم وبناء أجهزة الكمبيوتر الأولى؟ يمكننا أن نفترض أنه لم يكن لغرض تسلية الناس بألعاب الفيديو أو مقاطع فيديو YouTube.

بدأ كل شيء بهدف حل مشكلة زيادة المعلومات العلمية. يتم تقديم أجهزة الكمبيوتر كطريقة لإدارة الكمية المتزايدة من البيانات. كانوا قد أكملوا الأنشطة العادية مثل التخزين والاسترجاع ، وإفساح المجال للاكتشافات والاستنتاجات في التفكير العلمي. هل يمكننا حقًا ادعاء ذلك عندما يصبح العثور على إجابة لسؤال علمي على Google أمرًا صعبًا بشكل متزايد؟

علاوة على ذلك ، فإن الحجم الهائل من المنشورات العلمية التي تصدر كل يوم يتجاوز ما يمكن للإنسان معالجته. في مايو 2022 ، على سبيل المثال ، تلقت arXiv ما معدله 516 منشورًا يوميًا. علاوة على ذلك ، يرتفع حجم البيانات العلمية بما يتجاوز قدرات المعالجة لدينا.

لدينا أدوات للوصول إلى هذه البيانات وتصفيتها. أول مكان تذهب إليه لدراسة موضوع ما هو Google. على الرغم من أنه لن يوفر دائمًا الحل الذي تحتاجه ، فإن Google سترسل لك في الاتجاه الصحيح ، مثل Wikipedia أو Stackoverflow. نعم ، يمكننا اكتشاف الإجابات هناك ، لكن الصعوبة تكمن في أن هذه الموارد تتطلب مساهمات بشرية مكلفة ، ويمكن أن تتأخر التحديثات.

ماذا لو كان لدينا نموذج أفضل للوصول إلى الكم الهائل من البيانات العلمية المتاحة وتصفيتها؟ يمكن لمحركات البحث ببساطة تخزين البيانات ؛ لا يمكنهم التفكير في ذلك. ماذا لو كان لدينا جميعًا بحث Google يمكنه تفسير البيانات التي يخزنها والإجابة مباشرة على استفساراتنا؟ حان الوقت أخيرًا للقاء Galactica.

تمتلك أنظمة اللغة ، على عكس محركات البحث ، القدرة على تخزين الفهم العلمي والجمع بينه والسبب في ذلك. يمكنهم ربط الأوراق البحثية ، وكشف المعرفة المخفية ، وتقديم تلك الأفكار لك. يمكنهم أيضًا توفير المعلومات ذات الصلة لك عن طريق ربط المحتوى المألوف لديهم. إنشاء مراجعة أدبية حول موضوع معين ، وملاحظة محاضرة في الدورة التدريبية ، والردود على استفساراتك ، ومقالات wiki. كل هذا يمكن تحقيقه باستخدام نماذج اللغة.

Galactica هي الخطوة الأولى نحو إنشاء مساعد شبكة عصبية علمية مثالية. ستكون المساعدة العلمية النهائية هي الواجهة التي نحصل من خلالها على المعرفة. سوف يتعامل مع إجراءات التحميل الزائد للمعلومات التي تستغرق وقتًا طويلاً بينما تركز على اتخاذ القرارات بناءً على هذه المعرفة.

إذن ، كيف تعمل Galactica؟ نظرًا لأنه نموذج لغوي كبير ، فإنه يحتوي على مليارات من المعلمات التي تم تدريبها على مليارات من نقاط البيانات. نظرًا لأن Galactica يهدف إلى أن يكون مساعدًا علميًا ، فإن المنشورات البحثية تعد مصدرًا واضحًا لبيانات التدريب. في هذا الصدد ، تم استخدام ما يقرب من 48 مليون ورقة بحثية ، و 2 مليون نص ، و 8 ملايين ملاحظة محاضرة ، وكتب مدرسية لإنشاء بيانات تدريب Galactica. أخيرًا ، يتم استخدام مجموعة بيانات من 106 مليار رمز مميز.

تم استخدام Galactica في كتابة ورقتها الخاصة ، مما يجعلها واحدة من أولى نماذج الذكاء الاصطناعي التي تم تقديمها. نتوقع أنه سيتم استخدامه لكتابة عدد كبير من المقالات في المستقبل القريب.

المنشور ما هي مساعدة Galactica AI؟ ظهرت أولاً في Analytics Insight.

اظهر المزيد
زر الذهاب إلى الأعلى