يمكن أن تستهلك نماذج اللغة الكبيرة المستخدمة في أدوات الذكاء الاصطناعي التوليدي كميات هائلة من دورات المعالج وقد تكون مكلفة في الاستخدام. غالبًا ما توفر النماذج الأصغر والأكثر تركيزًا على الصناعة أو الأعمال نتائج أفضل مصممة خصيصًا لتلبية احتياجات العمل.
غالبًا ما يبدو أن نماذج اللغة الكبيرة (LLMs) تتنافس للحصول على لقب الأكبر والأقوى، ولكن العديد من المنظمات التي تتطلع إلى استخدامها بدأت تدرك أن الكبير ليس دائمًا الأفضل.
يتزايد اعتماد أدوات الذكاء الاصطناعي التوليدي بشكل كبير. وتخطط المؤسسات لاستثمار ما بين 10% إلى 15% أكثر في مبادرات الذكاء الاصطناعي على مدار العام ونصف العام المقبلين مقارنة بالعام التقويمي 2022، وفقًا لمسح أجرته شركة IDC لأكثر من 2000 من صناع القرار في مجال تكنولوجيا المعلومات وخطوط الأعمال.
ولقد أحدثت تقنية الذكاء الاصطناعي بالفعل تأثيرًا كبيرًا على الشركات والمؤسسات في مختلف الصناعات. فقد وجد تقرير IDC أن المستخدمين الأوائل لهذه التقنية حققوا زيادة بنسبة 35% في الابتكار وزيادة بنسبة 33% في الاستدامة بسبب استثمارات الذكاء الاصطناعي على مدى السنوات الثلاث الماضية.
كما تحسنت معدلات الاحتفاظ بالعملاء والموظفين بنسبة 32%. وقالت ريتو جوتي، نائبة رئيس مجموعة أبحاث الذكاء الاصطناعي والأتمتة في شركة IDC: “ستكون الذكاء الاصطناعي بنفس أهمية الحوسبة السحابية في توفير ميزة تنافسية حقيقية للعملاء على مدى السنوات الخمس إلى العشر المقبلة. وستتمتع المنظمات القادرة على التحلي بالرؤية المستقبلية بميزة تنافسية هائلة”.
في حين أن برامج LLM للأغراض العامة التي تحتوي على مئات المليارات أو حتى تريليون معلمة قد تبدو قوية، إلا أنها تلتهم أيضًا دورات الحوسبة بشكل أسرع من إمكانية تصنيع الرقائق التي تتطلبها أو ترقيتها؛ وهذا من شأنه أن يضغط على سعة الخادم ويؤدي إلى وقت طويل بشكل غير واقعي لتدريب النماذج لاستخدام تجاري معين.
قالت أفيفاه ليتان، نائبة الرئيس والمحللة المتميزة في شركة جارتنر للأبحاث: “عاجلاً أم آجلاً، سوف تفشل عملية توسيع شرائح وحدة معالجة الرسوميات في مواكبة الزيادة في حجم النماذج. لذا فإن الاستمرار في تصنيع نماذج أكبر وأكبر ليس خيارًا قابلاً للتطبيق”.
واتفق دان دياسيو، رئيس قسم استشارات الذكاء الاصطناعي العالمي في شركة إرنست آند يونج، مع هذا الرأي، مضيفًا أن هناك حاليًا تراكمًا في طلبات وحدات معالجة الرسوميات. ولا يؤدي نقص الرقائق إلى خلق مشاكل لشركات التكنولوجيا التي تصنع برامج الماجستير في القانون فحسب، بل وأيضًا لشركات المستخدمين التي تسعى إلى تعديل النماذج أو بناء برامج الماجستير في القانون الخاصة بها.
ونتيجة لذلك، فإن تكاليف ضبط وبناء برنامج ماجستير متخصص في القانون للشركات مرتفعة للغاية، مما يؤدي إلى دفع الاتجاه نحو حزم تعزيز المعرفة وبناء مكتبات من المواد التي تحتوي على المعرفة المتخصصة"، كما قال دياسيو.
بالإضافة إلى ذلك، فإن النماذج الأصغر حجمًا والمخصصة للمجال والتي يتم تدريبها على المزيد من البيانات سوف تتحدى في نهاية المطاف هيمنة أنظمة LLM الرائدة اليوم، مثل GPT 4 من OpenAI، أو LLaMA 2 من Meta AI، أو PaLM 2 من Google.
سيكون من الأسهل أيضًا تدريب النماذج الأصغر حجمًا لحالات الاستخدام المحددة.
يتم تدريب طلاب الماجستير في القانون من جميع الأحجام من خلال عملية تُعرف باسم الهندسة السريعة - إدخال الاستعلامات والاستجابات الصحيحة في النماذج حتى تتمكن الخوارزمية من الاستجابة بشكل أكثر دقة. واليوم، توجد أسواق لقوائم المطالبات، مثل أفضل 100 مطالبة لـ ChatGPT .
بالنسبة للصناعات الرأسية أو الاستخدام المتخصص، يمكن أن تكون برامج ماجستير إدارة الأعمال الضخمة للأغراض العامة مثل GPT 4 من OpenAI أو LLaMA من Meta AI غير دقيقة وغير محددة ، على الرغم من أنها تحتوي على مليارات أو تريليونات من المعلمات . المعلمة هي شيء يساعد برنامج ماجستير إدارة الأعمال في الاختيار بين الإجابات المختلفة التي يمكن أن يقدمها للاستفسارات.
ورغم أن “برامج الماجستير في القانون الضخمة” تستخدم تكنولوجيا مفهومة جيدا - وتستمر في التحسن - إلا أنه لا يمكن تطويرها وصيانتها إلا من قبل شركات التكنولوجيا العملاقة التي تمتلك الموارد الكافية والأموال والمهارات للقيام بذلك، كما جادل ليتان.
“إن هذا يعزز قوة شركات إدارة الأعمال مع عدد قليل من اللاعبين المهيمنين، وهذه المركزية تشكل مخاطرة هائلة في حد ذاتها”، كما قالت. “إن مركزية القوة التكنولوجية الهائلة بين حفنة من اللاعبين هي دائما فكرة سيئة. لا توجد ضوابط وتوازنات ذات مغزى على هذه الشركات. ولا تستطيع صناعة الرقائق مواكبة ذلك. إن ابتكارات وحدة معالجة الرسوميات تتحرك بشكل أبطأ من اتساع ونمو أحجام النماذج. الأجهزة دائما أبطأ في التغيير من البرامج”.
تدريب حاملي شهادات الماجستير في القانون لاستخدامات تنظيمية محددة
في حين يتم تعبئة نماذج مثل GPT 4 مسبقًا وتدريبها بكميات هائلة من المعلومات المستمدة من الإنترنت ومصادر أخرى، فإن الهندسة السريعة تسمح لمستخدمي genAI بتعديل الاستجابات باستخدام معلومات خاصة أو خاصة بالصناعة. على سبيل المثال، يمكن لمنظمة مستخدمة ربط ChatGPT بتطبيقاتها الخلفية وقواعد البيانات باستخدام واجهات برمجة التطبيقات الأصلية؛ يمكن لأداة genAI بعد ذلك الاستفادة من معلومات الشركة الخاصة لاستخدامات أكثر تحديدًا للأعمال.
وبحسب دراسة جديدة أجرتها شركة ديلويت على 115 مديراً مالياً، قال 42% منهم إن شركاتهم تجرب الذكاء الاصطناعي، وأن 15% منهم يعملون على دمجه في استراتيجيتهم. ويقول ما يقرب من ثلثي المديرين الماليين الذين شملهم الاستطلاع إن أقل من 1% من ميزانية العام المقبل ستنفق على الذكاء الاصطناعي، ويتوقع حوالي ثلث المديرين الماليين أن ينفق ما بين 1% و5% على التكنولوجيا الناشئة.
بالنسبة لـ 63% من المديرين الماليين، فإن أكبر العوائق التي تحول دون تبني ونشر genAI هي موارد المواهب والقدرات. وفي ضوء الافتقار إلى المواهب الداخلية، كشف عدد متزايد من شركات التكنولوجيا عن أدوات genAI القائمة على LLMs والتي يمكنها أتمتة المهام التجارية أو مساعدة المستخدمين في التعامل مع المهام المكررة أو المكررة.
في مارس، أعلنت شركة Salesforce عن خططها لإطلاق روبوت محادثة قائم على GPT للاستخدام مع منصة CRM الخاصة بها. وفي نفس الشهر، أعلنت شركة Microsoft عن برنامج Dynamics 365 Copilot القائم على GPT-4 ، والذي يمكنه أتمتة بعض مهام CRM وERP. يمكن أن تساعد منصات genAI الأخرى في كتابة التعليمات البرمجية أو أداء وظائف الموارد البشرية، مثل تصنيف المتقدمين للوظائف من الأفضل إلى الأسوأ أو التوصية بالموظفين للترقيات.
ويبدأ كبار منشئي برامج الماجستير في القانون أيضًا في تصميم نماذجهم لاستخدامات صناعية محددة.
على سبيل المثال، تقدم جوجل الآن نموذجين خاصين بمجال معين: Med-PaLM 2 ، وهو الإصدار الطبي من PaLM 2 ، والذي سيكون متاحًا الشهر المقبل كمعاينة لمزيد من العملاء في صناعة الرعاية الصحية وعلوم الحياة، و Sec-Palm ، وهو إصدار تم ضبطه بدقة للاستخدامات الأمنية. يشتمل الأخير على معلومات استخباراتية أمنية مثل رؤية جوجل لمشهد التهديد ومعلومات Mandiant في الخطوط الأمامية حول نقاط الضعف والبرامج الضارة ومؤشرات التهديد وملفات تعريف الجهات الفاعلة في التهديد السلوكي.
وتقدم جوجل أيضًا Vertex AI ، وهي مجموعة من منهجيات الضبط المستخدمة لتخصيص PaLM 2 LLM أو - كما تدعي - أي نموذج تابع لجهة خارجية أو مفتوح المصدر.
وقال متحدث باسم Google في رد عبر البريد الإلكتروني على Computerworld: “يستخدم عملاؤنا طرق الضبط هذه لتخصيص حالات استخدام الأعمال المحددة الخاصة بهم والاستفادة من بيانات المؤسسة الخاصة بهم، مع تقديم إرشادات حول النهج الأفضل لحالة الاستخدام وأهداف العمل والميزانية ” .
وقال المتحدث باسم Vertex AI إن الشركة تقدم ميزات تخصيص مثل الضبط الفوري وضبط المحول، الأمر الذي يتطلب مجموعة بيانات تدريب أكبر - من مئات إلى آلاف الأمثلة - وكمية صغيرة من قوة الحوسبة للتدريب.
ويقدم أيضًا “التعلم التعزيزي مع ردود الفعل البشرية”، والذي يأخذ ردود الفعل البشرية على المخرجات لضبط النموذج باستخدام خطوط أنابيب Vertex AI.
وتدخل الشركات الناشئة أيضًا في هذا المجال، حيث تعمل على إنشاء برامج ماجستير في القانون خاصة بقطاعات معينة أو نماذج ضبط دقيقة لعملائها.
على سبيل المثال، تعد شركة Writer شركة ناشئة تقدم منصة genAI كاملة المزايا للشركات؛ ويمكنها دعم العمليات التجارية والمنتجات والمبيعات وعمليات الموارد البشرية والتسويق. وتقدم الشركة مجموعة من نماذج اللغة التي تلبي احتياجات صناعات محددة. يحتوي أصغر نموذج للشركة على 128 مليون معلمة، بينما يحتوي أكبرها - Palmyra-X - على 40 مليار معلمة.
على سبيل المثال، لإنشاء نموذج Palmyra-Med الموجه للرعاية الصحية، استخدمت Writer نموذجها الأساسي، Palmyra-40B، وطبقت عليه ضبط التعليمات . ومن خلال هذه العملية، دربت الشركة طلاب الماجستير في القانون على مجموعات بيانات طبية مختارة من مصدرين متاحين للجمهور، PubMedQA و MedQA .
"وفقًا لليتان، أصبحت النماذج الأصغر حجمًا خيارات قابلة للتطبيق ومتاحة للعديد من الباحثين والمستخدمين النهائيين اليوم، ونشر “ثروة” الذكاء الاصطناعي فكرة جيدة من وجهة نظر التحكم والحل"، “هناك العديد من التجارب والابتكارات التي تُظهر أن النماذج الأصغر حجمًا المدربة على بيانات أكثر بكثير (على سبيل المثال، من خمسة إلى عشرة أضعاف) أو البيانات المنسقة، يمكن أن تقترب من أداء نماذج LLMs الضخمة.”
في فبراير، أصدرت شركة Meta، الشركة الأم لفيسبوك، إصدارات من LLaMa LLM بأحجام تتراوح من سبعة إلى 65 مليار معلمة، وهي أصغر بكثير من النماذج السابقة. كما ادعت أن نموذج LLaMA الذي يحتوي على 13 مليار معلمة تفوق على نموذج GPT-3 الأكبر بكثير في معظم المعايير. وقالت Meta إن نموذج LLaMA الأصغر حجمًا الخاص بها “سيجعل الوصول إلى genAI ديمقراطيًا ” من خلال طلب “قوة حوسبة وموارد أقل لاختبار الأساليب الجديدة، والتحقق من صحة عمل الآخرين، واستكشاف حالات استخدام جديدة”.
وهناك ابتكارات أخرى تجري في ستانفورد، وإنفيديا، وفي مختلف المؤسسات الأكاديمية مثل جون هوبكنز، التي أطلقت تحدي BabyLM لإنشاء نماذج أصغر حجماً بشكل ملحوظ، والتي تكاد تكون بنفس جودة أكبر برامج الماجستير في القانون. ويقول ليتان: “لا يزال على كل هذه البرامج أن تثبت نفسها خارج مختبرات الأبحاث، لكن التقدم يتقدم إلى الأمام”.
هناك أيضًا تقنيات أخرى قيد الاختبار، بما في ذلك تقنية تتضمن تدريب نماذج فرعية أصغر لوظائف محددة كجزء من نظام بيئي نموذجي أكبر.
قال أرفيند جين، الرئيس التنفيذي لشركة Glean، وهي شركة تقدم محرك بحث مؤسسي بمساعدة الذكاء الاصطناعي: “نرى مخاوف من جانب الشركات بشأن استخدام نموذج مثل GPT أو PaLM لأنها كبيرة جدًا ويجب استضافتها من قبل مقدمي النموذج. بمعنى ما، تمر بياناتك عبر هؤلاء المزودين”.
يعتمد محرك بحث Glean بشكل كبير على LLMs مثل GPT 4 وPaLM 2 وLLaMA 2 لمطابقة استعلامات المستخدم مع المؤسسة التي يبحثون عن البيانات أو المستندات الداخلية منها.
ومن بين المخاوف التي لا تزال قائمة فيما يتعلق ببرامج الماجستير في القانون المستندة إلى السحابة قضايا الأمن والخصوصية وانتهاك حقوق النشر . وقال جين، وهو مهندس سابق متميز في جوجل، إن شركتي OpenAI وGoogle تقدمان الآن ضمانات بعدم إساءة استخدام بيانات العملاء لتخصيص برامج الماجستير في القانون بشكل أفضل. وأضاف جين أن الشركات تقبل هذه الضمانات.
وعلى هذا المنوال، أطلقت OpenAI للتو تطبيق ChatGPT Enterprise ، الذي يوفر للمؤسسات مزيدًا من الأمان والخصوصية من خلال التشفير وتقنية تسجيل الدخول الموحد.
قال ديريك هولت، الرئيس التنفيذي لشركة Digital.ai، التي تبيع منصة لتطوير البرمجيات التي تعتمد على الذكاء الاصطناعي، إن برامج الماجستير في القانون الأصغر حجمًا والأكثر ملاءمة تنشأ من شركات ناشئة مثل Pryon التي تسمح للمؤسسات ببناء برامج الماجستير في القانون الخاصة بها بسرعة. وقال هولت: "الفكرة هي: “سنبني برنامجًا من خلال سياق بيانات مؤسساتنا”.
قال مات جاكسون، كبير مسؤولي التكنولوجيا العالميين في شركة Insight Enterprises ، وهي شركة تقدم خدمات تكامل الأنظمة ، إن هناك مزايا محددة لبعض مستخدمي برنامج ماجستير القانون “المركّز”. على سبيل المثال، تقوم صناعات الرعاية الصحية والخدمات المالية بتجربة نماذج أصغر حجمًا يتم تدريبها على مجموعات بيانات محددة.
وتقوم أمازون أيضًا بإطلاق سوق LLM الخاص بها مع نماذج أصغر يمكن للمؤسسات التدريب عليها باستخدام بيانات المؤسسة الخاصة بها.
“بالنسبة لمعظم الناس، ربما لا يكون تدريب نموذجهم الخاص هو النهج الصحيح. معظم الشركات التي نعمل معها مناسبة تمامًا لاستخدام ChatGPT أو Langchain أو محرك البحث المعرفي الخاص بشركة Microsoft. إن LLM عبارة عن صندوق أسود تم تدريبه مسبقًا. يمكنك السماح له بالوصول إلى بياناتك الخاصة،” كما قال جاكسون.
إن بناء برنامج ماجستير في القانون مخصص أمر صعب ومكلف
حاليًا، توجد مئات من برامج الماجستير في القانون مفتوحة النطاق في مستودعات المطورين عبر الإنترنت مثل Github . لكن النماذج تميل إلى أن تكون أصغر كثيرًا من تلك التي تقدمها شركات التكنولوجيا الراسخة، وبالتالي فهي أقل قوة أو قابلية للتكيف.
وعلاوة على ذلك، فإن بناء برامج ماجستير في القانون الملكية يمكن أن يكون مهمة شاقة؛ ويقول جين إنه لم يقابل عميلاً واحداً نجح في القيام بذلك، حتى مع استمرارهم في تجربة التكنولوجيا.
“إن الواقع في الوقت الحالي هو أن النماذج الموجودة في المجال المفتوح ليست قوية جدًا. وقد أظهرت تجاربنا الخاصة أن الجودة التي تحصل عليها من GPT 4 أو PaLM 2 تفوق بكثير جودة النماذج الموجودة في المجال المفتوح”، كما قال جين. “لذا، بالنسبة للتطبيقات ذات الأغراض العامة، ليست الاستراتيجية الصحيحة الآن لبناء وتدريب نماذجك الخاصة”.