أداة Corpus من Avail “تتعارض مع” التعليقات التي أدلى بها رئيس الذكاء الاصطناعي في Microsoft، كما يقول أحد المحللين.
أطلقت اليوم شركة Avail، وهي شركة أبحاث في مجال الذكاء الاصطناعي تركز على صناعة الإعلام، منصة Corpus، والتي قالت إنها تمكن المبدعين وحاملي حقوق الوسائط من ترخيص أعمالهم لمطوري نماذج الذكاء الاصطناعي.
وقالت شركة كوربوس، التي يقع مقرها في بروكلين بنيويورك، في بيان لها، إن “أصحاب الحقوق يمكنهم طلب تعويض عن محتوى الكتالوج والإجابات في الوقت الفعلي المستمدة من أعمالهم”.
يصف أحد الأسئلة الشائعة للشركة هذه المنصة بأنها “منصة تحقيق الدخل للمبدعين وشركات الإعلام وأصحاب الحقوق من جميع الأنواع. نحن نربط أصحاب المحتوى بشركات الذكاء الاصطناعي المهتمة بترخيص أعمالهم لأغراض التدريب أو استرجاع إجابات الدردشة الآلية في الوقت الفعلي”. تحتوي الصفحة الرئيسية لـ Corpus على حاسبة تقييم توفر للمبدعين تقديرًا لقيمة كتالوجهم بناءً على معايير حديثة، كما قالت Avail.
على الموقع، ذكر أنه دخل في شراكة مع OpenAI، وAnthropic، وشركة إنتاج وتوزيع الأفلام 30West، وشركة إدارة الثروات القائمة على الذكاء الاصطناعي Range، وشركات رأس المال الاستثماري General Catalyst وSeven Seven Six.
اعتبر بيل وونغ، زميل أبحاث الذكاء الاصطناعي في Info-Tech Research Group، إطلاق Corpus بمثابة خطوة إيجابية للمبدعين، وضرورية لإعادة ضبط “التوقعات التي لدى بائعي شركات التكنولوجيا الكبرى فيما يتعلق باستخدامهم للبيانات المحمية بحقوق الطبع والنشر”.
وفي حين قال إن مبادرة مثل هذه لديها القدرة على أن تكون مفيدة ليس فقط لمنشئي المحتوى، بل وأيضًا للشركات التي تدرب نماذج الذكاء الاصطناعي، “ستكون هناك تحديات في إعادة ضبط التوقعات وجعل هذا العمل فعالاً. تتمثل ميزة الوصول إلى البيانات المنسقة في أنها توفر جودة أعلى من البيانات لتدريب النموذج. ومع ذلك، قد تشكل إدارة هذا تحديًا، مثل حساب التكاليف الصحيحة، وربما تنفيذ أنواع جديدة من العلامات المائية، وما إلى ذلك”.
وأضاف وونغ أن أداة Corpus التي تقدمها شركة Avail “تتعارض” مع التعليقات الأخيرة التي أدلى بها مصطفى سليمان، الرئيس التنفيذي لشركة Microsoft AI، في مقابلة أجريت معه في مهرجان Aspen Ideas Festival الأخير. "بينما حاول تحديد نوع المحتوى الذي يحميه الناشرون، واصل حديثه قائلاً: “فيما يتعلق بالمحتوى الموجود بالفعل على شبكة الويب المفتوحة، كان العقد الاجتماعي لهذا المحتوى منذ التسعينيات هو أنه استخدام عادل. يمكن لأي شخص نسخه أو إعادة إنشائه أو إعادة إنتاجه. كان ذلك مجانيًا، إذا شئت؛ هذا هو الفهم”.
يقول وونغ: "لو كانت الإنترنت تمتلك أداة مثل Corpus في تسعينيات القرن العشرين، فأنا متأكد من أن صناع المحتوى كانوا ليحصلوا على التقدير المناسب وتعويضهم عن محتواهم. واليوم، لا تزال هيئة المحلفين تقيم ما إذا كانت بيانات حقوق الطبع والنشر للتدريب على القانون يجب أن تندرج تحت بند “الاستخدام العادل”، ولكن الوصول إلى البيانات في الوقت الفعلي يجب أن يُعترف به باعتباره ذا قيمة لكل من المستخدمين والبائعين، ولا ينبغي اعتبار هذا المحتوى مجانيًا".
وقال إن مكتب حقوق الطبع والنشر الأمريكي لم يمنع اليوم "بائعي LLM من استخدام البيانات المحمية بحقوق الطبع والنشر لتدريب نماذجهم. ويذكر البائعون عادة أن استخدام البيانات المحمية بحقوق الطبع والنشر يندرج ضمن المفهوم القانوني “الاستخدام العادل”، والذي يسمح للأشخاص/الشركات باستخدام أجزاء محدودة من العمل لأغراض غير تجارية أو تعليمية أو تحويلية".
وفقًا لوونغ، "إن الاستخدام “التحويلي” الذي يزعم البائعون أنه هو الطريقة التي تستخدم بها LLMs البيانات. لا يتم إعادة إنتاج البيانات المستوعبة ببساطة بواسطة LLM؛ يتم تحويل المحتوى واستخدامه لتوليد محتوى جديد لاستخدامات جديدة. ومع ذلك، لا أعتقد أنه عندما تم تعريف مبدأ “الاستخدام العادل” لأول مرة، فقد فكروا في برنامج من شأنه أن يستوعب جميع البيانات، ويستخدم لأغراض تجارية، ويعطل صناعة المبدعين".
يأتي إطلاق Corpus بعد إعلان في أواخر الشهر الماضي عن تشكيل سبع شركات ترخص الموسيقى والصور ومقاطع الفيديو وغيرها من البيانات المستخدمة في تدريب أنظمة الذكاء الاصطناعي رابطة تجارية لتعزيز الترخيص المسؤول والأخلاقي للملكية الفكرية . والمعروفة باسم تحالف موفري مجموعات البيانات (DPA)، والأهداف الأساسية هي توحيد ترخيص الملكية الفكرية لمجموعات بيانات الذكاء الاصطناعي والتعلم الآلي، وتسهيل التعاون الصناعي، والدفاع عن حقوق منشئي المحتوى وحماية الملكية الفكرية.
ولكن ماذا يمكن أن يحدث إذا ما انتهى الأمر بمنظمة ما إلى الوقوع في فخ انتهاك حقوق الطبع والنشر؟ لنتأمل هنا ما يلي: ففي شهر مارس/آذار، فرضت هيئة المنافسة الفرنسية غرامة إجمالية قدرها 250 مليون يورو (271 مليون دولار) على شركة جوجل، والشركة الأم ألفابت، وشركتين تابعتين لها، لانتهاك اتفاقية سابقة بشأن استخدام محتوى محمي بحقوق الطبع والنشر لتدريب خدمة Bard AI، المعروفة الآن باسم Gemini.
قالت هيئة المنافسة إن شركة البحث العملاقة فشلت في الامتثال لتسوية يونيو 2022 بشأن استخدام القصص الإخبارية في نتائج البحث وصفحات الأخبار وDiscover. تجنبت جوجل غرامة في تلك المرحلة من خلال التعهد بالدخول في مفاوضات بحسن نية مع مقدمي الأخبار بشأن التعويض عن محتواهم، من بين إجراءات أخرى.