Jannah Theme License is not validated, Go to the theme options page to validate the license, You need a single license for each domain name.
أخبار التكنولوجيا

يريد Reddit الحصول على أموال مقابل المساعدة في تدريس أنظمة الذكاء الاصطناعي الكبيرة


لطالما كان Reddit نقطة ساخنة للمحادثات على الإنترنت. يزور حوالي 57 مليون شخص الموقع يوميًا للدردشة حول مواضيع متنوعة مثل الماكياج وألعاب الفيديو ومؤشرات ممرات غسيل الطاقة.

في السنوات الأخيرة ، كانت مجموعة محادثات Reddit أيضًا مساعدة تعليمية مجانية لشركات مثل Google و OpenAI و Microsoft. تستخدم هذه الشركات محادثات Reddit في تطوير أنظمة الذكاء الاصطناعي العملاقة التي يعتقد الكثيرون في Silicon Valley أنها في طريقها لتصبح الشيء الكبير التالي في صناعة التكنولوجيا.

الآن يريد Reddit أن يتم الدفع مقابل ذلك. قالت الشركة يوم الثلاثاء إنها تخطط لبدء فرض رسوم على الشركات للوصول إلى واجهة برمجة التطبيقات الخاصة بها ، أو API ، وهي الطريقة التي يمكن للكيانات الخارجية من خلالها تنزيل ومعالجة مجموعة واسعة من المحادثات الشخصية على الشبكة الاجتماعية.

قال ستيف هوفمان ، المؤسس والرئيس التنفيذي لشركة Reddit ، في مقابلة: “إن مجموعة بيانات Reddit قيمة حقًا”. “لكننا لسنا بحاجة إلى إعطاء كل هذه القيمة لبعض أكبر الشركات في العالم مجانًا.”

تمثل هذه الخطوة واحدة من أولى الأمثلة المهمة على فرض رسوم على الشبكات الاجتماعية للوصول إلى المحادثات التي تستضيفها لغرض تطوير أنظمة الذكاء الاصطناعي مثل ChatGPT ، برنامج OpenAI الشهير. قد تؤدي أنظمة الذكاء الاصطناعي الجديدة هذه في يوم من الأيام إلى إنشاء شركات كبيرة ، لكن من غير المحتمل أن تساعد شركات مثل Reddit كثيرًا. في الواقع ، يمكن استخدامها لإنشاء منافسين – نسخ مكررة تلقائيًا لمحادثات Reddit.

تأتي خطوة Reddit أيضًا في الوقت الذي تستعد فيه لطرح عام أولي محتمل في وول ستريت في وقت لاحق من هذا العام. تحقق الشركة ، التي تأسست عام 2005 ، معظم أموالها من خلال الإعلانات والمعاملات التجارية الإلكترونية على منصتها. قال Reddit إنه لا يزال يعمل على تسوية تفاصيل الرسوم التي سيتقاضاها للوصول إلى واجهة برمجة التطبيقات (API) وسيعلن عن الأسعار في الأسابيع المقبلة.

أصبحت محادثات Reddit – أو subreddits ، كما تسميها الشركة – سلعًا قيمة حيث أصبحت النماذج اللغوية الكبيرة ، أو LLMs ، جزءًا أساسيًا من إنشاء تقنية ذكاء اصطناعي جديدة.

LLMs هي خوارزميات معقدة بشكل أساسي طورتها شركات مثل Google و OpenAI ، وهي شريك وثيق لمايكروسوفت. بالنسبة للخوارزميات ، فإن محادثات Reddit هي بيانات ، وهي من بين مجموعة كبيرة من المواد التي يتم إدخالها في LLMs لتطويرها.

تم تدريب الخوارزمية الأساسية التي ساعدت في بناء Bard ، خدمة الذكاء الاصطناعي للمحادثات من Google ، جزئيًا على بيانات Reddit. تستشهد دردشة GPT من OpenAI ببيانات Reddit كأحد مصادر المعلومات التي تم التدريب عليها.

بدأت الشركات الأخرى أيضًا في ملاحظة قيمة المحادثات والصور التي تستضيفها. كما باعت Shutterstock ، خدمة استضافة الصور ، بيانات الصور إلى OpenAI للمساعدة في إنشاء DALL-E ، وهو برنامج الذكاء الاصطناعي التوليدي الذي ينشئ صورًا رسومية جديدة وحيوية مع مطالبة تستند إلى النص فقط.

في الشهر الماضي ، قال Elon Musk ، مالك Twitter ، إنه كان يتخذ إجراءات صارمة بشأن استخدام واجهة برمجة تطبيقات Twitter ، والتي تستخدمها الآلاف من الشركات الخارجية والمطورين المستقلين لتتبع ملايين المحادثات التي تحدث عبر الشبكة. على الرغم من أنه لم يستشهد بـ LLMs كسبب لإجراء التغيير ، إلا أن الرسوم الجديدة يمكن أن تصل إلى عشرات أو حتى مئات الآلاف من الدولارات.

لمواصلة تحسين نماذجهم ، يحتاج صانعو الذكاء الاصطناعي إلى شيئين مهمين: كمية هائلة من قوة الحوسبة وكمية هائلة من البيانات. يمتلك بعض أكبر مطوري الذكاء الاصطناعي الكثير من القوة الحاسوبية ، لكنهم ما زالوا يبحثون خارج شبكاتهم الخاصة عن البيانات اللازمة لتحسين الخوارزميات الخاصة بهم. وقد تضمن ذلك مصادر مثل ويكيبيديا وملايين الكتب الرقمية والمقالات الأكاديمية و Reddit.

لطالما كان لدى Reddit علاقة تكافلية مع محركات البحث لشركات مثل Google و Microsoft. تقوم محركات البحث “بالزحف” إلى صفحات الويب الخاصة بـ Reddit لفهرسة المعلومات وإتاحتها لنتائج البحث. هذا الزحف ، أو “الكشط” ، ليس مرحبًا به دائمًا في كل موقع على الإنترنت. لكن Reddit استفاد من الظهور أعلى في نتائج البحث.

تختلف الديناميكية مع LLMs – فهم يلتهمون أكبر قدر ممكن من البيانات لإنشاء أنظمة ذكاء اصطناعي جديدة مثل روبوتات المحادثة.

يعتقد Reddit أن بياناته ذات قيمة خاصة لأنه يتم تحديثها باستمرار. قال هوفمان إن هذه الحداثة والملاءمة هما ما تحتاجه خوارزميات النمذجة اللغوية الكبيرة لتحقيق أفضل النتائج.

قال هوفمان: “أكثر من أي مكان آخر على الإنترنت ، فإن رديت هي موطن للمحادثات الأصيلة”. “هناك الكثير من الأشياء على الموقع لم تقلها إلا في العلاج ، أو AA ، أو لا تقولها على الإطلاق.”

قال السيد هوفمان إن واجهة برمجة تطبيقات Reddit ستظل مجانية للمطورين الذين يرغبون في إنشاء تطبيقات تساعد الأشخاص على استخدام Reddit. يمكنهم استخدام الأدوات لبناء روبوت يتتبع تلقائيًا ما إذا كانت تعليقات المستخدمين تلتزم بقواعد subreddit ، على سبيل المثال. سيستمر السماح للباحثين الذين يرغبون في دراسة بيانات Reddit لأغراض أكاديمية أو غير تجارية بالوصول المجاني إليها.

يأمل Reddit أيضًا في دمج المزيد مما يسمى التعلم الآلي في كيفية عمل الموقع نفسه. يمكن استخدامه ، على سبيل المثال ، لتحديد استخدام النص الذي تم إنشاؤه بواسطة AI على Reddit ، وإضافة تسمية تُعلم المستخدمين بأن التعليق جاء من روبوت.

وعدت الشركة أيضًا بتحسين أدوات البرامج التي يمكن استخدامها من قبل الوسطاء – المستخدمين الذين يتطوعون بوقتهم للحفاظ على عمل منتديات الموقع بسلاسة وتحسين المحادثات بين المستخدمين. وسيستمر دعم روبوتات الجهات الخارجية التي تساعد الوسطاء في مراقبة المنتديات.

لكن بالنسبة لصانعي الذكاء الاصطناعي ، حان وقت الدفع.

قال السيد هوفمان: “إن الزحف إلى Reddit ، وتوليد القيمة وعدم إعادة أي من هذه القيمة إلى مستخدمينا هو شيء لدينا مشكلة فيه”. “إنه وقت مناسب لنا لتشديد الأمور”.

واضاف “نعتقد ان هذا عادل”.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى