عمالقة التكنولوجيا يدفعون الحدود لتغذية شهية الذكاء الاصطناعي للبيانات

By James Kinoti
تم التحديث: 6 أبريل 2024 الساعة 12:39 مساءً بالتوقيت العالمي المنسق

3 دقائق للقراءة

507313

محتويات

1. مبادرة Whisper الخاصة بـ OpenAI: التنقيب في محادثات YouTube

2. أزمة البيانات: قيادة الأساليب غير التقليدية

3. ضرورة وجود مجموعات ضخمة من البيانات

رابط المشاركة:

في هذه التدوينة:

يلجأ عمالقة التكنولوجيا إلى أساليب مثيرة للجدل لجمع بيانات الذكاء الاصطناعي.
يقوم OpenAI بنسخ مقاطع فيديو YouTube، وتفكر Google وMeta في شراء محتوى محمي بحقوق الطبع والنشر.
تنشأ مناقشات قانونية وأخلاقية حول استخدام الذكاء الاصطناعي لمجموعات البيانات الضخمة.

سواء كان هناك عمل OpenAI وGoogle وMeta، فإن الذكاء الاصطناعي يمول القطاع الصناعي، والذي يضم وسائل مختلفة مثل جمع أو تجميع كميات هائلة من البيانات الرقمية بطرق إبداعية مختلفة ولكن مثيرة للجدل، فمن الواضح أن قدرات وإمكانيات الأتمتة آخذة في الازدياد. ومن الجدير بالذكر أن الجهود التي تنطوي على إجراءات مثل اتخاذ التدابير الموضحة أعلاه (أي أخذ الحدود القانونية وسياسات الشركات في الاعتبار) تعادل كمية كبيرة من البيانات المستخدمة لتدريب أنظمة الذكاء الاصطناعي.

مبادرة Whisper الخاصة بـ OpenAI: التنقيب في محادثات YouTube

بدأت قصتنا في Whisper في العام الماضي فقط. هناك نقص هائل في النصوص الإنجليزية من الدرجة الأولى التي تسبب التأخير في تقديم التعليم. كانت Whisper هي الخطوة التالية التي اتخذتها Google. لقد استوعب محيط الحوارات على YouTube وتم تطويره كنص، وتطبيق تحويل النص إلى كلام. تم استخدام الأداة المدعومة بالذكاء الاصطناعي نفسها، والتي تتكون من أكثر من مليون ساعة من مقاطع فيديو YouTube التي يتم تدقيقها بواسطة الذكاء الاصطناعي لإنشاء نصوص جديدة (في الأساس، محادثة جديدة)، لتدريب نماذج الذكاء الاصطناعي المنتجة من أحدث التقنيات وصولاً إلى GPT-4، أحدث إصدار من chatbot chatGPT.

على الرغم من أن بعض الموظفين جادلوا بأن لقطات Microsoft الخاصة بشركة OpenAI من شأنها أن تسرق حقوق YouTube من جميع المجالات، إلا أن أخلاقيات الانتحال كانت لا تزال محل نقاش؛ بالإضافة إلى ذلك، اعترف بعض العاملين بأنه سيكون من المستحيل التوافق بدقة مع نوايا يوتيوب. وبالمثل، فإن الاعتراض على معالجة مقاطع الفيديو خوارزميًاtracالمحتويات النصية لتغذية نماذج الذكاء الاصطناعي قد يعتبر تهديدًا لحقوق الطبع والنشر لمنشئي الفيديو، مما يسبب الغضب.

انظر أيضًا Donald Trump Dinner Hype يرفع ميلانيا على الرغم من عمليات بيع رمزية بقيمة 18 مليون دولار

وكانت شركة Meta، الشركة الأم لفيسبوك وإنستغرام، قلقة أيضًا بشأن استخدام العناصر المحمية بحقوق الطبع والنشر من دور النشر مثل Simon & Schuster، من بين آخرين. وفي الوقت نفسه، ناقش أيضًا الحصول على محتوى الويب العام، والذي من المحتمل أن يتم القبض عليه في انتهاك حقوق الطبع والنشر.

أزمة البيانات: قيادة الأساليب غير التقليدية

يساعد جمع البيانات المليء بالمنافسة على ملاحظة الموقع المحوري للبياناتdentفي تطوير تقنية الذكاء الاصطناعي. تتطلب اللغة في الذكاء الاصطناعي المزيد والمزيد من مجموعات البيانات التدريبية، بما في ذلك الكومنولث، والتي يتم التلاعب بها وصولاً إلى ويكيبيديا وريديت من خارج هذه المصادر اليوم. بالنسبة لشركات التكنولوجيا - وخاصة تلك التي تواجه صعوبة في الوصول إلى مصادر البيانات الشائعة جدًا مثل مخازن البيانات التقليدية - يمكن أن يكون إنشاء نماذج مدعومة بالذكاء الاصطناعي حلاً بديلاً قد يكون مرغوبًا بدرجة كافية في مثل هذه الحالات.

تشير الشركات المتخصصة في مجال التكنولوجيا إلى أن جمع البيانات ضروري للتدريب على الذكاء الاصطناعي، في حين أن نفس العملية موضع تساؤل في المحكمة من الناحية القانونية. في دفاعهما، شركتا OpenAI وMicrosoft بادعاء بشأن الاستخدام غير القانوني لمواد محمية بحقوق الطبع والنشر ضدهما. ومع ذلك، قالوا إن أفعالهم تندرج ضمن المبدأ القانوني للاستخدام العادل. في السنوات الأخيرة، تجاوز عدد الطلبات المقدمة إلى مكتب حقوق الطبع والنشر الأمريكي من قبل أصحاب حقوق الطبع والنشر عدد 10000، مما يوضح بوضوح أن قانون حقوق الطبع والنشر في عصر الذكاء الاصطناعي فريد وجديد تمامًا. وبالتالي، يواجه اللاعبون الأساسيون دائمًا مخاطر تتعلق بالتعدي على العديد من الأعمال تحت ستار عدم وجود أغراض مرخصة للنماذج التي تستخدم الذكاء الاصطناعي على هذا الأساس.

انظر أيضًا الذهب Bitcoin يجتمعان معًا ، هل الدولار في مشكلة؟

ضرورة وجود مجموعات ضخمة من البيانات

بشكل عام، كان عمل كايبان دي جاريد، العالم ذو الحجم الكبير، ملحميًا عن غير قصد في تطوير الذكاء الاصطناعي. يعد المحتوى المعتمد على البيانات أحد مكونات الذكاء الاصطناعي اللازمة لعملية التدريب، لكنه لا يمكن أن يعمل بشكل جيد بدون النماذج التي تم تدريبها بشكل جيد وتعمل بفعالية. مع زيادة تكنولوجيا الذكاء الاصطناعي، يتصاعد الطلب على البيانات لتحقيق النجاح في السوق بمعدل مرتفع، مما يترك الشركات أمام أسئلة تتعلق بالقانون والأخلاق والخصوصية. ولذلك، يجب أن تستخدم خوارزميات الذكاء الاصطناعي مجموعات البيانات هذه لتحقيق النجاح في السوق.

يتم تشويه سلوك جمع البيانات لـ V.IPs الذكاء الاصطناعي ؛ لقد أصبح القسم المنهجي النموذجي أكثر خشونة. سواء من خلال إحدى محادثاتهم على YouTube أو إنشاء بيانات تركيبية، فإن هذه الشركات هي قادة في مهمة لاكتشاف ماهية قضايا القانون والأخلاق والخصوصية حقًا.

قد تصبح مزحة على البحر في وقت لاحق. ونظرًا لظهور المجموعات الهائلة من البيانات اللازمة لدفع عملية الابتكار، يتعين على قادة المجتمع المشاركة بنشاط في حوار بناء لتطوير القواعد والمعايير التي تتوازن فيها جهود الابتكار مع المبادئ الأخلاقية لحقوق الملكية الفكرية والخصوصية.

القصة الأصلية من: https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html

أكاديمية Cryptopolitan: قريبًا - طريقة جديدة لكسب دخل سلبي مع DeFi في عام 2025. تعرف على المزيد

رابط المشاركة:

قراءة إخلاء المسؤولية

تنصل. المعلومات المقدمة ليست نصيحة تجارية. Cryptopolitan.com أي مسؤولية عن أي استثمارات تتم بناءً على المعلومات المقدمة في هذه الصفحة. نوصي tron dent و / أو استشارة متخصص مؤهل قبل اتخاذ أي قرارات استثمارية .

اختيار المحرر

جارٍ تحميل مقالات اختيار المحرر...

عمالقة التكنولوجيا يدفعون الحدود لتغذية شهية الذكاء الاصطناعي للبيانات

محتويات

في هذه التدوينة:

مبادرة Whisper الخاصة بـ OpenAI: التنقيب في محادثات YouTube

أزمة البيانات: قيادة الأساليب غير التقليدية

ضرورة وجود مجموعات ضخمة من البيانات

رابط المشاركة:

الأكثر قراءة

ابق على اطلاع بأخبار العملات المشفرة، واحصل على تحديثات يومية في بريدك الوارد

اختيار المحرر

قم بالتسجيل والبقاء في القمة

الأسواق تتحرك بسرعة.

نتحرك بشكل أسرع.

احصل على الحقائق.
تقدم.

عمالقة التكنولوجيا يدفعون الحدود لتغذية شهية الذكاء الاصطناعي للبيانات

محتويات

في هذه التدوينة:

مبادرة Whisper الخاصة بـ OpenAI: التنقيب في محادثات YouTube

أزمة البيانات: قيادة الأساليب غير التقليدية

ضرورة وجود مجموعات ضخمة من البيانات

رابط المشاركة:

الأكثر قراءة

ابق على اطلاع بأخبار العملات المشفرة، واحصل على تحديثات يومية في بريدك الوارد

اختيار المحرر

قم بالتسجيل والبقاء في القمة

تابعنا

- النشرة الإخبارية للتشفير التي تبقيك في المقدمة -

الأسواق تتحرك بسرعة.

نتحرك بشكل أسرع.

احصل على الحقائق. تقدم.

احصل على الحقائق.
تقدم.