استفاده شرکت‌های بزرگ از داده‌های یوتیوب

  • دسته بندی :
  • ۱۲:۰۹ ب.ظ
  • ۱۴۰۳/۰۴/۲۸
  • تولید محتوا
استفاده شرکت‌های بزرگ از داده‌های یوتیوب

در گزارشی که اخیراً منتشر شده بود، ادعا شده بود که شرکت‌های بزرگی مانند اپل بدون کسب مجوز از تولیدکنندگان محتوا، از ویدیوهای یوتیوب برای آموزش مدل‌های هوش مصنوعی خود استفاده کرده‌اند. این خبر باعث نگرانی‌هایی در خصوص حقوق تولیدکنندگان محتوا و حریم خصوصی کاربران شد. اما اپل اکنون به طور رسمی اعلام کرده که هیچ‌گاه از این مجموعه داده‌ها برای آموزش هوش مصنوعی خود، یعنی Apple Intelligence، استفاده نکرده است.

نقش EleutherAI و مجموعه داده‌های Pile

گزارش‌های قبلی نشان می‌داد که یک آزمایشگاه تحقیقاتی هوش مصنوعی به نام EleutherAI بدون اجازه تولیدکنندگان، زیرنویس ویدیوهای یوتیوب را استخراج کرده و از آن‌ها در مجموعه داده‌ای به نام Pile استفاده کرده است. این مجموعه داده‌ها شامل اطلاعات دیگری از منابعی مانند ویکی‌پدیا، پارلمان بریتانیا و ایمیل‌های شرکت Enron نیز می‌شد. هدف EleutherAI از ایجاد Pile کاهش موانع توسعه هوش مصنوعی برای شرکت‌های کوچکتر اعلام شده بود.

با این حال، گزارش‌های جدیدتر نشان می‌دهند که شرکت‌های بزرگی نظیر اپل، انویدیا و سیلزفورس از مجموعه داده Pile برای آموزش پروژه‌های مختلف هوش مصنوعی خود بهره برده‌اند. این ادعاها باعث بروز بحث‌های زیادی در خصوص استفاده از داده‌های بدون مجوز شده است.

استفاده شرکت‌های بزرگ از داده‌های یوتیوب

واکنش اپل به این ادعاها

اپل در واکنش به این گزارش‌ها، در مصاحبه‌ای با AppleInsider تأکید کرده است که مجموعه داده Pile هرگز برای آموزش هوش مصنوعی Apple Intelligence استفاده نشده است. این شرکت توضیح داده که از Pile تنها برای آموزش مدل‌های منبع باز OpenELM که در ماه آوریل منتشر شد، استفاده کرده است.

علاوه بر این، اپل تأیید کرده که مدل‌های OpenELM هیچ‌یک از ویژگی‌های هوش مصنوعی یا یادگیری ماشینی Apple Intelligence را تأمین نمی‌کنند و هدف از ایجاد OpenELM کمک به جامعه تحقیقاتی بوده است. اپل همچنین اشاره کرده که هیچ برنامه‌ای برای ساخت نسخه جدیدی از مدل OpenELM ندارد و تأکید کرده که این مدل‌ها هرگز برای توسعه Apple Intelligence مورد استفاده قرار نگرفته‌اند.

خرید یوتیوب پرمیوم

نتیجه‌گیری

این بیانیه اپل تلاش می‌کند تا نگرانی‌های مرتبط با استفاده غیرمجاز از داده‌ها برای آموزش هوش مصنوعی را کاهش دهد. با وجود این، بحث‌های پیرامون استفاده از داده‌های بدون مجوز همچنان ادامه دارد و نشان‌دهنده نیاز به تدوین قوانین و مقررات شفاف‌تر در این زمینه است. شرکت‌های بزرگ فناوری باید با دقت بیشتری از داده‌های کاربران استفاده کنند و از حقوق تولیدکنندگان محتوا و حریم خصوصی کاربران حفاظت کنند.