دروغگویی متا درباره توسعه سیستم هوش مصنوعی مولد

دروغگویی متا درباره توسعه سیستم هوش مصنوعی مولد
تاریخ انتشار : ۲۲ آذر ۱۴۰۲

طبق اسناد جدید یک شکایت نقض قانون کپی رایت علیه متا پلتفرمز، این شرکت هشدار وکلا درباره استفاده از کتاب‎های تحت قانون کپی رایت در آموزش سیستم هوش مصنوعی را نادیده گرفته است.

به گزارش گرداب، البته نسخه اولیه این شکایت در تابستان ثبت شده بود. اسناد جدیدی که دوشنبه شب ارائه شده، دو شکایت سارا سیلورمن (برنده جایزه پولیتزر)، مایکل چابن و دیگر مولفان برجسته علیه مالک فیس بوک و اینستاگرام را ثابت می‌کند.

در این شکایت‌ها ادعا شده متا بدون اجازه این نویسندگان از آثارشان برای آموزش مدل زبانی هوش مصنوعی خود به نام Llama استفاده کرده است. اسناد مذکور در حالی ارائه شده که ماه گذشته قاضی دادگاه بخشی از شکایت سیلورمن را رد و اعلام کرد به مولفان اجازه می‌دهد ادعا‌های خود را اصلاح کنند.

در شکایت جدید که روز دوشنبه ثبت شده، گزارش‌های چت یک محقق وابسته به متا وجود دارد که در مورد تهیه مجموعه داده در سرور Discord بحث می‌کند و شواهد بالقوه مهمی را دربردارد که نشان می‌دهد متا از قبل می‌دانسته استفاده از این کتاب‌ها برخلاف قانون کپی رایت آمریکا است.

در چت‌های ارائه شده به دادگاه، تیم دتمرز محقق متا بررسی‌های بخش حقوقی متا درباره اینکه آیا استفاده از فایل کتاب‌ها به عنوان داده آموزشی از لحاظ حقوقی درست یا خیر، توضیح داده است.

دتمرز در ۲۰۲۱ میلادی با اشاره به آنکه یک مخزن داده متا برای آموزش نسخه اولیه Llama به کار رفته، در چت‌ها نوشته است: در فیس بوک افراد زیادی از جمله خودم به فعالیت با The Pile (مخزن داده مذکور) علاقه دارند، اما در وضعیت فعلی به دلایل حقوقی نمی‌توانیم از آن استفاده کنیم.

ماه قبل از آن نیز دتمرز نوشته بود وکلای متا به او گفته اند اگر مدل‌های هوش مصنوعی براساس داده‌های مذکور آموزش ببینند، نمی‌توان آن‌ها را منتشر کرد.

هرچند این محقق فیس بوک در چت هایش نگرانی وکلای فیس بوک را توضیح نمی‌دهد، اما همکاران وی در چت کتاب‌هایی که تحت پوشش قانون کپی رایت هستند را به عنوان مهم‌ترین منبع نگرانی می‌دانند.

این محققان معتقد بودند آموزش براساس داده‌ها باید مبتنی بر دکترین «استفاده عادلانه» باشد. این دکترین حقوقی از برخی موارد استفاده غیر مجاز از آثار تحت پوشش کپی رایت محافظت می‌کند.

دتمرز یک دانشجوی دکتری در دانشگاه واشنگتن است.

شرکت‌های فناوری در سال جاری با انبوهی از شکایات خالقان محتوا روبرو شدند که آن‌ها را به نقض قانون کپی رایت آثارشان برای ساخت مدل‌های هوش مصنوعی مولد، متهم کرده اند.