پس از هشدار قانونی یک گروه مبارزه با سرقت ادبی در دانمارک، مجموعهای وسیع از کتابهای سرقت شده که برای آموزش مدلهای هوش مصنوعی به کار میرفت از فضای اینترنت پاک شد.
به گزارش گرداب، مخزن داده Book ۳ حاوی ۲۰۰ هزار کتاب در وب سایتی به نام The Eye ارائه شده بود و همچنین دادههای دیگری را برای تحقیقات هوش مصنوعی ارائه میکرد. این دادهها بخشی از یک پروژه بزرگتر به نام Pile بودند که هدف آن فراهم کردن دادههای منبع باز برای مدلهای زبانی هوش مصنوعی بود.
وب سایت The Eye درخواست حذف مخزن داده مذکور را از گروه Rights Alliance دریافت کرد که نماینده ناشران و مولفان دانمارک است. برای این منظور Rights Alliance با ۲ سازمان دیگر که لینکهایی به دانلود Book ۳ در وب سایتشان داشتند، تماس گرفته است.
مخزن Book ۳ در ابتدا توسط شان پرسر، توسعه دهنده هوش مصنوعی و یکی از حامیان هوش مصنوعی منبع باز آپلود شد. او مدعی است که هدفش از این اقدام فراهم کردن دسترسی بهتر برای توسعه این فناوری و رقابتی کردن آن به خصوص در مقابل رقبایی مانند اوپنای آی بوده است.
جالب آنکه یکی از کاربران شناخته شده Book ۳، شرکت متا است که چند مولف از آن شکایت کرده اند، زیرا مدعی هستند شرکت مذکور کتاب هایشان را برای آموزش هوش مصنوعی LlaMA سرقت کرده است.
در این شکایت ذکر شده متا از Book ۳ برای آموزش سیستم هوش مصنوعی خود استفاده کرده است، اما دقیقا مشخص نیست چه میزان داده از این مخزن را به کار برده است.