متا یک مدل گفتار به متن جدید به نام «SeamlessM۴T» را منتشر کرد که میتواند نزدیک به ۱۰۰ زبان را ترجمه کند.
به گزارش گرداب، به گفته متا مدل SeamlessM۴T (که مخفف ترجمه ماشینی انبوه چند زبانه و چندوجهی است) میتواند گفتار به متن و متن به متن را برای نزدیک به ۱۰۰ زبان ترجمه کند. این مدل برای عملکردهای گفتار به گفتار و متن به گفتار، ۱۰۰ زبان ورودی را تشخیص داده و آنها را به ۳۵ زبان خروجی تبدیل میکند.
متا گفت: «ساخت یک مترجم زبان جهانی، چالش برانگیز است، زیرا سیستمهای گفتار به گفتار و گفتار به نوشتار موجود تنها بخش کوچکی از زبانهای جهان را پوشش میدهند.»
این شرکت اعلام کرده که این مدل نشان دهنده پیشرفت قابل توجهی است، زیرا این مدل جدید کل کار ترجمه را یکجا انجام میدهد، برخلاف سایر مدلهای ترجمه بزرگ که ترجمه را در سیستمهای مختلف تقسیم میکنند.
یکی از ویژگیهای جالب این مدل، البته اگر بتواند به درستی کار کند، توانایی آن در زمانی است شخصی با دو یا چند زبان صحبت کند و آنها را در هم آمیزد. به عنوان مثال، متا در یک ویدئو نشان داد که این مدل بلافاصله بین هندی، تلوگو و انگلیسی تفاوت قائل میشود.
این مدل بر اساس مدلهای ترجمه قبلی از متا ساخته شده است. این شرکت سال گذشته، مدل ترجمه ماشینی متن به متن خود را که از ۲۰۰ زبان پشتیبانی میکرد معرفی کرد.
متا گفت در حین توسعه SeamlessM۴T، سیستمی ساخته است که کلمات حساس ونامناسب را شناسایی میکند. متا کلمات نامناسب را به عنوان مواردی تعریف میکند که ترجمه ممکن است باعث ایجاد نفرت، خشونت، ناسزا یا سوء استفاده شود.
محققان همچنین سعی کردند مجموعه دادههایی را که برخی از ناسزاها را اشتباه ترجمه میکنند، پاکسازی کنند.
متا ادعا میکند که سوگیری جنسیتی را در زبانها نیز تشخیص میدهد و گفت این مدل میتواند تعصب جنسیتی را در ترجمهها محدود کند.
این شرکت بسیاری از مدلهای هوش مصنوعی خود را به صورت کم و بیش منبع باز برای توسعه دهندگان و محققان منتشر کرده است. اخیراً آدیوکرفت را منتشر کرده است، کدی که امکان تولید متن به صدا را فراهم میکند. متا همچنین دسترسی به مدل زبان بزرگ خود ال لاما ۲ را فراهم کرده است.