ابزار دیگری از شرکت OpenAi سازنده چتجیپیتی برای تبدیل صوت به متن عرضه شده است.
به گزارش گرداب، شرکت OpenAi از ابزار خود با عنوان «Whisper» (نجوا) برای تبدیل صوت به متن رونمایی کرده است. این شرکت چتبات چتجیپیتی را توسعه داده است.
این ابزار از چند ماه پیش به صورت متنباز عرضه شده و برنامهنویسان میتوانند از طریق این آدرس به آن دسترسی داشته باشند.
این ابزار به برنامهنویسان این امکان را میداد که روی سختافزارهای خود فایلهای صوتی را به فرمتهای مختلف متنی از جمله txt و srt تبدیل کنند. یکی از مهمترین ویژگیهای این ابزار برای ما پشتیبانی از زبان فارسی است.
حالا این شرکت برای کاربران و شرکتهایی که سختافزار مجزا ندارند و یا نمیخواهند پردازش را بر روی آن انجام دهند، یک API پولی عرضه کرده است که این پردازش بر روی سرورهای قدرتمند این شرکت انجام بگیرد و فایلهای صوتی به متن تبدیل شوند. این سرویس بهطور آزمایشی و محدود رایگان است. برای امتحان این API به این پیوند مراجعه کنید.
این برنامه بیش از ۹۸ زبان زنده دنیا را پشتیبانی میکند و در تبدیل آنها دقیق عمل میکند. درصد خطای این برنامه برای زبان انگلیسی ۴.۲ درصد است، ولی برای زبان فارسی به گزارش رسانه تک توب ۳۲.۹ درصد خطا دارد که آمار خوبی نیست.
با توسعه این نوع ابزارها احتمالا دیگر زیرنویس کردن فیلمها و تبدیل کردن صحبتها به متن کار چندان دشواری نباشد. دانشآموزان و دانشجویان از این طریق میتوانند کلاسهای درس را به متن تبدیل کنند و در اختیار داشته باشند.