Gerdab.IR | گرداب

آشنایی با ابزار‌های هوش مصنوعی؛ تبدیل صوت به متن با «Whisper»

آشنایی با ابزار‌های هوش مصنوعی؛ تبدیل صوت به متن با «Whisper»
تاریخ انتشار : ۱۵ اسفند ۱۴۰۱

ابزار دیگری از شرکت OpenAi سازنده چت‌جی‌پی‌تی برای تبدیل صوت به متن عرضه شده است.

به گزارش گرداب، شرکت OpenAi از ابزار خود با عنوان «Whisper» (نجوا) برای تبدیل صوت به متن رونمایی کرده است. این شرکت چت‌بات چت‌جی‌پی‌تی را توسعه داده است.
این ابزار از چند ماه پیش به صورت متن‌باز عرضه شده و برنامه‌نویسان می‌توانند از طریق این آدرس به آن دسترسی داشته باشند.

این ابزار به برنامه‌نویسان این امکان را می‌داد که روی سخت‌افزار‌های خود فایل‌های صوتی را به فرمت‌های مختلف متنی از جمله txt و srt تبدیل کنند. یکی از مهم‌ترین ویژگی‌های این ابزار برای ما پشتیبانی از زبان فارسی است.
حالا این شرکت برای کاربران و شرکت‌هایی که سخت‌افزار مجزا ندارند و یا نمی‌خواهند پردازش را بر روی آن انجام دهند، یک API پولی عرضه کرده است که این پردازش بر روی سرور‌های قدرتمند این شرکت انجام بگیرد و فایل‌های صوتی به متن تبدیل شوند. این سرویس به‌طور آزمایشی و محدود رایگان است. برای امتحان این API به این پیوند مراجعه کنید.

این برنامه بیش از ۹۸ زبان زنده دنیا را پشتیبانی می‌کند و در تبدیل آن‌ها دقیق عمل می‌کند. درصد خطای این برنامه برای زبان انگلیسی ۴.۲ درصد است، ولی برای زبان فارسی به گزارش رسانه تک توب ۳۲.۹ درصد خطا دارد که آمار خوبی نیست.

با توسعه این نوع ابزار‌ها احتمالا دیگر زیرنویس کردن فیلم‌ها و تبدیل کردن صحبت‌ها به متن کار چندان دشواری نباشد. دانش‌آموزان و دانشجویان از این طریق می‌توانند کلاس‌های درس را به متن تبدیل کنند و در اختیار داشته باشند.