پژوهشگران دانشگاه علم و صنعت با همکاری محققانی از دانشگاه لون بلژیک سیستمی برای تحلیل محتوای صوتی و تصویری ارائه کردند.
تاریخ انتشار: ۱۳ خرداد ۱۳۹۶ - ۱۰:۱۰
کد خبر: ۲۵۱۴۰
به گزارش گرداب، سیستم دسته بندی و جستجوی خودکار فایل های صوتی و ویدئویی قادر است در میان انبوهی از ویدئوها، ویدئوی مورد نظر را جستجو کند، ضمن آنکه امکان رصد اتوماتیک ویدئو نیز در آن در نظر گرفته شده است.

محمدمهدی ارزانی دانشجوی دکتری دانشگاه علم و صنعت و از محققان این طرح، زمینه تحقیقات این تیم تحقیقاتی را پردازش صوت و تصویر عنوان کرد و گفت: محصولی که ما در این مطالعات عرضه کردیم، دستگاه تحلیل معنایی بینایی است.

وی افزود: این سیستم هر معنای ویدئویی که به آن داده می‌شود را تحلیل می‌کند ضمن آنکه هر آنچه را که در ویدئو رخ دهد، آن را آنالیز خواهد کرد.

این محقق تعیین دسته‌بندی کلی ویدئو را از دیگر قابلیت‌های این سیستم عنوان کرد و اظهار داشت: این سیستم با تحلیل ویدئو قادر است دسته‌بندی فیلم را در رده‌های ورزشی، حیات وحش و سایر دسته‌ها تعیین کند و حتی اتفاقات جدیدی را که در ویدئو رخ داده باشد نیز اعلام می‌کند.

ارزانی ادامه داد: یکی از کاربردهای سیستم «تحلیل معنایی ویدئو» برای حوزه‌هایی  مانند صدا و سیما و یا سایت‌هایی است که دارای آرشیوهای صوتی و تصویری بزرگی هستند.

وی عنوان کرد: این حوزه‌ها دارای محتوای زیاد صوتی و تصویری هستند و در صورتی که ویدئوها برچسب مناسبی نخورده باشند، پیدا کردن محتوای مد نظر از میان حجم عظیم ویدئوها و فایل‌های صوتی غیر ممکن است.

این محقق با بیان اینکه موتورهای جستجو تنها بر مبنای جستجوی متن کار می‌کنند، خاطر نشان کرد: بر این اساس ما سیستم تحلیل معنایی را طراحی و پیاده‌سازی کردیم و این سیستم محتوای متنی کار جستجو را انجام می‌دهد.

ارزانی گفت: این سیستم پس از دریافت ویدئو، همه مفاهیم را در آن می‌بیند و در قالب متن ارائه می‌کند و از این طریق جستجوی ویدئو از طریق متن میسر می‌شود.

وی پایش محتوا را از دیگر کاربردهای این سیستم عنوان کرد و افزود: در حال حاضر شبکه‌های مجازی و اجتماعی رو به ازدیاد است و موارد ممنوعه‌ای مانند خشونت، مواد مخدر و سایر محتوای غیر اخلاقی دیگر در حال رد و بدل شدن است، از این رو امکان رصد دستی این محتوا وجود ندارد.

این محقق با تاکید بر اینکه این سیستم می‌تواند به صورت اتوماتیک کار رصد را انجام دهد، گفت: این سیستم با استفاده از یک سرور قوی می‌تواند کاری که توسط چند نفر انجام گیرد را به تنهایی انجام دهد.

ارزانی تاکید کرد: این سیستم شامل یک نرم‌افزار است که بر روی سخت‌افزار کارت گرافیکی نصب می‌شود و قادر است حجم زیادی از صوت و تصویر را پردازش کند.

وی با تاکید بر اینکه در حال حاضر ۸ هزار مفهوم در این سیستم بارگذاری شده است، اضافه کرد: امکان افزودن داده‌های جدید در این سیستم وجود دارد، به نحوی که برای کاربران امکانی فراهم شده تا بتوانند مفاهیم جدید را تعریف کنند.

این محقق با بیان اینکه فناوری این سیستم در اختیار ۴ شرکت بزرگ است، عنوان کرد: شرکت‌های IBM، گوگل و ماکروسافت این سیستم را پیاده سازی کردند و ایران نیز همزمان با این فعالیت‌ها در دنیا وارد این حوزه شده است.

ارزانی با بیان اینکه از این طرح دو شرکت در ایران و بلژیک تاسیس شده است، گفت: این پروژه با همکاری محمدحسن بهاری و علی دیبا از دانشگاه لون (KU Leuven) بلژیک اجرایی شده است.

نظر شما :
نام:
ایمیل:
* نظر:
* کد امنیتی:
Chaptcha
حروفي را كه در تصوير مي‌بينيد عينا در فيلد مقابلش وارد كنيد