هوش مصنوعی چینی قابلیت درک تصاویر را دارد

هوش مصنوعی چینی قابلیت درک تصاویر را دارد
تاریخ انتشار : ۰۶ شهريور ۱۴۰۲

شرکت چینی علی بابا دو مدل را با استفاده از هوش مصنوعی مولد توسعه داده که قادر به انجام مکالمات پیچیده و درک تصاویر هستند.

به گزارش گرداب، در حالی که غول‌های فناوری مانند اپن‌ای آی و گوگل مدل‌های زبان بزرگ (LLM) را برای رقابت در فضای پررونق هوش مصنوعی مولد راه‌اندازی می‌کنند، شرکت چینی علی بابا ۲ مدل هوش مصنوعی جدید را راه‌اندازی کرده که می‌توانند مکالمات پیچیده را انجام دهند و تصاویر را درک کنند.

۲ مدل غول فناوری چینی با نام‌های Qwen-VL و Qwen-VL-Chat برای محققان، دانشگاهیان و شرکت‌ها در دسترس خواهد بود تا آن‌ها بتوانند برنامه‌های هوش مصنوعی خود را بدون نیاز به آموزش سیستم‌ها توسعه دهند.

ویژگی‌های مدل‌های هوش مصنوعی علی بابا

به گفته علی‌بابا، در حالی که Qwen-VL می‌تواند به پرسش‌های مرتبط با تصاویر مختلف پاسخ دهد و شرح تصاویر ایجاد کند، Qwen-VL-Chat می‌تواند در تعامل‌های پیچیده شرکت کند. به عنوان مثال، می‌تواند چندین ورودی تصویر را با هم مقایسه کند و به چندین دور سؤال پاسخ دهد.

سایر وظایفی که Qwen-VL-Chat می‌تواند انجام دهد شامل نوشتن داستان، ایجاد تصاویر بر اساس عکس‌هایی است که کاربر وارد می‌کند و حل معادلات ریاضی نشان داده شده در یک تصویر است.

پیش از این خبری نشان داد که هوش مصنوعی در طول ۱ سال بیشتر از همه تصاویر تولید شده توسط انسان در طی ۱۵۰ سال عکس تولید کرده است.

تا به حال، شرکت‌ها بر تولید محتوا بر اساس ورودی متن توسط انسان تمرکز کرده‌اند، اما Qwen-VL-Chat، تقریباً شبیه آخرین نسخه چت جی پی تی، می‌تواند تصاویر را تجزیه و تحلیل کند و به متن پاسخ دهد. این دو مدل بر روی مدل بزرگ زبانی این شرکت به نام Tongyi Qianwen که در اوایل سال جاری منتشر شد، توسعه یافته اند.

این خبر بلافاصله پس از آن منتشر شد که غول اینترنتی کره جنوبی ناور از HyperCLOVA X، مجموعه ابزار‌های هوش مصنوعی و اپلیکیشن چت بات CLOVA X خود رونمایی کرد.

ناور گفت که این محصول جستجو‌های مبتنی بر هوش مصنوعی را برای کاربران فراهم می‌کند و خدمات سفارشی را برای شرکت‌ها ارائه می‌دهد. CLOVA X با هدف بهبود جستجوی وب، خرید آنلاین و خدمات ناوبری راه اندازی شده است.

این شرکت همچنین گفت که در حال همکاری با سامسونگ برای توسعه تراشه جدیدی است که جهت پشتیبانی از توسعه فناوری هوش مصنوعی آن کوچکتر و کارآمدتر خواهد بود. ناور همچنین در حال برنامه ریزی برای افتتاح یک مرکز داده جهت خدمات HyperCLOVA X در ماه نوامبر (آبان-آذر) است.

علاقه به هوش مصنوعی مولد و ربات‌های گفتگو، ترس‌هایی را در مورد نابودی مشاغل ایجاد کرده است، مشابه آنچه که در زمان معرفی خط مونتاژ متحرک در اوایل دهه ۱۹۰۰ و پس از رایانه‌های بزرگ در دهه ۱۹۵۰ پدیدار شد. با این حال، مطالعه ارائه شده توسط سازمان بین المللی کار نشان داده بیشتر مشاغل و صنایع فقط تا حدی در معرض اتوماسیون هستند و بنابراین احتمال بیشتری وجود دارد که به جای جایگزینی، با هوش مصنوعی تکمیل شوند، به این معنی که مهمترین تأثیر فناوری احتمالاً کارافزایی است.

از زمانی که شرکت اپن‌ای آی ربات گفت و گوی مولد خود را منتشر کرده است بسیاری از شرکت‌ها تلاش کردند تا از غافله مسابقه هوش مصنوعی مولد عقب نمانند و بسیاری دیگر از ربات چت جی پی تی در محصولات خود مانند ماشین‌ها و دوچرخه‌ها استفاده کردند.