نقش یادگیری ماشینی در امنیت سایبری

نقش یادگیری ماشینی در امنیت سایبری
تاریخ انتشار : ۰۵ بهمن ۱۳۹۹

کارشناسان معتقدند که هوش مصنوعی و یادگیری ماشینی در حوزه امنیت سایبری نقش گسترده‌ای دارند.

به گزارش گرداب، به گفته کارشناسان، هوش مصنوعی (AI) برای سیستم‌های رایانه‌ای به کار می‌رود که از هوش انسان یعنی توانایی درک، شناخت الگوها و تصمیم‌گیری براساس الگوریتم تقلید می‌کنند. درست مثل تصمیماتی که بشر می‌گیرد، البته ممکن است صد در صد دقیق نباشد.

یادگیری ماشینی (ML) دانش ساخت ماشین و پالایش تجربه در طول زمان است، زیرا از مشاهدات در طول زمان (همبستگی‌های علت و معلولی زمینه) آموخته می‌شود. بیبوتی کار (Bibhuti Kar)، رئیس تحقیق و توسعه در فناوری‌های «Quick Heal» در این خصوص مقاله‌ای نوشته که به شرح زیر است :

«دیدگاه انسان با مجموعه‌ای پیچیده از همبستگی‌ها (یعنی شما رنگ یک شی را می‌بینید و در برخی زمینه‌ها، آن را بدون لمس کردن، گرم عنوان می‌کنید)، خودآزمایی‌ها (مانند لمس یک سینی مستقیم از فر)، یادگیری از دیگران (مانند تماشای درد افراد، درد ناشی از اینکه آنها به طور تصادفی صفحه داغی را با دست برداشته‌اند) ساخته شده است.

این درک ساده دما، همانطور که در مثال فوق بیان شد، از فرد به فرد دیگر براساس مواجهه و تجربه متفاوت خواهد بود.

هوش مصنوعی و یادگیری ماشینی زمانی مفید است که ورودی سیستم (مشاهده حس) متنوع باشد، ابعادی بزرگ و ظاهراً با هم همبستگی داشته باشد، پراکنده و پویا باشد و نمی‌تواند به عنوان قوانین ثابت ساکن نشان داده شود.

نحوه تکامل سیستم‌های سایبری

از دست دادن هویت‌های منحصر به فرد

با ظهور اینترنت، سیستم‌ها شناسه‌های دستگاه و شبکه منحصر به فردی (مانند آدرس IPv4 و آدرس MAC) را توسعه دادند. انفجار دستگاه‌ها با استفاده از اینترنت باعث ایجاد محدودیت در آدرس‌های شبکه موجود می‌شود. فناوری این مسئله را با استفاده مجدد از آدرس‌های آی‌پی یکسان در سلسله مراتب شبکه (NAT) حل می‌کند.

تغییرات مشابهی با شناسه‌های دستگاه شبکه (آدرس‌های MAC)، که قبلاً از نظر طراحی منحصر به فرد بوده‌اند، تجربه می‌شود. سیستم‌های معاصر (اندروید، IoS ، ویندوز و غیره) برای ایجاد امنیت و حفظ حریم خصوصی، آدرس‌های MAC را می‌چرخانند و ناشناس می‌کنند.

با هویت‌های منحصربه‌فرد از دست رفته، یک قانون ساده استاتیک برای تشخیص منبع خوب از بد امکان‌پذیر نیست. یافتن شهرت منبع در این زمینه (هویت مبهم) باید با هوش مصنوعی و یادگیری ماشینی (یافتن الگوها و اصلاح آنها به مرور زمان با کسب اطلاعات بیشتر در مورد منبع) تقویت شود.

افزایش سریع ابعاد مشاهدات

ویژگی عوامل تهدید به سرعت در حال افزایش است. با ظهور ویروس رایانه، یک ارزش هش ساده می‌تواند یک فایل مخرب را تعریف کند. امروزه، با جهش‌های پیشرفته، ترکیبی از نقشه جغرافیایی ، اعتبار ISP / منبع، الگوهای فعالیت، مسیرهای پیاده‌روی و سایر پارامترها باید در نظر گرفته شوند.

با افزایش تعداد متغیرها، توانایی قاعده‌ای که می‌تواند سوءنیت را از حالت عادی تفکیک کند، ساده نیست و هوش مصنوعی و یادگیری ماشینی را به عنوان گزینه‌ای بهتر انتخاب می‌کند.

سیستم‌های مکالمه

رابط‌های کاربری با سرویس‌های دیجیتالی به‌طور فزاینده‌ای ماهیت گفتگو پیدا می‌کنند. مکالمات بدون ساختار هستند (برخلاف کلیک کردن روی کادر تأیید). دستیارهای صوتی، چت‌بات‌ها برای خدمات مشتری، نقل قول خودکار براساس پست الکترونیکی، راهنمای فروش یا سؤالات مربوط به کالاها به‌طور فزاینده‌ای به بخشی از دسترسی و اتوماسیون تجاری تبدیل می‌شوند. برای محافظت از چنین سرویس‌های خودکاری، به همان سطح هوش مکالمه نیاز داریم.

امنیت در مقابل حریم خصوصی

پنهان کردن اطلاعات شخصی از داده‌های مشاهده شده همزمان با ارائه هوش و بینش برای کمک به تصمیم‌گیری تقریباً دقیق کار ساده‌ای نیست.

ناشناس‌سازی باعث ایجاد لایه‌های اضافی تمیز کردن و پراکندگی در مجموعه داده‌ها می‌شود. ثابت شده است که هوش مصنوعی و یادگیری ماشینی با این نوع مجموعه داده‌ها مؤثرتر هستند.

نحوه استفاده از هوش مصنوعی و یادگیری ماشینی برای امنیت سایبری

دشمن عصر جدید به سک شکل نیست، دشمن‌ها به زبان‌های گوناگون صحبت می‌کنند و متفاوت می‌نگرند. بنابراین لازم است مشخص شود که کدام پارامترها می‌توانند یک قانون مشخص برای تفکیک موارد خوب از بد ارائه دهند.

هیچ فرمول ریاضی ساده‌ای وجود ندارد که بتواند به ما اطلاع دهد که آیا شخصی قصد سوءنیت دارد یا خیر. با این حال، اگر صدها و هزاران نقطه داده و فعالیت مربوط به فرد را ردیابی کنیم، می‌توانیم مشخصات مشکوک را با کارآیی قابل قبول ایجاد کنیم.

آنالیز رفتاری و تشخیص ناهنجاری

دشمنان از کاربران واقعی تقلید می‌کنند و برخلاف انسان، آنها (ماشین آلات) این کار را خستگی‌ناپذیر و در مقیاسی بی‌سابقه انجام می‌دهند. تنها راه یافتن مورد مشکوک و بد در میان میلیاردها معامله اینترنتی، جمع‌آوری صدها ویژگی از کل معاملات (اصلی یا غیرمجاز) مانند شهرت منبع، موقعیت جغرافیایی، IP، زمان تعامل، تاریخچه، توانایی عبور از یک چالش، الگوهای ترافیک جهانی، نقشه‌برداری جهش، آنتروپی رمزگذاری و غیره است.

سپس این داده‌های مقیاس بزرگ باید از لایه‌های تمیزکاری عبور کرده و برای الگوها مشاهده شود و در نهایت تصمیم‌گیری انجام می‌شود. با این حال، فقط نمی‌توان همه چیز را آرام کرد. دفاع از سیستم فقط با سیاست‌های استاتیک مبتنی بر قاعده دیگر عملی نیست و باید با تجزیه و تحلیل رفتاری متمرکز بر تشخیص ناهنجاری‌ها در زمان واقعی تقویت شود.

فرض کنید یک دوربین مداربسته اداری توییت‌های زیادی درباره حرکات چهره‌های تازه شناخته شده در تعطیلات ارسال می‌کند. در این صورت، به خوبی می‌تواند یک درایو استخدام جدید باشد که در تعطیلات سازمان یافته است (خو‌ش‌بینانه)، یا مهاجمی است که دوربین شما را در اختیار گرفته تا حمله انکار خدمات را در توییتر انجام دهد (مخرب). هوش مصنوعی و یادگیری ماشینی در درک زمینه و همبستگی وقایع با آن و در شکل‌گیری و بهبود نظر درباره موارد طبیعی و ناهنجاری نیز سرآمد است.

TL;DR

انسان براساس تجربه خود قادر به درک تهدید است. سیستم سایبری امروزی به همان توانایی درک تهدید در مقیاس وسیع برای همگام شدن با رشد رقمی‌سازی نیاز دارد. سیستم‌های سایبری از هوش مصنوعی و یادگیری ماشینی برای ساختن شهود انسانی و درک تهدید با استفاده از تجزیه و تحلیل رفتاری استفاده می‌کنند. تنها تفاوت این است که، بر خلاف انسان، ماشین‌آلات می‌توانند سریع‌تر یاد بگیرند و بی‌وقفه کار کنند.»