بیگ دیتا چیست؟

بیگ دیتا چیست؟
تاریخ انتشار : ۱۱ بهمن ۱۳۹۵

بیگ دیتا در حقیقت بیانگر حجم زیادی از داده می‌باشد که آنالیز و دسته‌بندی آن‌ها به‌وسیله زیرساخت‌ها و دیتابیس‌های رایج مشکل می‌باشد. سازمان‌های بزرگ با انبوه اطلاعات متنوعی چون ایمیل، عکس، ویدیو، گزارش‌های روزانه، نوشته و اطلاعات روزانه مواجه هستند که می‌بایست به‌صورت هوشمندانه‌ای طبقه‌بندی گردند تا به‌سرعت و در زمان کوتاهی قابل‌بررسی و دستیابی باشند.

به گزارش گرداب، برای نمونه یک فروشگاه اینترنتی را در نظر بگیرید که بتواند با بررسی کلیک بازدیدکنندگان بر روی لینک‌های مختلف وب‌سایت، به علایق و سلیقه مشتریان پی ببرد و بدین‌سان کسب‌وکار خود را بهبود بخشد. یا دولت یک کشور می‌تواند با رصد شبکه‌های اجتماعی به مقابله و پیشگیری از ناهنجاری‌های جامعه بپردازد. نمونه بارز آن موتور جستجوی گوگل است که به دسته‌بندی و اولویت‌بندی علایق کاربران در کشورهای مختلف می‌پردازد و کاربران را در دستیابی به اطلاعات موردنظرشان راهنمایی می‌نماید. همچنین شهرداری یکی از شهرهای بزرگ آمریکا توانسته با جمع‌آوری داده‌ها و اطلاعات در بیش از ۳۰ نقطه جغرافیایی شهری و آنالیز این اطلاعات، به‌منظور کاهش جرم و جنایت و نیز ارائه خدمات بهتر شهری استفاده کند.

درواقع بیگ دیتا به مجموعه اطلاعات ایجادشده و ذخیره‌شده به همراه تجزیه‌وتحلیل آن گویند که ازنظر سرعت، حجم و تنوع قابل‌بررسی باشد.

بیگ دیتا متشکل از دو بخش اساسی و پایه می‌باشد:

۱- سیستم‌های پردازشی که قابلیت ثبت و ضبط اطلاعات را دارند. از نمونه‌های بارز چنین سیستم‌های پردازشی، دیتابیس‌های NoSQL است که قابلیت پاسخگویی به درخواست‌های هم‌زمان را با کمترین زمان تأخیر دارند. از ویژگی‌های چنین دیتابیسی می‌توان به کد نویسی کمتر، سرعت‌بالا و افزایش حجم ذخیره اطلاعات نسبت به دیتابیس‌های رایج اشاره کرد.

۲- سیستم‌های آنالیز کننده اطلاعات هستند که می‌توانند همراه با سیستم‌های پردازشی ارائه‌شده باشند و یا به‌صورت نرم‌افزاری جداگانه مورداستفاده قرار گیرند. در مفهوم بیگ دیتا، سیستم‌های آنالیز کننده بر پایه مدل برنامه‌نویسی MapReduce و معماری پردازش موازی به‌صورت انبوه پیاده‌سازی می‌شوند.



استفاده از چنین تکنولوژی‌هایی در حقیقت پاسخی به محدودیت‌های موجود در ارتباطات دیتابیس‌های رایج و پردازش بر روی تک سرور بوده است که توانسته ضمن حل این مشکلات، متدها جدیدی را برای آنالیز اطلاعات به کار گیرد.

همان‌طور که گفته شد، برخی سیستم‌های آنالیز کننده همراه دیتابیس NoSQL ارائه می‌شوند در غیر این صورت می‌توان اطلاعات دیتابیس NoSQL را در نرم‌افزار آنالیز کننده جداگانه‌ای مانند Hadoop که از مدل برنامه‌نویسی MapReduce استفاده می‌کند، وارد نمود.



درواقع Hadoop یک تکنولوژی نرم‌افزاری رایگان است که مختص پردازش حجم انبوهی از اطلاعات بر روی ذخیره‌سازها و سرورهای کلاستر شده، طراحی گردیده است. این نرم‌افزار شامل سیستم گسترده فایل با نام HDFS می‌باشد.

پردازش ابری

همان‌طور که می‌دانیم سیستم‌های پردازش ابری در یک دهه گذشته توانسته تحولی شگرف در زیرساخت‌های فناوری اطلاعات و ارتباطات به وجود آورد به‌نحوی‌که ازیک‌طرف به کاهش هزینه‌ها منجر شده و از طرف دیگر کارایی سیستم‌ها را بالا برده است. به همین دلیل می‌توان گفت که طراحی سیستم‌های بیگ دیتا برای استفاده از مزایای پردازش ابری بوده است. زیرا برای استفاده از مزایای چنین زیرساخت‌هایی طراحی‌شده‌اند و می‌توانند حجم انبوهی از اطلاعات را از طریق سرورهای کلاستر شده جمع‌آوری و پردازش کنند. برای درک بهتر مطلب می‌توانید نگاهی به ساختار و کارکرد MPP بیندازید که چگونه اطلاعات بخش‌های مختلف را به‌واسطه سرور میزبان جمع‌آوری می‌نماید.

دیتابیس‌های بر پایه مفهوم بیگ دیتا مانند NoSQL می‌توانند به‌راحتی بر بستری از سرورهای کلاستر شده پیاده‌سازی و اجرا شوند و این بدان دلیل است که برخلاف دیتابیس‌های معمولی که اطلاعات در جداول جداگانه ذخیره می‌شوند، در اینجا اطلاعات به‌صورت مجتمع ذخیره می‌گردند.

برای نمونه می‌توان به دیتابیس MangoDB اشاره نمود که بر یایه تکنولوژی NoSQL بنانهاده شده است. این دیتابیس توسط یک سری رابط‌های اینترفیس API قابل اتصال به نرم‌افزار Hadoop می‌باشد تا اطلاعات ثبت‌شده توسط پایگاه داده‌ی MangoDB به‌وسیله سیستم Hadoop و دیتابیس‌های MPP بررسی و آنالیز شوند.

پس نتیجه می‌گیریم سیستم‌های NoSQL به همراه MPP Databases و Hadoop باهم ما را به دنیای بیگ دیتا وارد می‌کنند.

منبع: مفتا