دادهها از ویژگیهای تعیین کننده جامعه مدرن هستند. هر روز انسانها و ماشین آلاتی که با آنها تعامل دارند 2.5 تریلیون مگابایت داده تولید میکنند. هرچه دادهها راحتتر در دسترس قرار بگیرند، وسوسه تجزیه و تحلیل آنها به ویژه در حوزه سیاست نیز افزایش مییابد.
به گزارش گرداب - دولتها برای نظارت بر رفتار شهروندان خود در شبکههای اجتماعی و حتی رصد رفتار مردم کشورهای دیگر، از این فناوری استفاده میکنند. این نوع نظارت به بسیاری از کشورها راه یافته است. نظارت در شبکههای اجتماعی از طریق جمعآوری و پردازش دادههای سیستم عاملها انجام میشود. میلیاردها نفر در سراسر جهان از این بسترهای دیجیتالی برای برقراری ارتباط با عزیزان، برقراری ارتباط با دوستان و همکاران و بیان عقاید سیاسی، اجتماعی و مذهبی خود استفاده میکنند.
حتی اگر افرادی باشند که به ندرت با چنین خدماتی ارتباط برقرار میکنند، اطلاعاتی که در مورد آنها جمعآوری، تولید و استنباط میشود، نه تنها برای تبلیغکنندگان، بلکه برای سازمانهای اجرای قانون و سازمانهای اطلاعاتی نیز بسیار باارزش است.
استفاده از هوش مصنوعی
پیشرفت در هوش مصنوعی (AI) امکانات جدیدی را برای نظارت انبوه خودکار فراهم کرده است. سیستمهای نظارتی پیچیده میتوانند به سرعت از طریق تجزیه و تحلیل پیوند، روابط کاربران را ترسیم کنند.
با استفاده از پردازش به زبان طبیعی و تجزیه و تحلیل احساسات، به پستهای آنها در رسانههای اجتماعی معنی یا نگرش دهند؛ و مکانهای گذشته، حال یا آینده آنها را استنباط کنند. یادگیری ماشینی سیستمها را قادر میسازد الگوهایی را پیدا کنند که برای انسان غیرقابل مشاهده است. شبکههای عصبی عمیق میتوانند دستههای جدیدی از الگوها را برای بررسی بیشتر شناسایی کرده و پیشنهاد دهند.
کلانداده یک موهبت بزرگ برای آژانسهای جاسوسی ایالات متحده است، که مدتهاست برای تهیه گزارشهای اطلاعاتی با چندین منبع داده همکاری دارند. در دهه گذشته، آژانسهایی مانند CIA و NSA، بررسی کلان دادهها را از طریق واحدهای تحلیلی اختصاصی و پروژههای تحقیقاتی با تمرکز بر تجزیه و تحلیل دادههای آنلاین مانند فیلمهای YouTube و پستهای رسانههای اجتماعی، شروع کردهاند.
اما در پی این اتفاق، متخصصان داخلی آمریکا نگران نقض شدن آزادیهای مدنی هستند. اما آیا این تحلیلها فقط محدود به مرزهای ایلات متحده است؟ بیشک خیر!
پنج روش تجزیه و تحلیل کلان دادهها برای مقاصد سیاسی
۱. تشخیص ناهنجاری: موارد، رویدادها یا مشاهداتی را مشخص میکند که مطابق با رفتار یا الگوی مورد انتظار نیستند. میتوان از این مورد برای ارزیابی مشکوک بودن فعالیت آنلاین استفاده کرد. در اینجا میتوان فعالیت غیرمعمول یک فرد معتمد یا خودی را به عنوان یک عمل بدخواهانه یا سهوی تشخیص داد و آن را از فعالیت روزمره شبکه متمایز کرد.
۲. طبقهبندی: یکی از نقشهای اصلی ابزارهای تحلیل کلانداده در امنیت ملی، در حوزه پردازش اطلاعات است. الگوریتمهای طبقهبندی، اشیا را در مجموعهای از دادهها به دستهها یا کلاسهای هدف اختصاص میدهند. از مدلهای طبقهبندی میتوان برای شناسایی ارتباطات مشکوک، کمخطر یا پرخطر استفاده کرد.
۳. خوشهبندی دادهها: خوشهبندی به گروهبندی اشیا یا داده بر اساس مفاهیم شباهت اطلاق میشود. چنین تواناییهایی برای الک کردن مقدار زیادی از دادههای متنوع رسانههای اجتماعی و سازماندهی آنها در گروههای موضوعی و تولید خلاصهای از محتوای آنها برای انجام تحلیل است. خوشهبندی همچنین میتواند به شناسایی انواع مختلف کاربران شبکههای اجتماعی (رهبران عقاید، رباتها و غیره) کمک بسیاری کند.
۴. تحلیل پیوند: تجزیه و تحلیل پیوند در تعریف، کشف و ارزیابی روابط بین اشیا و داده بسیار مفید است. این نوع الگوریتم معمولاً برای شناسایی گرهها و شبکههای متصلکننده مردم، سازمانها و نهادهای دیگر استفاده میشود. یکی از معروفترین کاربردهای تجزیه و تحلیل پیوند، شناسایی گرههای مهم در شبکههای تروریستی یا جنایی مانند القاعده از طریق تجزیه و تحلیل شبکههای اجتماعی بود.
۵. یادگیری ماشین: یادگیری ماشین به مجموعه خاصی از الگوریتمها گفته میشود که میتواند خود را بر اساس دادههای پردازشی سازگار کرده و از آنها بیاموزد و اطلاعات تازه را تلفیق کرده و نتیجهگیری کند. برای مثال الگوریتمهای یادگیری ماشین میتوانند اهداف پنهان را از مجموعه اسنادی که پردازش میکنند، بازیابی کنند، حملات فیشینگ را شناسایی کنند، نفوذ شبکه را تشخیص دهند، چهرههای انسانها را شناسایی کنند و جمعیت را تجزیه و تحلیل کنند. در همه این موارد، کلان دادهها تجزیه و تحلیل را تسهیل میکنند و بدون وجود آنها رسیدن به چنین قدرتی امکان پذیر نیست.
آمریکا چگونه از کلانداده برای حفظ منافع خود استفاده میکند؟
ابتدا به استفاده ایالات متحده از دادههای شهروندانش نگاهی میاندازیم و سپس استفاده دولت این کشور از اطلاعات کشورهای دیگر، خصوصا ایران را بررسی کنیم.
بنا بر مدارک افشا شده، دولت آمریکا با کمک شرکتهای بزرگ مخابراتی از جمله AT&T دست کم از سال ۲۰۰۱ بر روی ارتباطات داخلی میلیونها شهروند عادی آمریکایی نظارت گسترده و غیرقانونی داشته است. این موضوع اولین بار توسط مطبوعات گزارش شد و در اواخر سال ۲۰۰۵، EFF در تلاش برای متوقف کردن آن و خواستار نظارت دولت و قانون اساسی شد.
برای اولین بار در دسامبر ۲۰۰۵ گزارشهای خبری نشان داد که آژانس امنیت ملی (NSA) مکالمات تلفنی و ارتباطات اینترنتی آمریکاییها را رهگیری کرده است. این گزارشهای خبری، همراه داستان USA Today در ماه مه ۲۰۰۶ و اظهارات چند تن از اعضای کنگره، نشان داد که NSA تلفن و سایر سوابق ارتباطی شهروندان آمریکایی را بررسی میکند.
در ژوئن ۲۰۱۳، رسانهها به رهبری گاردین و واشنگتن پست، شروع به انتشار مقالاتی همراه با اسناد دولتی کردند، که بسیاری از گزارشهای سالهای ۲۰۰۵ و ۲۰۰۶ را تأیید میکرد. گزارشها نشان داد که دولت این کشور دادههای تلفن همه آمریکاییهاییها را جمعآوری کرده است. علاوه بر این، این گزارشها ثابت کرد که دولت آمریکا در حال جمعآوری و تجزیه و تحلیل محتوای ارتباطات خارجیهایی است که با افراد داخل ایالات متحده در ارتباطاند.
بعد از ۱۱ سپتامبر، بوش به آژانس امنیت ملی (NSA) اجازه داد تا داخل ایالات متحده فعالیتهای نظارتی انجام دهد. وقتی برنامه جاسوسی NSA برای اولین بار توسط نیویورک تایمز در سال ۲۰۰۵ افشا شد، دولت این اقدام را برنامه نظارت بر تروریسم نامگذاری کرد، که ارتباطات آمریکاییها با القاعده را تحلیل میکند. اما بررسی دادههای افراد مشکوک به اقدامات تروریستی، تنها هدف این برنامه نبود، بلکه اطلاعات میلیونها آمریکایی که هرگز به جرمی مشکوک نبودند نیز، مورد بررسی قرار گرفته بود.
اما دولت آمریکا چگونه این کار را انجام داد؟ هنگام ارسال ایمیل یا استفاده از اینترنت، دادهها از طریق سیمهای شرکتهای مخابراتی و شبکههای فیبر نوری به کامپیوتر شهروندان منتقل میشوند. برای رهگیری این ارتباطات، دولت دستگاههایی به نام تقسیمکننده فیبر نوری را در بسیاری از نقاط اتصال مخابراتی نصب کرد تا نسخههای دقیق دادههایی را که از آنها عبور میکند، به دست دولت برسد.
ایجاد پایگاه دادهها و نرمافزارهای تحلیل داده
از قضا، در همان زمان داغ بودن بحث تروریسم در آمریکا، شرکتهایی مانند Google و Yahoo در حال حل مشکل ذخیره و تجزیه و تحلیل کلان دادهها بودند. در نوامبر سال ۲۰۰۶، گوگل مقالهای در مورد BigTable منتشر کرد، یک پایگاه داده با ظرفیت پتابایت که میتوانست صفحات وب را فهرست کند و از Google Earth و سایر برنامهها پشتیبانی کند.
پایگاههای BigTable و Hadoop راهی را پیش روی NSA گذاشتند تا بتواند اطلاعات را ذخیره و طبقهبندی کنند. اما در سال ۲۰۰۸، به دلایل امنیتی، NSA تصمیم گرفت تا نسخه بهتری از BigTable به نام Accumulo را ایجاد کند.
آکومولو (Accumulo)
Accumulo یک پایگاه داده NoSQL است که بر اساس جفتهای مقدار-کلید کار میکند. این طراحی شبیه BigTable گوگل یا DynamoDB آمازون است، اما آکومولو ویژگیهای امنیتی ویژهای مانند چندین سطح دسترسی امنیتی دارد. این برنامه بر روی پلتفرم منبع باز Hadoop و سایر محصولات Apache ساخته شده است.
یکی از ویژگیهای آکومولو دسترسی لایهای است. کاربرانی که سطح پایینتری دارند، از وجود برخی دادههای امنیتی آگاهی نخواهند داشت.
آکومولو میتواند به دنبال کلمات یا مخاطبان خاص در پیامهایی از IPهای مختلف بگردد. یا میتواند به دنبال شمارههای تلفنی باشد که دو درجه از شماره تلفن هدف متفاوت هستند. سپس میتواند ایمیلها یا شماره تلفنهای انتخاب شده را به یک پایگاه داده دیگر ببرد تا مورد بررسی و تجزیه و تحلیل قرار بگیرند.
به عبارت دیگر، آکومولو به NSA این امکان را میدهد تا پیامها و تماسهایی که در بستر اینترنت برقرار میشوند را، ذخیره کند. دادههای جمعآوری شده از آکومولو را میتوان با ابزارهای دیگری مانند Palantir تجزیه و تحلیل کرده و نمودار ارتباط بین اشخاص بر اساس ویژگیها و روابط و اعمال آنها در اینترنت را ترسیم کرد.
SSL یکی از موانع نظارت بر ارتباطات اینترنتی NSA بود.
اما طبق اسلایدهای منتشر شده توسط پیمانکار NSA، ادوارد اسنودن در واشنگتن پست و گاردین، مایکروسافت در سال ۲۰۰۷ ارائه دادهها به NSA را آغاز کرد. در این برنامه، NSA به سرورهای پشت سرویسهای ابری و دادههای درون آنها دسترسی یافت، که نقض گواهینامههای SSL و ذخیره دادهها را امکان پذیر کرد.
پریسم
PRISM نام برنامهای است که طی آن آژانسهای اطلاعاتی ایالات متحده مستقیماً به سراغ شرکتهایی مانند گوگل، فیسبوک و یاهو میروند و شرکتها را مجبور میکنند که ارتباطات کاربران خود را در اخیارشان بگذارد. این شرکتها حق ندارند به کاربران خود اعلام کنند که دادههای آنها به دولت تحویل داده شده است. NSA میتواند از این درخواستهای PRISM برای هدف قرار دادن ارتباطات رمزگذاری شده در اینترنت استفاده کند.
PRISM در سال ۲۰۰۷ و در پی تصویب قانون محافظت از آمریکا زیر نظر دولت بوش آغاز به کار کرد. ۶ سال بعد توسط ادوارد اسنودن، پیمانکار NSA، خبر آن به بیرون درز پیدا کرد. وی هشدار داد که میزان جمعآوری دادهها بسیار بیشتر از آن است که مردم میدانند و شامل فعالیتهایی خطرناک و جنایتکارانه است. این افشای اطلاعات توسط گاردین و واشنگتن پست در ۶ ژوئن ۲۰۱۳ منتشر شد.
اسناد بعدی نشان داد که توافق مالی بین بخش عملیات ویژه NSA و شرکای PRISM میلیونها دلار بوده است. این اسناد چندین شرکت فناوری را به عنوان شرکتکنندگان در برنامه PRISM معرفی کردهاند، از جمله مایکروسافت در سال ۲۰۰۷، یاهو در سال ۲۰۰۸، گوگل در ۲۰۰۹، فیسبوک در ۲۰۰۹، Paltalk در ۲۰۰۹، یوتیوب در ۲۰۱۰، AOL در ۲۰۱۱، اسکایپ در ۲۰۱۱ و اپل در ۲۰۱۲. یادداشتهای سخنرانان نشان میدهد که ۹۸ درصد از نتایج PRISM براساس دادههای یاهو، گوگل و مایکروسافت هستند.
هرچند مدیران بیشتر این شرکتها در جریان اسناد فاش شده به گاردین گفتند که آنها هیچ اطلاعی از برنامه PRISM ندارند و همچنین ارائه اطلاعات به دولت در مقیاس ادعای رسانهها را تکذیب کردند. اما مدارک فاش شده بسیار موثق بودند.
آپستریم
برنامه دیگری که در کنار پریسم، به جاسوسی و بررسی دادهها کمک میکند، آپستریم است. نظارت آپستریم که در ابتدای کار با همان بهانه تروریسم و بررسی ارتباط آمریکاییها ترتیب داده شد، شامل رهگیری انبوه و جستوجوی ارتباطات اینترنتی از جمله ایمیل، چت و ترافیک وب است.اگر به دوستان خود ایمیل بفرستید یا وبسایتهایی را که میزبانی آنها در ایالات متحده است را باز کنید، NSA قطعا ارتباطات شما را رصد میکند.
در نظارت آپستریم، رایانهها به طور مداوم ارتباطات ما را برای اطلاعات مورد علاقه دولت آمریکا اسکن میکنند. در واقع کار آن جستوجوی محتوا حین انتقال ارتباطات است. NSA با کمک ارائهدهندگان ارتباطات از راه دور مانند AT&T و Verizon، تجهیزات نظارتی را در دهها نقطه مهم اینترنت نصب کرده است، تا با عبور از ارتباطات، تعداد زیادی از ترافیک اینترنت را کپی و سپس جستوجو کند.
کلماتی که جستوجو میشوند، معمولاً آدرس ایمیل، شماره تلفن یا سایر شناسههای مرتبط با اهداف دولت هستند. هرگاه NSA ارتباطی را پیدا کند که مربوط به کلمات مورد نظر باشد، آن ارتباط را برای استفاده و تجزیه و تحلیل ذخیره میکند. در پی این تحلیلها آمریکا نه تنها ارتباطات اهداف خود را رهگیری میکند، بلکه ارتباطات اشخاص ثالث را به طور سیستماتیک بررسی میکند تا افرادی را که به کلمات کلیدی مرتبطاند را، شناسایی کند.
بگذارید با ذکر مثالی غیردیجیتالی، موضوع را کمی شفافتر کنیم. فرض کنید NSA نمایندگان خود را به مراکز خدمات پستی میفرستد تا به طور مداوم نامههای بینالمللی همه اشخاص را باز کنند. نمایندگان هر نامه را باز میکنند، میخوانند، و از هر نامهای که در رابطه با موضوع مورد نظرشان است، یک نسخه کپی نگه میدارند!
هنگامی که فردی از اینترنت استفاده میکند، چه برای مرور یک صفحه وب یا ارسال پیام، رایانه وی اطلاعات را به صورت یک بسته دادهای ارسال میکند. اما برای حفظ امنیت و همچنین سرعت بالای انتقال، این بسته داده به بخشهای کوچکتر تقسیم میشود و هر قطعه از این پازل به طور مستقل به یک مقصد مشترک روانه میشود، در مقصد مجددا تجمیع میشوند و به صورت همان پیام اولیه در کنار یکدیگر قرار میگیرند. به همین دلیل، تجهیزات رهگیری سوئیچ میان راه، نمیتوانند فقط پیام هدف خود را دریافت کنند.
پس شنود کننده باید از همه چیز کپی بگیرد. اگرچه برخی از دادههایی که به کار نمیآیند، حذف میشوند، اما تنها با کپی برداری و جستوجوی ترافیک انبوه اینترنت میتوان ارتباطات را شناسایی کرد.
بنا به آنچه که گفته شد سازمان امنیت ملی آمریکا؛
از خطوط اینترنت در سراسر جهان استفاده کرده است: اینترنت از طریق کابلهای فیبر نوری مقادیر بیشمار دادهای را حمل میکنند و قارههای مختلف را به هم متصل میکنند. در برخی مکانها، NSA برای استفاده از این کابلها با آژانسهای اطلاعاتی محلی معامله میکند و در برخی دیگر به تنهایی وارد عمل میشود و حتی از زیردریاییها برای اتصال به سیمهای عمیق زیر اقیانوس استفاده میکند.
شرکتهای خارجی را هک کرده است: در برزیل، آلمان و سایر کشورها، NSA به شبکههای داخلی ارتباط از راه دور نفوذ کرده است، دادههای جمعآوری شده را رهگیری کرده و امنیت سیستمهای آنها را تضعیف میکند.
از همه اقدامات کاربران اینترنت مطلع است: با وجود شبکههای اجتماعی که میلیونها ایرانی عضو آنها هستند، بررسی و تحلیل دادههای آنها و پی بردن به الگوهای تفکری و اخلاقی از گزینههای پیش روی ایالات متحده است.
از رهبران خارجی جاسوسی کرده است: افشاگری دیگر در اسناد اسنودن این بود که NSA از مقامات ارشد کاخ سفید، وزارت امور خارجه و پنتاگون میخواهد که اطلاعات شخصی خود را در رابطه با رهبران خارجی به اشتراک بگذارند. این یادداشت فاش شده نشان میدهد که بیش از ۲۰۰ شماره تلفن محرمانه به NSA تحویل داده شده است، که به مکالمات آنها نفوذ پیدا کردهاند. NSA این جاسوسی را از کشورهای همپیمان با ایالات متحده نیز دریغ نکرد، که رهبر آلمان، آنگلا مرکل نیز یکی از اهداف بود.
میتواند در ردیابی کوکیها جاسوسی کند: کوکیها که بستههای کوچکی از اطلاعات که شامل تاریخچه مرور وب و مکان کاربر، برای تبلیغات هدفمند هستند نیز توسط NSA جمعآوری شدهاند. آژانس جاسوسی برای شناسایی کاربران در سراسر جهان به عنوان اهداف اصلی هک، از آنها استفاده میکند.
رئیس جمهور شدن ترامپ با کمک کلانداده
در انتخابات قبل از سال ۲۰۱۶ از کلانداده برای پیشبینی نتایج یا شناسایی مناطق مناسب برای تبلیغات استفاده میشد، اما اتفاقی که در سال ۲۰۱۶ افتاد، بسیار وسیعتر و جدید بود.
داستان از یک شرکت دادهکاوی به نام کمبریج آنالیتیکا شروع شد که در ابتدا با هدف تحقیقات آکادمیک شکل گرفت (آنطور که ادعا میشود)، اما بعد از چند سال در چندین انتخابات به خدمت کمپینهای تبلیغاتی درآمد. گفته میشود این شرکت در ۴۴ انتخابات، بر روی رایدهندگان تاثیر گذاشته است.
کاری که کمبریج آنالیتیکا میکرد چندان هم پیچیده نبود. آنها با جمعآوری دو دسته داده، اولی دادههای حاصل از فعالیت کاربران در شبکههای اجتماعی و سرویسهای مختلف اینترنتی که اطلاعات حریم خصوصی را شامل نمیشوند و دسته دوم دادههایی که از طریق اپلیکیشنهای تست شخصیت و روانشناسی (مثل اپهای my personality و This Is Your Digital Life که خودشان منتشر کرده بودند) اطلاعات کاملی در رابطه با حدود ۸۰ میلیون کاربر را تحلیل و ارزیابی کردند.
شرکت کمبریج آنالیتیکا از ستاد تبلیغاتی ترامپ مبلغ ۵ میلیون دلار دریافت کرد تا با استفاده از دادهها، شهروندان را قانع کند که به ترامپ رای بدهند.
این شرکت توانست با دادههای حاصل از متریکهای روانشناسی مانند پنج عامل مهم شخصیت، علایق فردی، محل سکونت، وضعیت اقتصادی و ... مدلی بسازد که نشان میداد شهروندان به احتمال قوی به چه کسی رای خواهند داد یا برای رای دادن چه میزان تردید دارند.
این اطلاعات در اختیار ستادهای انتخاباتی هر شهر قرار میگرفت تا محتوای تبلیغاتی به شکلی کاملاً هدفمند و مطابق وضعیت شهروندان پخش شود. با در دست داشتن اطلاعاتی مثل آدرس ایمیل یا آدرس خانه، کافی بود محتوایی که هر شهروند علاقه به شنیدنش دارد را به او برسانند.
حتی کارکنان این ستادها از همین اطلاعات در تبلیغات خانهبهخانه استفاده میکردند. افراد داوطلب کمپینها به درب خانهها مراجعه میکردند و با گفتوگوی مستقیم، شهروندان را برای رای دادن به ترامپ قانع میکردند.
بعد از انتخابات و پیروزی ترامپ، اخبار جنجالی زیادی درباره همکاری فیسبوک که بیشترین سهم از دادههای جمعآوری شده توسط کمبریج آنالیتیکا را داشت، منتشر شد.
بعد از سروصداهایی که شد، فیسبوک و چند شرکت دیگر که به نوعی دادهها را در اختیار کمپین ترامپ گذاشته بودند، سیاستهای فروش داده را تغییر دادند و دسترسی اپلیکیشنهای تست شخصیت و روانشناسی آنها نیز قطع شد. در نهایت شرکت کمبریج آنالتیکا در سال ۲۰۱۸ اعلام ورشکستگی کرد، اما ترامپ به عنوان رئیس جمهور امریکا انتخاب شد.
آمازون چگونه از کلانداده استفاده میکند؟
در نگاه مصرفکننده امروزی، آمازون یک غول تجارت الکترونیک به حساب میآید و این موفقیت یک شبه به دست نیامده است. در این قسمت درباره دلایلی صحبت خواهیم کرد که کلانداده به شکوفا شدن این برند کمک کرده است:
برای رقابت از قیمتگذاری پویا استفاده میکند؛ قبل از استفاده فروشندگان از کلانداده برای قیمتگذاری محصولات، معمولا مردم یک قیمت یکسان را در طول روزهای مختلف برای یک محصول میدیدند و دفعات بازدید از سایت نیز در قیمتگذاری تاثیرگذار نبود. اما حالا قیمتها بارها تغییر میکنند. یکی از علل این تغییر این است که کلانداده میل به خرید کاربر را افزایش میدهد.
به عنوان یک مثال خارج از مجموعه آمازون، میتوان به قیمتگذاری بلیطها و هتلها اشاره کرد. اگر فردی چند بار صفحه قیمت یک بلیط را چک کند، احتمالا متوجه افزایش قیمت آن خواهد شد. این تکنیک، قیمتگذاری پویا نام دارد.
آمازون از این تکنیک بسیار استفاده میکند. این کمپانی روزانه ۲.۵ میلیون بار قیمتها را تغییر میدهد. این به این معناست که قیمت یک محصول به طور میانگین هر ده دقیقه یکبار تغییر میکند. به لطف دادههای عظیم آمازون، این کمپانی میتواند فاکتورهای بسیاری را، از جمله نحوه قیمتگذاری رقبا و موجودی یک محصول، بررسی کند و سپس درباره قیمت نهایی یک محصول تصمیم بگیرد.
صفحه خرید و درخواستهای مرجوع را بررسی میکند؛ معروف بودن آمازون و موقعیت خوب آن در دنیای تجارت، باعث میشود تا هدف مناسبی برای سوءاستفاده و کلاهبرداری شود. این کمپانی در هر ثبت سفارش، بیش از ۲۰۰۰ داده مختلف درباره آن سفارش را جمعآوری میکند و از الگوریتمهای یادگیری ماشین استفاده میکند تا احتمال کلاهبرداری در یک تراکنش را تشخیص دهد. این سیستم هر ساله میلیونها دلار تراکنشهای کلاهبرداری را متوقف میکند.
از داده برای تغییر در فروشگاههای فیزیکی استفاده میکند؛ وقتی آمازون Whole Foods Market (فروشگاههای زنجیرهای مواد غذایی) را خرید، به سرعت از داده استفاده کرد تا روند اجرایی برند را تغییر دهد. یکی از این تغییرات کاهش قیمت محصولات محبوب بود. این اولین قدم در استفاده از آنالیز کلانداده بود.
موفقیت در این بخش باعث تغییر در صنعت سوپرمارکتها شد و آمازون تصمیم گرفت آن را بهتر از قبل اجرا کند.
همچنین برند خرید بدون پرداخت آمازن، Amazon Go، نیز بر داده متکی است. سنسورها تشخیص میدهند که مردم کدام کالا را برای خرید برداشتند و دوربینها تشخیص میدهند که افراد برای دزدی تلاش نکنند. اگرچه که این کمپانی جزئیات دقیقی درباره اطلاعاتی که از کاربران جمعآوری میکند ارائه نمیدهد، اما میتوان مطمئن بود که از این دادهها برای افزایش بهرهوری در خرید استفاده خواهد شد.
برای مثال، اگر دوربینها افرادی با کالسکه کودک را نشان دهند که در انجام خرید خود به مشکل برخوردند، آمازون از این داده جمعآوری شده استفاده میکند تا عرض مغازههای خود را بیشتر کند. یا اگر دادههای جمعآوری شده نشان دهند که در یک منطقه خاص، محصولات وگان فروش بیشتری دارند، تعداد آن محصولات را در آن ناحیه افزایش میدهد.
مردم را تشویق میکند تا با هم کالاهای بیشتری بخرند؛ احتمالا بخش پیشنهاد محصول آمازون، آشناترین قسمت کاربرد کلانداده برای کاربران است. طریقه پیشنهاد کالا این گونه است که بر اساس کالاهایی که در سبد خرید وجود دارند یا کالاهایی که قبلا سفارش داده شدهاند، محصولات مربوط به آنها را پیشنهاد میدهد.
پس از رونمایی از Amazon Personalize، این کمپانی به توسعهدهندگان اجازه داد تا در هر دامنهای محصولاتی را به کاربران پیشنهاد دهند. دیگر کمپانیها میتوانند از این تکنولوژی آمازون استفاده کنند تا انواع کالاهای خود را به مشتری هایشان معرفی کنند.
وقتی آمازون توانست برای هر مشتری، کالاهایی را معرفی کند که بیشتر به او مربوط است و آنها را مجاب کرد تا بیشتر بخرند، درآمد آمازون افزایش یافت و در نهایت کاربران، آمازون را محلی مناسب برای انجام خریدهای خود دیدند.
از داده برای پرکردن موجودی خود استفاده میکند؛ آمازون انبارهای خود را Fulfillment Centers یا مراکز تکمیل نامیده است. تعجبآور نخواهد بود که از کلانداده اینجا نیز استفاده شود. مثلا یکی از کاربردهای آن، هشدار دادن به کارکنانی است که آرام کار میکنند. همچنین از دادهها برای ردیابی کالاهایی که بیشترین میزان فروش را دارند، استفاده میکند.
آمازون، پتنتی به نام Anticipatory Shipping یا پیشبینی خرید دارد که قبل از این که کاربر محصولی را خریداری کند، میتواند خرید آن محصول را پیشبینی کند. قطعا بدون استفاده از کلانداده، آمازون نمیتوانست به این موفقیت دست یابد.
آمریکا چطور به دادههای جهانی دسترسی دارد؟
بیشتر ارتباطات الکترونیکی جهان از ایالات متحده عبور میکند و عمده زیرساختهای اینترنت جهان در ایالات متحده مستقر است و همین موضوع، فرصتی را در اختیار آمریکا قرار داده است تا دادههای کشورهای دیگر را به بهانه محافظت از منافع ملی خود، ذخیره کرده و تحلیل کند.
اندکی پس از انتشار گزارشهای گاردین و واشنگتن پست، مدیر اطلاعات ملی ایالات متحده، جیمز کلاپر، در ۷ ژوئن ۲۰۱۳، بیانیهای منتشر کرد که تأیید میکرد نزدیک به ۶ سال، دولت ایالات متحده از شرکتهای خدمات اینترنتی مانند فیسبوک برای جمعآوری اطلاعات خارجیان خارج از ایالات متحده استفاده کرده است.
توجیه استفاده از این اطلاعات، همان حمله ۱۱ سپتامبر و ارتباط جاسوسان داخلی با القاعده بود که به وضوح سوءاستفاده آمریکاییها از اطلاعات کشورهای خارجی با این بهانه، قابل درک است.
چه کشورهایی در استفاده از پریسم همکاری داشتند؟
ارتش آلمان در اوایل سال ۲۰۱۱ برای پشتیبانی از عملیات خود در افغانستان از PRISM استفاده میکرد.
روزنامه اسرائیلی کالکالیست، مقاله Business Insider را در رابطه با مشارکت دو شرکت اسرائیلی مخفی در برنامه PRISM - Verint Systems و Narus منتشر کرده بود.
افشاگریهای بعدی اسنودن اظهاراتی بود مبنی بر این که آژانسهای دولتی مانند GCHQ انگلستان نیز اقدام به رهگیری و ردیابی دادههای اینترنت میکنند. در انگلستان، ستاد ارتباطات دولتی (GCHQ)، با برنامه نظارت Tempora، از ژوئن ۲۰۱۰ یا قبل از آن به برنامه PRISM دسترسی داشت. به طوری که تنها در سال ۲۰۱۲، ۱۹۷ گزارش با آن نوشت.
جالب است بدانید که در آگوست ۲۰۱۳، مأموران GCHQ از دفاتر روزنامه گاردین بازدید کردند، آنها دستور تخریب هارد دیسکهای حاوی اطلاعات به دست آمده از اسنودن را صادر کردند.
کشورهای دیگر از جمله فرانسه نیز از این برنامه استفاده کردهاند که برای کسب اطلاعات بیشتر در این رابطه، بهتر است به منابعی که در ادامه میآوریم مراجعه کنید.
گزارش جدیدی از Freedom on the Net میگوید، که از هر ۱۰ کاربر اینترنت، ۹ نفر به صورت آنلاین تحت نظارت هستند. این کار ممکن است قبلا توسط تحلیلگران آغاز شده باشد، اما اکنون به صورت خودکار است.
پیشرفت در حوزه هوش مصنوعی و تجزیه و تحلیل الگوها باعث شده تا میلیاردها حساب بررسی شوند.
اینها همه ابزارهایی برای کنترل جمعیت و سرکوب سیاسی هستند که در ایالات متحده برای نظارت بر بازدیدکنندگان از کشور و در انگلیس برای نظارت بر تقریبا ۹۰۰۰ فعال سیاسی استفاده شدند.
این فعالیتها همه از طریق ردیابی موقعیت جغرافیایی و تجزیه و تحلیل احساسات افراد از روی دادههای به دست آمده از فیسبوک، توییتر و سایر سیستم عاملها انجام میشود.
علاوه بر نظارت این کشورها، کشورهای دیگر نیز میتوانند از این دادهها برای مقاصد سیاسی و اقتصادی استفاده کنند که اعمال کنترل بر آن بسیار دشوارتر خواهد بود.
به موازات این، همه ما از همان سیستم عاملهای رسانههای اجتماعی استفاده میکنیم، رسانههای اجتماعی به طرز خطرناکی به سمت غیرلیبرالیسم گرایش پیدا کردهاند و شهروندان را در معرض سرکوب آزادیهای اساسی خود قرار میدهند. در نتیجه این روندها، آزادی اینترنت جهانی در سالهای اخیر به شدت کاهش یافته است.
جاسوسان همیشه برای دستیابی به اطلاعات، ارتباطات را رصد میکردند. سرقت اسناد، گوش دادن به مکالمات و شکستن کدهای پیامهای مخفی، از اصول این حرفه است. انگلیسیها از یک سیستم نظارتی الکترونیکی پیشرفته برای گوش دادن به افسران آلمانی اسیر شده در طی دهه ۱۹۴۰ استفاده کردند. آنچه که جدید است، حجم و گستردگی اطلاعات جمعآوری شده است.
در سالهای اخیر و اعتراضات برخی از نمایندگان، به برنامههای پریسم و آپستریم، قانونی که این برنامهها را مجاز میداند، قرار بود منقضی شود، اما کنگره آمریکا با کمترین دشواری، قانونی بودن آنها را تمدید کرد. به نظر میرسد که نظارت جهانی بر اینترنت دیگر در ایالات متحده بحث برانگیز نیست.
برنامههای Prism و Upstream برای جمعآوری ارتباطات آنلاین خارجیها در خارج از ایالات متحده ارتقا یافتهاند. پریسم ارتباطات را مستقیماً از خدمات اینترنتی مانند ارائهدهندگان ایمیل و برنامههای گفتوگوی ویدیویی میگیرد و آپستریم برای ایجاد ارتباطات به زیرساختهای اینترنت نفوذ کرده و دادههای آنها را جمعآوری میکند.
تیموتی ادگار، یکی از اعضای موسسه امور عمومی واتسون در دانشگاه براون، گفت که وقتی این برنامهها برای اولین بار علنی شدند، اعتراض فقط معطوف به اطلاعات آمریکاییها نبود. ادگار تا زمانی که در دفتر مدیر اطلاعات ملی استخدام شود، در زمینههای حفظ حریم خصوصی در ACLU کار میکرد.
نقش او اطمینان حاصل کردن از مطابقت برنامههای جاسوسی دولت با قوانین ایالات متحده بود. وقتی اسنودن اطلاعات مربوط به پریسم و آپستریم را فاش کرد، ادگار گفت: «این در واقع شرحی از نظارت جهانی است. NSA واقعا توانایی جمعآوری دادههای سراسر جهان را دارد.»