پرونده: کلان داده و کاربردهای سیاسی و اجتماعی آن /بخش دوم: سوءاستفاده‌های آمریکا از کلان‌داده

پرونده: کلان داده و کاربردهای سیاسی و اجتماعی آن /بخش دوم: سوءاستفاده‌های آمریکا از کلان‌داده
تاریخ انتشار : ۲۰ آبان ۱۴۰۰

داده‌ها از ویژگی‌های تعیین کننده جامعه مدرن هستند. هر روز انسان‌ها و ماشین آلاتی که با آن‌ها تعامل دارند 2.5 تریلیون مگابایت داده تولید می‌کنند. هرچه داده‌ها راحت‌تر در دسترس قرار ‌بگیرند‌، وسوسه تجزیه و تحلیل آن‌ها به ویژه در حوزه سیاست نیز افزایش می‌یابد.

به گزارش گرداب - دولت‌ها برای نظارت بر رفتار شهروندان خود در شبکه‌های اجتماعی و حتی رصد رفتار مردم کشور‌های دیگر، از این فناوری استفاده می‌کنند. این نوع نظارت به بسیاری از کشور‌ها راه یافته است. نظارت در شبکه‌های اجتماعی از طریق جمع‌آوری و پردازش داده‌های سیستم عامل‌ها انجام می‌شود. میلیارد‌ها نفر در سراسر جهان از این بستر‌های دیجیتالی برای برقراری ارتباط با عزیزان، برقراری ارتباط با دوستان و همکاران و بیان عقاید سیاسی، اجتماعی و مذهبی خود استفاده می‌کنند.

حتی اگر افرادی باشند که به ندرت با چنین خدماتی ارتباط برقرار می‌کنند، اطلاعاتی که در مورد آن‌ها جمع‌آوری، تولید و استنباط می‌شود، نه تنها برای تبلیغ‌کنندگان، بلکه برای سازمان‌های اجرای قانون و سازمان‌های اطلاعاتی نیز بسیار باارزش است.

استفاده از هوش مصنوعی

پیشرفت در هوش مصنوعی (AI) امکانات جدیدی را برای نظارت انبوه خودکار فراهم کرده است. سیستم‌های نظارتی پیچیده می‌توانند به سرعت از طریق تجزیه و تحلیل پیوند، روابط کاربران را ترسیم کنند.

با استفاده از پردازش به زبان طبیعی و تجزیه و تحلیل احساسات، به پست‌های آن‌ها در رسانه‌های اجتماعی معنی یا نگرش دهند؛ و مکان‌های گذشته، حال یا آینده آن‌ها را استنباط کنند. یادگیری ماشینی سیستم‌ها را قادر می‌سازد الگو‌هایی را پیدا کنند که برای انسان غیرقابل مشاهده است. شبکه‌های عصبی عمیق می‌توانند دسته‌های جدیدی از الگو‌ها را برای بررسی بیش‌تر شناسایی کرده و پیشنهاد دهند.

کلان‌داده یک موهبت بزرگ برای آژانس‌های جاسوسی ایالات متحده است، که مدت‌هاست برای تهیه گزارش‌های اطلاعاتی با چندین منبع داده همکاری دارند. در دهه گذشته، آژانس‌هایی مانند CIA و NSA، بررسی کلان داده‌ها را از طریق واحد‌های تحلیلی اختصاصی و پروژه‌های تحقیقاتی با تمرکز بر تجزیه و تحلیل داده‌های آنلاین مانند فیلم‌های YouTube و پست‌های رسانه‌های اجتماعی، شروع کرده‌اند.

اما در پی این اتفاق، متخصصان داخلی آمریکا نگران نقض شدن آزادی‌های مدنی هستند. اما آیا این تحلیل‌ها فقط محدود به مرز‌های ایلات متحده است؟ بی‌شک خیر!

پنج روش تجزیه و تحلیل کلان داده‌ها برای مقاصد سیاسی

۱. تشخیص ناهنجاری: موارد، رویداد‌ها یا مشاهداتی را مشخص می‌کند که مطابق با رفتار یا الگوی مورد انتظار نیستند. می‌توان از این مورد برای ارزیابی مشکوک بودن فعالیت آنلاین استفاده کرد. در این‌جا می‌توان فعالیت غیرمعمول یک فرد معتمد یا خودی را به عنوان یک عمل بدخواهانه یا سهوی تشخیص داد و آن را از فعالیت روزمره شبکه متمایز کرد.

۲. طبقه‌بندی: یکی از نقش‌های اصلی ابزار‌های تحلیل کلان‌داده در امنیت ملی، در حوزه پردازش اطلاعات است. الگوریتم‌های طبقه‌بندی، اشیا را در مجموعه‌ای از داده‌ها به دسته‌ها یا کلاس‌های هدف اختصاص می‌دهند. از مدل‌های طبقه‌بندی می‌توان برای شناسایی ارتباطات مشکوک، کم‌خطر یا پرخطر استفاده کرد.

۳. خوشه‌بندی داده‌ها: خوشه‌بندی به گروه‌بندی اشیا یا داده بر اساس مفاهیم شباهت اطلاق می‌شود. چنین توانایی‌هایی برای الک کردن مقدار زیادی از داده‌های متنوع رسانه‌های اجتماعی و سازماندهی آن‌ها در گروه‌های موضوعی و تولید خلاصه‌ای از محتوای آن‌ها برای انجام تحلیل است. خوشه‌بندی هم‌چنین می‌تواند به شناسایی انواع مختلف کاربران شبکه‌های اجتماعی (رهبران عقاید، ربات‌ها و غیره) کمک بسیاری کند.

۴. تحلیل پیوند: تجزیه و تحلیل پیوند در تعریف، کشف و ارزیابی روابط بین اشیا و داده بسیار مفید است. این نوع الگوریتم معمولاً برای شناسایی گره‌ها و شبکه‌های متصل‌کننده مردم، سازمان‌ها و نهاد‌های دیگر استفاده می‌شود. یکی از معروف‌ترین کاربرد‌های تجزیه و تحلیل پیوند، شناسایی گره‌های مهم در شبکه‌های تروریستی یا جنایی مانند القاعده از طریق تجزیه و تحلیل شبکه‌های اجتماعی بود.

۵. یادگیری ماشین: یادگیری ماشین به مجموعه خاصی از الگوریتم‌ها گفته می‌شود که می‌تواند خود را بر اساس داده‌های پردازشی سازگار کرده و از آن‌ها بیاموزد و اطلاعات تازه را تلفیق کرده و نتیجه‌گیری کند. برای مثال الگوریتم‌های یادگیری ماشین می‌توانند اهداف پنهان را از مجموعه اسنادی که پردازش می‌کنند، بازیابی کنند، حملات فیشینگ را شناسایی کنند، نفوذ شبکه را تشخیص دهند، چهره‌های انسان‌ها را شناسایی کنند و جمعیت را تجزیه و تحلیل کنند. در همه این موارد، کلان داده‌ها تجزیه و تحلیل را تسهیل می‌کنند و بدون وجود آن‌ها رسیدن به چنین قدرتی امکان پذیر نیست.

کلان داده و کاربردهای سیاسی و اجتماعی آن /بخش دوم: سوءاستفاده‌های آمریکا از کلان‌داده

آمریکا چگونه از کلان‌داده برای حفظ منافع خود استفاده می‌کند؟

ابتدا به استفاده ایالات متحده از داده‌های شهروندانش نگاهی می‌اندازیم و سپس استفاده دولت این کشور از اطلاعات کشور‌های دیگر، خصوصا ایران را بررسی کنیم.

بنا بر مدارک افشا شده، دولت آمریکا با کمک شرکت‌های بزرگ مخابراتی از جمله AT&T دست کم از سال ۲۰۰۱ بر روی ارتباطات داخلی میلیون‌ها شهروند عادی آمریکایی نظارت گسترده و غیرقانونی داشته است. این موضوع اولین بار توسط مطبوعات گزارش شد و در اواخر سال ۲۰۰۵، EFF در تلاش برای متوقف کردن آن و خواستار نظارت دولت و قانون اساسی شد.

برای اولین بار در دسامبر ۲۰۰۵ گزارش‌های خبری نشان داد که آژانس امنیت ملی (NSA) مکالمات تلفنی و ارتباطات اینترنتی آمریکایی‌ها را رهگیری کرده است. این گزارش‌های خبری، همراه داستان USA Today در ماه مه ۲۰۰۶ و اظهارات چند تن از اعضای کنگره، نشان داد که NSA تلفن و سایر سوابق ارتباطی شهروندان آمریکایی را بررسی می‌کند.

در ژوئن ۲۰۱۳، رسانه‌ها به رهبری گاردین و واشنگتن پست، شروع به انتشار مقالاتی همراه با اسناد دولتی کردند، که بسیاری از گزارش‌های سال‌های ۲۰۰۵ و ۲۰۰۶ را تأیید می‌کرد. گزارش‌ها نشان داد که دولت این کشور داده‌های تلفن همه آمریکایی‌هایی‌ها را جمع‌آوری کرده است. علاوه بر این، این گزارش‌ها ثابت کرد که دولت آمریکا در حال جمع‌آوری و تجزیه و تحلیل محتوای ارتباطات خارجی‌هایی است که با افراد داخل ایالات متحده در ارتباط‌اند.

بعد از ۱۱ سپتامبر، بوش به آژانس امنیت ملی (NSA) اجازه داد تا داخل ایالات متحده فعالیت‌های نظارتی انجام دهد. وقتی برنامه جاسوسی NSA برای اولین بار توسط نیویورک تایمز در سال ۲۰۰۵ افشا شد، دولت این اقدام را برنامه نظارت بر تروریسم نام‌گذاری کرد، که ارتباطات آمریکایی‌ها با القاعده را تحلیل می‌کند. اما بررسی داده‌های افراد مشکوک به اقدامات تروریستی، تنها هدف این برنامه نبود، بلکه اطلاعات میلیون‌ها آمریکایی که هرگز به جرمی مشکوک نبودند نیز، مورد بررسی قرار گرفته بود.

اما دولت آمریکا چگونه این کار را انجام داد؟ هنگام ارسال ایمیل یا استفاده از اینترنت، داده‌ها از طریق سیم‌های شرکت‌های مخابراتی و شبکه‌های فیبر نوری به کامپیوتر شهروندان منتقل می‌شوند. برای رهگیری این ارتباطات، دولت دستگاه‌هایی به نام تقسیم‌کننده فیبر نوری را در بسیاری از نقاط اتصال مخابراتی نصب کرد تا نسخه‌های دقیق داده‌هایی را که از آن‌ها عبور می‌کند، به دست دولت برسد.

ایجاد پایگاه داده‌ها و نرم‌افزار‌های تحلیل داده

از قضا، در همان زمان داغ بودن بحث تروریسم در آمریکا، شرکت‌هایی مانند Google و Yahoo در حال حل مشکل ذخیره و تجزیه و تحلیل کلان داده‌ها بودند. در نوامبر سال ۲۰۰۶، گوگل مقاله‌ای در مورد BigTable منتشر کرد، یک پایگاه داده با ظرفیت پتابایت که می‌توانست صفحات وب را فهرست کند و از Google Earth و سایر برنامه‌ها پشتیبانی کند.

پایگاه‌های BigTable و Hadoop راهی را پیش روی NSA گذاشتند تا بتواند اطلاعات را ذخیره و طبقه‌بندی کنند. اما در سال ۲۰۰۸، به دلایل امنیتی، NSA تصمیم گرفت تا نسخه بهتری از BigTable به نام Accumulo را ایجاد کند.

آکومولو (Accumulo)

Accumulo یک پایگاه داده NoSQL است که بر اساس جفت‌های مقدار-کلید کار می‌کند. این طراحی شبیه BigTable گوگل یا DynamoDB آمازون است، اما آکومولو ویژگی‌های امنیتی ویژه‌ای مانند چندین سطح دسترسی امنیتی دارد. این برنامه بر روی پلتفرم منبع باز Hadoop و سایر محصولات Apache ساخته شده است.

یکی از ویژگی‌های آکومولو دسترسی لایه‌ای است. کاربرانی که سطح پایین‌تری دارند، از وجود برخی داده‌های امنیتی آگاهی نخواهند داشت.

آکومولو می‌تواند به دنبال کلمات یا مخاطبان خاص در پیام‌هایی از IP‌های مختلف بگردد. یا می‌تواند به دنبال شماره‌های تلفنی باشد که دو درجه از شماره تلفن هدف متفاوت هستند. سپس می‌تواند ایمیل‌ها یا شماره تلفن‌های انتخاب شده را به یک پایگاه داده دیگر ببرد تا مورد بررسی و تجزیه و تحلیل قرار بگیرند.

به عبارت دیگر، آکومولو به NSA این امکان را می‌دهد تا پیام‌ها و تماس‌هایی که در بستر اینترنت برقرار می‌شوند را، ذخیره کند. داده‌های جمع‌آوری شده از آکومولو را می‌توان با ابزار‌های دیگری مانند Palantir تجزیه و تحلیل کرده و نمودار ارتباط بین اشخاص بر اساس ویژگی‌ها و روابط و اعمال آن‌ها در اینترنت را ترسیم کرد.
SSL یکی از موانع نظارت بر ارتباطات اینترنتی NSA بود.

اما طبق اسلاید‌های منتشر شده توسط پیمانکار NSA، ادوارد اسنودن در واشنگتن پست و گاردین، مایکروسافت ​​در سال ۲۰۰۷ ارائه داده‌ها به NSA را آغاز کرد. در این برنامه، NSA به سرور‌های پشت سرویس‌های ابری و داده‌های درون آن‌ها دسترسی یافت، که نقض گواهینامه‌های SSL و ذخیره داده‌ها را امکان پذیر کرد.

پریسم

PRISM نام برنامه‌ای است که طی آن آژانس‌های اطلاعاتی ایالات متحده مستقیماً به سراغ شرکت‌هایی مانند گوگل، فیسبوک و یاهو می‌روند و شرکت‌ها را مجبور می‌کنند که ارتباطات کاربران خود را در اخیارشان بگذارد. این شرکت‌ها حق ندارند به کاربران خود اعلام کنند که داده‌های آن‌ها به دولت تحویل داده شده است. NSA می‌تواند از این درخواست‌های PRISM برای هدف قرار دادن ارتباطات رمزگذاری شده در اینترنت استفاده کند.


PRISM در سال ۲۰۰۷ و در پی تصویب قانون محافظت از آمریکا زیر نظر دولت بوش آغاز به کار کرد. ۶ سال بعد توسط ادوارد اسنودن، پیمانکار NSA، خبر آن به بیرون درز پیدا کرد. وی هشدار داد که میزان جمع‌آوری داده‌ها بسیار بیش‌تر از آن است که مردم می‌دانند و شامل فعالیت‌هایی خطرناک و جنایتکارانه است. این افشای اطلاعات توسط گاردین و واشنگتن پست در ۶ ژوئن ۲۰۱۳ منتشر شد.

اسناد بعدی نشان داد که توافق مالی بین بخش عملیات ویژه NSA و شرکای PRISM میلیون‌ها دلار بوده است. این اسناد چندین شرکت فناوری را به عنوان شرکت‌کنندگان در برنامه PRISM معرفی کرده‌اند، از جمله مایکروسافت در سال ۲۰۰۷، یاهو در سال ۲۰۰۸، گوگل در ۲۰۰۹، فیسبوک در ۲۰۰۹، Paltalk در ۲۰۰۹، یوتیوب در ۲۰۱۰، AOL در ۲۰۱۱، اسکایپ در ۲۰۱۱ و اپل در ۲۰۱۲. یادداشت‌های سخنرانان نشان می‌دهد که ۹۸ درصد از نتایج PRISM براساس داده‌های یاهو، گوگل و مایکروسافت هستند.

هرچند مدیران بیش‌تر این شرکت‌ها در جریان اسناد فاش شده به گاردین گفتند که آن‌ها هیچ اطلاعی از برنامه PRISM ندارند و هم‌چنین ارائه اطلاعات به دولت در مقیاس ادعای رسانه‌ها را تکذیب کردند. اما مدارک فاش شده بسیار موثق بودند.

آپستریم

برنامه دیگری که در کنار پریسم، به جاسوسی و بررسی داده‌ها کمک می‌کند، آپستریم است. نظارت آپستریم که در ابتدای کار با همان بهانه تروریسم و بررسی ارتباط آمریکایی‌ها ترتیب داده شد، شامل رهگیری انبوه و جست‌وجوی ارتباطات اینترنتی از جمله ایمیل، چت و ترافیک وب است.اگر به دوستان خود ایمیل بفرستید یا وب‌سایت‌هایی را که میزبانی آن‌ها در ایالات متحده است را باز کنید، NSA قطعا ارتباطات شما را رصد می‌کند.

در نظارت آپستریم، رایانه‌ها به طور مداوم ارتباطات ما را برای اطلاعات مورد علاقه دولت آمریکا اسکن می‌کنند. در واقع کار آن جست‌وجوی محتوا حین انتقال ارتباطات است. NSA با کمک ارائه‌دهندگان ارتباطات از راه دور مانند AT&T و Verizon، تجهیزات نظارتی را در ده‌ها نقطه مهم اینترنت نصب کرده است، تا با عبور از ارتباطات، تعداد زیادی از ترافیک اینترنت را کپی و سپس جست‌وجو کند.

کلماتی که جست‌وجو می‌شوند، معمولاً آدرس ایمیل، شماره تلفن یا سایر شناسه‌های مرتبط با اهداف دولت هستند. هرگاه NSA ارتباطی را پیدا کند که مربوط به کلمات مورد نظر باشد، آن ارتباط را برای استفاده و تجزیه و تحلیل ذخیره می‌کند. در پی این تحلیل‌ها آمریکا نه تنها ارتباطات اهداف خود را رهگیری می‌کند، بلکه ارتباطات اشخاص ثالث را به طور سیستماتیک بررسی می‌کند تا افرادی را که به کلمات کلیدی مرتبط‌اند را، شناسایی کند.

بگذارید با ذکر مثالی غیردیجیتالی، موضوع را کمی شفاف‌تر کنیم. فرض کنید NSA نمایندگان خود را به مراکز خدمات پستی می‌فرستد تا به طور مداوم نامه‌های بین‌المللی همه اشخاص را باز کنند. نمایندگان هر نامه را باز می‌کنند، می‌خوانند، و از هر نامه‌ای که در رابطه با موضوع مورد نظرشان است، یک نسخه کپی نگه می‌دارند!

هنگامی که فردی از اینترنت استفاده می‌کند، چه برای مرور یک صفحه وب یا ارسال پیام، رایانه وی اطلاعات را به صورت یک بسته داده‌ای ارسال می‌کند. اما برای حفظ امنیت و هم‌چنین سرعت بالای انتقال، این بسته داده به بخش‌های کوچک‌تر تقسیم می‌شود و هر قطعه از این پازل به طور مستقل به یک مقصد مشترک روانه می‌شود، در مقصد مجددا تجمیع می‌شوند و به صورت همان پیام اولیه در کنار یک‌دیگر قرار می‌گیرند. به همین دلیل، تجهیزات رهگیری سوئیچ میان راه، نمی‌توانند فقط پیام هدف خود را دریافت کنند.

پس شنود کننده باید از همه چیز کپی بگیرد. اگرچه برخی از داده‌هایی که به کار نمی‌آیند، حذف می‌شوند، اما تنها با کپی برداری و جست‌وجوی ترافیک انبوه اینترنت می‌توان ارتباطات را شناسایی کرد.

کلان داده و کاربردهای سیاسی و اجتماعی آن /بخش دوم: سوءاستفاده‌های آمریکا از کلان‌داده

بنا به آن‌چه که گفته شد سازمان امنیت ملی آمریکا؛

از خطوط اینترنت در سراسر جهان استفاده کرده است: اینترنت از طریق کابل‌های فیبر نوری مقادیر بی‌شمار داده‌ای را حمل می‌کنند و قاره‌های مختلف را به هم متصل می‌کنند. در برخی مکان‌ها، NSA برای استفاده از این کابل‌ها با آژانس‌های اطلاعاتی محلی معامله می‌کند و در برخی دیگر به تنهایی وارد عمل می‌شود و حتی از زیردریایی‌ها برای اتصال به سیم‌های عمیق زیر اقیانوس استفاده می‌کند.

شرکت‌های خارجی را هک کرده است: در برزیل، آلمان و سایر کشورها، NSA به شبکه‌های داخلی ارتباط از راه دور نفوذ کرده است، داده‌های جمع‌آوری شده را رهگیری کرده و امنیت سیستم‌های آن‌ها را تضعیف می‌کند.
از همه اقدامات کاربران اینترنت مطلع است: با وجود شبکه‌های اجتماعی که میلیون‌ها ایرانی عضو آن‌ها هستند، بررسی و تحلیل داده‌های آن‌ها و پی بردن به الگو‌های تفکری و اخلاقی از گزینه‌های پیش روی ایالات متحده است.

از رهبران خارجی جاسوسی کرده است: افشاگری دیگر در اسناد اسنودن این بود که NSA از مقامات ارشد کاخ سفید، وزارت امور خارجه و پنتاگون می‌خواهد که اطلاعات شخصی خود را در رابطه با رهبران خارجی به اشتراک بگذارند. این یادداشت فاش شده نشان می‌دهد که بیش از ۲۰۰ شماره تلفن محرمانه به NSA تحویل داده شده است، که به مکالمات آن‌ها نفوذ پیدا کرده‌اند. NSA این جاسوسی را از کشور‌های هم‌پیمان با ایالات متحده نیز دریغ نکرد، که رهبر آلمان، آنگلا مرکل نیز یکی از اهداف بود.‌

می‌تواند در ردیابی کوکی‌ها جاسوسی کند: کوکی‌ها که بسته‌های کوچکی از اطلاعات که شامل تاریخچه مرور وب و مکان کاربر، برای تبلیغات هدف‌مند هستند نیز توسط NSA جمع‌آوری شده‌اند. آژانس جاسوسی برای شناسایی کاربران در سراسر جهان به عنوان اهداف اصلی هک، از آن‌ها استفاده می‌کند.

رئیس جمهور شدن ترامپ با کمک کلان‌داده

در انتخابات قبل از سال ۲۰۱۶ از کلان‌داده برای پیش‌بینی نتایج یا شناسایی مناطق مناسب برای تبلیغات استفاده می‌شد، اما اتفاقی که در سال ۲۰۱۶ افتاد، بسیار وسیع‌تر و جدید بود.

داستان از یک شرکت داده‌کاوی به نام کمبریج آنالیتیکا شروع شد که در ابتدا با هدف تحقیقات آکادمیک شکل گرفت (آن‌طور که ادعا می‌شود)، اما بعد از چند سال در چندین انتخابات به خدمت کمپین‌های تبلیغاتی درآمد. گفته می‌شود این شرکت در ۴۴ انتخابات، بر روی رای‌دهندگان تاثیر گذاشته است.

کاری که کمبریج آنالیتیکا می‌کرد چندان هم پیچیده نبود. آن‌ها با جمع‌آوری دو دسته داده، اولی داده‌های حاصل از فعالیت کاربران در شبکه‌های اجتماعی و سرویس‌های مختلف اینترنتی که اطلاعات حریم خصوصی را شامل نمی‌شوند و دسته دوم داده‌هایی که از طریق اپلیکیشن‌های تست شخصیت و روانشناسی (مثل اپ‌های my personality و This Is Your Digital Life که خودشان منتشر کرده بودند) اطلاعات کاملی در رابطه با حدود ۸۰ میلیون کاربر را تحلیل و ارزیابی کردند.

شرکت کمبریج آنالیتیکا از ستاد تبلیغاتی ترامپ مبلغ ۵ میلیون دلار دریافت کرد تا با استفاده از داده‌ها، شهروندان را قانع کند که به ترامپ رای بدهند.

این شرکت توانست با داده‌های حاصل از متریک‌های روانشناسی مانند پنج عامل مهم شخصیت، علایق فردی، محل سکونت، وضعیت اقتصادی و ... مدلی بسازد که نشان می‌داد شهروندان به احتمال قوی به چه کسی رای خواهند داد یا برای رای دادن چه میزان تردید دارند.

این اطلاعات در اختیار ستاد‌های انتخاباتی هر شهر قرار می‌گرفت تا محتوای تبلیغاتی به شکلی کاملاً هدف‌مند و مطابق وضعیت شهروندان پخش شود. با در دست داشتن اطلاعاتی مثل آدرس ایمیل یا آدرس خانه، کافی بود محتوایی که هر شهروند علاقه به شنیدنش دارد را به او برسانند.


حتی کارکنان این ستاد‌ها از همین اطلاعات در تبلیغات خانه‌به‌خانه استفاده می‌کردند. افراد داوطلب کمپین‌ها به درب خانه‌ها مراجعه می‌کردند و با گفت‌وگوی مستقیم، شهروندان را برای رای دادن به ترامپ قانع می‌کردند.
بعد از انتخابات و پیروزی ترامپ، اخبار جنجالی زیادی درباره همکاری فیسبوک که بیش‌ترین سهم از داده‌های جمع‌آوری شده توسط کمبریج آنالیتیکا را داشت، منتشر شد.

بعد از سروصدا‌هایی که شد، فیسبوک و چند شرکت دیگر که به نوعی داده‌ها را در اختیار کمپین ترامپ گذاشته بودند، سیاست‌های فروش داده را تغییر دادند و دسترسی اپلیکیشن‌های تست شخصیت و روانشناسی آن‌ها نیز قطع شد. در نهایت شرکت کمبریج آنالتیکا در سال ۲۰۱۸ اعلام ورشکستگی کرد، اما ترامپ به عنوان رئیس جمهور امریکا انتخاب شد.

آمازون چگونه از کلان‌داده استفاده می‌کند؟

در نگاه مصرف‌کننده امروزی، آمازون یک غول تجارت الکترونیک به حساب می‌آید و این موفقیت یک شبه به دست نیامده است. در این قسمت درباره دلایلی صحبت خواهیم کرد که کلان‌داده به شکوفا شدن این برند کمک کرده است:
برای رقابت از قیمت‌گذاری پویا استفاده می‌کند؛ قبل از استفاده فروشندگان از کلان‌داده برای قیمت‌گذاری محصولات، معمولا مردم یک قیمت یکسان را در طول روز‌های مختلف برای یک محصول می‌دیدند و دفعات بازدید از سایت نیز در قیمت‌گذاری تاثیرگذار نبود. اما حالا قیمت‌ها بار‌ها تغییر می‌کنند. یکی از علل این تغییر این است که کلان‌داده میل به خرید کاربر را افزایش می‌دهد.

به عنوان یک مثال خارج از مجموعه آمازون، می‌توان به قیمت‌گذاری بلیط‌ها و هتل‌ها اشاره کرد. اگر فردی چند بار صفحه قیمت یک بلیط را چک کند، احتمالا متوجه افزایش قیمت آن خواهد شد. این تکنیک، قیمت‌گذاری پویا نام دارد.

آمازون از این تکنیک بسیار استفاده می‌کند. این کمپانی روزانه ۲.۵ میلیون بار قیمت‌ها را تغییر می‌دهد. این به این معناست که قیمت یک محصول به طور میانگین هر ده دقیقه یک‌بار تغییر می‌کند. به لطف داده‌های عظیم آمازون، این کمپانی می‌تواند فاکتور‌های بسیاری را، از جمله نحوه قیمت‌گذاری رقبا و موجودی یک محصول، بررسی کند و سپس درباره قیمت نهایی یک محصول تصمیم بگیرد.

صفحه خرید و درخواست‌های مرجوع را بررسی می‌کند؛ معروف بودن آمازون و موقعیت خوب آن در دنیای تجارت، باعث می‌شود تا هدف مناسبی برای سوءاستفاده و کلاهبرداری شود. این کمپانی در هر ثبت سفارش، بیش از ۲۰۰۰ داده مختلف درباره آن سفارش را جمع‌آوری می‌کند و از الگوریتم‌های یادگیری ماشین استفاده می‌کند تا احتمال کلاهبرداری در یک تراکنش را تشخیص دهد. این سیستم هر ساله میلیون‌ها دلار تراکنش‌های کلاهبرداری را متوقف می‌کند.

از داده برای تغییر در فروشگاه‌های فیزیکی استفاده می‌کند؛ وقتی آمازون Whole Foods Market (فروشگاه‌های زنجیره‌ای مواد غذایی) را خرید، به سرعت از داده استفاده کرد تا روند اجرایی برند را تغییر دهد. یکی از این تغییرات کاهش قیمت محصولات محبوب بود. این اولین قدم در استفاده از آنالیز کلان‌داده بود.

موفقیت در این بخش باعث تغییر در صنعت سوپرمارکت‌ها شد و آمازون تصمیم گرفت آن را بهتر از قبل اجرا کند.
هم‌چنین برند خرید بدون پرداخت آمازن، Amazon Go، نیز بر داده متکی است. سنسور‌ها تشخیص می‌دهند که مردم کدام کالا را برای خرید برداشتند و دوربین‌ها تشخیص می‌دهند که افراد برای دزدی تلاش نکنند. اگرچه که این کمپانی جزئیات دقیقی درباره اطلاعاتی که از کاربران جمع‌آوری می‌کند ارائه نمی‌دهد، اما می‌توان مطمئن بود که از این داده‌ها برای افزایش بهره‌وری در خرید استفاده خواهد شد.

برای مثال، اگر دوربین‌ها افرادی با کالسکه کودک را نشان دهند که در انجام خرید خود به مشکل برخوردند، آمازون از این داده جمع‌آوری شده استفاده می‌کند تا عرض مغازه‌های خود را بیش‌تر کند. یا اگر داده‌های جمع‌آوری شده نشان دهند که در یک منطقه خاص، محصولات وگان فروش بیش‌تری دارند، تعداد آن محصولات را در آن ناحیه افزایش می‌دهد.

مردم را تشویق می‌کند تا با هم کالا‌های بیش‌تری بخرند؛ احتمالا بخش پیشنهاد محصول آمازون، آشناترین قسمت کاربرد کلان‌داده برای کاربران است. طریقه پیشنهاد کالا این گونه است که بر اساس کالا‌هایی که در سبد خرید وجود دارند یا کالا‌هایی که قبلا سفارش داده شده‌اند، محصولات مربوط به آن‌ها را پیشنهاد می‌دهد.

پس از رونمایی از Amazon Personalize، این کمپانی به توسعه‌دهندگان اجازه داد تا در هر دامنه‌ای محصولاتی را به کاربران پیشنهاد دهند. دیگر کمپانی‌ها می‌توانند از این تکنولوژی آمازون استفاده کنند تا انواع کالا‌های خود را به مشتری هایشان معرفی کنند.

وقتی آمازون توانست برای هر مشتری، کالا‌هایی را معرفی کند که بیش‌تر به او مربوط است و آن‌ها را مجاب کرد تا بیش‌تر بخرند، درآمد آمازون افزایش یافت و در نهایت کاربران، آمازون را محلی مناسب برای انجام خرید‌های خود دیدند.
از داده برای پرکردن موجودی خود استفاده می‌کند؛ آمازون انبار‌های خود را Fulfillment Centers یا مراکز تکمیل نامیده است. تعجب‌آور نخواهد بود که از کلان‌داده این‌جا نیز استفاده شود. مثلا یکی از کاربرد‌های آن، هشدار دادن به کارکنانی است که آرام کار می‌کنند. هم‌چنین از داده‌ها برای ردیابی کالا‌هایی که بیش‌ترین میزان فروش را دارند، استفاده می‌کند.

آمازون، پتنتی به نام Anticipatory Shipping یا پیش‌بینی خرید دارد که قبل از این که کاربر محصولی را خریداری کند، می‌تواند خرید آن محصول را پیش‌بینی کند. قطعا بدون استفاده از کلان‌داده، آمازون نمی‌توانست به این موفقیت دست یابد.

کلان داده و کاربردهای سیاسی و اجتماعی آن /بخش دوم: سوءاستفاده‌های آمریکا از کلان‌داده


آمریکا چطور به داده‌های جهانی دسترسی دارد؟

بیش‌تر ارتباطات الکترونیکی جهان از ایالات متحده عبور می‌کند و عمده زیرساخت‌های اینترنت جهان در ایالات متحده مستقر است و همین موضوع، فرصتی را در اختیار آمریکا قرار داده است تا داده‌های کشور‌های دیگر را به بهانه محافظت از منافع ملی خود، ذخیره کرده و تحلیل کند.

اندکی پس از انتشار گزارش‌های گاردین و واشنگتن پست، مدیر اطلاعات ملی ایالات متحده، جیمز کلاپر، در ۷ ژوئن ۲۰۱۳، بیانیه‌ای منتشر کرد که تأیید می‌کرد نزدیک به ۶ سال، دولت ایالات متحده از شرکت‌های خدمات اینترنتی مانند فیسبوک برای جمع‌آوری اطلاعات خارجیان خارج از ایالات متحده استفاده کرده است.
توجیه استفاده از این اطلاعات، همان حمله ۱۱ سپتامبر و ارتباط جاسوسان داخلی با القاعده بود که به وضوح سوءاستفاده آمریکایی‌ها از اطلاعات کشور‌های خارجی با این بهانه، قابل درک است.

چه کشور‌هایی در استفاده از پریسم همکاری داشتند؟

ارتش آلمان در اوایل سال ۲۰۱۱ برای پشتیبانی از عملیات خود در افغانستان از PRISM استفاده می‌کرد.
روزنامه اسرائیلی کالکالیست، مقاله Business Insider را در رابطه با مشارکت دو شرکت اسرائیلی مخفی در برنامه PRISM - Verint Systems و Narus منتشر کرده بود.

افشاگری‌های بعدی اسنودن اظهاراتی بود مبنی بر این که آژانس‌های دولتی مانند GCHQ انگلستان نیز اقدام به رهگیری و ردیابی داده‌های اینترنت می‌کنند. در انگلستان، ستاد ارتباطات دولتی (GCHQ)، با برنامه نظارت Tempora، از ژوئن ۲۰۱۰ یا قبل از آن به برنامه PRISM دسترسی داشت. به طوری که تنها در سال ۲۰۱۲، ۱۹۷ گزارش با آن نوشت.

جالب است بدانید که در آگوست ۲۰۱۳، مأموران GCHQ از دفاتر روزنامه گاردین بازدید کردند، آن‌ها دستور تخریب هارد دیسک‌های حاوی اطلاعات به دست آمده از اسنودن را صادر کردند.

کشور‌های دیگر از جمله فرانسه نیز از این برنامه استفاده کرده‌اند که برای کسب اطلاعات بیش‌تر در این رابطه، بهتر است به منابعی که در ادامه می‌آوریم مراجعه کنید.

گزارش جدیدی از Freedom on the Net می‌گوید، که از هر ۱۰ کاربر اینترنت، ۹ نفر به صورت آنلاین تحت نظارت هستند. این کار ممکن است قبلا توسط تحلیلگران آغاز شده باشد، اما اکنون به صورت خودکار است.

پیشرفت در حوزه هوش مصنوعی و تجزیه و تحلیل الگو‌ها باعث شده تا میلیارد‌ها حساب بررسی شوند.

این‌ها همه ابزار‌هایی برای کنترل جمعیت و سرکوب سیاسی هستند که در ایالات متحده برای نظارت بر بازدیدکنندگان از کشور و در انگلیس برای نظارت بر تقریبا ۹۰۰۰ فعال سیاسی استفاده شدند.

این فعالیت‌ها همه از طریق ردیابی موقعیت جغرافیایی و تجزیه و تحلیل احساسات افراد از روی داده‌های به دست آمده از فیسبوک، توییتر و سایر سیستم عامل‌ها انجام می‌شود.

علاوه بر نظارت این کشورها، کشور‌های دیگر نیز می‌توانند از این داده‌ها برای مقاصد سیاسی و اقتصادی استفاده کنند که اعمال کنترل بر آن بسیار دشوارتر خواهد بود.

به موازات این، همه ما از همان سیستم عامل‌های رسانه‌های اجتماعی استفاده می‌کنیم، رسانه‌های اجتماعی به طرز خطرناکی به سمت غیرلیبرالیسم گرایش پیدا کرده‌اند و شهروندان را در معرض سرکوب آزادی‌های اساسی خود قرار می‌دهند. در نتیجه این روندها، آزادی اینترنت جهانی در سال‌های اخیر به شدت کاهش یافته است.

جاسوسان همیشه برای دستیابی به اطلاعات، ارتباطات را رصد می‌کردند. سرقت اسناد، گوش دادن به مکالمات و شکستن کد‌های پیام‌های مخفی، از اصول این حرفه است. انگلیسی‌ها از یک سیستم نظارتی الکترونیکی پیشرفته برای گوش دادن به افسران آلمانی اسیر شده در طی دهه ۱۹۴۰ استفاده کردند. آن‌چه که جدید است، حجم و گستردگی اطلاعات جمع‌آوری شده است.

در سال‌های اخیر و اعتراضات برخی از نمایندگان، به برنامه‌های پریسم و آپستریم، قانونی که این برنامه‌ها را مجاز می‌داند، قرار بود منقضی شود، اما کنگره آمریکا با کم‌ترین دشواری، قانونی بودن آن‌ها را تمدید کرد. به نظر می‌رسد که نظارت جهانی بر اینترنت دیگر در ایالات متحده بحث برانگیز نیست.

برنامه‌های Prism و Upstream برای جمع‌آوری ارتباطات آنلاین خارجی‌ها در خارج از ایالات متحده ارتقا یافته‌اند. پریسم ارتباطات را مستقیماً از خدمات اینترنتی مانند ارائه‌دهندگان ایمیل و برنامه‌های گفت‌وگوی ویدیویی می‌گیرد و آپستریم برای ایجاد ارتباطات به زیرساخت‌های اینترنت نفوذ کرده و داده‌های آن‌ها را جمع‌آوری می‌کند.

تیموتی ادگار، یکی از اعضای موسسه امور عمومی واتسون در دانشگاه براون، گفت که وقتی این برنامه‌ها برای اولین بار علنی شدند، اعتراض فقط معطوف به اطلاعات آمریکایی‌ها نبود. ادگار تا زمانی که در دفتر مدیر اطلاعات ملی استخدام شود، در زمینه‌های حفظ حریم خصوصی در ACLU کار می‌کرد.

نقش او اطمینان حاصل کردن از مطابقت برنامه‌های جاسوسی دولت با قوانین ایالات متحده بود. وقتی اسنودن اطلاعات مربوط به پریسم و آپستریم را فاش کرد، ادگار گفت: «این در واقع شرحی از نظارت جهانی است. NSA واقعا توانایی جمع‌آوری داده‌های سراسر جهان را دارد.»