استفاده از ابزار‌های استخراج داده برای مبارزه با کرونا

استفاده از ابزار‌های استخراج داده برای مبارزه با کرونا
تاریخ انتشار : ۰۴ شهريور ۱۴۰۰

دانشمندان علوم کامپیوتر به دنبال استفاده از ابزار‌های استخراج داده برای مبارزه با اطلاعات نادرست پیرامون کرونا و تشخیص علائم آن هستند.

به گزارش گرداب، دانشمندان علوم کامپیوتر از دانشگاه ریورساید در حال ساختن ابزاری برای کمک به ردیابی و نظارت بر علائم بیماری کووید-۱۹ هستند و سعی دارند تا اطلاعات غلط موجود در رسانه‌های اجتماعی در مورد این بیماری را به دقت بررسی کنند.

با استفاده از داده‌های گوگل ترندز، یک گروه به رهبری واگلیس پاپالکساکیس که دانشیاری در کالج مهندسی بورنز است و جیا چن که استادیار آموزشی است، الگوریتمی را ایجاد کردند که سه ویژگی منحصر به فرد بیماری کووید-۱۹ را در مقایسه با آنفولانزا شناسایی می‌کند.

این سه ویژگی عبارتند از: از دست دادن حس چشایی، تنگی نفس و اختلال بویایی یا از دست دادن حس بویایی. این الگوریتم با کمک دو دانشجوی فارغ‌التحصیل پزشکی به نام‌های ایمرول کیش و جاکر حسین از دانشگاه تگزاس ریو ایجاد شد.

پاپالکساکیس گفت: «بسیاری از افراد از گوگل ترندز برای پیش‌بینی فصل آنفولانزا استفاده می‌کنند، اما ما از این قابلیت برای پیدا کردن علائم خاص مربوط به کووید-۱۹ در بین علائم شبه آنفولانزا استفاده کردیم». محققان از روشی به نام DNA برای تجزیه و تحلیل داده‌های مربوط به ۲۰۱۹ و ۲۰۲۰ استفاده کردند.

چن گفت: «فرض ما بر این بود که در بین داده‌های مربوط به سال ۲۰۱۹، علائم بیماری آنفولانزا یا سایر بیماری‌های تنفسی را پیدا کنیم و در بین داده‌های مربوط به سال ۲۰۲۰ نیز دنبال همان علائم رفتیم. با استفاده از روش DNA توانستیم تا تفاوت بین دو مجموعه داده را پیدا کنیم».

پاپالکساکیس و چن امیدوارند که کار آن‌ها به اپیدمیولوژیست‌ها و سایر متخصصان بهداشت عمومی کمک کند تا بتوانند با استفاده از گوگل ترندز، علائم کووید-۱۹ را ردیابی و نظارت کنند. پاپالکساکیس گفت: «داده‌های موجود در گوگل ترندز شاید زیاد و شلوغ باشند، اما داده‌های بیمارستان در دسترس عموم قرار نمی‌گیرند. مردم درباره‌ی علائم بیماری جست‌وجو می‌کنند تا اطلاعات بیش‌تری درباره‌ی آن به دست بیاورند یا ممکن است خود آن علائم را داشته باشند. داده‌های حاصل از جست‌وجوی مردم در اینترنت، اطلاعات بیش‌تری را نسبت به این که خود افراد به علائم خاصی مبتلا شوند در اختیار می‌گذارد. با توجه به نبود داده‌های دیگر، به نظر ما این ابزار می‌تواند به محققان کمک کند تا درک بهتری از علائم بیماری داشته باشند».

چن اظهار داشت که الگوریتم مورد نظر، ساده و برای دانشمندانی که می‌خواهند درباره‌ی بیماری‌های دیگر تحقیق کنند، به راحتی قابل استفاده است.

پاپالکساکیس و ویلیام شیائو که دانشجوی دکتری در دانشگاه ریورساید هستند، با همکاری یک‌دیگر در حال ساختن ابزار جدیدی برای شناسایی اطلاعات غلط درباره¬ی کووید-۱۹ هستند. آن‌ها از ۹۰ هزار مقاله‌ی مربوط به کووید-۱۹ که توسط کاخ سفید و ائتلافی از گروه‌های تحقیقاتی تهیه شده بود، استفاده کردند و حدود ۲۰ هزار مقاله را که دارای اطلاعات نادرست درباره‌ی ویروس کرونا بود، جمع‌آوری کردند.

آن‌ها از روشی که آن را KI۲TE نامیدند، مقاله‌ها را به مجموعه‌ای از اسناد مرجع پیوند داده و آن‌ها را تفسیر کردند. اسنادی که به عنوان مرجع مورد استفاده قرار گرفتند مجموعه‌ای از مقالات دانشگاهی در زمینه‌ی تحقیقات درباره‌ی ویروس کرونا بود که در مجموعه داده‌ی CORD-۱۹ گنجانده شده بودند.

وقتی این ابزار مورد آزمایش قرار گرفت، روش آن‌ها نه تنها اطلاعات غلط را به درستی شناسایی کرد بلکه منابع علمی درست را نیز در اختیار قرار می‌داد.

پاپالکساکیس گفت: «ما علاقه‌ای به سانسور اطلاعاتی که مردم می‌بینند نداریم و ترجیح می‌دهیم تا فقط برچسب هشداری روی بخش‌های مختلف بزنیم. ما می‌خواهیم تا مردم به منابع درست و معتبر دسترسی پیدا کنند».

هرچند ابزاری که توسط این دو فرد ساخته شده هنوز در مراحل اولیه قرار دارد، اما در نهایت می‌توان از آن در تلفن‌های هوشمند یا شبکه‌های اجتماعی مانند فیسبوک استفاده کرد.

منبع: University of California - Riverside