حمله بزرگ داده‌ها به حریم شخصی ما

در شرایطی که تامین‌کننده‌های حجم عظیم داده‌ها (بزرگ داده‌ها) همه تلاش خود را می‌کنند تا افراد را از دسترسی به مجموعه اطلاعات مربوط به دیگران دور نگه‌دارند، خطر دسترسی به این داده‌ها و شناسایی افراد، بسیار واقعی است.

به گزارش افتانا (پایگاه خبری امنیت فناوری اطلاعات)، شاید انبوه اطلاعات موجود در تلفن‌های همراه، غیر قابل شناسایی به نظر برسند، اما یک مطالعه روی اطلاعات ۵/۱ میلیون کاربر گوشی‌های همراه در اروپا نشان داد که تنها وجود چهار نقطه مرجع کافی است که بر اساس آن بتوان ۹۵ درصد افراد را شناسایی کرد.

محققان مشاهده کردند که روش کار افراد در شهرهای مختلف متفاوت است و با در نظر گرفتن این موضوع که از مجموعه اطلاعات مردم تا چه حد می‌توان استنتاج کرد، پنهان ماندن هویت صاحب اطلاعات به یک «نگرانی روزافزون» بدل می‌شود. به مدد دانشمندانی چون آلساندرو آکوییستی، ما هم‌اکنون می‌دانیم که چگونه می‌توان کد تامین اجتماعی افراد را با تحلیل داده‌هایی که به راحتی در دسترس عموم قرار دارند، پیش‌بینی کرد.

اما مشکل حریم شخصی خیلی فراتر از خطرات معمول در راه مخفی نگهداشتن هویت صاحب اطلاعات است. هم اکنون اطلاعات پزشکی که به شرکت‌های تحلیلگر به فروش می‌رسند، این خطر را در پی دارند که برای پیگیری هویت شما مورد استفاده قرار گیرند.
به تازگی حرف‌های زیادی درباره داروهای شخصی شنیده می‌شود به این معنا که امید می‌رود داروها و سایر درمان‌ها چنان فردی شوند که تنها برای بدن شخص مورد نظر بکار گرفته شوند گویی که مخصوص دی‌ان‌ای آن فرد در نظر گرفته شده‌اند.

این یک دستاورد حیرت‌انگیز در جهت ارتقای علم پزشکی به شمار می رود، اما اساسا بر هویت فرد در سطح سلولی و ژنتیکی متکی است و خطر بسیار زیادی وجود دارد که از این اطلاعات، نادرست استفاده شود یا فاش شوند.
اما به رغم رشد سریع مراکز جمع‌آوری اطلاعات پزشکی افراد، از جمله مرکز ران‌کیپر و نایک پلاس، استفاده عملی از حجم عظیم اطلاعات برای بهبود پزشکی هنوز بیشتر جنبه حرف دارد تا عمل.

سایر انواع اطلاعات محرمانه توسط مراکز بزرگ داده‌های انرژی، از جمله اسمارت گرید جمع‌آوری می‌شوند. این تلاش با هدف بهبود بهره‌وری در توزیع انرژی و رساندن آن به منازل و دفاتر کار انجام می‌شود و در آن مجموعه‌های عظیمی از اطلاعات مربوط به مصرف انرژی مصرف‌کنندگان مورد تحلیل قرار می‌گیرند. چشم‌اندازهای فوق‌العاده‌ای پیش روی این پروژه قرار دارد، اما خطراتی را هم در زمینه حفظ حریم شخصی به همراه می‌آورد.

در این پروژه نه تنها می‌توان پیش‌بینی کرد که چه مقدار انرژی نیاز داریم و آن را چه زمان می‌خواهیم، بلکه اطلاعات لحظه به لحظه در مورد اینکه در کجای خانه خود هستیم و چه کاری انجام می‌دهیم هم در دسترس است.
از جمله اینکه چه زمانی زیر دوش هستیم، چه زمانی مهمان‌های شام ما خانه‌مان را ترک می‌کنند و چه زمانی چراغ‌ها را خاموش می‌کنیم که بخوابیم و صد البته که چنین داده‌های عظیمی که به شدت خصوصی هستند، هدف اولیه هکرها و
جاسوس‌ها هستند.

ویکی لیکس در مرکز برخی از این حجم عظیم داده‌های مربوط به دوران‌های اخیر قرار داشت و همان‌طور که به تازگی نشت داده‌ها از صنعت مالی فراساحل بریتانیا نشان داد، میزان آسیب‌پذیری تنها یک درصد از این مراکز در برابر فاش شدن اطلاعات خصوصی‌شان برابر با آسیب‌پذیری افراد است.

آینده علم

بزرگ داده‌ها آینده علم هستند. این جمله تا حدودی درست است اما هنوز جای کار دارد. بی شک ، بزرگ داده‌ها مسیرهای جدیدی را به روی علم می‌گشایند. کافی است نگاهی به کشف ذره بوزون توسط هیگز بیندازیم که حاصل بزرگ‌ترین محاسبات پروژه کامپیوتری در تاریخ بود.

اما اگر ما ضعف‌های موروثی بزرگ داده‌ها را که بر زندگی انسان تاثیر گذار است تشخیص ندهیم و برطرف نکنیم، ممکن است سیاست‌های عمده دولتی و تصمیمات تجاری خود را بر اساس فرضیات غلط اتخاذ کنیم.
برای مقابله با چنین خطری، دانشمندان حوزه داده‌ها، همکاری خود را با دانشمندان حوزه اجتماعی که مدت‌های زیادی است منتقد داده‌ها هستند، آغاز کرده‌اند.

این به آن معنا است که در طول زمان، راه‌های تازه‌ای برای تلفیق روش‌های بزرگ‌داده‌ها با مطالعات داده‌های جزئی یافت خواهد شد. روش‌های جدید تلفیقی می‌تواند پرسش‌هایی را به دست دهد در مورد اینکه چرا افراد کاری را انجام می‌دهند علاوه بر اینکه آن کار با چه بسامدی انجام می‌شود. این به معنای تحلیل اجتماعی و دیدگاه عمیق قومی است در کنار بازیابی اطلاعات و آموزش‌های ماشینی.

شرکت‌های فناوری خیلی زود دریافتند که دانشمندان علوم اجتماعی می‌توانند به آنها چشم‌انداز بهتری بدهند در مورد اینکه افراد چگونه و چرا به سمت محصولات آنها روی می‌آورند. این درست مانند زمانی است که شرکت زیراکس یک انسان‌شناس به نام لوسی ساچمن را به استخدام خود در آورد.
گام بعدی همکاری غنی‌تری است که بین دانشمندان علوم کامپیوتری، متخصصان آمار، و دانشمندان علوم اجتماعی شکل خواهد گرفت، نه فقط برای آزمودن کارهای یکدیگر، بلکه برای طرح پرسش‌هایی اساسا متفاوت با سختگیری‌های بیشتر.

با توجه به حجم عظیم داده‌ها که هر روز درباره ما جمع‌آوری می‌شود، از جمله کلیک‌های فیس‌بوک، داده‌های جی‌پی‌اس، تجویزهای پزشکی، باید هر چه زودتر تصمیم بگیریم که در مورد آن اطلاعات به چه کسی می‌توانیم اعتماد کنیم و به چه منظور. ما نمی‌توانیم از این واقعیت فرار کنیم که داده‌ها هرگز خنثی و بی‌اثر نیستند و دشوار است که هویت صاحب داده‌ها پنهان بماند.
اما می‌توانیم از تخصص در زمینه‌های مختلف استفاده کنیم تا بتوانیم تاثیرات، خلأها و فرضیات موجود را بهتر تشخیص دهیم و از این طریق در برابر چالش‌هایی که بر سر حفظ حریم شخصی و عدالت وجود دارد، بایستیم.