در شرایطی که تامینکنندههای حجم عظیم دادهها (بزرگ دادهها) همه تلاش خود را میکنند تا افراد را از دسترسی به مجموعه اطلاعات مربوط به دیگران دور نگهدارند، خطر دسترسی به این دادهها و شناسایی افراد، بسیار واقعی است.
منبع : روزنامه دنیای اقتصاد
در شرایطی که تامینکنندههای حجم عظیم دادهها (بزرگ دادهها) همه تلاش خود را میکنند تا افراد را از دسترسی به مجموعه اطلاعات مربوط به دیگران دور نگهدارند، خطر دسترسی به این دادهها و شناسایی افراد، بسیار واقعی است.
به گزارش افتانا (پایگاه خبری امنیت فناوری اطلاعات)، شاید انبوه اطلاعات موجود در تلفنهای همراه، غیر قابل شناسایی به نظر برسند، اما یک مطالعه روی اطلاعات ۵/۱ میلیون کاربر گوشیهای همراه در اروپا نشان داد که تنها وجود چهار نقطه مرجع کافی است که بر اساس آن بتوان ۹۵ درصد افراد را شناسایی کرد.
محققان مشاهده کردند که روش کار افراد در شهرهای مختلف متفاوت است و با در نظر گرفتن این موضوع که از مجموعه اطلاعات مردم تا چه حد میتوان استنتاج کرد، پنهان ماندن هویت صاحب اطلاعات به یک «نگرانی روزافزون» بدل میشود. به مدد دانشمندانی چون آلساندرو آکوییستی، ما هماکنون میدانیم که چگونه میتوان کد تامین اجتماعی افراد را با تحلیل دادههایی که به راحتی در دسترس عموم قرار دارند، پیشبینی کرد.
اما مشکل حریم شخصی خیلی فراتر از خطرات معمول در راه مخفی نگهداشتن هویت صاحب اطلاعات است. هم اکنون اطلاعات پزشکی که به شرکتهای تحلیلگر به فروش میرسند، این خطر را در پی دارند که برای پیگیری هویت شما مورد استفاده قرار گیرند. به تازگی حرفهای زیادی درباره داروهای شخصی شنیده میشود به این معنا که امید میرود داروها و سایر درمانها چنان فردی شوند که تنها برای بدن شخص مورد نظر بکار گرفته شوند گویی که مخصوص دیانای آن فرد در نظر گرفته شدهاند.
این یک دستاورد حیرتانگیز در جهت ارتقای علم پزشکی به شمار می رود، اما اساسا بر هویت فرد در سطح سلولی و ژنتیکی متکی است و خطر بسیار زیادی وجود دارد که از این اطلاعات، نادرست استفاده شود یا فاش شوند. اما به رغم رشد سریع مراکز جمعآوری اطلاعات پزشکی افراد، از جمله مرکز رانکیپر و نایک پلاس، استفاده عملی از حجم عظیم اطلاعات برای بهبود پزشکی هنوز بیشتر جنبه حرف دارد تا عمل.
سایر انواع اطلاعات محرمانه توسط مراکز بزرگ دادههای انرژی، از جمله اسمارت گرید جمعآوری میشوند. این تلاش با هدف بهبود بهرهوری در توزیع انرژی و رساندن آن به منازل و دفاتر کار انجام میشود و در آن مجموعههای عظیمی از اطلاعات مربوط به مصرف انرژی مصرفکنندگان مورد تحلیل قرار میگیرند. چشماندازهای فوقالعادهای پیش روی این پروژه قرار دارد، اما خطراتی را هم در زمینه حفظ حریم شخصی به همراه میآورد.
در این پروژه نه تنها میتوان پیشبینی کرد که چه مقدار انرژی نیاز داریم و آن را چه زمان میخواهیم، بلکه اطلاعات لحظه به لحظه در مورد اینکه در کجای خانه خود هستیم و چه کاری انجام میدهیم هم در دسترس است. از جمله اینکه چه زمانی زیر دوش هستیم، چه زمانی مهمانهای شام ما خانهمان را ترک میکنند و چه زمانی چراغها را خاموش میکنیم که بخوابیم و صد البته که چنین دادههای عظیمی که به شدت خصوصی هستند، هدف اولیه هکرها و جاسوسها هستند.
ویکی لیکس در مرکز برخی از این حجم عظیم دادههای مربوط به دورانهای اخیر قرار داشت و همانطور که به تازگی نشت دادهها از صنعت مالی فراساحل بریتانیا نشان داد، میزان آسیبپذیری تنها یک درصد از این مراکز در برابر فاش شدن اطلاعات خصوصیشان برابر با آسیبپذیری افراد است. آینده علم
بزرگ دادهها آینده علم هستند. این جمله تا حدودی درست است اما هنوز جای کار دارد. بی شک ، بزرگ دادهها مسیرهای جدیدی را به روی علم میگشایند. کافی است نگاهی به کشف ذره بوزون توسط هیگز بیندازیم که حاصل بزرگترین محاسبات پروژه کامپیوتری در تاریخ بود.
اما اگر ما ضعفهای موروثی بزرگ دادهها را که بر زندگی انسان تاثیر گذار است تشخیص ندهیم و برطرف نکنیم، ممکن است سیاستهای عمده دولتی و تصمیمات تجاری خود را بر اساس فرضیات غلط اتخاذ کنیم. برای مقابله با چنین خطری، دانشمندان حوزه دادهها، همکاری خود را با دانشمندان حوزه اجتماعی که مدتهای زیادی است منتقد دادهها هستند، آغاز کردهاند.
این به آن معنا است که در طول زمان، راههای تازهای برای تلفیق روشهای بزرگدادهها با مطالعات دادههای جزئی یافت خواهد شد. روشهای جدید تلفیقی میتواند پرسشهایی را به دست دهد در مورد اینکه چرا افراد کاری را انجام میدهند علاوه بر اینکه آن کار با چه بسامدی انجام میشود. این به معنای تحلیل اجتماعی و دیدگاه عمیق قومی است در کنار بازیابی اطلاعات و آموزشهای ماشینی.
شرکتهای فناوری خیلی زود دریافتند که دانشمندان علوم اجتماعی میتوانند به آنها چشمانداز بهتری بدهند در مورد اینکه افراد چگونه و چرا به سمت محصولات آنها روی میآورند. این درست مانند زمانی است که شرکت زیراکس یک انسانشناس به نام لوسی ساچمن را به استخدام خود در آورد. گام بعدی همکاری غنیتری است که بین دانشمندان علوم کامپیوتری، متخصصان آمار، و دانشمندان علوم اجتماعی شکل خواهد گرفت، نه فقط برای آزمودن کارهای یکدیگر، بلکه برای طرح پرسشهایی اساسا متفاوت با سختگیریهای بیشتر.
با توجه به حجم عظیم دادهها که هر روز درباره ما جمعآوری میشود، از جمله کلیکهای فیسبوک، دادههای جیپیاس، تجویزهای پزشکی، باید هر چه زودتر تصمیم بگیریم که در مورد آن اطلاعات به چه کسی میتوانیم اعتماد کنیم و به چه منظور. ما نمیتوانیم از این واقعیت فرار کنیم که دادهها هرگز خنثی و بیاثر نیستند و دشوار است که هویت صاحب دادهها پنهان بماند. اما میتوانیم از تخصص در زمینههای مختلف استفاده کنیم تا بتوانیم تاثیرات، خلأها و فرضیات موجود را بهتر تشخیص دهیم و از این طریق در برابر چالشهایی که بر سر حفظ حریم شخصی و عدالت وجود دارد، بایستیم.