حفظ حریم خصوصی در برون‌سپاری داده‌های سامانه‌های اطلاعاتی با تکیه بر سودمندی داده

نویسنده

دانشگاه صنعتی همدان، همدان ، ایران

چکیده

پژوهش‌های اخیر نشان می‌دهد که داده یکی از ارزشمندترین سرمایه‌های سازمان‌ها و کسب کارها  است.  پردازش و تحلیل  داده‌ها به شرکت‌ها وسازمان‌ها کمک می‌کند تا بینش لازم را کسب کرده و از آن در راستای تصمیم‌گیری استراتژیک بهره گیرند. انتشار و فراهم کردن دسترسی باز به اطلاعات به یک فرایند متداول و نیاز حیاتی سازمان‌های دولتی و خصوصی مبدل شده است. داده‌های جمع‌آوری شده در سازمان‌ها حاوی اطلاعات خصوصی افراد است که انتشار آنها می‌تواند منجر به افشای اطلاعات حساس و نقض حریم خصوصی‌ شود. اطلاعات حساس همچنین اسرار دولتی و اسرار تجاری را نیز شامل می‌شود. چالش اصلی حوزه حفظ حریم خصوصی در انتشار داده، انتشار یک شکل تغییریافته از داده‌های جمع‌آوری شده است که بتواند حریم خصوصی مالکان داده را حفظ نماید و قابلیت پاسخ به پرس‌وجوها و تحلیل‌های داده‌کاوی را با دقت مناسب داشته باشد. در سناریوی انتشار داده حفاظت از حریم خصوصی مالکان در حضور دانش پیش‌زمینه مهاجم مهم است. چارچوب گمنامی به عنوان یکی از راهبردهای حفظ حریم خصوصی، سودمندی داده راکاهش می‌دهد. در این پژوهش برآنیم یک چارچوب گمنامی برای ممانعت از حمله دانش پیش‌زمینه، افشای هویت و ویژگی مالکان  طراحی کنیم که سودمندی داده‌های گمنام را بیشینه کند. برای این منظور بعد از مدل‌سازی دانش پیش‌زمینه مهاجم، مدل حریم خصوصی تعیین و در ادامه الگوریتم گمنامی ارائه می‌شود. تمرکز این پژوهش بر مدل‌های حریم خصوصی نحوی مانند k- گمنامی و توسعه‌های آن است. الگوریتم پیشنهادی رکوردها را به چندین گروه‌ افراز می‌کند به نحوی‌که در هرگروه‌ مدل حریم خصوصی برآورده می‌شود. نتایج به کارگیری  چارچوپ پیشنهادی بر روی دو مجموعه داده ارزیابی و تحلیل می‌شود. برای ارزیابی کارایی چارچوب پیشنهادی از معیارهای سودمندی و حریم خصوصی استفاده می‌شود. نتایج آزمایشات نشان می‌دهد چارچوب پیشنهادی از نظر سودمندی بر الگوریتم های ارائه شده در جدیدترین پژوهش‌ها برتری دارد.

کلیدواژه‌ها


عنوان مقاله [English]

Privacy in Database Publishing in the Presence of Adversary’s Background Knowledge

نویسنده [English]

  • Fatemeh Amiri
چکیده [English]

Recent research shows that Data is one of the most valuable and important assets of organizations and businesses. Privacy in the dissemination of Data is becoming increasingly challenging. Anonymity as one of the privacy strategies, on the one side, conceals the relationship between individuals and records in a metadata table and, on the other side, preserves the usefulness of the data for subsequent analysis. Preventing information disclosure becomes difficult when the adversary possesses background knowledge. We propose an anonymization framework to protect against background knowledge attack, identity disclosure, and feature disclosure. The anonymization algorithm creates equivalence classes of records whose probability distributions extracted by background knowledge are similar. Our proposed algorithm satisfies k-anonymity and its extension too. The proposed anonymity algorithm tries to satisfy the privacy model while preserving the usefulness of the anonymous data. We verify the theoretical study by experimentation on two datasets. Experimental results show that our proposed algorithm outperforms the state of the art anonymization approaches in terms of loss of information.

کلیدواژه‌ها [English]

  • Privacy Preservation
  • Data Publishing
  • Background Knowledge
  • Hierarchical Anonymization Algorithm
  • Information Loss Metric