龚奇源,杨明,罗军舟.面向关系-事务数据的数据匿名方法.软件学报,2016,27(11):2828-2842 |
面向关系-事务数据的数据匿名方法 |
Data Anonymization Approach for Microdata with Relational and Transaction Attributes |
投稿时间:2015-11-09 修订日期:2016-02-23 |
DOI:10.13328/j.cnki.jos.005099 |
中文关键词: 数据匿名 隐私泄露 k-匿名 l-多样化 关系-事务数据 |
英文关键词:data anonymization privacy breach k-anonymity l-diversity RT-data |
基金项目:国家自然科学基金(61272054,61572130,61632008,61320106007,61502100,61402104);江苏省自然科学基金(BK20150628,BK20140648,BK20150637);中央高校基本科研业务费专项资金(2242014R30010);江苏省科技支撑项目(BE2014603);江苏省青蓝工程;江苏省网络与信息安全重点实验室资助项目(BM2003201);教育部网络与信息集成重点实验室资助项目(93K-9) |
|
摘要点击次数: 2553 |
全文下载次数: 1822 |
中文摘要: |
在发布同时包含关系和事务属性的数据(简称为关系-事务数据)时,由于关系数据和事务数据均有可能受到链接攻击,需要同时匿名这两部分的数据.现有的数据匿名技术在匿名化关系-事务数据时会造成严重的数据缺损,无法保障数据可用性.针对此问题,提出了(k,l)-多样化模型,通过等价类上的l-多样化约束和事务数据上的k-匿名约束来保证用户隐私不被泄露.在此基础上,设计并实现了APA和PAA两种满足该模型的匿名算法,以不同的顺序对关系-事务数据进行匿名,并提出了相应的数据缺损评估方法.实际公开数据集上的实验结果表明,与现有的数据匿名技术相比,APA和PAA能够在保护用户隐私的前提下,以更低的数据缺损和更高的效率完成对关系-事务数据的匿名. |
英文摘要: |
When publishing datasets that contain relational and transaction attributes, referred to as RT-data for briefness, either type of data may suffer from linking attacks. Anonymizing both of them is essential. However, previous approaches suffer from huge information loss during anonymizing RT-data, and they fail to preserve the utility of datasets. To address this problem, an anonymization model, (k,l)-diversity is proposed to ensure privacy by guaranteeing l-diversity on each equivalence class and k-anonymity on transaction data. In addition, two heuristic algorithms named APA and PAA, which anonymize RT-data in different orders, are also provided to achieve (k,l)-diversity. Extensive experiments based on real-world dataset show that APA and PAA outperform existing approaches in terms of execution time and information loss. |
HTML 下载PDF全文 查看/发表评论 下载PDF阅读器 |