一种高效的差分隐私随机森林训练算法
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

赵陈斌,E-mail:chenbinzhao96@whu.edu.cn

中图分类号:

TP309

基金项目:

国家自然科学基金项目(61702341);深圳技术大学深圳市高等院校稳定支持项目(SZWD2021012);深圳技术大学研究生校企合作研究基金项目(20223108010009)


Efficient Differential Privacy Random Forest Training Algorithm
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    差分隐私凭借其强大的隐私保护能力被应用在随机森林算法解决其中的隐私泄露问题,然而,直接将差分隐私应用在随机森林算法会使模型的分类准确率严重下降.为了平衡隐私保护和模型准确性之间的矛盾,本文创新性地提出了一种高效的差分隐私随机森林训练算法——eDPRF(efficient Differential Privacy Random Forest, eDPRF).具体而言,该算法创新设计了决策树构建方法,通过引入重排翻转机制高效的查询输出优势,进一步设计相应的效用函数实现分裂特征以及标签的精准输出,有效改善树模型在扰动情况下对于数据信息的学习能力.同时基于组合定理设计了隐私预算分配的策略,通过不放回抽样获得训练子集以及差异化调整内部预算的方式提高树节点的查询预算.最后,通过理论分析以及实验评估,表明本文算法在给定相同隐私预算的情况下,模型的分类准确度优于同类算法.

    Abstract:

    Differential privacy, with its powerful privacy protection ability, has been applied in random forest algorithms to solve privacy leakage problem. However, directly applying differential privacy to random forest will seriously reduce the classification accuracy of the model. Therefore, in order to alleviate the contradiction between privacy protection and model accuracy, this paper proposes a novel differential privacy random forest training algorithm, called eDPRF. Specifically, we design a decision tree construction method based on permute-and-flip mechanism, which utilizes the efficient query output advantage of this mechanism to design corresponding utility functions to achieve precise output of split features and labels. At the same time, we design a privacy budget allocation strategy based on composition theorem, which improves the privacy budget utilization rate of nodes by obtaining training subsets without replacement sampling and adjusting internal budgets through differentiation. Finally, privacy analysis and experimental results show that proposed algorithm outperforms similar algorithms in terms of classification accuracy given the same privacy budget.

    参考文献
    相似文献
    引证文献
引用本文

王树兰,邱瑶,赵陈斌,邹家须,王彩芬.一种高效的差分隐私随机森林训练算法.软件学报,2025,36(7):0

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2024-07-10
  • 最后修改日期:2024-10-15
  • 录用日期:
  • 在线发布日期: 2024-12-10
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号