MCL4DGA: 基于多视角对比学习的DGA域名检测方法
作者:
作者单位:

作者简介:

王继虎(1992-), 男, 博士生, 主要研究领域为网络安全, 深度学习, 数据挖掘. ;刘子雁(1990-), 男, 硕士, 主要研究领域为数据挖掘, 软件工程, 网络安全. ;倪金超(1990-), 男, 硕士, 主要研究领域为软件工程, 软件测试, 网络安全. ;孔凡玉(1978-), 男, 博士, 副教授, CCF专业会员, 主要研究领域为数据安全与隐私计算, 信息安全. ;史玉良(1978-), 男, 博士, 教授, 博士生导师, CCF专业会员, 主要研究领域为大数据, 人工智能, 信息安全.

通讯作者:

史玉良, E-mail: shiyuliang@sdu.edu.cn

中图分类号:

TP393

基金项目:

山东省重点研发计划(重大科技创新工程)(2021CXGC010103)


MCL4DGA: DGA Domain Detection Method Based on Multi-view Contrastive Learning
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    在网络安全领域, 由域名生成算法(domain generation algorithm, DGA)产生的虚假域名被称为DGA域名. 与正常域名类似的是, DGA域名通常是字母或数字的随机组合, 这使得DGA域名具有较强的伪装性. 网络黑客利用DGA域名的伪装性实施网络攻击, 以达到绕过安全检测的目的. 如何有效地对DGA域名进行检测, 进而维护信息系统安全, 成为当前的研究热点. 传统的统计机器学习检测方法需要人工构建域名字符特征集合. 然而, 人工或者半自动化方式构建的域名特征存在质量参差不齐的情况, 进而影响检测的准确性. 鉴于深度神经网络强大的特征自动化抽取和表示能力, 提出一种基于多视角对比学习的DGA域名检测方法(MCL4DGA). 与现有方法不同的是, 所提方法结合了注意力神经网络、卷积神经网络和循环神经网络, 能够有效地捕获域名字符序列中的全局、局部和双向多视角特征依赖关系. 除此之外, 通过多视角表示向量之间的对比学习而产生的自监督信号, 能够增强模型的学习能力, 进而提高检测的准确性. 通过在真实数据集上与当前DGA域名检测方法实验对比验证了所提方法的有效性.

    Abstract:

    In the field of cyber security, the mendacious domains generated by the domain generation algorithm (DGA) are called DGA domains. Similar to real domains, they are usually a random combination of characters or numbers, which makes DGA domains highly camouflaged. Hackers take advantage of the disguised nature of DGA domains to carry out cyber attacks, so as to bypass security detection. How to effectively detect DGA domains has become a research hotspot. Traditional statistical machine learning detection methods require the manual construction of domain feature sets. However, the quality of domain features constructed manually or semi-automatically varies, which affects the accuracy of detection. In view of the powerful automatic feature extraction and representation capability of deep neural networks, a DGA domain detection method based on multi-view contrastive learning (MCL4DGA) is proposed. Different from existing methods, it incorporates attentional neural networks, convolutional neural networks, and recurrent neural networks to effectively capture global, local, and bidirectional multi-view feature dependencies of domain sequences. Besides, the self-supervision signals derived by contrastive learning can enhance the expressiveness between multi-view feature learning encoders and thus improve the accuracy of detection. The effectiveness of the proposed method is verified by experimental comparison with current methods on a real dataset.

    参考文献
    相似文献
    引证文献
引用本文

王继虎,刘子雁,倪金超,孔凡玉,史玉良. MCL4DGA: 基于多视角对比学习的DGA域名检测方法.软件学报,2024,35(11):5228-5248

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-03-28
  • 最后修改日期:2023-02-04
  • 录用日期:
  • 在线发布日期: 2023-11-29
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号