Pobe: 一种基于生成式模型的分布外文本检测方法
作者:
作者单位:

作者简介:

欧阳亚文(1996-), 男, 博士生, 主要研究领域为自然语言理解, 开放环境下的机器学习;高源(1998-), 男, 硕士生, 主要研究领域为自然语言处理, 机器学习;宗石(1992-), 男, 博士, 主要研究领域为计算语言学;鲍宇(1993-), 男, 博士, 主要研究领域为自然语言处理, 科学智能;戴新宇(1979-), 男, 博士, 教授, 博士生导师, CCF专业会员, 主要研究领域为自然语言处理, 知识工程.

通讯作者:

戴新宇, E-mail: daixinyu@nju.edu.cn

中图分类号:

TP18

基金项目:

国家自然科学基金 (61936012, 61976114)


Pobe: Generative Model-based Out-of-distribution Text Detection Method
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    对于安全可靠的机器学习系统, 具备检测训练集分布外 (out-of-distribution, OOD) 样本的能力十分必要. 基于似然的生成式模型由于训练时不需要样本标签, 是一类非常受欢迎的OOD检测方法. 然而, 近期研究表明通过似然来检测OOD样本往往会失效, 并且失效原因与解决方案的探究仍较少, 尤其是对于文本数据. 从模型层面和数据层面分析文本上失效的原因: 生成式模型的泛化性不足和文本先验概率的偏差. 在此基础上, 提出一种新的OOD文本检测方法Pobe. 针对生成式模型泛化性不足的问题, 引入KNN检索的方式, 来提升模型的泛化性. 针对文本先验概率偏差的问题, 设计一种偏差校准策略, 借助预训练语言模型改善概率偏差对OOD检测的影响, 并通过贝叶斯定理证明策略的合理性. 通过在广泛的数据集上进行实验, 证明所提方法的有效性, 其中, 在8个数据集上的平均AUROC值超过99%, FPR95值低于1%.

    Abstract:

    It is essential to detect out-of-distribution (OOD) training set samples for a safe and reliable machine learning system. Likelihood-based generative models are popular methods to detect OOD samples because they do not require sample labels during training. However, recent studies show that likelihoods sometimes fail to detect OOD samples, and the failure reason and solutions are under explored, especially for text data. Therefore, this study investigates the text failure reason from the views of the model and data: insufficient generalization of the generative model and prior probability bias of the text. To tackle the above problems, the study proposes a new OOD text detection method, namely Pobe. To address insufficient generalization of the generative model, the study increases the model generalization via KNN retrieval. Next, to address the prior probability bias of the text, the study designs a strategy to calibrate the bias and improve the influence of probability bias on OOD detection by a pre-trained language model and demonstrates the effectiveness of the strategy according to Bayes’ theorem. Experimental results over a wide range of datasets show the effectiveness of the proposed method. Specifically, the average AUROC is over 99%, and FPR95 is below 1% under eight datasets.

    参考文献
    相似文献
    引证文献
引用本文

欧阳亚文,高源,宗石,鲍宇,戴新宇. Pobe: 一种基于生成式模型的分布外文本检测方法.软件学报,2024,35(9):4365-4376

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-06-02
  • 最后修改日期:2022-09-20
  • 录用日期:
  • 在线发布日期: 2023-09-20
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号