1. 中国科学院大学 人工智能学院, 北京 100049;
2. 中国科学院 自动化研究所 智能系统与工程研究中心, 北京 100190;
3. 中国科学院 脑科学与智能技术卓越创新中心, 上海 200031
黄文振(1992-), 男, 博士, 主要研究领域为强化学习;尹奇跃(1990-), 男, 博士, 副研究员, CCF专业会员, 主要研究领域为机器学习, 数据挖掘, 人工智能与游戏;张俊格(1986-), 男, 博士, 研究员, 主要研究领域为博弈决策, 强化学习, 模式识别, 人工智能;黄凯奇(1977-), 男, 博士, 研究员, 博士生导师, CCF杰出会员, 主要研究领域为计算机视觉, 模式识别, 人机对抗, 视觉监控应用
TP181
国家自然科学基金(61876181, 61673375); 北京市科技创新计划(Z19110000119043); 中国科学院青年创新促进会项目, 中国科学院项目(QYZDB-SSW-JSC006)
1. School of Artificial Intelligence, University of Chinese Academy of Sciences, Beijing 100049, China;
2. Center for Research on Intelligent System and Engineering (CRISE), Institute of Automation, Chinese Academy of Sciences, Beijing 100190, China;
3. Center for Excellence in Brain Science and Intelligence Technology, Chinese Academy of Sciences, Shanghai 200031, China
黄文振,尹奇跃,张俊格,黄凯奇.基于模型的强化学习中可学习的样本加权机制.软件学报,,():1-11
复制