张峻伟(1998-),男,硕士生,主要研究领域为人工智能,机器学习;于佳玉(1997-),男,硕士,主要研究领域为人工智能,机器学习;吕帅(1981-),男,博士,副教授,博士生导师,CCF高级会员,主要研究领域为人工智能,机器学习,自动推理;龚晓宇(1997-),男,硕士生,CCF学生会员,主要研究领域为人工智能,机器学习;张正昊(1996-),男,硕士,主要研究领域为人工智能,机器学习.
吕帅,E-mail:lus@jlu.edu.cn
国家重点研发计划(2017YFB1003103);国家自然科学基金(61300049);吉林省自然科学基金(20180101053JC)
张峻伟,吕帅,张正昊,于佳玉,龚晓宇.基于样本效率优化的深度强化学习方法综述.软件学报,2022,33(11):4217-4238
复制