基于声明式推理的高效协同查询处理技术
作者:
作者单位:

作者简介:

邱志林(1997-), 男, 硕士, 主要研究领域为数据库内机器学习的优化. ;寿黎但(1976-), 男, 博士, 教授, 博士生导师, CCF高级会员, 主要研究领域为非结构化数据管理, 移动社会媒体数据管理, 多媒体挖掘. ;陈珂(1977-), 女, 博士, 副研究员, CCF专业会员, 主要研究领域为非结构化数据管理, 数据挖掘, 隐私保护. ;江大伟(1982-), 男, 博士, 研究员, 博士生导师, 主要研究领域为分布式数据管理技术, 云数据管理技术, 大数据管理技术. ;骆歆远(1988-), 男, 博士, 助理研究员, 主要研究领域为大数据管理, 大数据智能计算, 信息检索. ;陈刚(1973-), 男, 博士, 教授, 博士生导师, CCF杰出会员, 主要研究领域为数据库, 大数据管理系统, 大数据智能计算.

通讯作者:

陈珂, E-mail: chenk@zju.edu.cn

中图分类号:

TP311

基金项目:

国家重点研发计划(2022YFB3304100); 中央高校基本科研业务费专项资金(2021FZZX001-24)


Efficient Collaborative Query Processing Technique Based on Declarative Inference
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    由于深度学习领域的不断进步, 人们对用协同查询处理(CQP)技术扩展关系数据库以处理涉及结构化和非结构化数据的高级分析查询越来越感兴趣. 最先进的CQP方法使用用户定义函数(UDFs)来实现深度神经网络(NN)模型来处理非结构化数据, 并使用关系操作来处理结构化数据. 基于UDF的方法简化了查询书写, 允许用户使用单一的SQL提交分析查询, 但要求在即席数据分析中能够根据所需性能指标手动选择合适且高效的模型, 这对用户提出了很高的挑战. 为了解决该问题, 提出基于声明式推理函数(DIF)的协同查询处理技术, 通过优化模型选择、执行方式、设备绑定等多个查询实现路径构建完整的协同查询处理框架. 基于所提研究设计的成本模型和优化规则, 查询处理器能够计算出不同查询计划的代价, 并自动选择最优的物理查询计划. 在4个数据集上的实验结果证实了提出的基于DIF的CQP方法的有效性和效率.

    Abstract:

    Due to the continuous advancements in the field of deep learning, there is growing interest in extending relational databases with collaborative query processing (CQP) techniques to handle advanced analytical queries involving structured and unstructured data. State-of-the-art CQP methods employ user-defined functions (UDFs) to implement deep neural network (NN) models for processing unstructured data while utilizing relational operations for structured data. UDF-based approaches simplify query composition, allowing users to submit analytical queries with a single SQL statement. However, they require manual selection of appropriate and efficient models based on desired performance metrics during ad-hoc data analysis, posing significant challenges to users. To address this issue, this research proposes a CQP technique based on declarative inference functions (DIF), which constructs a complete CQP framework by optimizing model selection, execution strategies, and device bindings across multiple query execution paths. Leveraging the cost model and optimization rules designed in this study, the query processor is capable of estimating the cost of different query plans and automatically selecting the optimal physical query plan. Experimental results on four datasets validate the effectiveness and efficiency of the proposed DIF-based CQP approach.

    参考文献
    相似文献
    引证文献
引用本文

邱志林,寿黎但,陈珂,江大伟,骆歆远,陈刚.基于声明式推理的高效协同查询处理技术.软件学报,2024,35(12):5558-5581

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2023-04-12
  • 最后修改日期:2023-06-05
  • 录用日期:
  • 在线发布日期: 2024-01-17
  • 出版日期: 2024-12-06
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号