摘要:学习型索引因其低内存占用和高查询性能的特点, 正辅助或逐步取代传统的索引结构. 然而数据更新导致的在线重新训练, 使其无法适应数据频繁更新的场景. 为了在不过多消耗内存的前提下, 尽量避免由于数据频繁更新导致的索引重构, 提出了一种自适应的感知更新分布学习型索引结构DRAMA. 使用类LSM-Tree的延迟学习方式主动学习数据更新的分布特征; 利用近似拟合技术快速建立更新分布模型; 采用模型合并策略代替频繁的重训练过程; 采用一种混合压缩技术降低索引中模型参数的内存占用率. 在真实和合成的数据集上构建了索引并进行验证. 结果表明, 相比传统索引和最先进的学习型索引, 该索引可以在不额外消耗过多内存的情况下, 有效降低了数据更新环境下的查询延迟.