王选所数据管理研究室学生参加SIGMOD 2024
国际数据管理会议SIGMOD(ACM SIGMOD International Conference on Management of Data),是数据库和数据管理领域最具权威性的三大会议之一,与其他会议VLDB、ICDE齐名,并被中国计算机学会(CCF)推荐为数据库领域的A类国际会议。今年,SIGMOD与数据库系统原理研讨会PODS共同举办,于2024年6月9日至6月15日在智利圣地亚哥隆重召开。
会议期间,来自王选所数据管理实验室的博士研究生庞悦就她的研究成果进行了展示,并与国际同行进行了深入交流。
庞悦同学做头报告
庞悦同学做海报展示
王选所研究生在SIGMOD2024上发表的论文信息如下:
Yue Pang, Lei Zou, Jeffrey Xu Yu, Linglin Yang. Materialized View Selection & View-Based Query Planning for Regular Path Queries.
给定一张数据图,正则路径查询(Regular path query, RPQ)返回以具有满足给定正则表达式的边标签序列的路径所连接的节点对。如果给定若干RPQ构成的集合作为查询负载,那么选择这些RPQ共有的子查询作为离线预计算的物化视图可以加速在线查询。由于可用内存有限,论文将RPQ的物化视图选择(Materialized view selection, MVS)问题定义为如下的优化问题:在给定的内存预算下,最小化RPQ负载的总查询时间。论文证明此问题是NP难的,并给出了一种高效的启发式MVS算法。为避免选择冗余的物化视图,论文创新性地提出了一种多RPQ的查询计划表示以编码子查询间的关系,称为AND-OR DAG with Closure(AODC)。除了检测冗余视图外,AODC还会随着视图选择过程增量化更新自身,使得视图选择完成后同时也得到了基于视图优化的查询计划。为支持查询计划选择,论文针对RPQ给出了一个具有良好可扩展性的查询代价与基数估计模型,这是首个能够支持包括Kleene闭包在内的任意RPQ的查询代价与基数估计模型。本方法在应用于Wikidata查询日志时,相较于不使用物化视图的方法,能够取得高达9.73倍的总查询时间加速比。
上一篇 下一篇