计算机所数据管理实验室师生参加ICDE2019

2019年4月8日至4月11日,计算机所邹磊老师和数据管理实验室苟向阳,胡琳,关乃清等同学前往中国澳门参加第35届数据工程国际会议(International Conference on Data Engineering,简称ICDE)。

ICDE由美国电气与电子工程师协会(IEEE)发起,是全球数据库领域三大顶级学术会议之一,该会议主要围绕数据密集型系统和应用的设计,构建,管理和评估,涉及数据挖掘和知识发现,数据库系统,图数据和RDF等多个领域,工业界的许多公司,如Amazon, Alibaba,华为等也都在会议上展示了研究成果。

计算机所师生在ICDE会场合影(后排左起:李友焕,关乃清,胡琳,苟向阳,前排左起:邹磊,彭鹏)

邹磊老师在ICDE Workshop International Workshop on Large Scale Graph Data Analytics (LSGDA https://lsgda.github.io ) 上做了主题演讲 “Processing SPARQL Queries Over Distributed RDF Graphs—A Partial Evaluation and Assembly Approach”,介绍了在分布式RDF图上执行SPARQL查询的技术,提出了“Partial Evaluation and Assembly” 框架,即将SPARQL查询转化为RDF图上的子图匹配问题,在分布式RDF图的每一个分块上匹配局部解,然后组合成最终解,并提出了集中式和分布式两种组合最终解的方案。

计算机所数据管理实验室在ICDE上共发表了4篇论文,论文信息如下

Peng Peng, Lei Zou, Runyu Guan, Accelerating Partial Evaluation in Distributed SPARQL Query Evaluation.

本文在提供性能保证的基础上进一步提高分布式RDF数据图上基于“局部计算与归并”的SPARQL查询处理框架的效率。 论文通过发现局部解的内部结构特性来剪枝掉一些无关的局部解,同时提供在数据通信和响应时间方面性能保证。此外,论文也提出了一个高效的归并算法来利用局部解特性进行局部解合并以找到最终解, 并提出了一个优化策略来通信变量的候选以避免重复计算。论文评估了不同数据划分策略对方法的影响, 并在真实和人造数据集合上的实验验证了方法的优越性。

Xiangyang Gou,Lei Zou, Chenxingyu Zhao, Tong Yang, Fast and Accurate Graph Stream Summarization.

本文研究高速图流数据的摘要问题, 提出了一种新的图流摘要技术Graph Stream Sketch (GSS)。GSS可以使用 的线性空间, 的常数级更新时间对图流数据进行摘要。此技术产生的摘要支持在图流上的多种查询,如边查询,点的前驱/后继查询,可达性查询,子图匹配等, 并把误差控制在极小范围内。实验表明该技术在使用相同的内存时准确率远高于已有摘要技术。

Youhuan Li, Lei Zou, Tamer Ozsu, Dongyan Zhao, Time Constrained Continuous Subgraph Search over Streaming Graphs.

本文以带时序限制的子图同构查询入手,在图数据流场景下研究对查询图的解实现快速响应的计算算法。论文在图数据流场景中引入时间窗口来聚焦更具时效性的数据, 并通过查询图自身的结果和时序特征,设计了图数据流场景下,基于中间结果维护的子图查询算法,此外,还设计并发管理的机制来提高在图数据流场景下的更新吞吐量。

Lin Hu, Naiqing Guan, Lei Zou, Triangle counting on GPU using fine-grained task distribution, ICDE Workshop (LSGDA)

本文试图通过使用GPU加速三角形计数算法。论文通过在GPU上使用细粒度的任务分配方法,让每个线程做更少的工作量,缓解了GPU上各个线程之间工作量负载不均衡和访存的效率低下的问题。另外本文还提出了基于GPU共享内存的算法优化,还有对数据预处理对于算法整体性能的讨论。实验证明,本文的算法在大规模的数据集上的性能显著优于当前已有的最优算法。

CLOSE

上一篇 下一篇