学术报告:大规模分布式图数据计算——系统与算法

时间:2017年5月29日 上午10点-12点

地点:计算机所大楼106会议室

Title: 大规模分布式图数据计算——系统与算法

Abstract:

现代应用产生了很多大规模的图数据,例如在线社交网络,万维网,知识图谱等。这些图数据通常含有数以亿计的顶点和边,因而很难在一台机器上进行高效地处理与分析。因此,近年来很多用于处理大规模图数据的分布式系统应运而生。其中,Google在2010年的SIGMOD会议上提出的Pregel框架开创了顶点式计算模型的先河,并获得了广泛的关注。在Pregel中,为了实现一个分布式的图算法,用户只需要指定一个顶点的计算行为。本讲座主要介绍分布式图数据计算领域的最新进展。讲座首先简要回顾一下Pregel的计算模型,以及如何在Pregel上对各种图问题开发高效以及扩展性强的算法。接着,我们分析一下现有的Pregel类型系统在处理现实生活中大图时的性能局限,并介绍一系列新颖的系统设计与优化技术以显著地改进图计算的性能和扩展性。这些技术从新的计算模型,通信机制,轻量级查询的后端设计,外存执行,容错机制等多方面提高了Pregel的性能,并往往达到几个数量级的性能改进。许多在这里介绍的工作已经发表于国际A类会议中,包括PVLDB,以及SIGMOD, WWW等。本讲座也会对大规模图数据处理领域的未来研究方向进行一个展望。

Bio:

严达博士目前在美国阿拉巴马大学伯明翰分校的计算机科学系任助理教授。他本科毕业于上海复旦大学,博士毕业于香港科技大学,并在2015年获得了香港青年科学家奖。严博士带领其团队开发了一系列用于大规模图计算的分布式系统,包括Pregel+, Blogel, Quegel等。这些系统在学术界以及工业界被广泛的关注与使用。相关的工作在国际A类会议发表,诸如SIGMOD, VLDB, KDD, WWW等,并且被邀请在Foundations and Trends in Databases, Springer Briefs in Computer Science以及机械工业出版社出版关于大规模图数据计算的书籍。他也担任国际A类会议与期刊的评审,例如PVLDB, IJCAI, TKDE, TPDS等。严达博士的其他研究方向包括地理空间数据管理,机器学习以及数据不确定性。

CLOSE

上一篇 下一篇