王选杰出青年学者奖 | 唐杰:以利他之心,登顶科研的山峰

2021年4月,首届王选杰出青年学者奖颁奖典礼在北京大学百周年纪念讲堂李莹厅举行。该奖项是为了更好地纪念王选院士、传承王选精神,由北京大学王选青年学者奖励基金资助设立的全国性科技奖项。清华大学计算机科学与技术系唐杰教授,凭借在社会网络影响力模型研究的贡献以及所实现的智能型科技情报挖掘和服务系统AMiner,成为2020年度王选杰出青年学者奖获得者。

首届王选杰出青年学者奖颁奖现场(左二为唐杰)

唐杰出生于四川,高中时期物理成绩非常好,父亲发现唐杰喜欢无线电类、编程类的东西,就给小唐杰购买了人生中第一台可编程学习机,从此唐杰与计算机的缘分悄然开始了。

“我本科其实是在燕山大学学习自动化专业,后来还是因为喜欢计算机、喜欢编程,硕士又转为计算机专业。”唐杰回忆往事,笑着说。从小热爱编程,凭借着对计算机领域新技术、新进展的兴趣和热爱,2002年唐杰以优异的成绩,顺利考取了清华大学计算机科学与技术专业,开始了博士的学习生涯。“我在清华的博士生导师是王克宏教授,博士期间主要从事语义Web和数据挖掘等相关研究。”

2006年唐杰博士毕业,当时计算机领域在国内正蓬勃发展,毕业生大都选择去大的互联网公司或者出国深造,唐杰坦言当时确实也想过出国。“工作几年后甚至有一所很不错的国外大学给我Tenured 副教授的offer,我还真认真考虑过,毕竟当时国外科研环境更好一些。但经过深思熟虑,我决定还是留在国内,要在国内做出世界一流的顶尖研究。”自从2002年踏入清华读博至今,不知不觉中,唐杰在清华大学计算机科学与技术系学习、工作已经快22年了。

以利他之心为始,选择科研的山峰

“外国人可以做的,我们也可以”。正是这种作为中国人的“傲骨”,使唐杰最终留在清华开始自己的科研之路。“现在回看,我当时没有出国,而是选择留在国内发展,可能是潜移默化地被王选老师影响了。”博士还没毕业时,学校的一次活动,使唐杰了解到北大的王选老师。唐杰非常激动地回忆着:“王选老师的汉字激光照排是独创的中国人自己的技术,他在我国七八十年代软件、硬件条件都不如国外的情况下,一步跨越国外40年的科研积累,直接攻下了汉字激光照排这个世界难题,令我印象深刻,也备受鼓舞。”王选老师的精神就这样悄悄地种在了20多岁的唐杰心底。2006年2月,王选老师与世长辞。同年,唐杰博士毕业留任清华。

唐杰手持沉甸甸的王选杰出青年学者奖奖杯

留校后,唐杰久经思考,才确定了社交网络分析和数据挖掘的研究方向。“大的人工智能方向,有好几个相关的研究领域,比如自然语言处理、语义Web以及数据挖掘,这几个领域我毕业后都仔细地思考、比较和找同行交流过。最终我发现数据挖掘这个方向,对新事物非常地开放和包容,这是我非常喜欢和看重的点,再加上那时候社交网络在国内才刚刚兴起,我就决定做这个方向了。”唐杰自2006年开始一直从事社会网络影响力模型研究以及智能型科技情报挖掘的研究,当时国内几乎没什么人做相关的研究,是非常超前的。从2006年一直到2015年,唐杰一做就是十年。

选择是努力的前提。谈到如何选择一个好的研究方向时,唐杰想了想,告诉记者:”选方向,要看未来,不要盲目跟风。具体来说就是首先思考自己的兴趣所在,然后基于兴趣去思考哪些研究方向是可以帮助‘别人’的。这个‘别人’是很宽泛的表达,往小了说可以是科研同行,大一点说是你这个研究方向,再大一点是能够对社会发展有推动作用,就像王选老师所做的。所以我认为只要能帮助到‘别人’,就是好的研究方向,就可以选择。”唐杰所说的帮助‘别人’,其实就是抱利他之心,行利他之事。

2006年唐杰率领团队建立了AMiner ,即科技情报大数据挖掘与服务系统平台,这是一个具有完全自主知识产权的新一代科技情报分析与挖掘平台。之后十年,唐杰一直在此基础上,不断地提出问题、解决问题、完善系统。AMiner自2006年上线以来,服务于全球科研人员,覆盖了220个国家和地区3000多万独立IP用户,服务21万余家企事业单位及各类机构,提供科研数据下载230万次。平台为中国工程院、国家自然基金委、科技部等科研管理部门提供专家智库、科技发展战略规划等科技情报挖掘服务。唐杰也因为此项研究获得了诸多荣誉——国家科技进步二等奖、北京市科技进步一等奖、北京市发明专利奖一等奖 、中国人工智能学会科技进步一等奖、KDD'18杰出贡献奖等。最值得骄傲的是,AMiner最早的文章获得了ACM SIGKDD Test-of-Time Award(十年最佳论文),这是国内第一次有人在顶级国际会议上获得十年最佳论文,也是国际上对这一工作的最大认可。

唐杰办公室内书架一角摆满各类奖状和奖杯

一步一个脚印,总能登顶

“科研的品味,也就是Research Taste,要做能帮到‘别人’的研究。确定了方向,下面就是怎么做出来了。”唐杰很认真地说:“踏踏实实、一步一个脚印地做Solid(结实、可靠)的研究工作。科研就像登山,一定要登到顶峰,不登顶就是失败。”唐杰是这么说的,也是这么做的。“我们从2006年开始做AMiner 这个平台,其实到2007年左右算法就已经都写好了,上线后效果也不错,但是我始终觉得不够Solid,之后每年我都会发现一些新问题,不断地去完善这个平台,期间也一直有新的科研发现和进展,一下子十年过去了,到了2015年我认为算是取得了阶段性的成果了。当然,直到今天我觉得其实还是有很多问题可以继续深挖,但在当时算是完成了我设立的阶段性目标了。”唐杰用十年的时间,一步一个脚印步,到达了他心中的山顶。

记者发现唐杰办公室窗边一张桌子上摆放着唐杰骑自行车的比赛照片,还有很多奖牌整齐有序地挂在一个可以旋转的木质展示架上,非常有意思。唐杰笑着介绍说:“马拉松和铁人三项等都是我很喜欢的比赛,这些都是我参赛的奖牌和比赛照片,我都留作纪念。”唐杰热爱运动,喜欢迎接挑战,比如铁人三项是将游泳、自行车和跑步这三项运动结合起来,是十分考验运动员的体力和意志的。至于在科研中如何面对挑战,克服困难,唐杰笑着说:“面对一些难题,通常来说就是三种方法,可以去大牛那里吸收新鲜的知识,也可以和同行间取长补短,还可以与青年学者或者学生进行交流,从而汲取新想法。” 这些唐杰说起来容易,但是可想而知做起来有多么的不易。困难就如同登顶途中一个个陡坡一样险峻,又如同马拉松和铁人三项中遇到的一个个极限和不同项目带来的考验,没有毅力,没有方法,没有勇气,是很难跨越的。

唐杰办公室里摆放着他参加铁人三项、马拉松等运动比赛的奖牌和照片

唐杰给记者分享了自己在科研中真实遇到的两次困难。“一次是2011年左右我在做AMiner这个平台的时候,因为平台是免费使用的,随着系统访问量越来越大,我需要不断地编程来维护这个平台,甚至还雇了一个工程师跟我一起维护这个系统,占用了我大量的时间和精力。那时候我挺痛苦的,不知道自己这么做是为了什么,每天都想放弃。直到后来有一次我去国际上做交流的时候,发现大家非常认可我们的工作,表示我们的工作给大家帮助很多,从那刻起我就不再痛苦了。因为我知道我的初衷就是要能够帮助大家呀!”

唐杰第二个比较痛苦的阶段是2015年起开始思考下一步研究方向的时候,探索了很多方向,却始终都没有思路。“我直到2018年才确定了要做认知智能方向的研究:“让机器像人一样思考”。那时,很多人都觉得肯定做不出来,做的人也不多,都觉得不可能。”然而,唐杰相信认知智能今后会对社会发展产生巨大价值,便开始着手研究。截止目前,唐杰从事认知智能领域的研究已经五年了,他主持设计了拥有完整知识产权的大模型技术体系GLM,研发了千亿级开源双语预训练模型GLM-130B,性能与 GPT-3原版基座模型相当,目前全球已有70多个国家上千家机构申请使用。开源的ChatGLM全球下载超过1000万,在开源网站Github上Star数超过LLaMA,达到5万;2023年获HuggingFace评选的全球最受欢迎开源机构第五名(国内唯一上榜,超过微软、Open AI、谷歌等机构)。这一次,唐杰选择了当时少有人看好的领域,顶着心理和时间的双重压力,始终坚持自己的判断,是因为他确信自己的利他之心,做对同行有帮助、对社会有价值的研究和工作,让唐杰在遇到困难的时候可以顺利度过。不忘初心,方得始终。

既要 “顶天”, 又要“立地”

“科技顶天、市场立地”是王选院士一贯倡导的目标,他曾这样解释:高科技产业应实现“顶天立地”模式。“顶天”就是不断追求技术上的新突破;“立地”就是把技术产品化,并大量推广、应用。“顶天”是为了更好地“立地”,从市场获取用户新的需求,进一步推动技术的创新和突破。“我完全认同王选老师科技顶天,产品立地的理念,我多年来几乎就是这样身体力行去实践的。” 唐杰在二十多年的科研工作中,用他的实际行动践行着“顶天立地”模式,在攀登科研顶峰的同时,一步一个脚印实现成果应用,服务社会所需。

唐杰在办公室

唐杰的主要研究领域包括人工智能、知识图谱、数据挖掘、社交网络和机器学习,目前已经是AAAI、ACM以及IEEE Fellow,也是国家杰出青年科学基金获得者。截止2023年底共发表论文300余篇,曾获ACM SIGKDD Test-of-Time Award(十年最佳论文)。弗朗西斯·培根曾说过:“阅读使人充实,会谈使人敏捷,写作与笔记使人精确。”唐杰告诉记者自己很喜欢这句话,也很认同这种工作方式,“我们做科研就是要不断地阅读,不断地交流,最终形成自己的idea(想法、思路),推动领域的发展。 ”

2019年6月,由清华大学计算机系知识工程实验室(KEG)的技术成果转化而来的北京智谱华章科技有限公司(智谱AI)成立,实验室的成果开始得到更广泛地应用,也有更大的“利他”机会。2021年3月和6月,时任智源研究院学术副院长的唐杰,作为“悟道”模型技术委员会主任,带队先后发布了我国首个超大规模智能模型“悟道1.0”和“悟道2.0”。2023年8月,基于唐杰团队的开源双语预训练模型,北京智谱华章科技有限公司推出了生成式AI助手“智谱清言”上线,目前已具备“通用问答、多轮对话、创意写作、代码生成以及虚拟对话”等丰富能力,未来还将开放多智能体等更多功能。

唐杰表示,未来会继续坚定不移地研究认知智能(AGI)的未来之路。“我们一定能实现超级AGI,就是超越人的智能的智能。”唐杰兴奋地展望着未来,但同时唐杰也表示如何能够安全地使用AGI更为重要。“前段时间看了奥本海默那部电影,引发了我的思考。当科技研究到达某种巅峰的时候,安全问题就变得很重要。我现在的研究也是如此,当超级AGI实现的时候,如何正确地引导和控制AGI系统仍然没有得到很好的解决,那么就需要同步研究超级对齐,也就是我未来要同步进行的第二个研究方向。”

抱利他之心,行利他之事,顶天立地,造福社会。唐杰的下一个十年,定能登顶更高的山峰。

学者简介:

唐杰,清华大学计算机系WeBank讲席教授、大模型研究中心主任,国家杰青,ACM/AAAI/IEEE Fellow。研究兴趣包括人工智能、知识图谱、数据挖掘、社交网络,最近专注大语言模型:ChatGLM(开源下载近1000万,HuggingFace全球点赞最多机构前五)等,获邀在ICLR、WWW上做大会特邀报告。曾获ACM SIGKDD Test-of-Time Award(十年最佳论文)、IEEE ICDM研究贡献奖、国家科技进步二等奖。

王选杰出青年学者奖介绍:

北京大学王选青年学者奖励基金由王选夫人陈堃銶教授于2008年12月代表北京大学王选计算机研究所(原北京大学计算机科学技术研究所)捐赠基金设立。之后,王选所硕士研究生刘振飞校友连续多年捐资注入本基金,是北大最早的针对青年学者所设的奖励基金。该基金下设“北京大学王选青年学者奖”,多年来奖励了北大一批在教学岗位和科研工作中作出重要贡献并具有巨大发展潜力的青年教师。

王选院士作为推动中国汉字和印刷技术迈入计算机时代的开拓者,是新时代知识分子的杰出代表和自主创新精神的楷模,他的崇高品格与精神风范值得永远铭记。为更好地纪念王选院士,发扬他坚持创新的科学精神和扶植新秀的高尚情怀,推动中国科技创新事业发展,扩大王选青年学者奖励基金的影响力,2020年,北京大学王选青年学者奖励基金决定增设全国性科技奖项“王选杰出青年学者奖”。该奖项实行推荐制,不受理个人(或单位)的申请或自荐,每年组织评选一次。候选者应满足以下条件:热爱祖国,有良好的社会公德和高尚的职业道德;在科研工作中作出重要贡献并具有巨大发展潜力,或者其科研成果得到重要应用或有重要应用前景;年龄在45岁以下的中国公民。每年由北京大学、中国计算机学会和中国工业与应用数学学会联合评选出在计算机和应用数学领域中自主创新和应用成果极为突出的杰出青年学者各一名,每人一次性奖励人民币50万元。

为开展好王选杰出青年学者奖的相关工作,确保该奖项的公正性、独立性和权威性,特设立王选杰出青年学者奖管理委员会、学术委员会、提名委员会及秘书处,学术委员会和提名委员会由数学、计算机理论与应用领域的著名专家担任,负责奖项的提名和评审工作,对候选人进行评议、表决后上报管理委员会审定。如当年度无合适人选,名额可空缺。

 

CLOSE

上一篇 下一篇