位纪伟,中共预备党员,计算机科学与工程学院(网络空间安全学院)2018级博士研究生,2021年度“成电杰出学生”(研究生)。曾获国家奖学金、学业一等奖学金、省级优秀毕业生、校级优秀毕业生、校“学术新秀”、校“优秀研究生”等荣誉。以主研身份参与国家重点研发计划、自然科学基金等项目4项。以第一作者身份在人工智能领域影响因子最高的期刊TPAMI(中科院JCR一区,影响因子16.389)、计算机视觉顶会CVPR(CCF A类,2021年Google学术全球最具影响力会议中排名第一)、多媒体顶会ACM MM(CCF A类)等高水平期刊和会议上发表研究成果。参加国际学术会议3次(海报展示2次、口头报告1次),申请国家发明专利5项,担任SCI一区期刊TMM、TCYB和TIP审稿人。
时间回到2020年9月28日,西藏地区的一条盘山公路上又一次发生塌方,两三米高的岩石块将这条路彻底封死、摧毁,路上的两辆越野车紧急停车,被断了前路。
这条盘山公路位于西藏自治区,属于我国西南地区,盘山公路旁边便是是中国与尼泊尔的界河。此刻,两辆越野车上的任何一个人都不敢轻举妄动,平均海拔4000米的青藏高原,氧气并不充足;山体塌方还在继续,时不时便有石块滑落下,任何一块都可能致命;滑落的巨石已将基站损坏,手机信号在国境边缘持续“罢工”;旁边河流凶猛湍急……
山体滑坡,巨石阻挡前路
这两辆越野车里,是来自中山大学、华南理工大学、四川大学等多所高校的科研人员,还有来自电子科技大学的位纪伟和他的同门师弟。到达这里时,他们已乘坐了两天的汽车,翻越了两座5300多米的山,疲惫不堪。他们的任务是前往西藏,参与一项重要的科研工作。
位纪伟算是这批科研人员中的“经验人士”,这已是他参与项目以来,第四次前往西藏的研究站点,但这次突发状况仍是他始料未及的。是冒着生命危险继续前行,还是被迫返程?要继续往前走又该怎么走?
竞赛:高原地区的24小时
位纪伟是来自我校计算机学院的博士研究生,主要研究方向为跨模态检索研究。跨模态检索是指,对一种模态的查询词,返回与之相关的其他不同模态检索结果的新型检索方法。位纪伟解释道,“简单来说,就是当用户输入文字,以文字模态进行检索时,系统能够检索到对应的图片、视频甚至音频等其他模态的内容,实现跨模态的搜索。”这项技术被广泛应用在各个领域,小到日常使用的搜索引擎,大到国防建设。
2019年初,位纪伟在导师杨阳教授的带领下加入了一项国家重点研发计划。项目开展地点为我国西藏的诸多站点,珠峰脚下,海拔4800米。前往研究站点之前,尽管他做了充足的准备,在正式抵达站点后,发现还是低估了科研条件的艰苦。
位纪伟在青藏高原
在这里,刺骨的寒风从高山一涌而下,每年风力最低为五级,甚至是内陆部分城市一年最高的风力等级;紫外线穿破大气层直射大地,似乎没有些许损耗,不到两三天人就会明显感受到皮肤的灼伤;海拔4800米的高原,含氧量不到内陆平原地区的一半,而位纪伟和他的同事们必须要一边行走在高原上,一边拿着沉重的设备采集数据,“走几步就要喘一大口气……平常看起来再正常不过的事情,在高原都变得无比的艰难。”而这些磨难,只是高原科研的第一道坎。
那些日子,每个清晨迎接位纪伟的不是雪域高原的第一束纯净的阳光,而是起床后剧烈的头疼、胸闷、鼻腔内的血痂。“我本来已经做好了条件艰苦的心理准备,但真的到这儿了,才知道这一点儿不开玩笑的。”
即便是这样,在过去三年内,他仍先后数十余次前往西藏高海拔地区进行数据采集和项目部署。位纪伟也已经对缓解高反轻车熟路,“多喝热水,在高原真的不是随便说说”;面对高反症状也已见怪不怪,“流鼻血,洗把脸就又开始干活了”,他向我们介绍起他一天的工作安排。
“我们一般早上七点多吃完早饭之后,就开始整理设备、装车,揣上干粮、准备‘出征’。乘坐一个多小时的车程抵达站点后,我们就得立刻开工了!”午餐时间,他们便从包里拿出准备好的干粮简单应付。在荒无人烟的高原,最近的饭店也需要车行两小时,高昂的时间成本着实劝退了项目组。
“虽然吃的是乏味的干粮,但午饭还是得吃饱,因为下一顿估计得凌晨再吃咯!”位纪伟笑着补充道。项目组最初计划每日七八点左右结束工作,而实际上大家往往十一二点才能做完自己的工作,再乘车程返回住所用餐,那时已是凌晨。“我们在西藏的时候必须要珍惜科研时间,与时间“竞赛”,大家都希望每天能多做一点。”
当天工作收尾后,位纪伟和同事都长舒了口气。已是凌晨的西藏,漫天繁星。望着壮阔静谧的星空,是他们一天最好的身心放松。这是位纪伟在西藏开展科研中最平常的一天,也是无数奋斗在国家边疆的科研人不为人知的一天。
使命:一场真实冒险故事
在珠峰脚下、国境边上做科研,是一种什么体验?这是位纪伟被问到最多的问题,他的回答是——“一场对科研人员生理和心理的极致考验”。
曾有一次关于生命的考验。时间回溯至2020年9月,位纪伟跟随项目组再次前往西藏,汽车正行驶在盘山公路上,还有一公里就要到达目的地时,意外发生了。“司机师傅突然告诉我们前路发生了塌方,山体石头直接砸跨了我们的路,但这是我们前往目的地的唯一一条路”。这里人烟稀少,公路事故需要从几百公里以外的地方调度出大型机械进行处理,因此塌方事故的处理往往要等上半个月甚至更久。
位纪伟生活照
时间等不及了。位纪伟和他的同事们迅速决定人工拖着设备、爬过巨石、徒步走向祖国边陲。而这一切,相当艰难:他们拖着许多一米高的大箱子设备,小心翼翼地爬过随时可能滑动的锐利巨石,顶着震颤神经的心理压力,时不时抬头观察是否有新的落石,然后徒步迈向更加偏僻的目的地。
“我们来一趟很不容易,这里的的技术难题等着我们去解决”,回忆起当时的状况,位纪伟仍然历历在目。“最开始肯定是有想过要原路返回的,因为这种随时可能继续的塌方是对生命直接构成威胁的。但也就是那个时候,我第一次感受到所谓的‘使命感’,是一种推着我们做出一些我们从未想过的事情的力量。”
走到国境边上,位纪伟看到了最真实的中国力量。在项目中有一段地区是一个峡谷,峡谷中间是原始森林和河流。峡谷中的地形错综复杂,因此也成为异常事件的高发地。而当地的安全稳定全部依靠边防士兵的严防死守,高原上的一次次地巡逻、冰天雪地中的一次次地排查,是中国力量在祖国大地边缘最后一寸土地的坚守。这些真实动人的感触,也在位纪伟的心中埋下了科研报国的种子。
蓄势:从0到1的突破
在项目进程中,位纪伟为了解决一个难题查阅了海量的文献,却仍然一筹莫展。他发现在以往的研究中,各种跨模态检索的框架中所包含的度量损失函数都是单独特殊设计的,比如图片与文字间的相互检索的损失函数,就与可见光与红外光相互检索的损失函数不同,并没有一个通用的框架和相应的损失函数。
设计一个通用的度量学习框架,并提升跨模态检索准确率,成为了位纪伟当时的科研目标。然而,想要实现从0到1的创新,并非易事。位纪伟回忆道,“我当时设计的这个框架里包含很多的超参数,而这些超参数需要靠我一个一个去调试设计、去实验,寻找最优的参数值。”
在最开始的调试过程中,位纪伟近乎是崩溃的,各种参数的随机排列可以产生无数种组合。“我的框架到底有作用吗?难道我的框架结果上具有随机性?”自我怀疑的声音越来越明显,但在导师的鼓励下,位纪伟始终没有停歇。
跑一次程序需要2天,位纪伟一共跑了186次。实验结果表明,位纪伟设计的通用度量学习框架能够适用于多种场景下的跨模态检索,检索准确率较前人提高5%左右。TPAMI主编Sven Dickinson教授对这篇论文给予高度赞赏并表示:“这篇论文的方法新颖且有趣,TPAMI的许多读者会对这篇论文相当感兴趣。”
他的研究成果以第一作者的身份发表在人工智能领域影响因子最高的刊物TPAMI,并成功应用到在西藏开展科研项目中,有效推进了项目进展。
位纪伟(一排左三)参加第29届ACM国际多媒体会议
显著成果的背后,是位纪伟长达数年的蓄势。位纪伟其实是一位“老成电人”,本科就读于光电学院电子科学与技术专业,硕士就读于数学学院统计学专业,博士阶段进入计算机学院学习。本硕期间培养的工科思维和扎实的数理基础,为他博士方向的研究提供了极大帮助。而为了弥补计算机领域的短板,他狠狠地推了自己一把:代码不如同门擅长,便花了三个月深度自学;论文阅读不够,便在图书馆一篇篇啃,一坐便是一天。会有疲累的时候,还好有一份执着的热爱让他孜孜不倦。
“十年,我在这里见证了成电的变化,也见证了我自己能力从0到1的变化”,一路走来,位纪伟最感谢的是学校所提供的的平台与导师的悉心指导。未来,他希望能够继续留在成电,参与更多国防科研项目,将 “求实求真、大气大为”的成电精神,带到祖国边疆的每一寸土地。
我要评论 (网友评论仅供其表达个人看法,并不表明本站同意其观点或证实其描述)
全部评论 ( 条)