欢迎您登录科学中国人官方网站!!
新浪微博|网站地图|联系我们
凌云壮志 勇攀高峰

来源:  发布时间:2017-11-03

——记中国科学院自动化研究所副研究员汪凌峰
  
本刊记者  范燕燕

  
  
  如果不是机缘巧合下的一场讲座,汪凌峰现在可能会在某家公司敲着代码、编着程序,也极有可能已告别计算机行业,另谋他就。但生活的巧妙恰恰是没有给出现实之外的答案,所以此时的他,出现在中国科学院自动化研究所,埋头钻研着计算机背后的智能奥秘。
  2006年,时值汪凌峰大学本科在读,武汉大学计算机学院是他汲取知识、收获经验的第一课堂。在这里,他了解计算机的发展,同时筹划着自己的未来。“当时盘算着,毕业后直接去找一份工作,没想到朱老师来武汉大学的一场讲座改变了我的所有规划。”
  汪凌峰口中的朱老师,是中国莲花山计算机视觉与信息科学研究院院长朱松纯,也是全球著名计算机视觉专家,在人工智能、计算机视觉等方面颇有造诣。至于那场讲座,汪凌峰记忆犹新。他这样形容:“那是一场前沿、极具吸引力的讲座,讲述的是我之前从未接触的领域,一下子勾起了我全部的兴趣。”
  从那时起,汪凌峰便开始接触计算机视觉。凭借天资聪颖、后天的勤恳,在新世界的浩瀚中,他不断向着更高的山峰攀援。
  
转身 选择另一番天地
  
  上世纪80年代,David Marr的《视觉:从计算的视角研究人的视觉信息表达与处理》一书,开创出计算机视觉发展潮流。随着时间推进,一代代科研人的呕心沥血,计算机视觉如今有了更加多样化的姿态。至今,Marr提出的3个层次研究方法,即计算理论层、表征与算法以及实现层,依然影响着计算机视觉的研究人员。
  在对计算机视觉深层了解后,汪凌峰决定考研。经过紧张、充足的准备,在2008年,他被中国科学院研究生院录取,在自动化研究所正式开启他的逐梦之旅。5年硕博连读,汪凌峰以一腔热诚和不间断的拼搏,在计算机视觉领域终有所斩获。
  2013年,他博士毕业,发表了题为“基于局部感知的若干视觉问题研究”的博士论文。次年,该论文被中国科学院评选为优秀博士论文。在论文中,他基于计算机软硬件发展及相关学科的基础,如:模式识别、图像处理、计算机图形学等,针对喷薄而出的多发性计算机视觉问题,作出了深入研讨。考虑到多数视觉问题自身的复杂性,运用全局模型难以准确的表达,他将大问题分而治之,引入局部感知,即:局部建模问题,全局约束问题,从而更加灵活并且有效地解决视觉问题。
  “论文中,从全局和局部角度出发看待视觉问题是当时的研究热点和难点。利用全局约束问题,采取局部建模,从而更能抓住问题关键所在。局部全局两者之间的结合、灵活使用,无论是在科研工作当中,还是在社会生活中,都具有很大的价值意义。”汪凌峰如是说。一艘航船,主梁是它的支撑,是全局,是宏观,船板、船舷、哪怕一颗螺丝也是它不可或缺的一部分,这就是所谓的局部和微观。宏观微观结合,航船才能扬帆起航。
  有了独特的切入点,机敏的方法基础,问题的解决也就变得简单不少。在后续研究中,一系列成果的展示十分可喜:首先,他提出一项基于局部背景感知的视觉目标跟踪算法,该算法可以有效地处理目标与背景相似且背景多变的难题,解决目标短时间遮挡及跟踪环境光照变化问题。其次,他提出基于局部梯度模自适应插值边缘指导的单幅图像超分辨率算法。该算法利用局部梯度模自适应插值从低分辨率图像中直接估计锐化的高分辨率梯度,并将估计的高分辨率梯度作为(边缘保持的)梯度约束。再次,在贝叶斯框架下,他提出了两个基于局部模型的水平集医学图像分割算法。
  
继往开来 突破进取
  
  通过汪凌峰的解读可以了解,目标跟踪在实际生活的诸多领域,具有不可替代的应用价值,例如:智能视频监控、智能交通控制、无人机驾驶与导航、体感人机交互以及视频压缩和检索等。同时,在军事国防领域,其作用亦可见一斑。智能安防、反恐,它无处不在。随着信息技术发展,其前景趋势更不可限量。
  目标跟踪作为视觉突破的难点,有着极其复杂的研究背景。信息的不完全化、环境的复杂性均会影响目标跟踪造成的结果,加之光照等外部因素,以及特化难点,譬如:目标的形变、姿态的改变或旋转等,诸如此类,都会给跟踪创造出一项又一项棘手的问题。但汪凌峰强调,跟踪始终会是计算机视觉的核心技术之一。
  于是,在明确目标跟踪的划归范围,以及其主要任务是从连续图像序列中估计目标状态,以此为高层视觉处理提供有力的支撑等问题上,汪凌峰投入到更深层次的跟踪研究之中。
  在国家青年科学基金的大力支持下,汪凌峰的项目开展得如火如荼。考虑到目标跟踪难点的多样性,在技术路线上,他一方面采取分而治之的研究策略,即根据不同的难点提出相应的解决方案;另一方面,则采取由简单到复杂的研究策略,即先引入局部背景,然后结合稀疏表达,最后将它们统一起来。针对目标外观变化(光照等因素引起)和背景相似等复杂难点,他提出基于在线分类的跟踪方法。面对遮挡难点,则采用基于结构稀疏表达的目标跟踪,再次灵活运用全局与局部概念,将局部背景感知和稀疏表达有效地结合起来,创新发现基于鉴别稀疏表达的目标跟踪算法。
  2013年,为奖励汪凌峰在计算机视觉方向所做出的杰出贡献,中国科学院特授予其“院长特别奖”,此奖系在全院甄选40名优秀科研工作者,以兹鼓励。在当年的自动化研究所,汪凌峰的这项荣誉可谓独一份。
  
新发展 新展望
  
  博士毕业后的一段时间,考虑到视野的拓展和时代的需要,汪凌峰将研究方向逐步转移到人工智能及其背后深度研发的强化学习和深度学习领域。“我希望走不同寻常的路,在科研过程中,另辟蹊径会让我感到欣喜。”不论是有了新的发现,还是与研究前沿的“大牛”不谋而合,这都让他收获前所未有的满足。研究之魅力,在他这里,总是彰显出新生的活力。
  汪凌峰说,深度学习通过构建深度网络逐步从信息中获取知识,强化学习可将学习模型在失败、成功的案例中逐渐增强。深度学习和强化学习的结合是必不可少的。首先通过大量的经验信息,挖掘有用的知识,然后,将知识反作用于世界,进而在世界反馈的机制下,对学习模型进一步调整。通俗地讲,这种学习过程如婴孩的成长一般。“要认识世界,就难免会有跌倒、摔碰,但正是接触的过程才会获取认识的经验,从而为成长铺垫下一步道路。”
  以号称“打败”人类的AlphaGo为例,汪凌峰做了更为深入的介绍。“AlphaGo背后的技术原理,其核心内容就是深度学习与强化学习的结合。通过分析几千万个专业围棋玩家棋谱,从而使其学会评估不同走法的系统,进而运用搜索机制来选择最佳走法。”他还表示,AlphaGo所面临的棋局理解问题,在状态空间的表示上,相对尚小,目前来看也非最复杂的。在金融、医疗、仿真对抗游戏等方面还存在更多、更艰难的问题,而这些难题的主要难点一方面源于状态空间的表示,另一方面则源于信息的不完全。
  在未来,汪凌峰将以深度学习为基石,推动人工智能多领域技术研发,将强化学习作为着眼点,促进图像、视觉与智能化研究的全面发展。在世界顶级杂志发表学术成果,与众前沿学者交流思想;承担国家重大攻坚项目,将成果实现技术转换;增加团队与个人的合作沟通,展现独立核心技术在应用层面的实际效能每一站的风景,汪凌峰都勾勒得清晰而又明确,让远方不再是远方,而化为触目可及的前方。
  

分享到:
杂志
本期封面

2024年3月

上一期 下一期