欢迎您登录科学中国人官方网站!!
新浪微博|网站地图|联系我们
王兵:迎接交叉学科研究的“大数据时代”

来源:  发布时间:2018-04-17

本刊记者  王 辉
  
      
  “这是最好的时代,也是最坏的时代。”英国著名作家狄更斯在《双城记》开篇这样写道。而当下的时代,对于从事智能信息处理研究的王兵来说,也是如此。
  各种技术的发展带来海量的数据,结合信息处理方法来解决生物医学、智能制造方面的问题,挖掘数据、分析结果,从海量数据中提取隐含在其中的信息进而对于生命医学与智能制造的进展提供帮助,这也是王兵的研究方向。作为一个多学科高度交叉的领域,其研究涉及信息、控制、计算机、生物以及医学等多个学科。“虽然困难重重,但我对交叉学科的研究前景非常看好。在这个前所未有的大数据时代,我愿意接受一切挑战。”王兵满怀斗志地说道。
  

交叉学科大数据处理


  对于未来,王兵有着清晰的规划和高瞻远瞩的眼光。2004年,在开始攻读博士阶段,他就预测大规模数据分析将是一个非常有前景的方向。在他看来,随着技术的进步,各个领域积累了大量的数据,而且这个趋势会越来越强。但是如何充分利用好这些数据,仅仅依靠各个领域的专家,几乎是不可能完成的任务。正因此,王兵希望自己能够从信息处理的角度在大数据里面挖掘新信息、探寻内存规律,从而对相关领域的研究进展提供帮助。
  事实证明,王兵当初的选择没有错。大数据计划已经成为欧美国家重要的发展战略,而在当时,我国大数据产业尚未形成,不仅缺少自主知识产权的高价值数据库,而且我国对大数据分析能力也存在着严重不足。为此,王兵决定走出去,只有接触更前沿的东西,才能拓宽视野。于是,王兵选择漂洋过海到美国深造。
  2009年,美国出台法案,将医疗卫生信息化列为重点发展方向,10年内将累计投入2760亿美元。2012年,美国政府又发布了《大数据研究和发展倡议》,旨在利用大量复杂数据集合获取知识和提升洞见能力,投入金额高达2亿美元。在美国的4年时间里,王兵深切地感受着美国生物医学大数据时代带给他的冲击,这也更加坚定了他学好本领回国效力的决心。
  做智能计算出身的王兵,按常理来讲,会选择进入和计算机或者信息处理相关的实验室,但他偏偏不走寻常路,先后选择加入了分析化学领域和生物医学领域的实验室。因为他明白,他所选择的领域是一个高度交叉的学科领域,如何更好地利用大数据为社会服务,是信息技术领域和生物医学领域共同面对的挑战,这需要自己对此两个领域都有较深的理解才行。
  近几年来,中国对于科研事业的鼓励和支持力度越来越大,国内大数据时代已来临,加上转化医学的兴起,中国生物医学研究有望实现历史性跨越。为适应生物医学大数据的发展,国家在生物医学信息领域对于专业人才的需求也越来越大,而正是报效祖国的大好时机。也正因如此,王兵毅然选择了回国。
  “国内的科研氛围越来越好了,只要全身心投入,一样可以做出一番成绩,一样可以实现自己的理想!”对于自己的选择,王兵信心十足。
  

蛋白质功能位点预测研究


  作为遗传信息的体现者,蛋白质是最主要的生命活动过程的载体和功能执行者。在生物体细胞中,蛋白质是通过与其他生物分子相互作用来完成特定的功能,但直接参与分子相互作用的残基只占一小部分,这些结合位点对实现蛋白质的功能显得十分重要。因此,分析和识别蛋白质和其他分子结合位点成为研究蛋白质功能实现机制的基础,是生物信息学领域的关键问题。
  “蛋白质功能位点预测研究”国家自然科学基金课题是王兵回国之后主持完成的第一个项目。通常情况下,对蛋白质结合面残基的定义有两类:第一类是根据蛋白质复合物内不同蛋白质链上氨基酸残基的距离来定义,一般给定一个阈值,小于这个值就认为是结合面残基;第二类是根据在蛋白质复合物形成前后,残基的可及面积的变化来定义,这里也需设定一个阈值或相对阈值。
  王兵认为,这种定义本身就会带来很多的假阳性和假阴性噪声,因为实际中很多蛋白质会在不同的位置与不同的对应蛋白发生相互作用。因此,王兵团队提出了一种蛋白质结合面残基的数据重构策略,以获得更高质量的数据源。实验结果表明,通过数据重构,可以得到很好的预测性能。
   尽管高通量实验技术针对不同物种产生了大量的蛋白质相互作用,但与生命系统所具有的真实的蛋白质相互作用相比,仍然只是一小部分。与此同时,实验方法费时费力,非常昂贵。基于蛋白质序列信息,王兵提出了一种新的PCA-EELM模型来对蛋白质相互作用进行预测。实验结果表明,他的方法获得了87%的预测精度、86.15%的灵敏度和87%的特异度,该方法极其有效。
  

用大数据为中医药正名


  中医药是中华民族瑰宝,但其在世界上的公认度似乎还没有那么高。对此,王兵认为,“中医药其实是一种成分问题,可以利用现代科学手段,对于中医药方进行分析,看看它的成分对于我们具体疾病的治疗效果如何。如果能从现代医学角度,利用数据挖掘和分析,把我们的古老中医从科学上进行解释,这也是一件非常有意义和有前景的工作。”
  王兵向记者介绍道,中医药领域具有典型的大数据特征。一是数据量巨大。我国人口众多,疾病的患病基数大,病人越多,采集信息越完整,对结果处理就会越准确。二是数据类型复杂。在中医院,每个患者不但要经过辨证论治的个体化诊疗,还会经过各种理化检测进行疾病及其预后的诊断,所以不只有病历资料中包含的信息,还会有生化检查、多种影像或病理切片检查的生物学信息。而收集这些庞大、多类别的数据,通过分析处理将其盘活,可以产生让人意想不到的价值。
  王兵认为,“‘大数据’充分应用到中医药的临床与科研,将会给这个领域带来革命性的变化,关键是如何把这些渺如烟海的数据成功采集出来,这是一个极其复杂的工程,也是一个大考验,处理得好,应用得当,大数据就会成为‘大优势’,为中医药发展带来‘大价值’”。而这也正是王兵目前正在研究的方向。
  以前,中医主要依赖个人在临床实践中积累的经验。在王兵看来 ,目前当务之急是进行技术体系的创新,而数字技术是促进中医药快速发展的必由之路。“这些海量信息就是一笔巨大的财富。利用数字技术记录中医临床诊疗实践中大量的中医学知识和诊疗信息,并把这些信息用于分析中医临床诊疗的疗效和经验知识,是中医药学现代化研究和发展的重要课题。”
  “大数据时代”将给中医药科研带来巨大的变化和极大的便利。王兵希望用现代科学技术进行中医药的研究,以加速中医药知识的更新和创新,并推进中医药的产业化和国际化进程,为我国中医正名。
  

时刻在创新


  当下,大家都在谈“创新”,科研界更是如此。但是在王兵的眼中,创新不是一个响亮的口号,而是要具体落实到每一个细节中去。王兵说:“以我对创新的理解,我们应该时刻都在创新。发现一条新的规律、做一个全新的实验,或者从日常生活中找到不一样的东西。我觉得只要有一点点不同于前人的形式,都可以归纳为创新”。
  王兵也把他的“创新”思想运用到团队管理和日常的教学中去。“每个人都应该是复合型人才,能力都是多方面的,但是也都各有所长”。王兵会根据每个人的特点,因材施教,多方面锻炼他们。在王兵的团队里,时刻都可以感受到开放自由的工作氛围,这也是他很得意的一点,“团队是一个整体,但也要百花齐放”。
  说到今后的目标,王兵的理想显得朴素又接地气,“把自己本职的研究工作做好,如果我的研究能为病人解决掉哪怕一个很小的问题,我就感到极其欣慰了”。

 

专家简介:
  
  王兵,IEEE高级会员,安徽工业大学教授,同济大学博士生导师。2006年获中国科学技术大学博士学位,2007年香港城市大学高级研究助理,2008~2012年在美国路易斯维尔大学、范德堡大学从事博士后研究。近几年发表高水平论文70余篇。主持国家自然科学基金项目3项、省部级项目5项,安徽省科研平台创新团队负责人,入选安徽省学术与技术带头人后备入选,中科院院长奖获得者。

分享到:
杂志
本期封面

2024年3月

上一期 下一期