来源: 发布时间:2025-11-26
——记香港科技大学(广州)人工智能学域助理教授陈颖聪
李 莉 周晴晴
近年来,生成式人工智能在AI技术应用中持续成为焦点,其中文生视频大模型Sora凭借60秒连贯视频生成能力,在全球范围内掀起了新一轮技术热潮.。香港科技大学(广州)人工智能学域助理教授陈颖聪正聚焦这一领域的前沿研究,他的核心方向是突破文本生成3D模型的技术瓶颈。
“技术之所以备受关注,源于它在游戏开发、影视制作、工业设计等领域的变革性潜力.。传统3D建模需要30~200小时的复杂流程,而生成式AI有望将其压缩至数小时甚至更短.。”陈颖聪介绍,数字3D资产不仅能实现高度可视化,还能构建与现实世界深度交互的复杂场景,这种能力将随着技术的演进而持续增强.。
如今,结合生成式视觉模型的成果与业界开展跨领域研究,陈颖聪已与思谋科技、华为诺亚方舟实验室、趣丸科技等公司开展合作,持续在工业智能、智能驾驶、智能创作等应用领域寻求突破。值得关注的是,他的研究也正从静态生成向动态交互演进——关注视觉生成模型在具身智能上的应用,用生成模型构建高度拟真的虚拟世界训练具身智能体,有望培育出适应复杂现实场景的机器人..。正如Sora展现出的物理规律模拟能力,生成模型与具身智能的结合,或将重新定义人工智能理解并改造物理世界的方式.。
跨界融合探真知
陈颖聪的学术成长轨迹呈现出典型的学科交融探索特征。他的科研生涯始于通信工程专业学习阶段,大三时在中山大学赖剑煌教授的数字图像处理课程中他初次接触计算机视觉领域。这段经历颇具转折意义——当时深度学习尚未兴起,传统计算机视觉研究方法面临诸多局限,但正是这种技术挑战激发了他的研究兴趣。
有一个关键点是,赖剑煌教授在人脸识别领域的研究恰好与陈颖聪的个人需求相契合。“我希望可以学以致用,通过研究人脸识别去解决自己脸盲的问题。”陈颖聪笑说。科研需求与个人兴趣共振的机缘成为他持续深耕的重要动力。
在学术进阶的关键节点上,陈颖聪特别提到了博士生导师贾佳亚教授对他研究思维的深刻影响。在香港中文大学攻读博士学位期间,贾教授提出的“真问题导向”研究范式与他之前的固有理念形成鲜明对比。贾教授以自身从图像复原转向深度学习的研究转型,示范了如何突破领域惯性思维,这种身教胜于言传的指导方式使陈颖聪深刻领悟到学术研究的本质在于解决真实世界的关键问题,而非单纯追求发表指标或所谓的热点。
这种理念的转变在陈颖聪后续的科研实践中得到充分体现。在麻省理工学院从事博士后研究期间,他将计算机视觉领域的经验创造性应用于无线感知与医疗健康的交叉研究,成功取得了基于Wi-Fi信号的远程血氧监测和帕金森病无扰诊断等突破性成果。这些跨领域探索不仅验证了“真问题导向”研究范式的有效性,更让他体验到前沿科研应有的创新维度。
“这段经历颠覆了我先前对科研的认识:优秀的研究工作不仅可以深入探究单一领域的方法机理,还可以从现实问题出发,有机融合多个领域的知识,形成新的理论与方法,进而为原有领域带来全新的思维范式。”陈颖聪说。这段经历亦让他明确了未来的研究方向。
加入香港科技大学(广州),陈颖聪正是看中学校交叉学科的发展定位与个人研究理念的高度契合。“在AI技术快速迭代的当下,保持对‘真问题’的敏锐洞察和跨学科整合能力,或许是突破研究瓶颈的关键所在。”陈颖聪坦言。
学海无涯守本心
在香港科技大学(广州),陈颖聪找到了理想的研究土壤,学校不仅提倡跨学科研究,更通过宽容的管理模式为高风险的研究提供了保障。这赋予他更多空间去尝试那些“无人区”的探索。然而随着研究深入,他意识到:需要解决的问题实在太多,可能一辈子都做不完。这种认知促使他重新审视自己的学术追求,最终回归研究初心——聚焦解决真实问题。“身处视觉生成模型这一热门领域,许多现有研究可能很快就会被突破或形成共识。但我相信,在这个大领域内终将找到自己的贡献点,而这个定位会随着研究进程自然显现。”陈颖聪说。
在科研上,陈颖聪目前主要深耕两个领域:基础研究和产业应用。基础研究方面,他致力于提升生成式视觉模型的质量、速度、可控性等核心指标;产业应用方面,则充分发挥跨领域研究经验,从大湾区实际产业需求中提炼关键问题。这种双轨并进的研究模式,既保持了学术深度,又确保了研究价值。
校企合作项目是陈颖聪研究的重要组成部分。以三维生成模型项目为例,他与趣丸科技的合作颇具代表性。这个项目源于企业数字化转型需求,尽管面临激烈的市场竞争,但双方组成的联合研究团队仍取得了显著进展。合作推出的Kiss3DGen模型,创新性地利用现有2D图像生成模型的知识与框架,将多视图图像和对应法线贴图拼接成三维聚合图,把传统3D生成问题转化为2D图像生成任务。即使在有限的训练数据条件下,Kiss3DGen仍能生成高质量的3D资产,减少对大规模数据的依赖,同时在灵活性和性能方面表现出色。目前,Kiss3DGen单独使用效果已优于现有开源方法,而且在与现有方法结合后,性能可进一步增强。
陈颖聪介绍,三维生成模型的意义类似于文字生成图像技术,作为基础模型可大幅降低建模门槛。在游戏开发、建筑设计等领域,它能将原本需要数周的建模过程缩短至一两个小时,实现降本增效。更重要的是,它让非专业人员也能参与建模,加速创新迭代。此外,团队还探索了AI与消费市场的结合,尝试开拓三维模型打印等增量市场。
产学研深度合作模式给陈颖聪带来深刻启示。他发现,科研已从单打独斗转向需要学界与产业界协同推进。学界能快速收敛技术路线,产业界则提供数据、算力等资源支持。更令他欣喜的是,参与项目的学生的研究思维发生了明显转变——从单纯关注技术实现,转为思考研究成果的系统价值和社会影响。
在香港科技大学(广州),陈颖聪切身体会到“以学生为中心”理念的真正落地。学校领导通过定期组织青年教师聚餐等非正式交流,为学术民主创造了开放环境。这种管理模式不仅体现在制度设计上,更渗透到日常互动中,使陈颖聪逐渐形成了“成长教练”的教育理念——注重通过培养学生全面发展来推动科研进步,而非单纯追求学术产出。
在具体实践中,陈颖聪有意注重培养学生识别“真问题”的能力。面对AI领域普遍存在的论文竞赛现象,他营造纯粹科研氛围,引导学生回归研究本质。这种理念亦体现在他对团队的独特管理方式中:博士生和硕士生自发形成研究小组,通过“传帮带”机制实现知识传承;团队成员能主动协调资源分配,这种协作精神在竞争激烈的AI领域尤为珍贵。团队采用分层协作模式,陈颖聪负责把握跨领域方向,学生则深耕细分领域并定期分享见解,形成知识流动的良性循环。
面对AI技术的飞速发展,陈颖聪保持着清醒认知。他目前聚焦生成模型与具身智能的结合研究,这一选择源于对行业痛点的深刻理解。“演示视频再酷炫,如果不能适应真实环境的微小变化,就永远无法进入应用。”他指出现有具身智能系统的泛化性瓶颈。通过生成模型模拟多样化场景数据,他正试图突破这一限制,让机器人真正具备普适性。为此,他计划加大与产业界的交流,确保研究方向始终对准真实需求。
在应对技术迭代带来的挑战时,陈颖聪有前瞻性思考——当某个领域刚开始爆发时,就预判哪些问题具有长期价值;在技术收敛阶段,则主动寻找尚未标准化的创新空间。“我们要做的不是追赶潮流,而是创造潮流。”他始终强调保持非功利性好奇心的重要性,希望帮助学生建立应对快速变化的定力。

