报告人:吴鹏
报告题目:基于视觉语言基础模型的视频异常事件理解
时间:2025年12月24日 16:00-18:00
地点:数学楼2-3会议室
报告摘要:
视频异常理解是人工智能在公共安全、工业监测与自动驾驶等场景中的重要应用,其目标是在复杂、开放且动态变化的环境中,自动发现并理解偏离正常行为或状态的异常事件。长期以来,相关研究主要集中于视频异常检测任务,相关方法在闭集有限场景下取得了一定进展,但在真实世界应用中仍普遍面临对未知异常泛化能力不足、异常语义缺失、解释能力有限以及跨场景迁移困难等关键问题。基于视觉语言模型的视频异常事件理解研究面向复杂开放环境下的安全感知需求,利用视觉语言模型的自身泛化性、世界知识、推理能力等特性,突破了传统方法依赖密集标注、仅能输出无语义分数的局限。本研究报告提出以视觉语言基础模型为核心的视频异常理解体系,包括异常检测、异常检索、异常描述推理、开放识别等方向。
报告人简介:
吴鹏,西北工业大学准聘副教授,硕士生导师。所在团队依托平台为空天地海一体化大数据应用技术国家工程实验室和陕西省语音与图像信息处理省重点实验室。本人分别于2022年和2017年在西安电子科技大学获得博士学位(校优秀博士论文)和学士学位(专业排名:1/144)。2023年获得中国电子教育学会优秀博士论文,2025年入选斯坦福全球前2%顶尖科学家榜单。目前主要从事深度学习与视觉领域的相关研究,包括视频异常事件检测、视觉语言模型等。目前已发表论文40余篇,其中以第一作者及通讯作者身份在TOP期刊和会议上发表论文17篇,谷歌学术引用3200余次。担任TIP、TNNLS、TCSVT、TMM、CVPR、ECCV、ICCV、AAAI等知名期刊和会议的审稿人。
邀请人:李慧斌教授