海量视频内容快速检索与深度分析的关键技术及其应用
对多模态目标进行快速检索和深度分析是海量视频内容处理亟待解决的公开难题(Nature 2009报道)。围绕这一难题,在国基面上、省基重点和省部产学研等项目的持续支持下,在视频监控、人像采集和视频会议等应用(迫切需要高性能海量视频处理技术)的驱动下,项目组深入研究了基于仿生视觉的视频内容快速检索和深度分析技术,获得创新成果如下:
(1)针对多模态不变特征设计快速多分类算法,发明了保持几何特征不变性的细粒度视频内容检索方法,显著提高了多角度、多区域、多背景、多轮廓、多色差、多类别等六种细粒度内容的检索速度(≦0.02秒)与准确率(>95%),整体性能提高了3%-6%,与IBM公司QBIC系统技术性能持平,达到国际先进水平。
(2)针对人脸局部特征设计增强的多分类算法,发现了低复杂性、五官特征偏移不变性的人脸快速检索方法,显著提高了上亿级人脸库的检索速度,检索采用的实际应用人像库规模居世界第一(用户单位之一山东省公安厅的人脸库规模达到了1.04亿);将彩色监控视频人脸检索效率提高了5%,打破了美国SecurOSFace技术多年占据视频人脸识别性能第一的局面,并在国际视频监控领域首次实现了红外模式的蒙面人事件检测系统;整体技术水平达到了国际先进水平。
(3)运用基于双凸优化的多核学习模拟了双目视觉分类,率先获得了低复杂性、高抗扰性的敏感信息智能检测方法,在保持计算时间优于Facebook 的PhotoDNA 技术前提下,将相似颜色干扰的色情信息检测准确率提高了13%,响应时间缩短至0.3秒内,视频截图的舆情信息检测准确率提高至>96%,整体技术提升至国际先进水平。张景中院士为主任的鉴定委员会一致认为:“项目针对海量视频内容的检索与分析,提出了视频内容快速检索技术、基于敏感信息智能分析技术…对推动我国公共安全视频数据处理分析和快速检索发挥重要作用