竞技赛场上,视频跟踪转播运动健儿的飒爽英姿;公共场所里,监控设备定位监测可疑行为;自动驾驶中,收集道路实时信息指挥车辆行驶。日常生活中,相机的应用已无处不在,视频分析与日俱增的需求引发目标跟踪算法的迅猛发展。
目标跟踪发展迅猛
算法面临多元挑战
随着当代媒体设备与视频图像的高速发展,目标识别与跟踪成为计算机视觉领域的重要研究方向,通常识别出目标后,后续帧持续跟踪,利用矩形边界框锚定目标,以实现目标的定位与追踪,其关键便在于对个体或多个体实时提取特征并准确识别分割。在目标跟踪过程中出现的特征丢失,往往会使跟踪器在后续视频帧中无法准确识别分割目标,如何应对这些挑战为算法带来了巨大压力。
● 目标消失:若目标全部被遮挡或长时间被遮挡消失在视野范围,会造成目标跟踪器无法有效更新,从而跟踪失败。
● 目标运动:目标因运动导致的位移旋转、姿态变换、尺度距离等情形很容易影响目标的特征表达,当目标移速过快,与前序帧位置差异较大,甚至产生模糊时,也会加大跟踪难度。
● 背景干扰:主要表现是前景与背景界限不明,包括背景杂乱以及光照变化等干扰。其中强烈光照不仅会模糊背景界限,也会使得目标外观颜色等特征细节丢失,从而加大跟踪的难度。
特征提取成关键
深度学习来助力
在目标跟踪的任务中,如何在复杂多变的情形下成功提取目标特征成为关键问题,在其他领域中已经表现出强大的特征提取和表达能力的深度学习开始被应用到目标跟踪领域。基于分类的深度学习跟踪算法MDNet使用小型VGG网络,通过多域联合训练一个网络,从而使得这个网络拥有提取共性和个性特征的能力,提高对目标和背景的辨别能力。而针对目标移速过快及被遮挡的问题,在MDNet基础上加入GAN网络的VITAL算法,生成遮挡情况下的正样本从而使分类器具备解决此类问题的能力。
▲MDNet结构设计
孪生神经网络算法采用两个Alexnet网络组成双分支结构网络,其中一个分支用于提取样本图像特征,另一个分支用于提取搜索图像特征做相似性比较,取响应最大的地方作为目标中心,另外在此基础上加入RPN网络,能够很好地应对尺度变化问题。
数据提升训练效果
深度筑牢算力支撑
目标跟踪作为底层视觉分析技术,能够辅助进行其它视觉任务,在安全监控、交通管控、自动驾驶、人机交互、医疗诊断及军事等领域都具有巨大的应用前景。其中安全监控广泛应用于日常生活的各个角落,如银行、超市、车站等人员流动性强场所,通过对可疑目标或行为的识别、跟踪、分析并预警,提升公共安全系数。
AI产业的飞速发展,萌生了大量垂直领域的数据需求。无论是人手一部的手机还是随处可见的摄像头、传感器都在产生积累着数据。如果说AI是数字社会的生产力工具,那么数据便是生产原料,我们前进的动力便在于算力筑基打通数字动脉,为数字化进程开疆扩土。
2023-07-07 坤前科技发布了 《金i奖榜单揭晓!坤前计算机荣膺“2023服务器创新企业奖”》的文章
2023-06-28 坤前科技发布了 《坤前计算机荣登“2023 AI服务器企业排行榜”四强》的文章
2023-06-16 坤前科技发布了 《智能加速 算力先行 | 坤前明星机型闪耀安博会》的文章
2023-05-15 坤前科技发布了 《客户案例 | 坤前携手广州大学 为高校科研添翼》的文章
2023-04-20 坤前科技发布了 《排名第二!迈向新高峰!》的文章