【网易智能讯8月23日音讯】近来,澎思科技(Pensees)在根据视频的行人再辨认数据集(PRID-2011,iLIDS-VID,MARS)中获得打破。
据了解,澎思科技算法在最大的视频数据集MARS上的首位命中率目标88.8%,在iLIDS-VID和PRID-2011等数据集上首位命中率分别为88.0%和95.5%。
具体来说,首要包含三个方面:
1、受遮挡、姿势改变、视角改变等要素的影响,视频序列中行人的特征是不接连的。用大局特征来衡量每一帧图片的权重往往会丢失掉许多重要的信息。选用切割重组战略将特定部分特征重组成多个视频序列进行学习,然后极大削减部分特征丢失对终究特征的影响。
2、提出双向图注意力机制模块。将图卷积神经网络和SENet结合,在整个序列上进行通道域的形式挑选学习。一起经过双向网络进行空间域的注意力区域学习。因为图卷积网络的特性,每一帧图片的注意力特征都是与其他帧彼此学习结合的成果,然后进步特征的代表性。
3、使用帧间类似度进行序列交融。经过数学核算的方法就可以到达交融的意图。这样,数据的类内类似度得到了进步。在结合三元丢失函数进行练习后,类间类似度得到了下降,然后进步重辨认作用。
澎思科技角介绍,根据视频的行人再辨认(ReID)技能更靠近才智城市建设的许多使用场景,能有用处理行人信息有限、特征缺乏及其他搅扰要素等问题,比较单帧图片的行人再辨认具有更久远的落地使用空间。(定西)
本文来历:网易智能 责任编辑:顾雨芯_NBJS8596