@heavysheep
2019-03-04T09:26:00.000000Z
字数 1603
阅读 896
需求分析
评估标准:在以下的说明中,我们使用COCO数据集作为评估数据集,以COCO mAP作为精度评价标准,以所有帧的平均mAP作为预估准确率率之一,其计算方式可以参考这里。
并预估一个常规场景中,大多数人理解的“准确率”作为参考指标。
模型速度:在提出的模型参考中,均以TITAN XP(京东价格约10000元)在单一图片的运算速度作为参考指标。
fps:即每秒帧数,2fps即为每0.5秒检测一张图片。这个指标和硬件成本相互关联,可以简单理解为fps翻倍时,硬件成本翻倍;fps减半时,硬件成本减半。
图像分割
可见,仅一个摄像头下,以目前的技术在此业务中,不仅速度不达标(1.2fps),精度也不足够(例如我们的面包识别商用的mAP保证在90以上)。
3. 手部在人员非主动展示的情况下,作为较小单位,检测中略有难度。
硬件:0.5fps下: 10000 + 10000元 * 摄像头
软件:200000元
mAP:20-30
准确率:30%-35%
视频姿态跟踪
跟踪结果自定义算法识别“洗手”行为
可见,精度在商用中依旧困难。
2. 根据姿态结果,识别“洗手”行为亦是先进和复杂的算法。在1的结果上进行开发更降低了精准度。
3. 人员在洗手时一般较难获得质量足够的图像(比如从后方拍摄,背部挡住了手部),就会出现难以识别的情况
4. 在多人进入洗手区域时,此时的跟踪在人员交错中容易跟踪错误,即不能识别A洗手后,B也进行了洗手。另外,在一个视频中,对A、B洗手完毕的界定也较难。
硬件:4fps下: 10000元 + 10000 * 摄像头
软件: 350000元
mAP:30-35
准确率:30-35%
图像识别
硬件:2fps下: 10000 + 2000元 * 摄像头
软件: 150000元
mAP:70-80
准确率:95%
你可能会想问,在业务3中,虽然先进模型在COCO数据集的精度并不高,但是我们可以做到较高的准确率,那是否其他领域也有机会做到如此可能?事实上是不行的,业务1、2是在一个时间区间内,识别一个结果,这是一个开阔的边界。而业务3是因为我们用MA作平滑后,通过较高的平均精度,压制错误样本的均值,这是两个不同的实现方式。