[关闭]
@wanghuijiao 2021-07-12T11:24:41.000000Z 字数 7471 阅读 1438

视频理解领域小样本调研报告

学习笔记



0. 前言

背景

本文组织结构

参考资料

1. 问题定义和调研结论

1.1 问题定义

1.1.1 行为识别算法面临什么问题?

1.1.2 小样本学习可以解决什么问题?解决的怎么样?

1.2 调研结论

1.2.1 能否用小样本学习解决行为识别模型遇到的问题?

1.2.2 假如尝试将小样本学习用于跌倒检测,预计能达到什么效果?

2. 小样本学习研究现状

2.1 常用数据集

数据集 动作类别数 总视频数 train:val:test 或train:test(类别数比值)
UCF101 101 13320 51:50
HMDB51 51 6766 26:25
Olympic-Sports 16 783 8:8
Kinetics-100 100 100*100 64:12:24
Something-Something V2-100 100 100*100 64:12:24
miniMIT 200 200*550 120:40:40
Human-Centric Atomic Action 466 -- 310:156
Finegym 288 -- 231:57

2.2 主流算法可以分为哪几类

2.3 各种SOTA方法在数据集上的精度

算法 算法类别 UCF101 HMDB51 Kinetics-100 SSv2-100 miniMIT Olympics-Sports HAA Finegym
ProtoGAN (2019ICCV) Generative Method 80.2 54.0 -- -- -- 86.3 -- --
Ashish et.al (2018WACV) Generative Method 78.68 52.58 -- -- 83.81 -- --
CMN (2018ECCV) Metric-Based -- -- 78.9 -- -- -- -- --
CMN-J (2020TPAMI) Metric-Based -- -- 78.9 48.8 -- -- -- --
TRAN (2019BMVC) Metric-Based (时序) -- -- 78.5 -- -- -- -- --
ARN (2020ECCV) Metric-Based (时空) 84.8 59.1 82.4 -- 57.35 -- -- --
OTAM (2020CVPR) Metric-Based(时序) -- -- 85.8 52.3 -- -- -- --
TRX Git (2021CVPR) Metric-Based(时序) -- -- 85.9 59.1 -- -- -- --
AMeFu-Net (2020ACM) Metric-Based(深度) 95.5 75.5 86.8 -- -- -- -- --
Semi-supervised FAAR Git (2020arXiv) Metric-Based(时空) -- -- -- -- 61.77 -- 80.68 75.84
UCF101 Few-Shot Action Recognition Git -- 94.28% -- -- -- -- -- -- --

3. 小样本学习流程

3.1 数据集长这样

3.2 模型训练过程

3.3 测试流程

4. 用小样本学习解决行为识别需要做什么

4.1 数据集准备

4.2 开源算法复现可行性评估

4.2.1 TRX

4.2.2 Few-shot-action-recognition

4.2.3 UCF101 Few-Shot Action Recognition

附录. 一些必须了解的基本概念

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注