@wanghuijiao
2021-12-08T16:19:48.000000Z
字数 1820
阅读 677
数据采集方案
技术文档
前言
- 需要提供文档内容(by 袁):
- 1、数据采集计划设计方法及相关建议(周三中午前,你先大概写个通用的,然后以WJ项目为例再具体展开一下);
- 2、CVAT使用教程(含数据筛选(这个问张工要文档连接)、基本标注、半自动标注、标签导入、多人协同标注流程、使用小技巧、运维QA)、周四中午前;
- 3、我们在git.d上开发的目标检测工具,readme和demo (袁工写,王和张再过下)
- 起因
- 在做具体项目时,数据“长”的大多数情况下与公开数据集不太一样,比如做人头检测任务时,任务需求是检测200米内极小的人头,但大多数公开数据集中此类数据偏少,不论是做训练集或是测试集都需要对实际应用场景进行数据采集,标注。而此类数据采集的工作琐碎但必不可少,工作内容重复度高,因此,此处提供一些通用建议和项目用例,以供参考。
数据采集流程
- 数据采集准备工作
- 首先,根据任务需求,拆解确定采集的数据需要包含的场景、数据量、采集软硬件设备,并事先调通数据采集软硬件设备;同时需要明确时间安排、人员安排、采集场景(最好详细描述场景内容,比如球机视角下十字路口密集人车场景)等信息。
- 其次,根据上一步信息,制定详细的采集计划表。
- 按采集计划进行采集
- 整理数据,备份上传到指定位置
WJ项目数据采集方案
WJ项目介绍
- 项目需求:
- 检测红外热成像图片,200米以内的人头、行人、车(轿车、大巴)三类。
- 任务分析
- 在红外热成像图片中做目标检测,与可见光任务不同之处在于,红外热成像人头、行人、车三类的公开数据集数据量极少,因此,对采集数据多样性要求高,标注成本随数据量直线上升。项目紧急时,标注时间占据了极大的部分,为提升标注效率,此次数据采集会同时采集可见光(RGB)和红外热成像(IR)双路信号,后续通过对齐操作将可见光与红外热成像图片对齐,随后通过RGB人头、行人、车三类目标检测模型对RGB图片半自动标注,从而生产对IR图片的半自动标注标签,如此可以大大提高标注效率。
采集方案
- 制定采集计划
- 场景
- 两种角度:车流来的方向、车流离开的方向
- 三个地点:省委党校仓前校区公交站、良睦路与文一西路交叉口、良睦路与文一西路交叉口延文一西路向西100米
- 时间段:早、中、晚(红外热成像对温度敏感,因此要考虑日照时间对温度分布的影响)
- 摄像头视角:高度距离地面1米,平视
- 三个地点、两种角度、三种时间点排列组合共有18种场景
- 数据量
- 每个场景中RGB和IR视频各采集5min,帧率30帧/s,大约每个场景9000*2帧图片,最终数据量约为6场景*9000帧*2 = 108000帧图片。
- 硬件设备
- Sumboy的ZX-IRC-IV双光相机:RGB具有多段调焦功能,1x、2x、3x、4x、5x、6x、7x、8x、9x、10x这10个焦段,其可视距离分别为150米、300米、600米、1200米、2400米、4800米、9600米、19200米、38400米、76800米。IR固定焦段。
- 采集数据时,固定采集RGB焦段在3x,IR采用默认。2台双光相机,并排放置,一台拍摄RGB,一台拍摄IR,同时开启拍摄。
- 软件
- 热像仪跟踪器云台操控软件(相机自带的上位机)
- 运行在Windows下。由于一台电脑仅支持一台双光相机,因此需要两台笔记本同时操作。
- 人员安排
- 两个采集人员:需要调试软硬件设备、搬运拍摄器材、采集数据等。
- 时间安排
- 数据采集计划表
时间段 |
角度 |
地点 |
数据量 |
状态 |
早 |
车流来 |
省委党校仓前校区公交站 |
5min |
|
|
|
良睦路与文一西路交叉口 |
5min |
|
|
|
良睦路与文一西路交叉口延文一西路向西100米 |
5min |
|
|
车远离 |
省委党校仓前校区公交站 |
5min |
|
|
|
良睦路与文一西路交叉口 |
5min |
|
|
|
良睦路与文一西路交叉口延文一西路向西100米 |
5min |
|
中 |
车流来 |
省委党校仓前校区公交站 |
5min |
|
|
|
良睦路与文一西路交叉口 |
5min |
|
|
|
良睦路与文一西路交叉口延文一西路向西100米 |
5min |
|
|
车远离 |
省委党校仓前校区公交站 |
5min |
|
|
|
良睦路与文一西路交叉口 |
5min |
|
|
|
良睦路与文一西路交叉口延文一西路向西100米 |
5min |
|
晚 |
车流来 |
省委党校仓前校区公交站 |
5min |
|
|
|
良睦路与文一西路交叉口 |
5min |
|
|
|
良睦路与文一西路交叉口延文一西路向西100米 |
5min |
|
|
车远离 |
省委党校仓前校区公交站 |
5min |
|
|
|
良睦路与文一西路交叉口 |
5min |
|
|
|
良睦路与文一西路交叉口延文一西路向西100米 |
5min |
|
2. 按采集计划表进行采集
3. 整理数据,备份上传到指定位置
- WJ项目中是统一通过公司网盘备份,然后传输到服务器进行后续预处理操作。