[关闭]
@wanghuijiao 2021-11-25T10:56:18.000000Z 字数 2131 阅读 522

数据集发布教程

技术文档


前言

使用步骤

1. 准备数据集

2. 准备配置文件

数据集输入配置文件

  1. {
  2. "data_root": "/ssd01/wanghuijiao/tdlp/test/cethik_seg_example", // 数据集根目录的路径
  3. "image_dir": "images", // 原始图片根目录相对路径
  4. "masks_dir": "labels", // 标签图片根目录相对路径
  5. "sample_list_file_format": "{}.txt", // 样本列表模版相对路径,在'{}'中使用 train/val/test 替换,分别表示训练集、验证集、测试集对应的样本列表。
  6. "annotation_file": "categories.json" // 类别信息文件相对路径
  7. }

数据集发布配置文件

  1. {
  2. "name": "RGB_Passage-area_Segmentation", # 数据集名称
  3. "version": "v1.0", # 数据集版本号
  4. "task_type": "Segmentation", # 任务类型,比如目标检测(Object_Detection)、分割(Segmentation)
  5. "scene": "Available pass area", # 应用场景描述
  6. "anno_type": "cethik_seg", # 标签格式,目前支持“yolo” 、“coco”、“cethik_seg”,注意是小写
  7. "number": {
  8. "train": 100,
  9. "val": 100,
  10. "test": 100
  11. }, # train\val\test包含的标签数量
  12. "size": "1GB", # 数据集大小
  13. "storage_location": "/ssd01/wanghuijiao/tdlp/test/cethik_seg_example", # 数据集文件夹所在的绝对路径
  14. "release_person": "Wanghuijiao", # 发布人姓名全拼
  15. "release_time": "2021/11/11", # 发布时间:{年}/{月}/{日}
  16. "description": "This is used for ..." # 数据集描述,比如详细用途说明、版本间的改动或者对此数据集的其他补充说明等信息
  17. }

3. 运行发布脚本

  1. wget https://git.cethik.com/wanghuijiao/tdlp/-/tree/main/tools/dataset_release.py
  1. python dataset_release.py \
  2. --dataset_release_json_path /ssd01/wanghuijiao/tdlp/test/cethik_seg_dataset_release.json \
  3. --dataset_input_json_path /ssd01/wanghuijiao/tdlp/test/cethik_seg_dataset_input.json
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注