[关闭]
@superpigy 2023-07-24T16:53:58.000000Z 字数 1114 阅读 31

专利答复

  1. Target Dropout(自研)并非传统TargetDropout方法(名字一样内容不同)。传统CNN方法更多的关注纹理特征以及高频特征使得牛脸上真正具备区分度的特征没有被学习从而导致在不同光照,比对间隔长度以及遮挡环境下的识别准确率降低。TargetDropout分支中的通道注意力会提取当前网络中特征图概率分布并根据显著图筛选器筛选出TopK个高频特征通道然后通过NMS降低不同通道关注特征的相关性并最终用Blockwise Dropout MaskMap强迫网络忘记过度关注的高频特征去学习图像中的低频信号。TargetDropout仅在训练中使用,推理时会被略掉从而可以在不影响模型推理速度的同时极大增强模型的特征抓取性能。

  2. KeyAttention(自研)并非传统方法, 用于解决传统CNN仅关注局部特征的问题。其通过KeyQuery以较低计算成本建立多个不同通道之间的特征关联空间。之后使用自研简化的多头注意力来关联不同的特征关联空间从而形成级联效应可以让训练网络有更大的长距离特征群的感知能力。而LambdaAttention的引入可以弥补简化多头注意力的特征性能损失并降低整体注意力的内存及计算需求从而提高模型推理速度。

  3. Depthwise Region Attention(自研)并非传统方法,用于提升特征强度并稀疏化密集特征。其中Depthwise 3x3 Conv分支用共享卷积核的方式在减少内存使用的同时压缩合并特征通道从而降低模型参数量。通道指导性池化分支用类似门控机制的方式来保证(2)中级联特征的稀疏性从而增大不同牛脸的特征区分度并降低推理时所需的计算要求。GemPooling为传统方法用于增强全局特征(譬如轮廓等)

  4. TTA(Test-time augmentation)为公开方法在牛脸识别领域的自研改进方法。由于牛脸与人像不同,采集时无法规定其保持合适的姿态,光照,遮挡率。所以在进行AI特征编码前,用图像生成技术会已采集图片(标记为Anchor图片)以随机噪音向量(符合正态分布)生成多张无遮挡,光照多样性的图片来增加采集图像的多样性来保证后续AI编码的鲁棒性。同时也可以减少采集图片数量提升系统在开放世界的落地可用性(譬如密度高的牛群,牛脸可能只出现一瞬)

  5. 对于自适应阈值系统的补充
    在开放世界牛脸识别系统中,固定阈值在较多ID的Close-Set识别库中会导致大量误识率(较高的False-Positive或者False-Negative)因为每头牛的特征决策边界不可控,尤其是采集多样性较少的牛只ID。自适应阈值系统会计算并预测Close-Set识别库中每个ID的合理决策边界从而降低比对时的误识率。

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注