Applications of MEMS Gyroscope in Infrared Imaging Systems
-
摘要: 简要介绍了红外成像导引系统中的稳像技术原理,说明陀螺仪在辅助设备电子稳像系统中的重要地位。目前,国内辅助设备电子稳像系统中常采用的光纤陀螺,文中对光纤陀螺的优缺点进行分析,并与新兴的MEMS陀螺在技术指标层面作对比。再设计试验方案,从试验的角度论证MEMS在实际应用中可以代替光纤陀螺,并且在性能、体积、价格上比光纤陀螺更有优势。
-
0. 引言
随着无人机技术的迅猛发展,在军事方面无人机发挥了影响战局的重要作用,如何对空中无人机进行检测成为一重要研究方向。现阶段最简易的方法是通过红外检测技术,对红外图像中无人机小目标进行识别,这在远程预警、空间监视、战场侦察等领域都有重要作用。在通常情况下红外小目标图像背景复杂、成像距离远、小目标尺寸小、缺少目标的纹理特征,因此对小目标的精确识别和定位存在一定的难度[1-2]。近几十年来人们对这一领域进行了大量的研究,2016年,Chen等[3]提出了基于深度学习的小目标检测网络,通过引入小目标检测数据集以及数据集的评估指标,将标注框面积占总面积小于0.58%的部分定义为小目标。Pang等[4-5]提出基于多尺度融合的Faster-RCNN(Region-based Convolutional Neural Network)的小目标检测方法,提高了无人机对地面车辆目标的检测精度。Li等[6]提出了构建轻量的并行混合注意力模块抑制图像中复杂背景和负样本的干扰,同时通过调整下采样倍数,来保证传递更多的信息,但像船类等密集小目标分布方向具有任意性,易造成预测框重叠,导致水平检测框无法精确定位目标位置。Xie等[7]提出了Drone-YOLO(You Only Look Once)模型,设计了新的特征融合模块和特征金字塔结构,用于提高对小目标的关注度,但是模型参数较多、计算量大、实时性较低。Ni等[8]提出了一种基于金字塔共生特征架构的红外小目标检测算法,提取出更多的边缘和纹理信息,但复杂背景下的检测效果仍然不甚理想。小目标检测仍是计算机视觉中一个富有挑战的难题,如何对红外小目标进行快速、准确地智能化检测具有重要意义[9-10]。
1. 本文总体方案
1.1 小目标检测层
由于小目标检测对精度和速度都有较高要求,文中将YOLOv8_n检测算法作为基础框架,并从特征金字塔融合、注意力机制及损失函数3个角度进行优化。在特征提取阶段,由于YOLOv8_n的下采样倍数比较大,较深的特征图很难学习到小目标的特征信息,而无人机目标又缺乏明显的形态特征。因此提出增加小目标检测层对较浅特征图与深特征图拼接后进行检测以充分利用全局上下文信息。同时增加了用于微小物体检测的预测头。预测头由更浅层、更高分辨率的特征图构成。新的预测头与其他3个预测头形成四预测头结构,虽然增加了计算与存储的成本,但对微小物体的检测性能有较大提升。未加小目标检测层时mAP@0.5为0.8514。构建小目标检测层后mAP@0.5达到了0.8832,提升了3.7%。但是在增加检测层后,带来的问题就是计算量增加,导致推理检测速度降低30.4 FPS。
改进后的网络模型如图 1所示,红虚线为改动模块。
1.2 注意力机制
在红外小目标检测任务中,通过不同的卷积信道提取目标的不同特征将导致太多的训练资源被用于无小目标区域[11-13],从而导致网络的训练效率低下。为了解决这一问题,文中将高效通道注意力机制SA(Shuffle-Attention)模块注意力添加到YOLOv8_n目标检测模型的特征提取层,具体网络结构如图 1所示。通过添加SA注意力模块,将不同的权重分配给不同的卷积信道,以突出小目标特征,通过适当的跨通道交互,避免了降维对学习通道的影响,大大降低了模型的复杂度,只添加少量参数,可以实现客观的性能改进。
SA[14]的设计思想结合了组卷积(为了降低计算量)、空间注意力机制和通道注意力机制,SA首先将通道维分组为多个子特征,对于每个子特征,SA利用Shuffle Unit在空间和通道维度上的特征依赖性,将所有子特征汇总在一起,并采用“channel-shuffle”运算符来启用不同子特征之间的信息通信。通过这种结构,模型可以选择性地增强包含目标特征更多的细节,抑制不相关或弱特征[15-16]。
SA注意力机制分块并行使用空间和通道两类注意力机制,使两类注意力机制高效结合。SA模块结构如图 2所示。具体步骤如下:
1)将输入特征图分组,作为SA单元;
2)每个SA单元分为两部分,一部分使用通道注意力(如图 2中橙色矩形),另一部分使用空间注意力(如图 2中蓝色矩形);
3)A内部两个部分按通道数叠加,实现信息融合;
4)最后对所有SA单元进行随机混合操作进行重排,得到最终输出特征图。
1.3 IoU loss函数
YOLOv8_n使用的分类损失函数为BCE(Binary Cross Entropy),回归损失函数是CIoU loss+DFL(Distribution Focal Loss),其中CIoU[17]定义如式(1)所示:
$$ {R_{{\text{CIoU}}}} = \frac{{{\rho ^2}(b, {b^{{\text{gt}}}})}}{{{c^2}}} + \alpha \nu $$ (1) 式中:b、bgt分别代表预测框和真实框的中心点;ρ代表计算两点间的欧氏距离;c代表的是能够同时包含预测框与真实框的最小包围框对角线距离;α是权重系数:
$$ \alpha = \frac{\nu }{{(1 - {\text{IoU}}) + \nu }} $$ (2) 式中:IoU(Intersection over Union)是预测框与真实框的交并比;ν是用来度量长宽比的相似性定义为:
$$ \nu = \frac{4}{{{{\text{π }}^2}}}{(\arctan \frac{{{w^{{\text{gt}}}}}}{{{h^{{\text{gt}}}}}} - \arctan \frac{w}{h})^2} $$ (3) 式中:w、h、wgt、hgt分别为标注框宽、高和真实框宽、高,完整的CIoU定义为:
$$ {L_{{\text{CIoU}}}} = 1 - {\text{IoU}} + \frac{{{\rho ^2}(b, {b^{{\text{gt}}}})}}{{{c^2}}} + \alpha v $$ (4) 但CIoU存在一定缺陷,v长宽比描述的是相对值,存在一定模糊,并且未考虑难易样本平衡问题,但由于训练数据不可避免地包含低质量示例,几何因素(距离和长宽比)将加重对低质量示例的惩罚,静态聚焦机制(Focusing Mechanism, FM)不能区分标注框质量高低,模型的泛化性能较弱[18]。文中通过使用WIoU_v3[19]利用动态非单调FM的梯度增益分配策略,可以在训练的不同阶段,做出最符合当前情况的梯度增益分配策略。在训练早期保存高质量锚框,削弱几何因素的惩罚,使模型获得更好的泛化能力,并在训练中后期,WIoU_v3将较小的梯度增益分配给低质量锚框,以减少有害梯度,提高模型的定位性能[20]。
WIOU_v3定义如下:
$$ {L_{{\text{WIoU}\_\text{v3}}}} = \gamma \cdot {R_{{\text{WIoU}}}} \cdot {L_{{\text{IoU}}}} $$ (5) $$ {R_{{\text{WIoU}}}} = \exp (\frac{{{{(x - {x_{{\text{gt}}}})}^2} + {{(y - {y_{{\text{gt}}}})}^2}}}{{(W_{\text{g}}^2 + H_{\text{g}}^2)}}) $$ (6) $$ \gamma = \frac{\beta }{{\delta {\alpha ^{\beta - \delta }}}} $$ (7) 式中:Wg、Hg为最小包围框的宽高;RWIoU为预测框框和真实框中心点之间的归一化距离。式(7)中α与$\delta $是常数,β是离群度。离群度是指锚框与标注框之间的IoU与均值IoU的比值,随着训练轮数的变化影响γ,因此完成了动态非单调FM的梯度增益分配策略。
2. 数据集与实验指标
2.1 数据集
文中的实验数据来源于公布在Science Data Bank中复杂背景下红外弱小运动目标检测数据集[21],再加以筛选以及图像增强,最终使用其中的2033张进行训练,以4∶1比例随机划分训练集和测试集,其中训练集1624张,测试集409张,借助Lableimg软件对转换的数据集进行标注。
图 3显示,数据集中标注的红外小目标在图像中的相对宽度集中在0.095以内,相对高度集中在0.06以内,图像面积集中在0.57%以内,基本满足文献[3]中对小目标尺寸的定义。
2.2 实验指标
采用精度均值(mAP,IoU阈值取0.5)评估模型性能,采用FPS(Frames Per Second)来评估模型检测速度,其中mAP和AP表达式为:
$$ {\text{AP = }}\frac{{{\text{TP + TN}}}}{{{\text{TP + TN + FP + FN}}}} $$ (8) $$ {\text{mAP}} = \frac{{\sum\limits_{n = 1}^{{\text{Num(classes}})} {{\text{AP}}(n)} }}{{{\text{TP + TN + FP + FN}}}} $$ (9) 式中:TP为识别正确的正样本的数量;TN为识别正确的负样本数量;FP为错误识别成正样本的负样本数量;FN为错误识别成负样本的正样本数量。
3. 实验与结果分析
3.1 优化网络结构实验
为检测改进算法的有效性,将原算法YOLOv8_n与加入小目标检测层算法YOLOv8_n_Small参数对比(表 1中FPS是仅计算检测耗时,不包含前处理与后处理耗时)。
表 1 优化网络结构实验结果Table 1. Results of experiment with optimized network structureStructural models YOLOv8_n YOLOv8_n_Small Enter the size/pixels 640×640 640×640 mAP@ 0.5 0.8514 0.8832 FPS 171.9 141.5 Parameter quantity/M 3.01 3.05 FLOPs/G 8.1 12.8 如表 1中数据所示,改进的YOLOv8_n_Small算法对检测性能有提升。其中mAP涨幅明显,提升了约3.7%,说明加深的网络结构能够缓解小目标语义信息缺乏的问题,这也表明网络深度对特征提取必不可少。直接添加小目标层对检测精度提升效果明显,虽然运算量增加,FPS下降至141.5,但仍能满足小目标检测的实时性要求。
3.2 注意力机制消融实验
由于小目标特征不明显,检测结果经常有误检、漏检现象,而SA注意力机制的混合注意模式,能够突出表现小目标特征,在YOLOv8_n_Small (v8_n_S)基础上添加SA注意力机制,并与不同主流注意力机制对比,验证其对小目标检测的有效性。
如表 2所示,经实验数据表明,加入SA注意力机制后(v8_n_S_SA)较未加入之前(v8_n_S),mAP@0.5提升约为1.1%,精确率与召回率提升约为0.83%与3.1%。虽然SA精确率低于CA注意力机制[22],召回率低于SE注意力机制,但SA在提升mAP的基础上兼顾提升了精确率与召回率,综合指标下SA优于其它注意力机制。
表 2 注意力机制消融实验结果Table 2. Results of attention mechanism ablation experimentsStructural models mAP@ 0.5 Precision Recall v8_n 0.8514 0.8499 0.7457 v8_n_S 0.8832 0.8971 0.7897 v8_n_S_MHSA 0.8292 0.8356 0.7383 v8_n_S_A2 0.8515 0.9092 0.7345 v8_n_S_SE 0.8795 0.8507 0.8222 v8_n_S_CA 0.8893 0.9293 0.7750 v8_n_S_CoTA 0.8886 0.8929 0.8190 v8_n_S_SA 0.8928 0.9045 0.8142 经表 2实验结果验证,SA注意力机制的混合注意模式,能够突出表现小目标特征。在主干网络中的不同位置加入SA模块进行消融实验,特征提取效果如表 3所示。
表 3 SA模块位置消融实验结果Table 3. Results of SA module position ablation experimentBackbone network mAP@ 0.5 Precision Recall v8_n 0.8514 0.8499 0.7457 + Floor 5 0.8521 0.8466 0.7615 + Floor 7 0.8546 0.8559 0.7922 + Floor 9 0.8928 0.9045 0.8142 + Floor 10 0.8933 0.8990 0.8156 如表 3实验结果所示,针对本文实验场景下,将SA模块在主干网络的深层加入比在浅层具有更好的效果,是由于深层中语义信息比浅层中的细节信息更有效,浅层的细节信息中含有大量杂波,浅层处加入注意力机制对网络性能提升不明显。本文v8_n_S_SA是将模块加入在第9层(表 3中的+Floor 9)。
3.3 IoU消融实验
由于待检测目标较小,较小的定位误差就可使检测框偏移目标,而YOLOv8_n的CIoU函数无法动态调整梯度增益,标注框的质量好坏,显著影响模型训练效果。文中通过加入WIoU替换CIoU,引入动态梯度策略,降低标注框对训练效果的影响。表 4对比加入不同损失函数对目标的定位误差(表 4中FG、FD、FC、FE、FS分别代表Focal-GIoU、Focal-DIoU、Focal-CIoU、Focal-EIoU、Focal-SIoU。W(v1)、W(v2)分别代表WIoU_v1、WIoU_v2。
表 4 IoU消融实验结果Table 4. Results of IoU ablation experimentStructural models mAP@0.5 Box_loss v8_n 0.8514 1.425 v8_n_S 0.8832 1.339 v8_n_S_SA 0.8928 1.350 v8_n_S_SA_FG 0.8878 1.191 v8_n_S_SA_FD 0.8846 1.182 v8_n_S_SA_FC 0.8917 1.163 v8_n_S_SA_FE 0.8799 1.271 v8_n_S_SA_FS 0.8726 2.061 v8_n_S_SA_W(v1) 0.8797 1.368 v8_n_S_SA_W(v2) 0.8931 0.861 YOLOv8_SG 0.8997 0.928 如表 4所示,经实验数据表明,加入损失函数WIoU_v3后(YOLOv8_SG)较未加入之前(v8_n_S_SA),使定位误差box_loss由1.350降低至0.928,定位精度提升了约31.3%,较原模型(v8_n)提升了约34.9%。虽然WIoU_v2定位误差较WIoU_v3更低,但其对mAP无明显提升。综合指标下,WIoU_v3优于其它损失函数。
3.4 对比实验
择取若干幅云天背景下无人机红外图像对比YOLOv8_SG改进效果,图 4为YOLOv8_n算法效果图,图 5为YOLOv8_SG算法效果图。
对比图 4与图 5的检测效果,在图 4中有两幅图像未检测出无人机位置,而在图 5中无人机无漏检现象,有效提高了召回率。
P-R曲线对比如图 6所示。在图中P-R曲线与坐标轴围成的面积大小,反映了算法的优劣。由图 6可以看出,YOLOv8_SG包围面积大于原算法,同时兼顾了精确率与召回率。
mAP曲线对比如图 7所示。在图 7中可以看出,改进后的算法在训练100轮时mAP高于原算法,证明了YOLOv8_SG较原算法能够有效提升对小目标的检测能力。
3.5 验证实验
为了验证YOLOv8_SG有效性,对比主流YOLO系列检测算法的消融实验,以确定算法改进的贡献是否合理。
文中数据集下,将YOLOv8_SG与主流目标检测算法模型对比检测精度、FPS、参数量、运算量,各算法实验结果如表 5所示。
表 5 不同算法的实验结果Table 5. Experimental results of different algorithmsStructural models Enter the size/pixels mAP@ 0.5 FPS Parameter quantity/M FLOPs/G YOLOv5_n 640×640 0.5156 201.4 1.83 4.36 YOLOv5_s 640×640 0.8110 172.3 7.06 16.50 YOLOv5_m 640×640 0.7260 166.5 21.05 50.60 YOLOv6_n 640×640 0.8437 173.9 4.65 11.39 YOLOv6_s 640×640 0.8760 116.3 18.54 45.28 YOLOv8_n 640×640 0.8514 171.9 3.01 8.10 YOLOv8_s 640×640 0.8461 141.4 11.13 28.60 YOLOv8_m 640×640 0.7874 97.5 25.80 79.10 YOLOv8_l 640×640 0.8026 54.8 43.63 165.40 YOLOv8_x 640×640 0.7617 33.7 68.15 258.10 YOLOv8_SG 640×640 0.8997 140.8 10.90 37.90 如表 5所示。将YOLOv8_s、YOLOv8_m、YOLOv8_l、YOLOv8_x分别与YOLOv8_n算法对比,参数量与运算量大大增加,但针对小目标数据集的检测效果却没有明显提升,造成此现象的主要原因是由于未经改动的算法都是3目标检测头,限制了对更小尺度目标的检测能力。
YOLOv8_SG与YOLOv8_n,参数量、运算量都较YOLOv8_s大大增加,就检测效果而言,YOLOv8_n略优于YOLOv8_s,YOLOv8_SG的检测效果却远高于YOLOv8_s。造成此结果的原因是由于YOLOv8_s只加深了网络宽度未改变网络深度,仍为3目标检测头,而YOLOv8_SG在深度上进行了调整,形成4目标检测头。能够融合更深层次目标特征,增强了目标检测效果。
这也表明只是单纯的增加网络体量,并不能在特定场景下提高目标检测效果,YOLOv8_SG根据小目标检测场景,合理地改善模型,有效提高了算法的检测能力。
经实验数据表明,YOLOv8_SG的mAP值远高于其它一阶段算法。
4. 结论
文中针对小目标检测准确率不高且定位误差较大的问题,提出了基于YOLOv8_n的一种改进目标检测算法YOLOv8_SG。通过设计小目标检测层、引入注意力机制与损失函数,有效改善在复杂背景下进行小目标检测的能力。实验结果表明,YOLOv8_SG的检测效果与定位效果均优于YOLOv8_n算法,在保证检测速度的前提下有效提升检测精度,提升了红外图像中小目标的检测准确率。
-
期刊类型引用(5)
1. 韩颖. 基于卡尔曼滤波的MEMS陀螺噪声抑制算法设计与实现. 电子测试. 2021(19): 51-53+40 . 百度学术
2. 韩颖. 基于PSoC的陀螺仪数据采集系统设计与实现. 红外技术. 2020(09): 905-908 . 本站查看
3. 雷琼莹,金伟其,郭宏,米凤文,张旭,胡亮亮. 基于MEMS陀螺仪及压电微摆镜的光机电联合稳像技术. 红外技术. 2018(04): 332-337 . 本站查看
4. 李伟忠,孙鹏. 战术导弹用MEMS陀螺仪研制进展及关键技术. 导航与控制. 2017(03): 97-104 . 百度学术
5. 范永杰,陈华. 基于MEMS陀螺仪的实时电子稳像技术. 红外技术. 2015(09): 724-727 . 本站查看
其他类型引用(7)
计量
- 文章访问数:
- HTML全文浏览量:
- PDF下载量:
- 被引次数: 12