MEMS陀螺在红外成像系统中的研究应用

韩颖; 黄剑侠; 高原

MEMS陀螺在红外成像系统中的研究应用

中国空空导弹研究院计量测试中心,河南洛阳,471000
中国空空导弹研究院计量测试中心

详细信息

中图分类号: TN409
计量
- 文章访问数: 078
- HTML全文浏览量: 021
- PDF下载量: 020
出版历程

Applications of MEMS Gyroscope in Infrared Imaging Systems

摘要

摘要: 简要介绍了红外成像导引系统中的稳像技术原理，说明陀螺仪在辅助设备电子稳像系统中的重要地位。目前，国内辅助设备电子稳像系统中常采用的光纤陀螺，文中对光纤陀螺的优缺点进行分析，并与新兴的MEMS陀螺在技术指标层面作对比。再设计试验方案，从试验的角度论证MEMS在实际应用中可以代替光纤陀螺，并且在性能、体积、价格上比光纤陀螺更有优势。
- 稳像技术 /
- 电子稳像 /
- 光纤陀螺 /
- MEMS陀螺 /
- 卡尔曼滤波

HTML全文

0. 引言

随着无人机技术的迅猛发展，在军事方面无人机发挥了影响战局的重要作用，如何对空中无人机进行检测成为一重要研究方向。现阶段最简易的方法是通过红外检测技术，对红外图像中无人机小目标进行识别，这在远程预警、空间监视、战场侦察等领域都有重要作用。在通常情况下红外小目标图像背景复杂、成像距离远、小目标尺寸小、缺少目标的纹理特征，因此对小目标的精确识别和定位存在一定的难度^[1-2]。近几十年来人们对这一领域进行了大量的研究，2016年，Chen等^[3]提出了基于深度学习的小目标检测网络，通过引入小目标检测数据集以及数据集的评估指标，将标注框面积占总面积小于0.58%的部分定义为小目标。Pang等^[4-5]提出基于多尺度融合的Faster-RCNN（Region-based Convolutional Neural Network）的小目标检测方法，提高了无人机对地面车辆目标的检测精度。Li等^[6]提出了构建轻量的并行混合注意力模块抑制图像中复杂背景和负样本的干扰，同时通过调整下采样倍数，来保证传递更多的信息，但像船类等密集小目标分布方向具有任意性，易造成预测框重叠，导致水平检测框无法精确定位目标位置。Xie等^[7]提出了Drone-YOLO（You Only Look Once）模型，设计了新的特征融合模块和特征金字塔结构，用于提高对小目标的关注度，但是模型参数较多、计算量大、实时性较低。Ni等^[8]提出了一种基于金字塔共生特征架构的红外小目标检测算法，提取出更多的边缘和纹理信息，但复杂背景下的检测效果仍然不甚理想。小目标检测仍是计算机视觉中一个富有挑战的难题，如何对红外小目标进行快速、准确地智能化检测具有重要意义^[9-10]。

1. 本文总体方案

1.1 小目标检测层

由于小目标检测对精度和速度都有较高要求，文中将YOLOv8_n检测算法作为基础框架，并从特征金字塔融合、注意力机制及损失函数3个角度进行优化。在特征提取阶段，由于YOLOv8_n的下采样倍数比较大，较深的特征图很难学习到小目标的特征信息，而无人机目标又缺乏明显的形态特征。因此提出增加小目标检测层对较浅特征图与深特征图拼接后进行检测以充分利用全局上下文信息。同时增加了用于微小物体检测的预测头。预测头由更浅层、更高分辨率的特征图构成。新的预测头与其他3个预测头形成四预测头结构，虽然增加了计算与存储的成本，但对微小物体的检测性能有较大提升。未加小目标检测层时mAP@0.5为0.8514。构建小目标检测层后mAP@0.5达到了0.8832，提升了3.7%。但是在增加检测层后，带来的问题就是计算量增加，导致推理检测速度降低30.4 FPS。

改进后的网络模型如图 1所示，红虚线为改动模块。

图 1 YOLOv8_SG网络结构

Figure 1. This article algorithm network structure

下载: 全尺寸图片幻灯片

1.2 注意力机制

在红外小目标检测任务中，通过不同的卷积信道提取目标的不同特征将导致太多的训练资源被用于无小目标区域^[11-13]，从而导致网络的训练效率低下。为了解决这一问题，文中将高效通道注意力机制SA（Shuffle-Attention）模块注意力添加到YOLOv8_n目标检测模型的特征提取层，具体网络结构如图 1所示。通过添加SA注意力模块，将不同的权重分配给不同的卷积信道，以突出小目标特征，通过适当的跨通道交互，避免了降维对学习通道的影响，大大降低了模型的复杂度，只添加少量参数，可以实现客观的性能改进。

SA^[14]的设计思想结合了组卷积（为了降低计算量）、空间注意力机制和通道注意力机制，SA首先将通道维分组为多个子特征，对于每个子特征，SA利用Shuffle Unit在空间和通道维度上的特征依赖性，将所有子特征汇总在一起，并采用“channel-shuffle”运算符来启用不同子特征之间的信息通信。通过这种结构，模型可以选择性地增强包含目标特征更多的细节，抑制不相关或弱特征^[15-16]。

SA注意力机制分块并行使用空间和通道两类注意力机制，使两类注意力机制高效结合。SA模块结构如图 2所示。具体步骤如下：

图 2 SA注意力机制

Figure 2. SA attention mechanism

下载: 全尺寸图片幻灯片

1）将输入特征图分组，作为SA单元；

2）每个SA单元分为两部分，一部分使用通道注意力（如图 2中橙色矩形），另一部分使用空间注意力（如图 2中蓝色矩形）；

3）A内部两个部分按通道数叠加，实现信息融合；

4）最后对所有SA单元进行随机混合操作进行重排，得到最终输出特征图。

1.3 IoU loss函数

YOLOv8_n使用的分类损失函数为BCE（Binary Cross Entropy），回归损失函数是CIoU loss+DFL（Distribution Focal Loss），其中CIoU^[17]定义如式(1)所示：

$$ {R_{{\text{CIoU}}}} = \frac{{{\rho ^2}(b, {b^{{\text{gt}}}})}}{{{c^2}}} + \alpha \nu $$

(1)

式中：b、b^gt分别代表预测框和真实框的中心点；ρ代表计算两点间的欧氏距离；c代表的是能够同时包含预测框与真实框的最小包围框对角线距离；α是权重系数：

$$ \alpha = \frac{\nu }{{(1 - {\text{IoU}}) + \nu }} $$

(2)

式中：IoU（Intersection over Union）是预测框与真实框的交并比；ν是用来度量长宽比的相似性定义为：

$$ \nu = \frac{4}{{{{\text{π }}^2}}}{(\arctan \frac{{{w^{{\text{gt}}}}}}{{{h^{{\text{gt}}}}}} - \arctan \frac{w}{h})^2} $$

(3)

式中：w、h、w^gt、h^gt分别为标注框宽、高和真实框宽、高，完整的CIoU定义为：

$$ {L_{{\text{CIoU}}}} = 1 - {\text{IoU}} + \frac{{{\rho ^2}(b, {b^{{\text{gt}}}})}}{{{c^2}}} + \alpha v $$

(4)

但CIoU存在一定缺陷，v长宽比描述的是相对值，存在一定模糊，并且未考虑难易样本平衡问题，但由于训练数据不可避免地包含低质量示例，几何因素（距离和长宽比）将加重对低质量示例的惩罚，静态聚焦机制（Focusing Mechanism, FM）不能区分标注框质量高低，模型的泛化性能较弱^[18]。文中通过使用WIoU_v3^[19]利用动态非单调FM的梯度增益分配策略，可以在训练的不同阶段，做出最符合当前情况的梯度增益分配策略。在训练早期保存高质量锚框，削弱几何因素的惩罚，使模型获得更好的泛化能力，并在训练中后期，WIoU_v3将较小的梯度增益分配给低质量锚框，以减少有害梯度，提高模型的定位性能^[20]。

WIOU_v3定义如下：

$$ {L_{{\text{WIoU}\_\text{v3}}}} = \gamma \cdot {R_{{\text{WIoU}}}} \cdot {L_{{\text{IoU}}}} $$

(5)

$$ {R_{{\text{WIoU}}}} = \exp (\frac{{{{(x - {x_{{\text{gt}}}})}^2} + {{(y - {y_{{\text{gt}}}})}^2}}}{{(W_{\text{g}}^2 + H_{\text{g}}^2)}}) $$

(6)

$$ \gamma = \frac{\beta }{{\delta {\alpha ^{\beta - \delta }}}} $$

(7)

式中：W_g、H_g为最小包围框的宽高；R_WIoU为预测框框和真实框中心点之间的归一化距离。式(7)中α与$\delta $是常数，β是离群度。离群度是指锚框与标注框之间的IoU与均值IoU的比值，随着训练轮数的变化影响γ，因此完成了动态非单调FM的梯度增益分配策略。

2. 数据集与实验指标

2.1 数据集

文中的实验数据来源于公布在Science Data Bank中复杂背景下红外弱小运动目标检测数据集^[21]，再加以筛选以及图像增强，最终使用其中的2033张进行训练，以4∶1比例随机划分训练集和测试集，其中训练集1624张，测试集409张，借助Lableimg软件对转换的数据集进行标注。

图 3显示，数据集中标注的红外小目标在图像中的相对宽度集中在0.095以内，相对高度集中在0.06以内，图像面积集中在0.57%以内，基本满足文献[3]中对小目标尺寸的定义。

图 3 标注框大小占比

Figure 3. The proportion of the size of the label box

下载: 全尺寸图片幻灯片

2.2 实验指标

采用精度均值（mAP，IoU阈值取0.5）评估模型性能，采用FPS（Frames Per Second）来评估模型检测速度，其中mAP和AP表达式为：

$$ {\text{AP = }}\frac{{{\text{TP + TN}}}}{{{\text{TP + TN + FP + FN}}}} $$

(8)

$$ {\text{mAP}} = \frac{{\sum\limits_{n = 1}^{{\text{Num(classes}})} {{\text{AP}}(n)} }}{{{\text{TP + TN + FP + FN}}}} $$

(9)

式中：TP为识别正确的正样本的数量；TN为识别正确的负样本数量；FP为错误识别成正样本的负样本数量；FN为错误识别成负样本的正样本数量。

3. 实验与结果分析

3.1 优化网络结构实验

为检测改进算法的有效性，将原算法YOLOv8_n与加入小目标检测层算法YOLOv8_n_Small参数对比（表 1中FPS是仅计算检测耗时，不包含前处理与后处理耗时）。

表 1 优化网络结构实验结果

Table 1. Results of experiment with optimized network structure

Structural models	YOLOv8_n	YOLOv8_n_Small
Enter the size/pixels	640×640	640×640
mAP@ 0.5	0.8514	0.8832
FPS	171.9	141.5
Parameter quantity/M	3.01	3.05
FLOPs/G	8.1	12.8

下载: 导出CSV

| 显示表格

如表 1中数据所示，改进的YOLOv8_n_Small算法对检测性能有提升。其中mAP涨幅明显，提升了约3.7%，说明加深的网络结构能够缓解小目标语义信息缺乏的问题，这也表明网络深度对特征提取必不可少。直接添加小目标层对检测精度提升效果明显，虽然运算量增加，FPS下降至141.5，但仍能满足小目标检测的实时性要求。

3.2 注意力机制消融实验

由于小目标特征不明显，检测结果经常有误检、漏检现象，而SA注意力机制的混合注意模式，能够突出表现小目标特征，在YOLOv8_n_Small (v8_n_S)基础上添加SA注意力机制，并与不同主流注意力机制对比，验证其对小目标检测的有效性。

如表 2所示，经实验数据表明，加入SA注意力机制后（v8_n_S_SA）较未加入之前（v8_n_S），mAP@0.5提升约为1.1%，精确率与召回率提升约为0.83%与3.1%。虽然SA精确率低于CA注意力机制^[22]，召回率低于SE注意力机制，但SA在提升mAP的基础上兼顾提升了精确率与召回率，综合指标下SA优于其它注意力机制。

表 2 注意力机制消融实验结果

Table 2. Results of attention mechanism ablation experiments

Structural models	mAP@ 0.5	Precision	Recall
v8_n	0.8514	0.8499	0.7457
v8_n_S	0.8832	0.8971	0.7897
v8_n_S_MHSA	0.8292	0.8356	0.7383
v8_n_S_A2	0.8515	0.9092	0.7345
v8_n_S_SE	0.8795	0.8507	0.8222
v8_n_S_CA	0.8893	0.9293	0.7750
v8_n_S_CoTA	0.8886	0.8929	0.8190
v8_n_S_SA	0.8928	0.9045	0.8142

下载: 导出CSV

| 显示表格

经表 2实验结果验证，SA注意力机制的混合注意模式，能够突出表现小目标特征。在主干网络中的不同位置加入SA模块进行消融实验，特征提取效果如表 3所示。

表 3 SA模块位置消融实验结果

Table 3. Results of SA module position ablation experiment

Backbone network	mAP@ 0.5	Precision	Recall
v8_n	0.8514	0.8499	0.7457
+ Floor 5	0.8521	0.8466	0.7615
+ Floor 7	0.8546	0.8559	0.7922
+ Floor 9	0.8928	0.9045	0.8142
+ Floor 10	0.8933	0.8990	0.8156

下载: 导出CSV

| 显示表格

如表 3实验结果所示，针对本文实验场景下，将SA模块在主干网络的深层加入比在浅层具有更好的效果，是由于深层中语义信息比浅层中的细节信息更有效，浅层的细节信息中含有大量杂波，浅层处加入注意力机制对网络性能提升不明显。本文v8_n_S_SA是将模块加入在第9层（表 3中的+Floor 9）。

3.3 IoU消融实验

由于待检测目标较小，较小的定位误差就可使检测框偏移目标，而YOLOv8_n的CIoU函数无法动态调整梯度增益，标注框的质量好坏，显著影响模型训练效果。文中通过加入WIoU替换CIoU，引入动态梯度策略，降低标注框对训练效果的影响。表 4对比加入不同损失函数对目标的定位误差（表 4中FG、FD、FC、FE、FS分别代表Focal-GIoU、Focal-DIoU、Focal-CIoU、Focal-EIoU、Focal-SIoU。W(v1)、W(v2)分别代表WIoU_v1、WIoU_v2。

表 4 IoU消融实验结果

Table 4. Results of IoU ablation experiment

Structural models	mAP@0.5	Box_loss
v8_n	0.8514	1.425
v8_n_S	0.8832	1.339
v8_n_S_SA	0.8928	1.350
v8_n_S_SA_FG	0.8878	1.191
v8_n_S_SA_FD	0.8846	1.182
v8_n_S_SA_FC	0.8917	1.163
v8_n_S_SA_FE	0.8799	1.271
v8_n_S_SA_FS	0.8726	2.061
v8_n_S_SA_W(v1)	0.8797	1.368
v8_n_S_SA_W(v2)	0.8931	0.861
YOLOv8_SG	0.8997	0.928

下载: 导出CSV

| 显示表格

如表 4所示，经实验数据表明，加入损失函数WIoU_v3后（YOLOv8_SG）较未加入之前（v8_n_S_SA），使定位误差box_loss由1.350降低至0.928，定位精度提升了约31.3%，较原模型（v8_n）提升了约34.9%。虽然WIoU_v2定位误差较WIoU_v3更低，但其对mAP无明显提升。综合指标下，WIoU_v3优于其它损失函数。

3.4 对比实验

择取若干幅云天背景下无人机红外图像对比YOLOv8_SG改进效果，图 4为YOLOv8_n算法效果图，图 5为YOLOv8_SG算法效果图。

图 4 YOLOv8_n算法效果图

Figure 4. YOLOv8_n algorithm renderings

下载: 全尺寸图片幻灯片

图 5 YOLOv8_SG效果图

Figure 5. YOLOv8_SG algorithm renderings

下载: 全尺寸图片幻灯片

对比图 4与图 5的检测效果，在图 4中有两幅图像未检测出无人机位置，而在图 5中无人机无漏检现象，有效提高了召回率。

P-R曲线对比如图 6所示。在图中P-R曲线与坐标轴围成的面积大小，反映了算法的优劣。由图 6可以看出，YOLOv8_SG包围面积大于原算法，同时兼顾了精确率与召回率。

图 6 P-R曲线对比

Figure 6. P-R curves comparison

下载: 全尺寸图片幻灯片

mAP曲线对比如图 7所示。在图 7中可以看出，改进后的算法在训练100轮时mAP高于原算法，证明了YOLOv8_SG较原算法能够有效提升对小目标的检测能力。

图 7 mAP曲线对比

Figure 7. mAP curves comparison

下载: 全尺寸图片幻灯片

3.5 验证实验

为了验证YOLOv8_SG有效性，对比主流YOLO系列检测算法的消融实验，以确定算法改进的贡献是否合理。

文中数据集下，将YOLOv8_SG与主流目标检测算法模型对比检测精度、FPS、参数量、运算量，各算法实验结果如表 5所示。

表 5 不同算法的实验结果

Table 5. Experimental results of different algorithms

Structural models	Enter the size/pixels	mAP@ 0.5	FPS	Parameter quantity/M	FLOPs/G
YOLOv5_n	640×640	0.5156	201.4	1.83	4.36
YOLOv5_s	640×640	0.8110	172.3	7.06	16.50
YOLOv5_m	640×640	0.7260	166.5	21.05	50.60
YOLOv6_n	640×640	0.8437	173.9	4.65	11.39
YOLOv6_s	640×640	0.8760	116.3	18.54	45.28
YOLOv8_n	640×640	0.8514	171.9	3.01	8.10
YOLOv8_s	640×640	0.8461	141.4	11.13	28.60
YOLOv8_m	640×640	0.7874	97.5	25.80	79.10
YOLOv8_l	640×640	0.8026	54.8	43.63	165.40
YOLOv8_x	640×640	0.7617	33.7	68.15	258.10
YOLOv8_SG	640×640	0.8997	140.8	10.90	37.90

下载: 导出CSV

| 显示表格

如表 5所示。将YOLOv8_s、YOLOv8_m、YOLOv8_l、YOLOv8_x分别与YOLOv8_n算法对比，参数量与运算量大大增加，但针对小目标数据集的检测效果却没有明显提升，造成此现象的主要原因是由于未经改动的算法都是3目标检测头，限制了对更小尺度目标的检测能力。

YOLOv8_SG与YOLOv8_n，参数量、运算量都较YOLOv8_s大大增加，就检测效果而言，YOLOv8_n略优于YOLOv8_s，YOLOv8_SG的检测效果却远高于YOLOv8_s。造成此结果的原因是由于YOLOv8_s只加深了网络宽度未改变网络深度，仍为3目标检测头，而YOLOv8_SG在深度上进行了调整，形成4目标检测头。能够融合更深层次目标特征，增强了目标检测效果。

这也表明只是单纯的增加网络体量，并不能在特定场景下提高目标检测效果，YOLOv8_SG根据小目标检测场景，合理地改善模型，有效提高了算法的检测能力。

经实验数据表明，YOLOv8_SG的mAP值远高于其它一阶段算法。

4. 结论

文中针对小目标检测准确率不高且定位误差较大的问题，提出了基于YOLOv8_n的一种改进目标检测算法YOLOv8_SG。通过设计小目标检测层、引入注意力机制与损失函数，有效改善在复杂背景下进行小目标检测的能力。实验结果表明，YOLOv8_SG的检测效果与定位效果均优于YOLOv8_n算法，在保证检测速度的前提下有效提升检测精度，提升了红外图像中小目标的检测准确率。

参考文献(0)

施引文献(12)

期刊类型引用(5)

1.	韩颖. 基于卡尔曼滤波的MEMS陀螺噪声抑制算法设计与实现. 电子测试. 2021(19): 51-53+40 . 百度学术
2.	韩颖. 基于PSoC的陀螺仪数据采集系统设计与实现. 红外技术. 2020(09): 905-908 . 本站查看
3.	雷琼莹，金伟其，郭宏，米凤文，张旭，胡亮亮. 基于MEMS陀螺仪及压电微摆镜的光机电联合稳像技术. 红外技术. 2018(04): 332-337 . 本站查看
4.	李伟忠，孙鹏. 战术导弹用MEMS陀螺仪研制进展及关键技术. 导航与控制. 2017(03): 97-104 . 百度学术
5.	范永杰，陈华. 基于MEMS陀螺仪的实时电子稳像技术. 红外技术. 2015(09): 724-727 . 本站查看

其他类型引用(7)

资源附件(0)

计量

文章访问数:
HTML全文浏览量:
PDF下载量:
被引次数: 12

0. 引言
1. 本文总体方案
1.1 小目标检测层
1.2 注意力机制
1.3 IoU loss函数
2. 数据集与实验指标
2.1 数据集
2.2 实验指标
3. 实验与结果分析
3.1 优化网络结构实验
3.2 注意力机制消融实验
3.3 IoU消融实验
3.4 对比实验
3.5 验证实验
4. 结论

MEMS陀螺在红外成像系统中的研究应用

计量

出版历程