全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211008039.9 (22)申请日 2022.08.22 (71)申请人 武汉理工大 学 地址 430070 湖北省武汉市洪山区珞狮路 122号 (72)发明人 聂琳真 陆美合 尹智帅  (74)专利代理 机构 湖北武汉 永嘉专利代理有限 公司 42102 专利代理师 李丹 (51)Int.Cl. G06V 20/52(2022.01) G06V 40/10(2022.01) G06V 10/44(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称 一种基于智能车辆的多光谱行人检测方法 及系统 (57)摘要 本发明公开了一种基于智能车辆的多光谱 行人检测方法及系统, 包括: 1)将成对的可见光 与红外图像进行预处理; 2)将预处理后的红外图 像进行梯度计算, 获得边缘特征图, 获得补充边 缘特征的红外图像; 3)将成对的可见光与补充 边 缘特征的红外图像分别输入ResNet50网络进行 特征提取; 4)将两模态相同阶段的输出特征进行 相加融合, 得到融合特征; 5)将最高层的融合特 征进行高级语义特征提取, 获取高级语义信息; 6)对补充高级语义信息的融合特征图进行行人 位置信息增强处理; 7)对经过特征补充与增强的 不同尺度的融合特征图进行行人检测, 获得行人 检测结果。 本发 明对融合特征进行了信息补充与 增强, 取得了更好的检测效果。 权利要求书4页 说明书11页 附图4页 CN 115457456 A 2022.12.09 CN 115457456 A 1.一种基于智能车辆的多光谱行 人检测方法, 其特 征在于, 包括以下步骤: 1)将成对的可 见光与红外图像进行 预处理; 2)将预处理后的红外图像进行梯度计算, 获得边缘特征图, 并获得补充边缘特征的红 外图像; 3)将成对的可见光与补充边缘特征的红外图像分别输入ResNet50 网络进行特征提取, 并输出特征提取网络中不同阶段的特 征; 4)将两模态相同阶段的输出特征进行相加融合, 得到结构与ResNet50一致的融合特 征; 其中, 输出的特 征选择每阶段的最高层特 征; 5)将最后一个阶段的最高层的融合特 征进行高级语义特 征提取, 获取高级语义信息; 6)将步骤5)中的高级语义信息传给步骤4)中不同尺度的浅层融合特征, 并通过特征聚 合模块进行融合, 获取补充高级语义信息的融合特 征; 7)对融合特 征进行行人位置信息增强处 理, 以增强融合特 征图中行 人的位置信息; 8)对经过特征补充与增强的不同尺度的融合特征图进行行人检测, 获得行人检测结 果。 2.根据权利要求1所述的基于智能车辆的多光谱行人检测方法, 其特征在于, 所述步骤 2)中, 对红外图像进行梯度计算, 输出边 缘特征图, 具体如下: 2.1)任取经过数据 预处理后红外图像3通道中的其中一个通道作为梯度计算的原始图 像P; 2.2)使用Sobel 算子计算原 始图像P的横向和纵向的梯度; 以P代表原始图像, Gx及Gy分别代表经横向及纵向梯度计算得到的横向及纵向的边缘特 征, 其公式如下: 采用以下的公式合并横向及纵向的边 缘特征, 获取边 缘特征图G: 2.3)获取边缘特征图G后, 将边缘特征图与经预处理后3通道的红外图像进行拼接, 得 到补充边 缘特征的4通道红外图像; 2.4)4通道红外图像经 过一个3×3的卷积将通道数变成3以适应特 征提取网络的输入。 3.根据权利要求1所述的基于智能车辆的多光谱行人检测方法, 其特征在于, 所述步骤 3)中, 采用ResNet5 0网络为改进的ResNet5 0网络; 在原始ResNet50包含的{conv1,conv2_x,conv3_x,conv4_x,conv5_x}结构中, 将 conv4_x及conv5_x阶段内包含的标准卷积替换成可变形卷积; 所述可变形卷积为在原来的 标准卷积的计算位置上加入一个偏移, 使得卷积的形状不再是方形, 卷积的注意会随着感 兴趣的目标发生变化; 可变形卷积层的计算方式为: 权 利 要 求 书 1/4 页 2 CN 115457456 A 2其中, 是卷积规则网格上的采样点, w是卷积的权重, x是输入的特征图, p0是网格的中 心, pn遍历 中的各个采样点的位置, Δpn是网络所学习到的每个采样点的偏移量, 偏移后 的采样位置是pn+Δpn, 此外通过添加权重系数Δ mn来区分引入的区域是否为 感兴趣目标的 区域, 假如卷积对这个采样点的区域 不感兴趣, 则把权 重系数设置为0 。 4.根据权利要求1所述的基于智能车辆的多光谱行人检测方法, 其特征在于, 所述步骤 5)中, 将最高层的融合特 征进行高级语义特 征提取, 获取高级语义信息, 具体如下: 5.1)将最高层的融合特 征conv5_x_f进行 金字塔池化获取高级语义特 征f1; 5.1.1)将融合特征conv5_x_f依次输入4个尺度的池化层子分支, 池化层分支将特征图 分成不同的子区域并形成不同的池化特征表示, 4个池化层子分支输出特征图的空间大小 分别为1×1,2×2,4×4,6×6; 5.1.2)当输入特征通道为N时, 在每个池化的特征后使用1 ×1卷积层将特征的通道数 降低到N/4; 5.1.3)降维后的特征通过双线性插值进行上采样, 得到与融合特征conv5_x_f大小相 同的特征, 并将不同分支的特征进行拼接, 得到金字塔池化后 最终的输出特征f1, f1的尺度 及通道数与输入特 征一致。 5.根据权利要求1所述的基于智能车辆的多光谱行人检测方法, 其特征在于, 所述步骤 5)中, 将最高层的融合特 征进行高级语义特 征提取, 获取高级语义信息, 具体如下: 5.2)将最高层的融合特 征conv5_x_f进行交叉注意处 理获取高级语义特 征f2; 5.2.1)输入 特征图 在conv5_x_f上应用两个1 ×1卷积层, 分别生 成两 个特征图Q和K, 其中 其中, 表示输入特征图, W表示输入特征图的宽度, H表示输入特征图的高度, C和C'是 通道数, 通过降维计算后通道数C'小于通道数C; 5.2.2)在Q的空间维度上的每个位置u, 得到一个向量 在K中与位置u在同一行 及同一列的位置提取 特征向量获得集 合 计算交叉位置上两元 素的关联度; 是Ωu的第i个元 素, 关联度计算的公式如下: 其中, di,u∈D是特征Qu和Ωi,u之间的关联度, i =[1,...,H+W‑1], 5.2.3)对关联度集 合D应用softmax层计算注意图A; 5.2.4)在conv5_x_f上施加另一个1 ×1卷积层以产生 用来调整特征; 在V的空 间维度上的每个位置u得到一个向量 和一组集合 集合Φu是V中与位置 u在同一行或列中的特 征向量的集 合, 通过以下公式可收集 最高层融合特 征的上下文信息: 其中, [conv5_x_f] ′u是 在位置u处的特征向量, Ai,u是A中通道i和位 置u处的注意力标量值; 将上下文信息[conv5_x_f] ′u添加到特征[conv5_x_f]u中能够增强权 利 要 求 书 2/4 页 3 CN 115457456 A 3

PDF文档 专利 一种基于智能车辆的多光谱行人检测方法及系统

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于智能车辆的多光谱行人检测方法及系统 第 1 页 专利 一种基于智能车辆的多光谱行人检测方法及系统 第 2 页 专利 一种基于智能车辆的多光谱行人检测方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:06:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。