全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211242279.5 (22)申请日 2022.10.11 (71)申请人 陕西科技大 学 地址 710021 陕西省西安市未央区大 学园 区陕西科技大 学 (72)发明人 张开生 关凯凯  (74)专利代理 机构 西安智大知识产权代理事务 所 61215 专利代理师 王晶 (51)Int.Cl. G06T 7/00(2017.01) G06V 10/26(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于改进YOLOv5的纸病检测方法 (57)摘要 本发明公开了一种基于改进YOLOv5的纸病 检测方法, 包括以下步骤; 步骤1: 获取纸张图像, 对纸张缺陷图像进行分类和标注; 步骤2: 对获取 的纸张图像进行裁剪、 数据增强; 步骤3: 基于 YOLOv5模型进 一步提高网络的特征提取能力, 建 立适合纸张缺陷图像检测的PaperNet; 步骤 4: 图 像训练; 利用所构建的训练样本集和验证样本 集, 对PaperNet进行训练并验证模型性能; 步骤 5: 图像测试; 使用改进后的PaperNet 权重文件对 测试集纸张图像进行检测, 分析检测结果。 本发 明具有检测精度高、 检测速度快, 对于光源的依 赖程度更低的特点, 能够实现对常见的治病缺陷 实现精准 辨识的特点。 权利要求书3页 说明书8页 附图7页 CN 115457026 A 2022.12.09 CN 115457026 A 1.一种基于改进YOLOv5的纸病检测方法, 其特 征在于, 包括以下步骤; 步骤1: 获取纸张图像, 对纸张缺陷图像进行分类和标注; 步骤2: 对获取的纸张图像进行裁 剪、 数据增强; 步骤3: 基于YOLOv5模型进一步提高网络的特征提取能力, 建立适合纸张缺陷图像检测 的PaperNet; 步骤4: 图像训练; 利用所构建的训练样本集和验证样本集, 对PaperNet进行训练并验 证模型性能; 步骤5: 图像测试; 使用改进后的PaperNet权重文件对测试集纸张图像进行检测, 分析 检测结果。 2.根据权利 要求1所述的一种基于改进YOLOv5的纸病检测方法, 其特征在于, 所述步骤 1具体包括: 步骤1.1: 在纸机车间配备高清线阵相机, 当待测纸张通过触发传感器, 启动成像设备 后对纸张图像进行拍摄, 获取高清线阵图像, 后经过人工挑选, 挑选出含有缺陷的纸张图 像, 对纸张缺陷图像剥离背景; 步骤1.2: 在步骤1.1中对整理好的缺陷图像, 利用LalbelImg工具, 对数据集当中的图 片标定真实框与对应治病 种类并生成xml格式的标签文件。 3.根据权利 要求1所述的一种基于改进YOLOv5的纸病检测方法, 其特征在于, 所述步骤 2具体包括: 步骤2.1: 将含有缺陷的纸张图像裁 剪成640×640的大小; 步骤2.2: 对裁剪后的纸张图像采用改变亮度、 翻转、 随机裁剪、 位移和添加高斯噪声的 方式进行 数据增强, 以9:1的比例把数据增强后的纸病数据集分为训练集和验证集。 4.根据权利 要求1所述的一种基于改进YOLOv5的纸病检测方法, 其特征在于, 所述步骤 3具体包括: 纸张缺陷实时检测模型PaperNet包括: 待检测图像先经过输入端进行预处理, 再经由 骨干网络提取特征信息, Neck部 分连接负责进行特征信息的拼接、 Head部 分输出检测效果; 其中, 骨干网络为CSPDarknet53, 主要包括切片结构(Focus)、 卷积模块(CBL)、 坐标注意力 机制(Coordinate  Attention, CA)、 瓶颈层(CSP1 ‑x)以及SPP; Neck部分采用了 FPN+PAN的网 络结构; 为进一步提 高YOLOv5的特征提取能力并形成更稳定的特征分布, 通过在批量归一化模 块(Batch  Normalization, BN)的首尾部分添加居 中和缩放校准以增强纸张缺陷的有效特 征, 并在主干网络中引入坐标注意力机制(Coordinate  Attention, CA)提升模型的特征提 取能力。 5.根据权利 要求1所述的一种基于改进YOLOv5的纸病检测方法, 其特征在于, 所述步骤 4具体包括: 步骤4.1: 纸张缺 陷图片从输入部分输入, 输入部分采用了Mosaic:数据增强、 自适应锚 框计算和图片尺寸处理的预处理方式; 骨干网络Focus模块将纸张缺陷特征图的输入进行 复制与切片操作; 再经过一个大小为3 ×3卷积核来改变网络的通道数; 通过Batch_Norm层, 将梯度集中在原点附近, 实现结果归一化; 最后用LeakyRelu激活函数输入 结果到下一层卷 积BottleNeckCS P;权 利 要 求 书 1/3 页 2 CN 115457026 A 2BottleNeckCSP残差结构能优化梯度信息, 同时降低PaperNet纸张缺陷网络的计算量, 首先输入会被分成两部分, 一部分先进行n次BottleNeck操作, 再进行卷积操作, 另一部分 直接进行 卷积操作, 然后两 部分再经过Concat拼接后输出至空间金字塔池化S PP; 在空间金字塔池化SPP中, 先进行Conv提取特征输出, 再经过 四种不同尺度的最大池化 进行多尺度融合; 步骤4.2: 在骨干特征提取网络当中引入了坐标注意力机制来进一步提高模型对于纸 病特征的提取能力, 给定任意中间张量X=[x1,x2,…,xn]∈RC×H×W作为输入都能输出一个增 强表示能力的有相同尺寸的输出Y=[y1,y2,…,yn]。 其中C为通道数, H和W分别 为输入图像 的高和宽; 首先通过全局平均池化沿水平方向和垂直方向对每个通道c进行编码, 得到两个一维 特征编码向量: 再使用Concat级联之前生成的特征图zw、 zh, 然后使用卷积核大小为1的卷积变换函数 F1进行变换操作: f= δ(F1([zh,zw])) (3); 其中δ为非线性激活函数, f为在水平方向和垂直方向的的空间信 息进行编码时的中间 特征映射, 沿空间维度将f分解为fh∈RC/r×H和fw∈RC/r×W, 其中r为下采样比例, 利用两个卷 积核大小为1的卷积运 算Fh和Fw对fh和fw进行变换, 得到具有相同通道数的张量: gh=σ(Fh(fh)) (4); gw=σ(Fw(fw)) (5); 其中σ 为Sigmoid激活函数, 在这里为了降低 计算开销, 通常使用恰当的缩减比r来减少 f的通道数。 最后再对gh和gw进行扩展, 分别作为注意力权 重, 可得最终公式如下: 4 .3 : 为了形成更稳定的纸张缺陷特征分布 , 在批量归一化模块 (Batch Normalization, BN)的原始归一化层的开头和结尾添加居中和缩放校准。 给定输入 特征X∈ RN×C×H×W其中N、 C、 H、 W分别代表批次大小、 输入特征的通道数、 高度、 宽度, 表示如下公式 (7): 其中wm∈R1×C×1×1是可学习的权重 向量, 其大多层的值接近于零, 但是随着网络层数的 不断叠加, 其绝对值也不断增加, 网络有了更多特定于实例的功能。 Xcm为特征的居中校准, ⊙对特征的点乘操作, 经 过居中校准的居中特 征, 表示如下公式(8): Xm=Xcm‑E(Xcm) (8); 其中, E(Xcm)为Xcm的平均值, 通过像BN 一样缩放Xm, 能够推得如下公式(9):权 利 要 求 书 2/3 页 3 CN 115457026 A 3

.PDF文档 专利 一种基于改进YOLOv5的纸病检测方法

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于改进YOLOv5的纸病检测方法 第 1 页 专利 一种基于改进YOLOv5的纸病检测方法 第 2 页 专利 一种基于改进YOLOv5的纸病检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 思考人生 于 2024-02-07 20:35:22上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。