全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211137035.0 (22)申请日 2022.09.19 (71)申请人 陕西师范大学 地址 710062 陕西省西安市长安 南路199号 (72)发明人 吴晓军 刘艺薇 张玉梅  (74)专利代理 机构 西安永生专利代理有限责任 公司 61201 专利代理师 申忠才 (51)Int.Cl. G06F 40/242(2020.01) G06F 40/295(2020.01) G06N 3/04(2006.01) G06V 10/764(2022.01) G06V 10/82(2022.01) (54)发明名称 基于改进的注意力机制网络五言绝句生成 方法 (57)摘要 一种基于改进的注意力机制网络五言绝句 生成方法, 由生成图像数据集和诗词数据集、 构 建VGG16图片标签网络、 训练VGG16图片标签网 络、 提取图像关键标签、 扩展诗词数据集、 诗词数 据预处理、 建立关键词对应词典、 构建改进的注 意力机制网络、 训练改进的注意力机制网络、 生 成五言绝句步骤组成。 用户输入图片进行分类后 的实体标签, 增强了与图片的关联性, 增加了整 首古诗意境上的概括性与完整性。 通过VGG16网 络建立图像特征提取模型以及基于注意力机制 改进的编码解码作诗模型融合, 实现将图像转换 成五言绝句。 本发明具有转换准确、 转换速度快、 转换完整等优点, 可用于将图像转换成五言绝 句。 权利要求书2页 说明书7页 附图2页 CN 115545014 A 2022.12.30 CN 115545014 A 1.一种基于改进的注意力机制网络五言绝句生成方法, 其特 征在于由下述 步骤组成: (1)生成图像数据集和诗词数据集 从CIFAR‑100图像数据集中选取图像, 按5:1分为训练集和测试集, 将CIFAR ‑100图像数 据集中的100个类分成10个超类, 每个图像都带有一个所属类别标签和一个所属的超类标 签; 从中华古典文集数据库中挑选15000首唐诗与宋诗的五言绝句, 作为五言绝句诗词数 据库; (2)构建VG G16图片标签网络 VGG16图片标签网络由第一模块与第二模块、 第三模块、 前第四模块、 后第四模块、 全局 平均池化层、 Softmax分类层d1依次串联构成; 所述的第一模块由64通道串联的2个卷积层与1个池化层串联构成; 第二模块由128通 道串联的2个卷积层与 1个池化层串联构成; 第三模块由256通道串联的3个卷积层与 1个池 化层串联构成; 前第四模块由512 通道串联的3个卷积层与1个池化层 串联构成; 后第四模块 由512通道串联的3个卷积层与1个池化层串联构成; (3)训练VG G16图片标签网络 将训练集输入到VGG16图片标签网络进行训练, 批量大小为128, 线性整流层作为激活 函数层, 学习率定为0.1, 采用交叉熵损失函数H(p,q)对VGG16图片标签网络进行训练, 训练 至损失函数收敛: 其中n表示分类 个数, n为有限的正整数, p(xi)表示正确答案, q(xi)表示预测值; (4)提取图像关键标签 将测试集输入到训练好的VGG16图片标签网络进行测试, 提取卷积特征, 输出层采用 Softmax分类层d1, 通过Softmax分类层d1将测试集中图像分为10个类别的概率, 其中概率 最大的类别作为输出类别, 得到图像关键标签; (5)扩展诗词数据集 1) 从民 族民 间 文 化 资 源 数 据 库 中 获 取 诗 词 , 数 据 库 网 址 为 h t t p : / / 51cst.sn nu.edu.cn/; 2)将民族民间文化资源数据库的诗词添加到五言绝句诗词数据库中; (6)诗词数据预处 理 1)将五言绝句诗词数据库中的繁体字转换为简体字; 2)删除五言绝句诗词数据库中的生僻字; 3)删除五言绝句诗词数据库的标题中含有非中文的诗词; (7)建立关键词对应词典 建立100个图片标签所对应的超类别关键词[l1,l2,...,l10]的对应汉字字典, 其中l1 表示[江, 湖, 海,水, 鱼], l2表示[春, 花, 秋, 落], l3表示[杯, 盘], l4表示[子, 郎], l5表示 [金, 盘], l6表示[ 飞, 高], l7表示[山, 野, 峰], l8表示[楼, 高, 阁], l9表示[树, 林, 枝], l10 表示[车, 路, 马], 建立了关键词对应词典;权 利 要 求 书 1/2 页 2 CN 115545014 A 2(8)构建改进的注意力机制网络 改进注意力机制的古诗生成网络由编码器和解码器串联构成, 编码器由1层长短期记 忆层b1构成, 解码器由长短期记忆层b2与长短期记忆层b3、 Softmax分类层d2依次串联构 成, 长短期记 忆层b2与长短期记 忆层b3的结构相同; (9)训练改进的注意力机制网络 采用TextRan k方法的W ord2vec模型按下式确定节点Vi的得分WS(Vi): 式中, Wji表示节点Vi和节点Vj边的权重, In(Vi)表示进入节点i的节点集合, Out(Vj)表 示离开节点j的节点集合, 节点Vi的得分WS(Vi)的初始值为[0.5,2], d表示阻尼因子, d取值 为[0.8,1], 选取 得分最高的词作为整句的关键词; 用收集到的五言绝句诗词数据库作为语料库训练词向量模型Word2vec, 词向量维度T 取256, 迭代次数为50次, 即输入1个关键词时, 得到词的1个向量空间wi和向量空间wj, 按下 式确定向量间相似度simi(wi,wj), 由相似度的大小判断与关键词语义最接近的系列词, 并 按照顺序提取概 率最大的前3个关键词集 合{C1,C2,...,Cj}: 编码器将关键词集合{C1,C2,...,Cj}通过长短期记忆网络编码成隐层状态集合{h1, h2,...,hj}, j为有限的正整数, Cj为第j个编码向量; 编码器用隐层状态生成输出序列{y1, y2,...,yj}, 按下式确定 输出向量yj: yj=argmaxP(y|yj‑1,sj,cj) sj=f(sj‑1,yj‑1,cj) 式中, yj‑1为上一时刻的输入, sj‑1为上一时刻的状态, sj为当前时刻的状态, cj是所有输 入序列的隐层状态; (10)生成五言绝句 将测试集输入到训练好的VGG16图片标签网络中, 得到关键字, 将关键字输入到古诗生 成网络中, 生成五言绝句。 2.根据权利要求1所述的基于改进的注意力 机制网络五言绝句生成方法, 其特征在于: 在(2)步骤中, 所述的卷积层的卷积核为3 ×3, 步长为1; 所述的池化层的滤波器为2 ×2, 步 长为2; 所述的全局平均池化层通道数为512。 3.根据权利要求1所述的基于改进的注意力机制网络五言绝句生成方法, 其特征在于 在(6)步骤中, 所述的繁体字转换为简 体字的方法为: 使用简 繁转换词 库对全部诗句进 行简 繁转换操作; 所述删除五言绝句诗词 数据库的标题中含有非中文的诗词的方法为: 使用正 则表达方法对标题中含有空白、 句号、 特殊符号、 标题不 规范的诗句删除。 4.根据权利要求1所述的基于改进的注意力 机制网络五言绝句生成方法, 其特征在于: 在(8)步骤中, 所述的长短期记忆层b1输出空间维数为4, 长短期记忆层b2、 长短期记忆层b3 输出空间维数为20 。权 利 要 求 书 2/2 页 3 CN 115545014 A 3

PDF文档 专利 基于改进的注意力机制网络五言绝句生成方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于改进的注意力机制网络五言绝句生成方法 第 1 页 专利 基于改进的注意力机制网络五言绝句生成方法 第 2 页 专利 基于改进的注意力机制网络五言绝句生成方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:44上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。