全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211252213.4 (22)申请日 2022.10.13 (71)申请人 深圳占领信息技 术有限公司 地址 518102 广东省深圳市宝安区西乡街 道劳动社区万庭大厦1号楼1 111 (72)发明人 宋柯 黄以可 罗德军 石泽文  (74)专利代理 机构 成都初阳知识产权代理事务 所(特殊普通 合伙) 51305 专利代理师 李春芳 (51)Int.Cl. G06F 40/289(2020.01) G06F 40/216(2020.01) G06F 40/30(2020.01) G06N 20/00(2019.01) (54)发明名称 一种基于细粒度情感字典的网络情绪分析 系统 (57)摘要 本发明公开了一种基于细粒度情感字典的 网络情绪分析系统, 包括文本输入单元、 情感分 析单元、 情感赋权单元、 情绪划分单元和可视化 单元; 情感分析单元, 其对文本输入单元中的文 本训练集字词进行情感分析, 情感分析方式根据 与情感字典单元中的多类情感词进行对比, 并以 此得出文本训练集的整体情感方向; 情绪划分单 元, 其对情感赋权后的文本训练集情感方向进行 细分, 并以此得出文本训练集所要表 示的情绪方 向; 本发明涉及文本字词情绪分析技术领域; 该 基于细粒度情感字典的网络情绪 分析系统,通过 将文本中字词进行情感方向的确定, 之后根据情 感进行情绪方向的细分, 并可根据程度副词的位 置来确定情感的强度值, 可准确的分析出文本所 包含的情绪信息 。 权利要求书2页 说明书6页 附图6页 CN 115545026 A 2022.12.30 CN 115545026 A 1.一种基于细粒度情 感字典的网络情绪分析系统, 其特征在于,包括文本输入单元、 情 感分析单元、 情感赋权单 元、 情绪划分单 元和可视化单 元; 文本输入单元, 其用于将所需进行情绪分析的文本训练集输入网络情绪分析系统中, 并进行后续的文本训练集处 理; 情感分析单元, 其对文本输入单元中的文本训练集字词进行情感分析, 情感分析方式 根据与情感字典单 元中的多类情感词进行对比, 并以此 得出文本训练集的整体情感方向; 情感赋权单元, 其对文本训练集中拆分后的字词进行情感赋值, 并得出整体文本训练 集所指向的情感方向; 情绪划分单元, 其对情感赋权后的文本训练集情感方向进行细分, 并以此得出文本训 练集所要表示的情绪方向; 可视化单元, 其将文本训练集中的字词通过图表的方式进行生成, 并将文本训练集中 所体现情绪方向的重要性字词进行区分, 之后通过图表的方式进行展示。 2.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于, 还包括中央处 理单元、 情感字典单 元、 文本清洗单 元和词频统计单 元; 中央处理单元, 其用于对网络情绪分析系统中多个业务单元的属性信息进行管理, 并 根据多个业 务单元的属性信息分别管理业 务单元的属性信息相匹配的配置数据文件; 情感字典单元, 其用于存储正面情 感字词、 负向情 感字词和中性情感字词, 并将多组字 词区分后进行分类储 存; 文本清洗单元, 其对文本输入单元中进行情绪分析的文本训练集进行拆分, 将无效字 符去除, 并将其文本训练集拆分成多组字词; 词频统计单元, 其将文本清洗单元中文本训练集拆分后的多组字词针对相同字词 进行 聚集, 并统计相同字词的数量。 3.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于: 所述情感赋权单元中将正面情感词分值设1, 负面情感词分值设为 ‑1, 中性词则设为0, 肯定 词分值全设为1, 否定词分值全设为 ‑1, 程度副词不做改变, 其中否定词和程度副词的不同 位置会产生两种结果, 一是 “否定词+程度副词+情感词 ”, 还有就是 “程度副词+否定词+情感 词”; 其中对于“否定词+程度副词+情感词 ”的计算方式如下: P1=(x(K)+x(M)+x(O) )×α, 对于“程度副词+否 定词+情感词 ”的计算方式如下: P2=(x(M)+x(K)+x(O)) ×β, 其中P1和P2表示计算得到的情感词语的情感强度值, x表示 字词的数量, K表 示否定词的权值, O表示情感词的权值, M表 示该情感词O前的程度副词的权 值, α 表示P1中的总权值系数, β 表示P2中的总权值系数。 4.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于, 所述情绪划分单 元对文本训练集中拆分字词的情感进行情绪方向的细分, 细分公式如下: 其中Q(XI|B)表示情感方向下细分后B情绪的强度 值, DB表示文本训 练集中属于B情绪下的字词集合, 表示文本训练集中属于B情绪中第I个属性取值为XI权 利 要 求 书 1/2 页 2 CN 115545026 A 2的集合。 5.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于, 所述中央处理单元的输出端均与情感字典单元、 文本输入单元、 文本清洗单元、 词频 统计单 元、 情感分析 单元、 情感赋权单 元、 情绪划分单 元和可视化单 元的输入端相连接; 所述文本输入单元的输出端与文本清洗单元的输入端相连接, 所述文本清洗单元的输 出端与词频 统计单元的输入端相连接, 所述词频 统计单元的输出端与情感分析单元的输入 端相连接, 所述情感分析单元 的输出端与情感赋权单元 的输入端相连接, 所述情感赋权单 元的输出端与情绪划分单元的输入端相连接, 所述情绪划分单元的输出端与可视化单元的 输入端相连接; 所述情感字典单元与情感分析单元之间实现双向连接, 所述情感字典单元与情绪划分 单元之间实现双向连接 。 6.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于, 所述文本清洗单元包括输入模块一、 文本 分词模块、 字 符检测模块和输出模块一, 所述输入 模块一的输出端与文本 分词模块的输入端相连接, 所述文本分词模块的输出端与字符检测 模块的输入端相连接, 所述字符检测模块的输出端与输出模块 一的输入端相连接 。 7.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于, 所述情感分析单元包括输入模块二、 字词筛选模块、 字词归类模块、 程度副词判断模块和输 出模块二, 所述输入模块二的输出端与字词筛选模块的输入端相连接, 所述字词筛选模块 的输出端与字词归类模块的输入端相连接, 所述字词归类模块的输出端与程度副词判断模 块的输入端相连接, 所述 程度副词判断模块的输出端与输出模块 二的输入端相连接 。 8.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于, 所述情感赋权单元包括输入模块三、 字词赋值模块、 正面情感词模块、 中性词模块、 负面情 感词模块和输出模块三, 所述输入模块三的输出端与字词赋值模块的输入端相连接, 所述 字词赋值模块的输出端均与正面情感词模块、 中性词模块和负面情感词模块的输入端相连 接, 所述正面情感词模块、 中性词模块和负面情感词模块的输出端均与输出模块三的输入 端相连接 。 9.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于, 所述情绪划分单元包括输入模块四、 情绪分类模块、 快乐情感词模块、 悲哀情感词模块、 恐 惧情感词模块、 愤怒情感词模块和输出模块四, 所述输入模块四的输出端与情绪分类模块 的输入端相连接, 所述情绪分类模块的输出端均与快乐情感词模块、 悲哀情感词模块、 恐惧 情感词模块和愤怒情感词模块的输入端相连接, 所述快乐情感词模块、 悲哀情感词模块、 恐 惧情感词模块和愤怒情感词模块的输出端均 与输出模块四的输入端相连接 。 10.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在 于,所述可视化单元包括输入模块五、 图表生成模块、 图表编辑模块、 图表展示模块和输出 模块五, 所述输入模块五的输出端与图表生成模块的输入端相连接, 所述图表生成模块的 输出端与图表编辑模块的输入端相连接, 所述图表编辑模块的输出端与图表展示模块的输 入端相连接, 所述图表展示模块的输出端与输出模块五的输入端相连接 。权 利 要 求 书 2/2 页 3 CN 115545026 A 3

PDF文档 专利 一种基于细粒度情感字典的网络情绪分析系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于细粒度情感字典的网络情绪分析系统 第 1 页 专利 一种基于细粒度情感字典的网络情绪分析系统 第 2 页 专利 一种基于细粒度情感字典的网络情绪分析系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:07:03上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。