(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211252213.4
(22)申请日 2022.10.13
(71)申请人 深圳占领信息技 术有限公司
地址 518102 广东省深圳市宝安区西乡街
道劳动社区万庭大厦1号楼1 111
(72)发明人 宋柯 黄以可 罗德军 石泽文
(74)专利代理 机构 成都初阳知识产权代理事务
所(特殊普通 合伙) 51305
专利代理师 李春芳
(51)Int.Cl.
G06F 40/289(2020.01)
G06F 40/216(2020.01)
G06F 40/30(2020.01)
G06N 20/00(2019.01)
(54)发明名称
一种基于细粒度情感字典的网络情绪分析
系统
(57)摘要
本发明公开了一种基于细粒度情感字典的
网络情绪分析系统, 包括文本输入单元、 情感分
析单元、 情感赋权单元、 情绪划分单元和可视化
单元; 情感分析单元, 其对文本输入单元中的文
本训练集字词进行情感分析, 情感分析方式根据
与情感字典单元中的多类情感词进行对比, 并以
此得出文本训练集的整体情感方向; 情绪划分单
元, 其对情感赋权后的文本训练集情感方向进行
细分, 并以此得出文本训练集所要表 示的情绪方
向; 本发明涉及文本字词情绪分析技术领域; 该
基于细粒度情感字典的网络情绪 分析系统,通过
将文本中字词进行情感方向的确定, 之后根据情
感进行情绪方向的细分, 并可根据程度副词的位
置来确定情感的强度值, 可准确的分析出文本所
包含的情绪信息 。
权利要求书2页 说明书6页 附图6页
CN 115545026 A
2022.12.30
CN 115545026 A
1.一种基于细粒度情 感字典的网络情绪分析系统, 其特征在于,包括文本输入单元、 情
感分析单元、 情感赋权单 元、 情绪划分单 元和可视化单 元;
文本输入单元, 其用于将所需进行情绪分析的文本训练集输入网络情绪分析系统中,
并进行后续的文本训练集处 理;
情感分析单元, 其对文本输入单元中的文本训练集字词进行情感分析, 情感分析方式
根据与情感字典单 元中的多类情感词进行对比, 并以此 得出文本训练集的整体情感方向;
情感赋权单元, 其对文本训练集中拆分后的字词进行情感赋值, 并得出整体文本训练
集所指向的情感方向;
情绪划分单元, 其对情感赋权后的文本训练集情感方向进行细分, 并以此得出文本训
练集所要表示的情绪方向;
可视化单元, 其将文本训练集中的字词通过图表的方式进行生成, 并将文本训练集中
所体现情绪方向的重要性字词进行区分, 之后通过图表的方式进行展示。
2.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于,
还包括中央处 理单元、 情感字典单 元、 文本清洗单 元和词频统计单 元;
中央处理单元, 其用于对网络情绪分析系统中多个业务单元的属性信息进行管理, 并
根据多个业 务单元的属性信息分别管理业 务单元的属性信息相匹配的配置数据文件;
情感字典单元, 其用于存储正面情 感字词、 负向情 感字词和中性情感字词, 并将多组字
词区分后进行分类储 存;
文本清洗单元, 其对文本输入单元中进行情绪分析的文本训练集进行拆分, 将无效字
符去除, 并将其文本训练集拆分成多组字词;
词频统计单元, 其将文本清洗单元中文本训练集拆分后的多组字词针对相同字词 进行
聚集, 并统计相同字词的数量。
3.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于:
所述情感赋权单元中将正面情感词分值设1, 负面情感词分值设为 ‑1, 中性词则设为0, 肯定
词分值全设为1, 否定词分值全设为 ‑1, 程度副词不做改变, 其中否定词和程度副词的不同
位置会产生两种结果, 一是 “否定词+程度副词+情感词 ”, 还有就是 “程度副词+否定词+情感
词”;
其中对于“否定词+程度副词+情感词 ”的计算方式如下:
P1=(x(K)+x(M)+x(O) )×α,
对于“程度副词+否 定词+情感词 ”的计算方式如下:
P2=(x(M)+x(K)+x(O)) ×β, 其中P1和P2表示计算得到的情感词语的情感强度值, x表示
字词的数量, K表 示否定词的权值, O表示情感词的权值, M表 示该情感词O前的程度副词的权
值, α 表示P1中的总权值系数, β 表示P2中的总权值系数。
4.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于,
所述情绪划分单 元对文本训练集中拆分字词的情感进行情绪方向的细分, 细分公式如下:
其中Q(XI|B)表示情感方向下细分后B情绪的强度 值, DB表示文本训
练集中属于B情绪下的字词集合,
表示文本训练集中属于B情绪中第I个属性取值为XI权 利 要 求 书 1/2 页
2
CN 115545026 A
2的集合。
5.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于,
所述中央处理单元的输出端均与情感字典单元、 文本输入单元、 文本清洗单元、 词频 统计单
元、 情感分析 单元、 情感赋权单 元、 情绪划分单 元和可视化单 元的输入端相连接;
所述文本输入单元的输出端与文本清洗单元的输入端相连接, 所述文本清洗单元的输
出端与词频 统计单元的输入端相连接, 所述词频 统计单元的输出端与情感分析单元的输入
端相连接, 所述情感分析单元 的输出端与情感赋权单元 的输入端相连接, 所述情感赋权单
元的输出端与情绪划分单元的输入端相连接, 所述情绪划分单元的输出端与可视化单元的
输入端相连接;
所述情感字典单元与情感分析单元之间实现双向连接, 所述情感字典单元与情绪划分
单元之间实现双向连接 。
6.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于,
所述文本清洗单元包括输入模块一、 文本 分词模块、 字 符检测模块和输出模块一, 所述输入
模块一的输出端与文本 分词模块的输入端相连接, 所述文本分词模块的输出端与字符检测
模块的输入端相连接, 所述字符检测模块的输出端与输出模块 一的输入端相连接 。
7.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于,
所述情感分析单元包括输入模块二、 字词筛选模块、 字词归类模块、 程度副词判断模块和输
出模块二, 所述输入模块二的输出端与字词筛选模块的输入端相连接, 所述字词筛选模块
的输出端与字词归类模块的输入端相连接, 所述字词归类模块的输出端与程度副词判断模
块的输入端相连接, 所述 程度副词判断模块的输出端与输出模块 二的输入端相连接 。
8.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于,
所述情感赋权单元包括输入模块三、 字词赋值模块、 正面情感词模块、 中性词模块、 负面情
感词模块和输出模块三, 所述输入模块三的输出端与字词赋值模块的输入端相连接, 所述
字词赋值模块的输出端均与正面情感词模块、 中性词模块和负面情感词模块的输入端相连
接, 所述正面情感词模块、 中性词模块和负面情感词模块的输出端均与输出模块三的输入
端相连接 。
9.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在于,
所述情绪划分单元包括输入模块四、 情绪分类模块、 快乐情感词模块、 悲哀情感词模块、 恐
惧情感词模块、 愤怒情感词模块和输出模块四, 所述输入模块四的输出端与情绪分类模块
的输入端相连接, 所述情绪分类模块的输出端均与快乐情感词模块、 悲哀情感词模块、 恐惧
情感词模块和愤怒情感词模块的输入端相连接, 所述快乐情感词模块、 悲哀情感词模块、 恐
惧情感词模块和愤怒情感词模块的输出端均 与输出模块四的输入端相连接 。
10.根据权利要求1所述的一种基于细粒度情感字典的网络情绪分析系统,其特征在
于,所述可视化单元包括输入模块五、 图表生成模块、 图表编辑模块、 图表展示模块和输出
模块五, 所述输入模块五的输出端与图表生成模块的输入端相连接, 所述图表生成模块的
输出端与图表编辑模块的输入端相连接, 所述图表编辑模块的输出端与图表展示模块的输
入端相连接, 所述图表展示模块的输出端与输出模块五的输入端相连接 。权 利 要 求 书 2/2 页
3
CN 115545026 A
3
专利 一种基于细粒度情感字典的网络情绪分析系统
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:07:03上传分享