情感|舆情情感是如何被测量的?( 三 )


与情感词典的方法相比 , 机器学习方法更简单 , 能取得更高的分类准确度 , 但是机器学习是一个监督学习方法 , 需要对数据集进行三类情感的类别标注 。 大规模高质量的数据标注耗费极高的人工成本 , 人为主观的数据标注结果准确和一致性也不易保证 , 而模型参数的训练完全依赖数据集类标的准确性 , 因此成本压力和大量数据过载情况下都会影响其可靠和可实现性 。
基于深度学习的方法 。 深度学习DL(DeepLearning)是指通过多层神经网络拟合训练样本分布的一种机器学习方法 , 它缓解了传统神经网络算法在训练多层神经网络时出现的局部最优问题 , 且其训练过程不依赖于样本标签信息 。
在情感分析的深度学习方法中 , 常常看到注意力机制 , 如CNN+注意力机制等 。 注意力机制是一种类似人脑的注意力分配机制 , 它对重要的区域投入更多的资源 , 以获取更多的细节 , 对无用的信息则进行抑制 , AI领域的从业者把这种机制引入到一些模型里 , 并取得了成功 。
与基于情感词典与机器学习的方法相比 , 深度学习有更强的表达能力和模型泛化能力 , 但是缺乏大规模的训练数据也是深度学习在情感分类中遇到的问题 。
多策略混合的方法 , 相较于单一模型 , 将领域新词或构建的主题情感词典与机器学习、深度学习模型相结合 , 可以提高情感倾向性分析的准确率 。 多策略混合的方法一般分析问题更为全面和深入 , 具有一定优势 , 但是多策略混合方法的模型复杂度与训练难度更高 , 比单一模型更难以实现 。
针对不同情感反应有效进行舆情处置
现阶段 , 舆情事件不同情感分布主要分为三种情形 , 分别有不同的处理方法 。一是敏感跟帖所占比重很高 , 说明负面观点比较多 , 涉事主体需尽快采取处置措施避免事态扩大 。二是正面跟帖比重高 , 则可以设法延长舆情周期 , 提升宣传效果 。三是中性跟帖比较多 , 涉事主体则需考虑在巩固中性情感底盘的同时 , 如何进一步“提正抑负” 。 对于以上三种状态提出了基本的应对策略 。 但是实际舆情应对工作中 , 处理起来更为复杂 。
通过机器快捷判定舆情事件的初步情况 , 能够为人的综合判断和设计应对方案提供一个好的路线图 , 以便于舆情苗头出现之际快速发现信号、舆情发酵过程中检验应对有效性 , 以及在后期科学评判处置效果 。 事实上 , 机器帮我们做一个先期的关于舆情事件中公众敏感、中性、和正面三种情感的分布和时间上的发展趋势 , 而涉事主体或者政府部门该如何处置 , 还是需要专业人员提供个性化的多维度、多因素基于现状、资源约束条件下对结果预期的最优条件下采取的策略组合 , 这是充分发挥人的能动性和实现应对有效性的重要路径 。因此 , 技术手段结合人类智力是舆情及时发现、有效处置、声誉修复的重要方法 。

推荐阅读