NLP领域文本摘要有哪些研究方法?( 六 )
图二 构建词袋特征向量
指标表示- 将文本中每个句子转换为重要特征列表 , 其功能可能包括:
· 句子长度
· 句子位置
· 句子是否包含特定单词(有关此类特征提取方法的示例 , 请参见图2 , 词袋(https://en.wikipedia.org/wiki/Bag-of-words_model))
· 句子是否包含特定短语
使用一组特征来表示文本数据和并对其进行排序 , 可以通过使用两种总体指示表示方法中的任一种来执行:图形方法和机器学习方法 。
使用图形表示:
· 我们发现 , 子图最终代表了本文所涵盖的主题 。
· 我们能够分离出文本中的重要句子 , 因为这些句子将与更多其他句子相连(如果你将句子视为顶点 , 并将句子相似性表示为边缘) 。
推荐阅读
- g2|拳头澄清C9和G2限制阿P加入FNC不作数!巴萨正式进军LOL领域
- 零|腾讯收购角川6.86股份,将加强动画和IP领域合作
- 王者荣耀·世界|《王者荣耀·世界》正式公布,王者IP再度拓展新领域
- 交易|梦幻西游:浩文本月服战0谛听出战,391神链号70万元交易!
- 张大仙|张大仙转型成功,勤奋减肥只为在新的领域发展更好,大仙加油!
- 传奇世界手游|传奇世界手游:复古传世元神,深海领域,沉船重宝,战士刷怪技巧
- 李白|S24赛季正式开启,10大英雄调整,射手领域变天,李白这次又行了
- 预告|斗罗大陆:154话预告藏拙,天使领域在第4秒被打报废,千仞雪重伤
- 伊苏|LOL新英雄:哥特玩偶扛着大剪刀,开领域无视技能,破败王后哭了
- 魔兽世界|魔兽世界3月13日修正,下水道战士再次削弱,DK领域享受良心修复