变身抓重点小能手:机器学习中的文本摘要入门指南 | 资源( 五 )
3
4# Tokenizing the sentences
5sentences = sent_tokenize(article)
6
7# Algorithm for scoring a sentence by its words
8sentence_scores = _calculate_sentence_scores(sentences, frequency_table)
9
10# Getting the threshold
11threshold = _calculate_average_score(sentence_scores)
12
13# Producing the summary
14article_summary = _get_article_summary(sentences, sentence_scores, 1.5 * threshold)
15
16print(article_summary)
第一步:准备数据
这里使用了Beautiful Soup库。
推荐阅读
- 胡桃夹子|干将莫邪新皮肤将上线,干将变身胡桃夹子,真有趣?
- edg战队|王者荣耀体验服六位英雄调整,镜、澜再削弱,钟无艳提升技能手感
- 传奇|璀璨传奇复古:道士前期有多爽?三职业最强 开荒能手 自带两个特戒
- 手办|少女前线:春田太太静享芳醇可动手办实物 咖啡台才是核心和重点
- 手机游戏|LOL手游女神诞生!美女主播发现流量密码,黑丝变身腿根纹身亮眼
- 程咬金|程咬金的三大误区,第二条是重点,程咬金居然也有连招!
- 原神|原神角色颜值不是唯一衡量标准,强度才是重点,期待新版本来袭
- 万圣节|闪耀暖暖:万圣节主题新非凡套装公开 变身古灵精怪的猫耳小魔女
- 和平精英|“吃鸡”更新3.1G,玩家在海岛里捡到3个“变身器”,光回来了!
- 最终幻想|梦幻西游:天机城的秒三技能有多垃圾?三攻变身还没平砍打的多