变身抓重点小能手:机器学习中的文本摘要入门指南 | 资源( 九 )

19 if wd in frequency_table:

20 frequency_table[wd] += 1

21 else:

22 frequency_table[wd] = 1

23

24 return frequency_table

第三步:将文章标注成句子

1from nltk.tokenize import word_tokenize, sent_tokenize

2

3sentences = sent_tokenize(article)

第四步:计算句子的权重

句子的权重取决于它包含的单词的出现频率。

1def _calculate_sentence_scores(sentences, frequency_table) -> dict:

2

3 # Algorithm for scoring a sentence by its words

推荐阅读