变身抓重点小能手:机器学习中的文本摘要入门指南 | 资源(11)

16

17 sentence_weight[sentence[:7]] = sentence_weight[sentence[:7]] / sentence_wordcount_without_stop_words

18

19 return sentence_weight

需要注意的是,长句有可能得到不必要的高分,为了避免这一点,要将句子的总分数除以该句的单词数。

第五步:计算句子的阈值

为了进一步优化结果,要计算句子的平均分数。使用此阈值,可以避免分数较低的句子的干扰。

1def _calculate_average_score(sentence_weight) -> int:

2

3 # Calculating the average score for the sentences

4 sum_values = 0

5 for entry in sentence_weight:

6 sum_values += sentence_weight[entry]

推荐阅读