变身抓重点小能手:机器学习中的文本摘要入门指南 | 资源( 三 )

第一步:把段落转成句子

首先要做的是分割段落。

夜里志明和春娇乘坐出租车去城里聚会

聚会上春娇晕倒并被送进了医院

她被诊断出患有脑损伤,医生告诉志明要一直陪着她直到她好起来

因此,志明待在医院整整陪了她三天

第二步:文本处理

接下来,删掉没什么意义的连接词、数字、标点。

就像这样:

夜里志明春娇乘坐出租车去城里聚会

聚会春娇晕倒送医院

诊断脑损伤医生告诉志明陪着好起来

志明待在医院天

第三步:标注

然后,对句子进行标记,获得句子中的所有单词:

[‘志明’,‘春娇’,‘乘坐’,‘出租车’,‘去’,‘夜里’,‘聚会’,‘城里‘,‘聚会’,‘春娇’,‘晕倒’,‘医院’,‘诊断’,‘脑’,‘损伤’,‘医生’,‘告诉’,‘志明’,‘陪’,‘好起来’,‘志明’,‘待’,‘医院’,‘天’]

推荐阅读