百度是如何判断页面关键词的?( 二 )

搜索引擎判断一个页面的核心关键词的流程应该有:

  1. 抽取页面部分内容 , 对内容进行分词处理;

  2. 根据各个关键词在页面中的频率以及在全网中的频率来判断哪些词是该页面的主要关键词 , 这里一般运用的是TF-IDF及其改进算法;

  3. 推荐阅读