搜索引擎收到用户输入的搜索词后,需要在进入排名过程之前对搜索词进行一些处理。
搜索词处理包括以下几方面:
(1)中文分词。与页面索引时一样,搜索词也必须进行中文分词,将查询字符串转换为以词为基础的关键词组合。分词原理与页面分词相同。
(2)指令的处置。平时咱们在搜索时会输入多个词语,实在默认的情况下,搜索引擎把多个默认的词语都依照“与”来进行词语。比方你搜索“seo”“培训”时,搜索引擎会默认咱们输入的“seo培训”来进行处置,独自包括“seo”或者“培训”的网站内容实践上将不会返回,但实际情况往往也会呈现独自包括一个词语的网站。另外,还要处置各种高等搜索指令的词语,比方加号减号等。
(3)停止词。和索引时一样,搜索引擎也需要把搜索词中的停止词去掉,最大限度地提高排名相关性及效率。
(4)过错纠正。用户如果输入了明显错误的字或英文单词拼错,搜索引擎会提示用户正确的用字或拼法。
(5)整合搜索触发。某些搜索词会触发整合搜索,比如明星姓名就经常触发图片和视频内容,当前的热门话题又容易触发资讯内容。
计算相关性是排名过程中最重要的一步。相关性计算是搜索引擎算法中最令SEO感兴趣的部分。
影响相关性的主要因素包括以下几方面。
(1)关键词常用程度。经过分词后的多个关键词,对整个搜索字符串的意义贡献并不相同。越常用的词对搜索词的意义贡献越小,越不常用的词对搜索词的意义贡献越大。
(2)关键词位置及形式。就像在索引部分中提到的,页面关键词出现的格式和位置都被记录在索引库中。关键词出现在比较重要的位置,如标题标签、黑体、H1等,说明页面与关键词越相关。这一部分就是页面SEO所要解决的。
(3)词频和密度。一般情况是关键词在文章中出现密度越高,搜索越相关,但是不能刻意的关键词堆积,因为如果被认为关键词堆积那么反而会降低相关性。
(4)关键词距离。切分后的关键词完整匹配地出现,说明与搜索词最相关。比如搜素“优化方法”时,页面上连续完整出现“优化方法”四个字是最相关的。如果“优化”和“方法”两个词没有连续匹配出现,不过出现的距离较近,也被搜索引擎认为相关性较大。
(5)链接和页面权重。页面的权重越高那么相关性越强,页面越多一搜索词为锚文字的导入链接越多,相关性越大。
相关阅读
一些搜索引擎优化初学者认为有一些搜索引擎优化的秘密我们经常看到一些成员在论坛上问一些问题,当没有人给出明确的答案时,我
SEO常用搜索引擎指令 site指令: 查询某个特定网站的收录情况:如果结果有返回数据,则表明该网站已被收录,如果返回数据为空
什么是引擎蜘蛛?搜索网页爬虫是一种程序或脚本,它们是一种设立的程序来获取互联网的消息。互联网可以理解为一个巨大的"蜘蛛网
在搜索引擎优化工作中,我们经常关心网站如何优化如何挖掘关键词而忽略了对蜘蛛的理解。虽然搜索引擎优化是一个相对复杂的工
对SEOer来说,分析竞争对手的网站是我们必须做的事情,并且做得很好。然而,许多首尔人只知道如何观察,却不知道如何分析竞争对手的