在一些站长群体中,很多站长和编辑都会经常听到一个声音,无论如何自己的关键词没有排名。"似乎每个人都习惯了听这个声音,认为做SEO就是看着百度的脸和过去。当然,网站管理员也会做一些技巧,除了编写高质量的原创内容外,还要提高网页关键词的密度,将网络关键词的密度控制在2%到8%之间,然后分析关键词的布局,第一段和结尾一般会出现关键词。
百度如何判断关键词的密度
一个网页是否和关键词相匹配,首先SEO站长要明白两个概念,一个是词频,一个是密度。搜索引擎刚发展的时候,很多站长都知道堆积关键词就可以轻松获取排名,这就是词频。显然这个算法是有弊端的,所以衍生出密度这个说法,密度的出现对关键词堆积的行为有了一定的遏制。
上面说到词频这个概念,我们要了解一种统计方法TF-IDF。TF就是词频 (temfrequency),IDF是逆文档频率(inverse document frequency)。针对一个特定关键词,包含这个关键词的文件数量除以数据库文件总数,得到这个词的文件频率。反过来,文件总数除以包含这个词的文件数量(通常真正计算时还要取对数) ,就得到逆文档频率。所以,语言中越常见的词,包含这个词的文件数越多,文件频率也就越高,逆文档频率越低。
什么是逆文档频率
逆文档频率代表了这个词的语义重要性或者说区别文件的能力。举例来说,“的”通常在所有文件中出现,文件频率极高,逆文档频率极低,也就是“的”这个词的语义重要性很低,几乎无法用来代表和区别文件内容。“搜索引擎”这个词只出现在一小部分文件中,逆文档频率要高得多,对文件内容来说重要性要高得多。
搜索引擎在判定页面与什么关键词更相关时,不是单纯考虑词频,而是计算词频乘以逆文档频率,也就是TF-IDF。逆文档频率低,即使词频高,页面与关键词相关性还是不高。举个例子,如果要优化“新加坡旅游”这个词组,在百度搜索“新加坡”返回27600000个结果,搜索“旅游”返回100000000个结果,包含“新加坡”的文件数远小于包含“旅游”的文件数,百度数据库的文件总数是固定的,所以“新加坡”的逆文档频率大于“旅游”。或者换句话说,“新加坡”这个词在区别、辨识文件能力上比“旅游”这个词要高。在优化文案时,增加“旅游”出现次数就没有增加“新加坡”次数更有效。
好了,以上就是本期的内容,希望这些内容可以帮知道大家
相关阅读
可以说我们每天都在用搜索工具,用它来查询我们不知道的一些事情,搜索工具可以帮助我们解决生活中许多难题,今天我就来说一说百
为了得到更多的东西而放弃,编辑无穷无尽地同意这句哲学的说法。减号的命令是让你放弃一些搜索标准,使搜索结果更加准确。今天
我们要知道现在是互联网的时代,在网上可以挖掘到许多客户,其中最常用的就是百度,想问你的朋友们,你真的掌握了如何使用百度搜索
我们知道百度权重是网站非常重要的一部分,一般来说权重高,网站的流量就会高很多,带来的收益就会高,今天和大家说说最简单的SEO提
听说这个名字不是很高,其实我是近十年来第一次听说SEO的。一般的专业搜索引擎优化快速排名业务使用这种模式很多。我会告诉你