对于网站的概念,在互联网或搜索引擎中有很多相关的定义。网站包含是指爬虫对网页进行爬网并将网页内容数据放入搜索引擎数据库的结果。
由于收录是页面参与排名的前提,因此尽可能增加本网站的收录量就显得尤为重要。如何有效增加网站收藏量?增加收藏的方法有哪些?这里有三个方面的参考。
孤岛网页如何让蜘蛛发现?
1、收录入口
蜘蛛能爬取任何页面的前提,是要有入口。假设一个页面没有入口,就是我们俗称的孤岛页面,那么蜘蛛是无法爬取到的。我们在建设网站之初,就要考虑为蜘蛛留有足够的入口。具体包括:网站导航,网站地图,百度站长主动推送,外链发布,面包屑导航,站内相关推荐,上一篇下一篇,内容页内链锚文本等。
如何增加网站收录?
1、抓取规律
搜索引擎在爬取互联网中页面的时候,是有一定的爬取规律的。较广泛的说法有大站优先,权威站点优先,权重高站点优先,新闻源站点优先,广度爬取,深度爬取等。我们如何利用抓取规律提升收录量呢?较简单的做法是增加需要排名的页面更新频率与更新量,在内容更新位置,频率与数量上下功夫。
2、页面质量
页面质量可以算是提升收录的最重要因素。假设你的站点收录入口丰富,也较好的把握了搜索引擎抓取规律,但页面内容低质,那么这样的页面参与被收录的概率就会变小。页面质量涉及到页面内容,url设置,相关性建设,整站权重等要素的影响。
3.网站页面收录比
上面我们讲解了增加网站收录量的重要性以及一些方法,这里再提一个概念:网站页面收录比。从某种程度来讲,收录比比收录量更重要。收录量大的网站,排名不一定好;收录量小的网站,排名不一定差就是这一说法的佐证。什么是收录比呢?假设一个网站所有页面数量为100,被收录的网页数量为50,那么收录比就是50%。收录比越高越好。