飓风算法
飓风算法早在17年7月份的时候就已经发布出来了,时隔一年2个月算法再次升级,飓风算法2.0出现,再次对采集类网站敲响了警钟。
对于采集网站我们都知道,这类网站基本是没有自己的内容产出的,就是一个内容搬运工,短时间产生大量内容,为了恶意获取流量赚取联盟广告费而催生的。
这类采集网站有几个特点
1、内容冗杂
基本上这类采集网站中,啥内容都有,信息杂乱没有整合。
2、布局排版差
很多采集网站布局相当错乱,内容页更是不能看,一大堆错乱的内容,甚至语句不通。
3、垃圾页面
很多采集网站都是无差别采集,针对很多垃圾广告文,也是直接就采,小广告太多,造成很多垃圾页面的产生。
了解了上面的东西,我们再来解读一下这个算法(飓风算法2.0)
9月下旬飓风算法就会升级,2.0就会推出,要求站长进行自查,清理全部“违规采集”内容。
这里我们不妨对“违规采集”钻一下字眼
1、啥是采集违规?
2、难道说不违规的采集就不会被清理?
3、采集还是能允许存在的?
这里先不解答,我们继续看,飓风算法2.0针对的问题
1、存在大量从其他站点或公众号等内容生产方采集、搬运而来的内容,信息未经整合,排版混乱,文章可读性差,有明显采集痕迹,对用户无任何增益价值。
官方示例1(垃圾文,排版错乱):
官方示例2(小广告):
2、存在多段文章拼接的内容,文章逻辑性差,无法满足用户需求,阅读体验差。
3、站点内存在大量采集内容,网站自身的内容生产力极差。
4、站点内存在大量与本站主题无关的采集内容,领域专注度差,恶意获取流量。例如:科技网站采集大量娱乐八卦、社会新闻等情况。
这4点是算法所针对的违规采集网站,触犯这几点规则的都会被惩罚,从这几点我们就能回答上面的几个疑问了。
1、违规采集,不存在的,我只要不触犯这几点,就不会违规了,打击也打找不到我。
2、只要不违规,也不会被清理,我们从很多实例依旧发现,很多采集站排名依然坚挺首页。
3、采集依然允许存在,搜索引擎对于资源整合优秀的采集网站还是给予支持态度。
那么如何规避算法,如何有效打造采集站点?
从搜索的主题来说,“营造良好的内容生态,保护用户阅读体验,保护优质内容在百度搜索中的权益”,总结为两个点,“用户体验,优质内容”。
现在的搜索引擎对于垃圾页面,可以说是零容忍了,层出不穷的算法全是为了促进优质内容的生产,绿化搜索生态。
如此再根据上面的规则,怎么采集,我们就有了方向,也不会触犯算法。
1、采集内容,不能原搬照旧,需要自己再进行整合归纳,排版好,文章要有增益,比如采集的原文章没有配图,但是采集过来后,你加了配图,这就是增益。
2、文章逻辑性要强,不能断章取义、到处截取、随意拼接,这样的文章显然是不合格的,所以需要对文章进行重组,提高可阅读性。
3、站内不能一味地采集搬运,这样的网站会被搜索引擎判断为,内容生产力低下,没有自己的原生内容,网站会被降低不少评级。
4、网站内容要与主题密切相关,假设你是餐饮行业站就一定不能出现理财、科技之内的内容,现在都是细分领域才能脱颖而出,领域专注不够,只为恶意获取流量而采集更新一些与自己站点毫无干系的内容,肯定会被打击的。
小贴士:采集网站广告的植入一定要合理,不能牺牲用户体验,具体的规则看《百度移动搜索落地页体验白皮书4.0》,pc端异曲同工都差不太多。
好了多的seo实验室也就不说了,虽然以上这些增加了不少人工成本,但这已是不可避免的,希望大家良性采集,坚持优质内容创造,网站一定会起飞的。
相关阅读
重复内容是SEO优化行业一直关注的问题,重复内容到底会不会被搜索引擎惩罚,这是一个被经常讨论的话题,百度通过对比来对内容采集站
对前阵子即将上线的细雨算法2.0,百度官方近日给出了针对细雨算法2.0的具体问题的错误示例和整改建议,帮助站长们具体地理解细雨
现代启发式算法 启发式算法(heuristic algorithm)是相对于最优化算法提出的。一个问题的最优算法求得该问题每个实例的最优解。启
MD5算法最近看了一个MD5的视频,突然发现MD5挺意思的,所以记录一下代码(写好封装),没准以后要用。也为一些寻找MD5算法的人提供便利。MD
吐槽 国庆假期第二天,去实验室开门,给猫猫铲丑丑,然后给她换猫粮,换水,喂这货吃的emmmmmm,然后今天就把之前在极客时间上买的数据结构与