作为一个站长,你需要明白网站日志是什么,如果你不想去关心它,我只能说你是一个无能的网站管理员,一旦网站出了问题,你就什么也做不了!即使你有SEO的基本知识,你也应该善于分析网站日志。
什么是网站日志
很多新手SEO站长可能觉得不去分析网站日志也无关紧要,相信大家都在自己的网站上安装了网站统计的代码,如Google analytics、量子统计、百度统计、cnzz、51.la等。这些工具可以统计网站的流量,但是这些统计工具都不能统计你主机上资源的原始访问信息,例如某个图片被谁下载了,也不能统计到那些没有添加统计代码的地方,比如后台操作页面。
网站日志对于网站建设的作用相当于监控摄像头对我们的房间,它可以记录下来,这一段时间里面所有的访客到我们家来访问的这个记录。
那我们一个网站每天有很多的用户来访问,同时每天还有很多的搜索引擎的蜘蛛来抓取日志,网站日志就能够把所有访客访问的情况,它用什么浏览器,什么操作系统,什么时间点来访问,访问了哪些页面?日志能够把这些数据全部记录下来。
同时呢搜索引擎的蜘蛛过来抓取,它是百度的搜索引擎的蜘蛛,还是google的还是360的?他们过来抓取,分别是什么时间点抓取的哪些页面,抓取的时候返回值是什么?是正常打开还是打不开,所有这些数据都能够记录到一个叫做日志的一个文件里。
网站日志怎么去分析
1.网站日志下载及数据解读
分析网站日志,我们可以了解搜索引擎蜘蛛来到我们网站访问的时候,它获取到的信息是什么?网站跟搜索引擎之间它是什么样的一个对话,那网站日志怎么进行分析,从哪里下载到这个数据?
通过FTP访问网站的根目录。可以看到一个包含log的文件夹,这是存放日志的地方。
2、如何查看网站日志
下载、解压、打开日志文件,日志文件内容如:
61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)" (注:百度,这部分为本文添加)
203.208.60.43 - - [11/Jan/2009:04:02:43 +0800] "GET /sns/space-13563-do-friend-view-me.html HTTP/1.1" 200 5162 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" (注:Google)
202.160.178.21 - - [11/Jan/2009:04:02:44 +0800] "GET /sns/space.php?uid=323 HTTP/1.0" 200 7535 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)" (注:雅虎)
65.55.220.217 - - [11/Jan/2009:04:02:57 +0800] "GET /ucenter/avatar.php?uid=12373&size=small&type=virtual HTTP/1.1" 301 - "-" "msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)" (注:MSN)
65.55.109.46 - - [11/Jan/2009:04:02:57 +0800] "GET /sns/source/script_menu.js HTTP/1.0" 200 7219 "http:/sns/space-5755-do-blog-view-me.html" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)
大概就是上面这样密密麻麻的代码,但是这些代码怎么理解呢。比较好理解,我们看一下这一串日志的内容。前面这个ip代表今天来访问我们的网站,它是什么ip?是用户呢还是搜索引擎蜘蛛它都有一个ip,就是把他的ip记录下来。后面这个是一个时间点,什么时间来访问我们的网站?然后呢get就是抓取,抓取的哪一个文件呢?抓取了这个文件。
就是我们的域名下面的www.xxx.com/BBS什么什么,把这个文件抓取回去。抓取回去之后呢200,这是http状态码,它代表抓取成功,然后后面这个数字代表抓取了多少个字节?那200,然后这个8000多就是代表成功抓取了8000多个字节,也就是我们一个网页的大概的大小。那后面这一段就是代表蜘蛛,Baidu Spider就代表百度的蜘蛛,那这一句就代表这个内容是百度蜘蛛过来抓取,成功抓取了这么多个字节。
好,那我们再看这个上面就可以看出这个是谁的蜘蛛,yahuspider这是雅虎的它是这个时间点。然后这上面是谁的呢?google的,对吧?最下面看一下,里面没有看到这是哪一个具体的搜索引擎。那它是谁?你看这个有MSIE6.0。这就说明微软的ie6.0,这是一个用户在来抓取和访问的一个页面。
所以日志它就这样的一个文件,把每天每时每刻用户和蜘蛛来抓取我们网站的所有的情况,把它记录下来。
绝大多数收费主机都提供原始访问日志,网站服务器会把每一个访客来访时的一些信息自动记录下来,保存在原始访问日志文件中,如果你的主机不提供日志功能,建议你到期后还是换主机吧。日志中记录了网站上所有资源的访问信息,包括图片、CSS、JS、FLASH、HTML、MP3等所有网页打开过程载入的资源,同时记录了这些资源都被谁访问了、用什么来访问以及访问的结果是什么等等,可以说原始访问日志记录了主机的所有资源使用情况。
相关阅读
网站访问记录日志能方便的帮助我们开发人员准确的定位到问题,能帮助我们进行错误重现,快速的解决问题,节省时间。这里我将项目
相信很多站长都在想破脑袋,期望自己的网站在百度上的排名不断提升。于是不断的进行网站内容的更新和各种外链的建设,现在也在开
在seo逐步普及的大浪潮下,许多所谓的seoer都将她简单归结为内容和外链,其实这个说法并没有错,内容和外链的确是做seo最为重要的两大
收集web日志的目的Web日志挖掘是指采用数据挖掘技术,对站点用户访问Web服务器过程中产生的日志数据进行分析处理,从而发现Web用户的
网站日志分析能为SEOer带来什么?_百度快速排名SEO优化
我们做SEO优化要经常分析网站日志,网站日志的分析和诊断就像给网站看病一样,我们通过网站日志的分析,可以更加清楚的知道网站的健