第一:为什么我们要分析IIS日志。
1:通过日志我们可以发现空间存在的一些故障,这些故障可能是一些站长工具无法察觉到的。就比如近阶段很火的美橙空间因为技术员误操作导致空间屏蔽了百度了蜘蛛事件,假如站长们事先分析一下分析一下空间日志,或许可以发现这一错误。
2:网站的内容更新与蜘蛛爬行存在一定的关系,一般只要我们更新稳定频繁,蜘蛛的就会爬行得更加的勤。对此我们可以借助日志中的蜘蛛来访频率对网站内容的更新频率做一个细调。
3:借由该日记记录我们可以更加清楚的分析搜索引擎蜘蛛在网站上的爬行信息,这些信息包含有蜘蛛的爬行路线以及爬行深度。通过这一些数据信息,我们可以分析近期我们建设的外链效果如何。因为我们知道外链就像是引导蜘蛛爬行的蜘蛛丝,如果外链建设的好的话,蜘蛛爬行的自然而然频繁,而且我们可以记录下从哪一个“入口”进入蜘蛛的频率高。
第二:如何去分析IIS日志。
我们拿着IIS日志后可以用IIS日志分析工具去大概的去查一查IIS日志。一般工具都能查出有各种蜘蛛来到网站的总数,以及有没有失败,不会把各种的信息都给你。并不是工具分析没有出现失败的我们就不用一条一条看了,工具分析只是简单的告诉你有没有失败,没有失败当然是皆大欢喜了,但是来是一条一条的去分析。我们拿出这样子的一条信息来分析一下
首先是时间:2010-10-22 05:04:53 机器编号为W3SVC151800 P-0YMR9WW8YX4U9 222.76.213.49是网站的IP GET是触发事件, 80是端口号,61.135.186.49是蜘蛛的IP,Baiduspider是百度的蜘蛛,200 0 0访问成功, 41786 193 6968 是蜘蛛与网站对话的时间与下载的数据以及花了多少时间。连在一起就是2010.10.22的早上5点4分53秒的时候一个编号为W3SVC151800 P-0YMR9WW8YX4U9的蜘蛛通过80端口进入网站成功访问并下载了47186B的数据,花费了193MS。
百度的蜘蛛名字:Baiduspider、google蜘蛛名字:googlebot 、
IIS日志基本上都是这样子的,区别在于上面那个是成功抓取:200 0 0
404(未找到)服务器找不到请求的页面
304 (未修改)自从上次请求后,请求的页面未修改过,服务器返回此响应时,不会返回网页内容
503 (服务不可用)服务器目前无法使用(由于超时或停机维护)
301 永久重定向
302 临时重定向
基本上我们要了解的就是这些FTTP状态码,如果你的网站出现了404,那你就要立刻用robots进行屏蔽,404是死链接,如果出现了404的话搜索引擎会认为你欺骗用户,会对你作出处罚。大面积出现304的话那就要注意了,网站没有更新,一二条关系不大,但是多了就会让搜索引擎认为你网站没有人管理,时间长了就会导致网站快照不更新,关键词的波动;出现了503是你无法解决的,你就要找服务器供应商。如果是连续同一时间出现503的时候我建议你去换一个服务器,因为他在那个时候判断服务器导致蜘蛛进不去,蜘蛛不能进你的网站,搜索就不会了解,就会降低信任度,降权也随之开始了。301是永久重定向,是网站改换了使用的,可以从这里判断你的301做的怎么样,成功了没有。302临时的重定向,当做策划什么活动的时候可以使用,例如现在春节要到了,很多商家都打活动,就可以用302临时重定向过去,春节过后再恢复。
第三:如何存放日志文件以及分析日志应注意的事项
1.要获得该日志文件我们的空间需要有iis日志记录的功能,假如我们的空间有这一功能的话,一般该日志文件会记录在weblog文件夹中,我们可以直接从这一文件夹中下载我们站点的日志文件。
2.在使用这一功能时我们需要注意日志的生成时间设置,笔者的建议是如果站点是一个小型的站点可以让它一天生成一次,假如是比较大的站点我们可以让其每小时更新,以免生成的文件出现过大的情况。
3.观察IIS日志还有一个重要的地方就是观察蜘蛛的平均,以一个星期为一个周期,蜘蛛来的总量是增加的就说明你的网站的权重是不断增加的,如果这个星期的星期平均量是5000次/天,而下个星期是7000次/天那就说明你的权重在增加,如果是下降到3000次/天的话那就是权重在下降,要注意查看网站是哪里出了问题。还有观察什么时候段蜘蛛活动的比较频繁,就在蜘蛛活动的频繁的时候更新是有利于网站权重增加的。