青岛做网站
        行业新闻
行业新闻
当前位置:首页> 新闻动态 > 行业新闻

通过网站日志如何辨别蜘蛛的真假

来源:华软创信  ‌|  ‌类型:青岛做网站/网站建设  |  ‌时间:2013-08-24
  很多站长朋友平时都比较喜欢查看网站日志,查看网站是否被搜索引擎蜘蛛抓取,是否受到攻击等等。不过现在很多人通过有些站长工具或者采集程序,冒充搜索引擎蜘蛛来爬行我们的网站,那么我们怎么判断爬行我们网站的是不是真正的搜索引擎蜘蛛呢。今天笔者就跟大家分享一下通过网站日志如何辨别蜘蛛的真假。

  目前互联网上有少量spider冒充Baiduspider抓取网页,Baiduspider iphostname *.baidu.com的格式命名,非 *.baidu.com即为冒充,那么如何查询确定抓却来源ip属于百度?使用DNS反查方式即可,具体操作如下:

1、辨别百度蜘蛛

复制蜘蛛的IP,点击“开始”—“运行”—“CMD”—在光标闪的地方输入“nslookup”—回车键(如下图)

输入蜘蛛的IP再按回车(如下图)

返“Namebaiduspider-***-***-***-***.crawl.baidu.com”有这一行说明是百度的蜘蛛IP。否则为假蜘蛛。

百度电信:220.181.108.*

百度联通123.125.71.*123.125.67.*

假蜘蛛:125.90.88.96(站长工具的假蜘蛛)

2、辨别谷歌蜘蛛

点击Windows系统里的“开始” “运行”,输入tracert 203.208.60.179,点击确定。

运行结果显示:crawl-203-208-60-179.googlebot.com

但我发现现在的采集越来越高明,也会伪造反向DNS来指向***.googlebot.com。这时候,我们需要验证运行结果的反向DNS得出的IP地址。

点击Windows系统里的“开始”–“运行”,输入tracert crawl-203-208-60-179.googlebot.com,点击确定。

运行结果得出的IP地址与原本检测IP对应即可。

  以上就是笔者总结出通过通过网站日志如何辨别蜘蛛的真假的方法,希望对大家有所帮助,如果大家有更好的方法也欢迎交流和探讨。

 

 

免责声明:本站所有资讯内容搜集整理于互联网或者网友提供,并不代表本网赞同其观点,仅供学习与交流使用,如果不小心侵犯到你的权益,如果你对文章内容、图片和版权等问题存在异议,请及时联系我们删除该信息。