通过网站日志如何辨别蜘蛛的真假

来源：华软创信 ‌| ‌类型：青岛做网站/网站建设 | ‌时间：2013-08-24

很多站长朋友平时都比较喜欢查看网站日志，查看网站是否被搜索引擎蜘蛛抓取，是否受到攻击等等。不过现在很多人通过有些站长工具或者采集程序，冒充搜索引擎蜘蛛来爬行我们的网站，那么我们怎么判断爬行我们网站的是不是真正的搜索引擎蜘蛛呢。今天笔者就跟大家分享一下通过网站日志如何辨别蜘蛛的真假。

目前互联网上有少量spider冒充Baiduspider抓取网页，Baiduspider ip的hostname以 *.baidu.com的格式命名，非 *.baidu.com即为冒充，那么如何查询确定抓却来源ip属于百度？使用DNS反查方式即可，具体操作如下：

1、辨别百度蜘蛛

复制蜘蛛的IP，点击“开始”—“运行”—“CMD”—在光标闪的地方输入“nslookup”—回车键（如下图）

输入蜘蛛的IP再按回车（如下图）

返“Name：baiduspider-***-***-***-***.crawl.baidu.com”有这一行说明是百度的蜘蛛IP。否则为假蜘蛛。

百度电信：220.181.108.*等

百度联通123.125.71.*、123.125.67.*等

假蜘蛛：125.90.88.96(站长工具的假蜘蛛)

2、辨别谷歌蜘蛛

点击Windows系统里的“开始” – “运行”，输入tracert 203.208.60.179，点击确定。

运行结果显示：crawl-203-208-60-179.googlebot.com

但我发现现在的采集越来越高明，也会伪造反向DNS来指向***.googlebot.com。这时候，我们需要验证运行结果的反向DNS得出的IP地址。

点击Windows系统里的“开始”–“运行”，输入tracert crawl-203-208-60-179.googlebot.com，点击确定。

运行结果得出的IP地址与原本检测IP对应即可。

以上就是笔者总结出通过通过网站日志如何辨别蜘蛛的真假的方法，希望对大家有所帮助，如果大家有更好的方法也欢迎交流和探讨。

免责声明：本站所有资讯内容搜集整理于互联网或者网友提供，并不代表本网赞同其观点，仅供学习与交流使用，如果不小心侵犯到你的权益，如果你对文章内容、图片和版权等问题存在异议，请及时联系我们删除该信息。