稳定互联,中美互联,站长交流,虚拟主机,香港主机,美国主机,虚拟空间,免费空间,免费VPS,免费域名

 找回密码
 立即注册
查看: 1804|回复: 0

[运营经验] 如何识别Baiduspider(百度蜘蛛)

[复制链接]
发表于 2014-4-24 14:25:17 | 显示全部楼层 |阅读模式
来源:百度站长平台
# y) h  W$ U0 m; W9 |% q
' l7 J5 T# D, t5 S% D       摘要:误封过Baiduspider,想把所有BaiduspiderIP放入白名单?发现一只名为Baidu的spider行径可疑,该如何判断?
) p) m4 _" n- @$ L. W+ Q
; w& d. Z! [4 S( a       上周百度站长平台接到某站长求助,表示误封禁了Baiduspider的IP,询问是否有办法获得Baiduspider的所有IP,打算放入白名单加以保护,防止再次误封。在此要告诉各位站长,Baiduspider的IP池是不断变动的,我们无法提供IP全集。
# F; a+ g0 s; Z/ V/ ^% O) n
% q6 D) n; j3 h: o& ?7 t       除此之外,之前还有站长发来质疑说Baiduspider光顾过于频繁,已超越服务器承受能力。而百度站长平台追查发现,Baiduspider对该站点的抓取并无异常,那只spider极有可能是个李鬼。8 m/ q2 V5 N# u8 q( I0 e, h
7 t: A% N7 [1 p  z
       那么,站长该如何通过IP来判断此spider是不是来自百度搜索引擎的呢?& A  C" a1 x# T& u; m, r6 @/ ?
0 |. E6 o) O1 _" j
       可以通过DNS反查方式来解决这个问题。根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:7 B% ?% V; Z; A' K$ S

* j8 L. u/ ^; Z
105512h4qmnzy55cjjngrg.jpeg.thumb.jpg
3 |4 g% q9 i" C1 c4 ?8 v
       1,在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。' m$ u9 K3 G1 K# a+ o: K9 j
9 E% m0 \; Y, W) G" b8 w. S
       2,在windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。8 r' h6 w7 X" Z5 t/ y

0 N2 a2 y: ]7 b$ v, h6 {       3,在mac os平台下,您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。# O* u+ ^" y4 m8 m7 G' v+ b: c8 k) s
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|WdidcNet ( 苏ICP备17005075号-1 )

GMT+8, 2024-7-18 01:35 , Processed in 0.038744 second(s), 22 queries .

Powered by Discuz!

© 2010-2023.

快速回复 返回顶部 返回列表