稳定互联,中美互联,站长交流,虚拟主机,香港主机,美国主机,虚拟空间,免费空间,免费VPS,免费域名

 找回密码
 立即注册
查看: 1940|回复: 0

[运营经验] 如何识别Baiduspider(百度蜘蛛)

[复制链接]
发表于 2014-4-24 14:25:17 | 显示全部楼层 |阅读模式
来源:百度站长平台
, X" W, l& G5 X. @& {. E6 }0 {% V0 Y3 e3 H# v) u8 b# @
       摘要:误封过Baiduspider,想把所有BaiduspiderIP放入白名单?发现一只名为Baidu的spider行径可疑,该如何判断?
# g9 s8 W' [0 x: ]7 F) j8 E# y9 |( y9 g) l5 \1 N. F4 D4 L% ?
       上周百度站长平台接到某站长求助,表示误封禁了Baiduspider的IP,询问是否有办法获得Baiduspider的所有IP,打算放入白名单加以保护,防止再次误封。在此要告诉各位站长,Baiduspider的IP池是不断变动的,我们无法提供IP全集。
- h- D& g! W7 `0 K. O
4 M* u7 P/ C2 l5 s0 ~5 c$ @- p; x       除此之外,之前还有站长发来质疑说Baiduspider光顾过于频繁,已超越服务器承受能力。而百度站长平台追查发现,Baiduspider对该站点的抓取并无异常,那只spider极有可能是个李鬼。
* L' l/ Q4 s; Y2 b7 [8 |0 ~
  F, p4 v6 ^- Z  }' n" M) X       那么,站长该如何通过IP来判断此spider是不是来自百度搜索引擎的呢?
- n' H0 ]$ K  o
! l' Z0 H. P1 p, U$ h. u8 `2 ?# n       可以通过DNS反查方式来解决这个问题。根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:
4 X/ C4 m% A1 f! Q0 m, L/ P7 _& H# w% k5 c' d& z
105512h4qmnzy55cjjngrg.jpeg.thumb.jpg

9 N) k* I3 L$ j4 a3 y. Y  U8 l       1,在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。! i2 I0 E% n) R8 }1 V9 J3 d* ]; A
# n. M8 _; N) c8 n
       2,在windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。
) Q$ L* o! e- p+ m: ]) [( h, z3 d/ T; k& r
       3,在mac os平台下,您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。. T3 g. r0 h" _2 A( u/ T" |
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|WdidcNet ( 苏ICP备17005075号-1 )

GMT+8, 2024-11-23 16:02 , Processed in 0.014447 second(s), 11 queries , APCu On.

Powered by Discuz!

© 2010-2023.

快速回复 返回顶部 返回列表