稳定互联,中美互联,站长交流,虚拟主机,香港主机,美国主机,虚拟空间,免费空间,免费VPS,免费域名

 找回密码
 立即注册
查看: 2648|回复: 0

[运营经验] 如何识别Baiduspider(百度蜘蛛)

[复制链接]
发表于 2014-4-24 14:25:17 | 显示全部楼层 |阅读模式
来源:百度站长平台6 N/ }! u9 S- ~
. ?$ a8 z$ E  w1 i2 N# ]2 k& r" w2 ^
       摘要:误封过Baiduspider,想把所有BaiduspiderIP放入白名单?发现一只名为Baidu的spider行径可疑,该如何判断?
4 T# g" M6 j* y5 B" h9 d; N& p: ^  v8 F) c2 {2 Q
       上周百度站长平台接到某站长求助,表示误封禁了Baiduspider的IP,询问是否有办法获得Baiduspider的所有IP,打算放入白名单加以保护,防止再次误封。在此要告诉各位站长,Baiduspider的IP池是不断变动的,我们无法提供IP全集。4 y" s6 u; W: X& {0 R5 }/ q2 `2 [2 [
: s2 y) l" }  ~1 m( H8 R
       除此之外,之前还有站长发来质疑说Baiduspider光顾过于频繁,已超越服务器承受能力。而百度站长平台追查发现,Baiduspider对该站点的抓取并无异常,那只spider极有可能是个李鬼。; G6 M0 e$ M; d0 N" s4 I

+ ?# F- B* K, U0 q/ z       那么,站长该如何通过IP来判断此spider是不是来自百度搜索引擎的呢?
5 m4 g1 ?8 Z- ^9 h8 o/ @. H! ~& f, g% C% o
       可以通过DNS反查方式来解决这个问题。根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:' d- J/ b4 O  m5 E9 K9 K
. n: d0 |, p4 w# g
105512h4qmnzy55cjjngrg.jpeg.thumb.jpg
1 Z7 S# ~7 n2 V5 \
       1,在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。8 G7 J' _, }, ?
) d7 e/ F, Q0 m5 a$ c
       2,在windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。0 `9 E6 p0 P& l: V" h6 Q2 \
9 H3 b" Z2 l& B; F0 N# Z- G4 X# n
       3,在mac os平台下,您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。
% M' {! B9 Z3 m+ i
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|WdidcNet ( 苏ICP备17005075号-1 )

GMT+8, 2026-5-30 18:11 , Processed in 0.008340 second(s), 11 queries , APCu On.

Powered by Discuz!

© 2010-2023.

快速回复 返回顶部 返回列表