稳定互联,中美互联,站长交流,虚拟主机,香港主机,美国主机,虚拟空间,免费空间,免费VPS,免费域名

 找回密码
 立即注册
查看: 1721|回复: 0

[运营经验] 如何识别Baiduspider(百度蜘蛛)

[复制链接]
发表于 2014-4-24 14:25:17 | 显示全部楼层 |阅读模式
来源:百度站长平台8 Q& }$ G! w. a0 }' F

/ Y$ j$ ]/ v+ }1 C( u       摘要:误封过Baiduspider,想把所有BaiduspiderIP放入白名单?发现一只名为Baidu的spider行径可疑,该如何判断?
. U" u. ?; F6 t" c7 u; [* S& \: X1 q7 P3 `  {5 ]9 X+ W7 S
       上周百度站长平台接到某站长求助,表示误封禁了Baiduspider的IP,询问是否有办法获得Baiduspider的所有IP,打算放入白名单加以保护,防止再次误封。在此要告诉各位站长,Baiduspider的IP池是不断变动的,我们无法提供IP全集。
. d) `5 A' }$ t. O5 L4 Y6 u0 r7 K5 s2 E) p
       除此之外,之前还有站长发来质疑说Baiduspider光顾过于频繁,已超越服务器承受能力。而百度站长平台追查发现,Baiduspider对该站点的抓取并无异常,那只spider极有可能是个李鬼。
" \* r1 {! \3 ?4 S6 E
: X. @- r( Z: a: c( ]       那么,站长该如何通过IP来判断此spider是不是来自百度搜索引擎的呢?
# X; x. m& n3 H0 a) H: ~0 A
4 X# K: t. G; C( Q2 s/ u, T, J       可以通过DNS反查方式来解决这个问题。根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:
5 p; C1 h% t% w% m/ q8 ^# N# n0 \) }
105512h4qmnzy55cjjngrg.jpeg.thumb.jpg

7 z. F: R: g- B' x! l3 a       1,在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。( B9 A$ r& x- P. y+ s
6 p8 Q1 k$ N$ y, H$ U' M
       2,在windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。. W4 z- J, s% ]9 w7 J5 u
8 m6 S) Y1 h7 D9 x! K! N( P' i
       3,在mac os平台下,您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。
3 N* d4 z5 G( y0 Y# N. O
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|WdidcNet ( 苏ICP备17005075号-1 )

GMT+8, 2024-4-24 02:59 , Processed in 0.032372 second(s), 22 queries .

Powered by Discuz!

© 2010-2023.

快速回复 返回顶部 返回列表