稳定互联,中美互联,站长交流,虚拟主机,香港主机,美国主机,虚拟空间,免费空间,免费VPS,免费域名

 找回密码
 立即注册
查看: 1549|回复: 0

[运营经验] 如何识别Baiduspider(百度蜘蛛)

[复制链接]
发表于 2014-4-24 14:25:17 | 显示全部楼层 |阅读模式
来源:百度站长平台+ t# \+ ?" N( ~( w* o# p

, L, r! A3 w; V8 T' j       摘要:误封过Baiduspider,想把所有BaiduspiderIP放入白名单?发现一只名为Baidu的spider行径可疑,该如何判断?1 G, c; _/ }0 e' l) ?4 e
7 `2 {8 Q8 v; ]% \6 B
       上周百度站长平台接到某站长求助,表示误封禁了Baiduspider的IP,询问是否有办法获得Baiduspider的所有IP,打算放入白名单加以保护,防止再次误封。在此要告诉各位站长,Baiduspider的IP池是不断变动的,我们无法提供IP全集。
& i, V3 D9 u  J" ]; A3 V
) B2 r4 N$ O' A* J2 g       除此之外,之前还有站长发来质疑说Baiduspider光顾过于频繁,已超越服务器承受能力。而百度站长平台追查发现,Baiduspider对该站点的抓取并无异常,那只spider极有可能是个李鬼。  x2 U- C( R$ D
7 z: p& X3 u6 d1 a& o+ R- R
       那么,站长该如何通过IP来判断此spider是不是来自百度搜索引擎的呢?
1 M6 Q3 c' S& ^9 _  P0 J3 |; u6 \- D  V7 k$ v- g
       可以通过DNS反查方式来解决这个问题。根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:5 ~  y6 N2 q  J$ h- S
+ ], X0 P& l1 B# [- O
105512h4qmnzy55cjjngrg.jpeg.thumb.jpg
. h# N# `4 J# H8 `# R$ x
       1,在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。4 Q7 D# \; Y, o# P

/ r4 C7 n9 d7 \7 A       2,在windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。3 z) ^7 r9 d+ z: C
: A. p, y6 k& [) X# A+ n8 }  l% k1 j
       3,在mac os平台下,您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。
1 ^" I; L+ i' b, ]1 X3 c
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|WdidcNet ( 苏ICP备17005075号-1 )

GMT+8, 2023-10-3 03:06 , Processed in 0.030413 second(s), 22 queries .

Powered by Discuz!

© 2010-2023.

快速回复 返回顶部 返回列表