經常聽(tīng)到站(zhàn)長們問,百度蜘蛛是什(shén)麽?Baiduspider是百度搜索引擎的一(yī)個(gè)自動程序,它的作(zuò)用是訪問互聯網上(shàng)的網頁,建立索引數據庫,使用戶能(néng)在百度搜索引擎中搜索到您網站(zhàn)上(shàng)的網頁。最近百度蜘蛛來(lái)的太頻繁服務(wù)器(qì)抓爆了(le),最近百度蜘蛛都不來(lái)了(le)怎麽辦,還有很多站(zhàn)點想得到百度蜘蛛的IP段,想把IP加入白名單,但(dàn)IP不固定,我們無法對外公布。
那怎麽才能(néng)識别正确的百度蜘蛛呢(ne)?很簡單,隻需兩步,就(jiù)能(néng)教你正确識别百度蜘蛛。
1、查看UA,如(rú)果UA都不對,可以直接判斷非百度搜索的蜘蛛,目前對外公布過的UA是:
移動UA:
Mozilla/5.0(Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko)Version/5.1 Mobile Safari/10600.6.3 (compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)
PC UA:
Mozilla/5.0(compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)
新(xīn)增渲染UA:
移動UA:
Mozilla/5.0(iPhone;CPUiPhoneOS9_1likeMacOSX) AppleWebKit/601.1.46(KHTML,likeGecko) Version/9.0Mobile/13B143Safari/601.1(compatible;Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)
PC UA:
Mozilla/5.0(compatible;Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)
2、反查IP
站(zhàn)長可以通過DNS反查IP的方式判斷某隻spider是否來(lái)自百度搜索引擎。根據平台不同驗證方法不同,如(rú)linux/windows/os三種平台下(xià)的驗證方法分(fēn)别如(rú)下(xià):
1)、在linux平台下(xià),您可以使用hostip命令反解ip來(lái)判斷是否來(lái)自Baiduspider的抓取。Baiduspider的hostname以*.baidu.com或*.baidu.jp的格式命名,非*.baidu.com或*.baidu.jp即為(wèi)冒充。
2)、在windows平台或者IBMOS/2平台下(xià),您可以使用nslookupip命令反解ip來(lái)判斷是否來(lái)自Baiduspider的抓取。打開命令處理(lǐ)器(qì)輸入nslookupxxx.xxx.xxx.xxx(IP地址)就(jiù)能(néng)解析ip,來(lái)判斷是否來(lái)自Baiduspider的抓取,Baiduspider的hostname以*.baidu.com或*.baidu.jp的格式命名,非*.baidu.com或*.baidu.jp即為(wèi)冒充。
3)、在macos平台下(xià),您可以使用dig命令反解ip來(lái)判斷是否來(lái)自Baiduspider的抓取。打開命令處理(lǐ)器(qì)輸入digxxx.xxx.xxx.xxx(IP地址)就(jiù)能(néng)解析ip,來(lái)判斷是否來(lái)自Baiduspider的抓取,Baiduspider的hostname以*.baidu.com或*.baidu.jp的格式命名,非*.baidu.com或*.baidu.jp即為(wèi)冒充。