当前位置:网站首页 > 资讯百科 > 百度优化 > 正文

什么是网络爬虫特征?(百度蜘蛛抓取的主要特征)

三石哥三石哥 2022-07-20 17:52:47 286

一、固定标识

不管是谷歌、百度、雅虎等等,他们的蜘蛛在进行网页爬取时都会带上他们的商业标识。比如:

网页搜索 Baiduspider

在线搜索 Baiduspider

图片搜索 Baiduspider-image

视频搜索 Baiduspider-video

新闻搜索 Baiduspider-news

百度搜藏 Baiduspider-favo

百度联盟Baiduspider-cpro

竞价蜘蛛Baiduspider-sfkr

什么是网络爬虫特征?(百度蜘蛛抓取的主要特征)

二、User Agent信息

用户代理(User Agent,简称 UA),是一个特殊字符串头,使得服务器能够识别客户使用的操作系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等。我们可以获取请求头中的UserAgent信息,来判断是否为爬虫行为。

三、IP策略

同样的,网络请求是离不开IP的,也就是说:以百度为例,他们的蜘蛛的IP是有一个相近的区间的。比如:

Mozilla/5.0 (Windows NT 6.1; WOW64; Baidu Transcoder) AppleWebKit/536.11 (KHTML,likeGecko)Chrome/20.0.1132.57 Safari/536.11

61.135.169.75

61.135.169.55

61.135.169.22

220.181.51.40

220.181.51.39

111.13.13.74

111.13.13.73

111.13.13.72

111.13.13.71

111.13.13.6

111.13.13.5

111.13.13.4

111.13.13.3

101.254.184.206

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3561739510@qq.com 举报,一经查实,本站将立刻删除。

转载请注明来自专注SEO技术,教程,推广 - 8848SEO,本文标题:《什么是网络爬虫特征?(百度蜘蛛抓取的主要特征)》

标签:

关于我

关注微信送SEO教程

搜索
最新文章
热门文章
热门tag
抖音优化提升网站排名百度SEO优化网站优化提高网站排名抖音小店SEO优化SEO优化技巧网站SEO优化网站排名seo优化seo网站优化关键词优化百度SEO排名小红书关键词排名seoSEO优化排名搜索引擎优化
友情链接