Python与爬虫的详细区分
xjj
2021-05-10
爬虫也可以称为Python爬虫,不知从何时起,Python这门语言和爬虫就像一对恋人,二者如胶似漆 ,形影不离,你中有我、我中有你,一提起爬虫,就会想到Python,一说起Python,就会想到人工智能和爬虫,了解一下爬虫和爬虫ip代理的相关知识对网络工作者能有不少的好处。
一般说爬虫的时候,大部分程序员潜意识里都会联想为Python爬虫,为什么会这样,我觉得有两个原因:
Python生态极其丰富,诸如Request、Beautiful Soup、Scrapy、PySpider等第三方库实在强大。
Python语法简洁易上手,分分钟就能写出一个爬虫。
那什么是爬虫?
爬虫是一个程序,这个程序的目的就是为了抓取万维网信息资源,比如你日常使用的谷歌等搜索引擎,搜索结果就全都依赖爬虫来定时获取,从网上搜索结果来看,爬虫有关的搜索结果全都带上了Python,这就是原因。
爬虫的目标对象也很丰富,不论是文字、图片、视频,任何结构化非结构化的数据爬虫都可以爬取,爬虫经过发展,也衍生出了各种爬虫类型:
1、通用网络爬虫:爬取对象从一些种子 URL 扩充到整个 Web,搜索引擎干的就是这些事。
2、垂直网络爬虫:针对特定领域主题进行爬取,比如专门爬取小说目录以及章节的垂直爬虫。
3、增量网络爬虫:对已经抓取的网页进行实时更新。
4、深层网络爬虫:爬取一些需要用户提交关键词才能获得的 Web 页面。
爬虫的目标对象也很丰富,不论是文字、图片、视频,任何结构化非结构化的数据爬虫都可以爬取,爬虫经过发展,也衍生出了各种爬虫类型:
1、通用网络爬虫:爬取对象从一些种子 URL 扩充到整个 Web,搜索引擎干的就是这些事。
2、垂直网络爬虫:针对特定领域主题进行爬取,比如专门爬取小说目录以及章节的垂直爬虫。
3、增量网络爬虫:对已经抓取的网页进行实时更新。
4、深层网络爬虫:爬取一些需要用户提交关键词才能获得的 Web 页面。
上一篇:怎样简单换ip?
下一篇:ip代理伪装上网ip的基本原理