怎么用Python爬取某图网的图片

本篇内容介绍了“怎么用Python爬取某图网的图片”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

创新互联主要为客户提供服务项目涵盖了网页视觉设计、VI标志设计、营销推广、网站程序开发、HTML5响应式重庆网站建设公司、手机网站开发、微商城、网站托管及网站维护、WEB系统开发、域名注册、国内外服务器租用、视频、平面设计、SEO优化排名。设计、前端、后端三个建站步骤的完善服务体系。一人跟踪测试的建站服务标准。已经为石凉亭行业客户提供了网站推广服务。

相信很多设计小伙伴有好的灵感，但是没有好的设计素材,今天它来了。摄图网4000张设计素材，取之不尽，如下图所示：

怎么用Python爬取某图网的图片

好了，废话不多说，开始用Python采集。

01需求分析

采集摄图网的素材图片，目标网址-->请求数据-->解析数据-->提取数据-->保存数据。

02技术栈

首先我们用到的技术包括：urllib，requests，bs4等。

03采集流程

1、分析网页结构

打开网址:https://699pic.com/paihang/tupian.html,分析网页结构,我们可以看到首页图片数据杂论,这里我们爬取的是"今日热门"的图片,点击发现更多:来到目标页面,拖动滚轮滑到底部,发现有40个分页,也就是我们今天要爬取的4000张设计图片：

怎么用Python爬取某图网的图片

2、发起请求

接着对列表中的每一条url进行遍历,然后发起请求：

for url in urllist:     resp = requests.get(url,headers=hd)     html = resp.content.decode('utf-8')

3、数据解析

得到了一个html对象,爬取页面数据信息后,需要对页面进行解析,这里我使用到的解析库是bs4(偏爱),当然xpath也是可以的。通过分析页面元素,我们发现每个翻页里面的图片都有这样的规律：

怎么用Python爬取某图网的图片

因此可以通过bs4的select方法抓取所有class='lazy'的img标签,得到一个列表,然后通过测试发现图片的链接存放在img标签的data-original属性里,通过img.attrs['data-original']得到,再与'https:'进行字符串拼接,得到完整图片链接。

for img in imgs:            img_url = img.attrs['data-original']            total_url = base_http_str + img_url            print(total_url)            # print('--'*60)            imgurllist.append(total_url)

4.提取保存数据

最后运用urllib中的urlretrive方法,把图片保存到本地。

def writeData(imgurllist):     for index,url in enumerate(imgurllist):         urllib.request.urlretrieve(url,'image/'+ '%s.png'%index)         print('第%s张图片下载完成'%index)

04运行爬虫

运行爬虫代码，效果如下：

怎么用Python爬取某图网的图片

图片就下载完成了，不过运用传统方法有点慢，下次试试多线程，提升爬虫效率。

“怎么用Python爬取某图网的图片”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注创新互联网站，小编将为大家输出更多高质量的实用文章！

新闻名称：怎么用Python爬取某图网的图片
URL分享：http://chengdu.cdxwcx.cn/article/iidoee.html

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

首页

网站建设

网站制作案例

解决方案

网站设计报价

网站制作动态

关于我们

联系我们

成都网站建设设计将想法与焦点和您一起共享

怎么用Python爬取某图网的图片

01需求分析

02技术栈

03采集流程

1、分析网页结构

2、发起请求

3、数据解析

4.提取保存数据

04运行爬虫

其他资讯

怎样注册阿里海外版？(阿里云国际版如何注册)

html文件如何查看效果

海外网站平台

带宽

wifi什么意思

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

成都网站建设设计 将想法与焦点和您一起共享

怎么用Python爬取某图网的图片

01需求分析

02技术栈

03采集流程

1、分析网页结构

2、发起请求

3、数据解析

4.提取保存数据

04运行爬虫

其他资讯

怎样注册阿里海外版？(阿里云国际版如何注册)

html文件如何查看效果

海外网站平台

带宽

wifi什么意思

成都网站建设设计将想法与焦点和您一起共享