怎么在python中使用scrapy框架处理多页数据

怎么在python中使用scrapy框架处理多页数据？相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。

创新互联2013年至今，是专业互联网技术服务公司，拥有项目成都网站建设、做网站网站策划，项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命，1280元雨山做网站,已为上家服务,为雨山各地企业和个人服务,联系电话:18982081108

python的五大特点是什么

python的五大特点：1.简单易学，开发程序时，专注的是解决问题,而不是搞明白语言本身。2.面向对象，与其他主要的语言如C++和Java相比, Python以一种非常强大又简单的方式实现面向对象编程。3.可移植性，Python程序无需修改就可以在各种平台上运行。4.解释性，Python语言写的程序不需要编译成二进制代码,可以直接从源代码运行程序。5.开源，Python是 FLOSS(自由/开放源码软件)之一。

方法一：将每一页对应的url存放到爬虫文件的start_urls

问题：如果页数较多时，列表就会变得很大。

方法二：使用Request方法手动发起请求（推荐使用）

案例：爬取古诗文网每一页的古诗的标题

1、爬取所有页码数据

import scrapy

class GushiSpider(scrapy.Spider):
    name = 'gushi'
    start_urls = ['https://www.gushiwen.org/']

    pageNum = 2 #pageNum为2，第一页已经爬取过了 
    url = 'https://www.gushiwen.cn/default_%d.aspx' #每页的url是类似的
    
    def parse(self, response):
        div_list = response.xpath('//div[@class="sons"]/div[1]/p[1]')
        print(str(len(div_list))+"首古诗")
        for div in div_list:
            title = div.xpath('./a/b/text()').extract()
            print(title)
        print("------------------------")

        # 爬取所有页码数据    
        if self.pageNum <= 10: #一共爬取10页（共10页）
            self.pageNum += 1
            url = format(self.url % self.pageNum)   # 每一页的url和pageNum有关

2、使用Request方法向页面手动发起请求

         # 手动发起请求: scrapy.Request(url,callback,meta)
            ## url是需要发起请求的url,
            ## callback参数的值是回调函数，即发起请求后需要调用哪一个方法
            ## meta参数的值是一个 字典，表示的是向回调函数传递什么样的参数

3、向上面格式化的url发起请求，callback递归调用parse()方法，将得到的数据继续进行解析

 yield scrapy.Request(url=url,callback=self.parse)

看完上述内容，你们掌握怎么在python中使用scrapy框架处理多页数据的方法了吗？如果还想学到更多技能或想了解更多相关内容，欢迎关注创新互联行业资讯频道，感谢各位的阅读！

网站栏目：怎么在python中使用scrapy框架处理多页数据
网页URL：http://chengdu.cdxwcx.cn/article/ppiojp.html

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

首页

网站建设

网站制作案例

解决方案

网站设计报价

网站制作动态

关于我们

联系我们

成都网站建设设计将想法与焦点和您一起共享

怎么在python中使用scrapy框架处理多页数据

python的五大特点是什么

其他资讯

成都网站建设需不需要考虑上线广告，会不会体验很差

电脑重装系统多少钱(一键重装系统)

肉如何快速(怎样让肉变嫩)

如何正确使用无创呼吸机

刘备一生错过的5位顶尖人才他们有着什么样的故事

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

成都网站建设设计 将想法与焦点和您一起共享

怎么在python中使用scrapy框架处理多页数据

python的五大特点是什么

其他资讯

成都网站建设需不需要考虑上线广告，会不会体验很差

电脑重装系统多少钱(一键重装系统)

肉如何快速(怎样让肉变嫩)

如何正确使用无创呼吸机

刘备一生错过的5位顶尖人才他们有着什么样的故事

成都网站建设设计将想法与焦点和您一起共享