python爬虫如何爬取抖音热门音乐

这篇文章主要为大家展示了“python爬虫如何爬取抖音热门音乐”，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下“python爬虫如何爬取抖音热门音乐”这篇文章吧。

创新互联成立十多年来，这条路我们正越走越好，积累了技术与客户资源，形成了良好的口碑。为客户提供成都做网站、成都网站建设、网站策划、网页设计、国际域名空间、网络营销、VI设计、网站改版、漏洞修补等服务。网站是否美观、功能强大、用户体验好、性价比高、打开快等等，这些对于网站建设都非常重要，创新互联通过对建站技术性的掌握、对创意设计的研究为客户提供一站式互联网解决方案，携手广大客户，共同发展进步。

爬取抖音的热门音乐

这个就相对来说简单一点，这是代码运行的结果

python爬虫如何爬取抖音热门音乐

获取音乐的网址https://kuaiyinshi.com/hot/music/?source=dou-yin&page=1

打开该网页F12,F5刷新

python爬虫如何爬取抖音热门音乐

做义工只需要以上的数据

根据beautifulsoup去获取,直接上代码

headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'
}
# 保存路径
save_path = "G:\\Music\\douyin\\"
url = "https://kuaiyinshi.com/hot/music/?source=dou-yin&page=1"
# 获取响应
res = requests.get(url, headers=headers)
# 使用beautifulsoup解析
soup = BeautifulSoup(res.text, 'lxml')
# 选择标签获取最大页数
max_page = soup.select('li.page-item > a')[-2].text
# 循环请求
for page in range(int(max_page)):
   page_url = "https://kuaiyinshi.com/hot/music/?source=dou-yin&page={}".format(page + 1)
   page_res = requests.get(page_url, headers=headers)
   soup = BeautifulSoup(page_res.text, 'lxml')
   lis = soup.select('li.rankbox-item')
   singers = soup.select('div.meta')
   music_names = soup.select('h3.tit > a')
   for i in range(len(lis)):
       music_url = "http:" + lis[i].get('data-audio')
       print("歌名:" + music_names[i].text, singers[i].text, "链接:" + music_url)
       try:
           download_file(music_url,
               save_path + music_names[i].text + ' - ' + singers[i].text.replace('/', ' ') + ".mp3")
       except:
           pass
   print("第{}页完成~~~".format(page + 1))
   time.sleep(1)

将获取到的文件的url传递到下载函数中


def download_file(src, file_path):

   #   响应体工作流
   r = requests.get(src, stream=True)
   # 打开文件
   f = open(file_path, "wb")
   # for chunk in r.iter_content(chunk_size=512):
   #     if chunk:
   #         f.write(chunk)
   for data in tqdm(r.iter_content(chunk_size=512)):
       #tqdm进度条的使用,for data in tqdm(iterable)
       f.write(data)
   return file_path

接下来就是关于响应体工作流的说明

python爬虫如何爬取抖音热门音乐

默认情况下，当你进行网络请求后，响应体会立即被下载。你可以通过 stream 参数覆盖这个行为，推迟下载响应体直到访问 Response.content 属性：

tarball_url = 'https://github.com/kennethreitz/requests/tarball/master' r = requests.get(tarball_url, stream=True)

此时仅有响应头被下载下来了，连接保持打开状态，因此允许我们根据条件获取内容：

if int(r.headers['content-length']) < TOO_LONG: content = r.content ...

你可以进一步使用 Response.iter_content 和 Response.iter_lines 方法来控制工作流，或者以 Response.raw 从底层 urllib3 的 urllib3.HTTPResponse 读取。

如果你在请求中把 stream 设为 True，Requests 无法将连接释放回连接池，除非你消耗了所有的数据，或者调用了 Response.close。这样会带来连接效率低下的问题。如果你发现你在使用stream=True 的同时还在部分读取请求的 body（或者完全没有读取 body），那么你就应该考虑使用 contextlib.closing (文档)，如下所示：

from contextlib import closing with closing(requests.get('http://httpbin.org/get', stream=True)) as r: # 在此处理响应。

以上是“python爬虫如何爬取抖音热门音乐”这篇文章的所有内容，感谢各位的阅读！相信大家都有了一定的了解，希望分享的内容对大家有所帮助，如果还想学习更多知识，欢迎关注创新互联行业资讯频道！

            
            
                                

                    文章名称：python爬虫如何爬取抖音热门音乐                    

                    URL网址：http://chengdu.cdxwcx.cn/article/igiehi.html


        
        
        
            其他资讯
            
                
                    
                            
                                乌海抖音代运营介绍
                            
                        

                            
                                在成都网站建设的价格差异大的原因！
                            
                        

                            
                                百创信息抖音代运营怎么样做
                            
                        

                            
                                为什么要选择抖音代运营
                            
                        

                            
                                抖音账号直播带货怎么做,抖音账号直播带货培训广告怎么做？

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

首页

网站建设

网站制作案例

解决方案

网站设计报价

网站制作动态

关于我们

联系我们

成都网站建设设计将想法与焦点和您一起共享

python爬虫如何爬取抖音热门音乐

其他资讯

乌海抖音代运营介绍

在成都网站建设的价格差异大的原因！

百创信息抖音代运营怎么样做

为什么要选择抖音代运营

抖音账号直播带货怎么做,抖音账号直播带货培训广告怎么做？

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

成都网站建设设计 将想法与焦点和您一起共享

python爬虫如何爬取抖音热门音乐

其他资讯

乌海抖音代运营介绍

在成都网站建设的价格差异大的原因！

百创信息抖音代运营怎么样做

为什么要选择抖音代运营

抖音账号直播带货怎么做,抖音账号直播带货培训广告怎么做？

成都网站建设设计将想法与焦点和您一起共享