如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕

本篇文章为大家展示了如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕，内容简明扼要并且容易理解，绝对能使你眼前一亮，通过这篇文章的详细介绍希望你能有所收获。

创新互联建站专业为企业提供临夏州网站建设、临夏州做网站、临夏州网站设计、临夏州网站制作等企业网站建设、网页设计与制作、临夏州企业网站模板建站服务，十多年临夏州做网站经验，不只是建网站，更提供有价值的思路和整体网络服务。

前言

耗子喂汁是什么意思什么梗呢？可能很多人不知道，这个梗是出自马保国，经常上网的人可能听说过这个名字，而他所说的一些话也被当成了一些梗，比如年轻人不讲武德，闪电五连鞭等等

B站马保国的一段视频中他右眼红肿金句频出，部分经典句式甚至被网友们总结归纳成了“保国体”，变成了口头禅，比如“年轻人不讲武德，欺侮我六十九岁的老同志”“耗子尾汁”（好自为之）等

那么让我们来看看网友们大都发了啥弹幕

项目目标

爬取B站弹幕，词云图

第一个视频播放量快2000W了，弹幕也有4.8W

如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕

每天一遍，快乐源泉，嘿嘿嘿

环境

Python3.6

pycharm

爬虫代码

导入工具

import requests
import parsel
import csv
import time

先按F12，找到弹幕的数据在哪

从列表页中获取详情页的URL地址等数据

如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕

for page in range(20,32):
    time.sleep(1)
    print('=================正在下载11月{}日弹幕===================================='.format(page))
    url = 'https://api.bilibili.com/x/v2/dm/history?type=1&oid=140610898&date=2020-11-{}'.format(page)
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36',
        "cookie": "__uuid=1896D3F7-4A98-54EB-F7FA-3301CE9EF5F307776infoc; buvid3=B68B2187-4C3E-4466-A896-FBF9B292099B190963infoc; LIVE_BUVID=AUTO4115757254257055; stardustvideo=1; rpdid=|(umu|ulY)JJ0J'ul~l~klRJ); sid=8cq4r229; im_notify_type_65901796=0; laboratory=1-1; DedeUserID=523606542; DedeUserID__ckMd5=909861ec223d26d8; blackside_state=1; CURRENT_FNVAL=80; SESSDATA=a976c0b4%2C1618637313%2C4d792*a1; bili_jct=7f54729ec20660f750661122b80746d2; PVID=1; bp_video_offset_523606542=458111639975213216; CURRENT_QUALITY=16; bfe_id=1e33d9ad1cb29251013800c68af42315"
    }
    response = requests.get(url=url, headers=headers)
    response.encoding = response.apparent_encoding
    selector = parsel.Selector(response.text)
    data = selector.css('d::text').getall()
    for i in data:
        print(i)
        with open('B站弹幕.csv', mode='a', newline='', encoding='utf-8-sig') as f:
            writer = csv.writer(f)
            links = []
            links.append(i)
            writer.writerow(links)

如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕

词云代码

import jieba
import wordcloud
import imageio

# 读取文件内容
f = open('csv文件地址', encoding='utf-8')
txt = f.read()
# print(txt)
# jiabe 分词 分割词汇
txt_list = jieba.lcut(txt)
string = ' '.join(txt_list)
# 词云图设置
wc = wordcloud.WordCloud(
        width=800,         # 图片的宽
        height=500,         # 图片的高
        background_color='white',   # 图片背景颜色
        font_path='msyh.ttc',    # 词云字体
        # mask=py,     # 所使用的词云图片
        scale=15,
)
# 给词云输入文字
wc.generate(string)
# 词云图保存图片地址
wc.to_file('\\1.png')

上述内容就是如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕，你们学到知识或技能了吗？如果还想学到更多技能或者丰富自己的知识储备，欢迎关注创新互联行业资讯频道。

文章名称：如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕
本文网址：http://chengdu.cdxwcx.cn/article/jeejgh.html

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

首页

网站建设

网站制作案例

解决方案

网站设计报价

网站制作动态

关于我们

联系我们

成都网站建设设计将想法与焦点和您一起共享

如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕

前言

项目目标

环境

爬虫代码

词云代码

其他资讯

Android自定义Drawable实现圆角效果

tensorboard显示空白的解决方法

MySQL中Join的执行过程有哪些

springBoot 创建定时任务过程详解

解决anaconda安装包失败的问题

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

成都网站建设设计 将想法与焦点和您一起共享

如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕

前言

项目目标

环境

爬虫代码

词云代码

其他资讯

Android自定义Drawable实现圆角效果

tensorboard显示空白的解决方法

MySQL中Join的执行过程有哪些

springBoot 创建定时任务过程详解

解决anaconda安装包失败的问题

成都网站建设设计将想法与焦点和您一起共享