Python中bs4基础的示例分析-创新互联

这篇文章给大家分享的是有关Python中bs4基础的示例分析的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。

成都创新互联公司坚持“要么做到，要么别承诺”的工作理念，服务领域包括：成都网站建设、成都做网站、企业官网、英文网站、手机端网站、网站推广等服务，满足客户于互联网时代的枝江网站设计、移动媒体设计的需求，帮助企业找到有效的互联网解决方案。努力成为您成熟可靠的网络建设合作伙伴！

安装

在命令提示符框中直接输入pip install beautifulsoup4

介绍

beautifulsoup是python的一个第三方库，和xpath一样，都是用来解析html数据的。

引入

from bs4 import BeautifulSoup

使用

将一段文档传入BeautifulSoup的构造方法，就能得到一个文档的对象。

bs = BeautifulSoup(open('index.html',encoding='utf-8'),'lxml')
print(bs)

注意：这样上传文档的话，BeautifulSoup里面需要两个参数。一个为open方法，一个是固定写法，也就是解析器。

open方法里面也同样需要两个参数，一个是想要解析的数据，另一个为设置编码的格式。

（1）获取网页中的title标签

print(bs.title)

（2）获取head标签及标签内部的所有其他标签

print(bs.head)

（3）获取当中的第一个a标签

print(bs.a)

注意：获取文档当中所有的xx当中第一个xx或者第一个xx里面的内容。都可以用bs.xx来获取

（4）获取指定标签的所有属性

print(bs.a.attrs)

（5）获取标签的属性

print(bs.a['href'])

（6）获取标签的文本内容。

print(bs.a.string)

注意：string获取的文本指的是本标签的文本，不包含子标签的文本

（7）contents能够获取指定标签下面的所有内容。

print(bs.body.contents)

（8）获取所有内容当中指定索引的内容

print(bs.div.contents[3])

（9）通过id和类名来找标签

print(bs.find(id='kw')) print(bs.find(class_='shopping'))

注意：id是唯一的，通过id来找，只能找到一个，所以用find，而class不是唯一的，通过class来找，就有可能找到多个。

（10）select选择指定的标签

print(bs.select('title')) print(bs.select('a'))

在bs4中，小数点“.”表示类名，#表示id

print(bs.select('.first')) print(bs.select('#kw')) print(bs.select('div.now'))

感谢各位的阅读！关于“Python中bs4基础的示例分析”这篇文章就分享到这里了，希望以上内容可以对大家有一定的帮助，让大家可以学到更多知识，如果觉得文章不错，可以把它分享出去让更多的人看到吧！

网站题目：Python中bs4基础的示例分析-创新互联
网站路径：http://chengdu.cdxwcx.cn/article/csjhcg.html

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

首页

网站建设

网站制作案例

解决方案

网站设计报价

网站制作动态

关于我们

联系我们

成都网站建设设计将想法与焦点和您一起共享

Python中bs4基础的示例分析-创新互联

其他资讯

腾讯云校园更换服务器腾讯云校园云服务器

包含百威系统sap成功入账的词条

关于sap系统增加预算的信息

阿里云服务器添加监听端口阿里云slb监听的端口范围

linux命令ip查地址 linux 查询 ip

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

成都网站建设设计 将想法与焦点和您一起共享

Python中bs4基础的示例分析-创新互联

其他资讯

腾讯云校园更换服务器 腾讯云校园云服务器

包含百威系统sap成功入账的词条

关于sap系统增加预算的信息

阿里云服务器添加监听端口 阿里云slb监听的端口范围

linux命令ip查地址 linux 查询 ip

成都网站建设设计将想法与焦点和您一起共享

腾讯云校园更换服务器腾讯云校园云服务器

阿里云服务器添加监听端口阿里云slb监听的端口范围