python3中编码怎样获取网页-创新互联

这篇文章给大家分享的是有关python3中编码怎样获取网页的内容。小编觉得挺实用的，因此分享给大家做个参考。一起跟随小编过来看看吧。

成都创新互联2013年开创至今，是专业互联网技术服务公司，拥有项目做网站、成都网站建设网站策划，项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命，1280元连平做网站,已为上家服务,为连平各地企业和个人服务,联系电话:18982081108

1. encoding和apparent_encoding

import scrapy
url="https://www.ygdy8.net/html/gndy/dyzz/index.html"
re=requests.get(url)
#获取响应头Content-Type的charset值，有的网站没有charset字段，就可能使用默认的 ISO-8859-1
print(re.encoding)
#apparent_encoding就是获取网站真实的编码
print(re.apparent_encoding)

2. 处理方案

直接用r.encoding = ‘xxx’

re.encoding='utf-8'

3. requests的text() 跟 content() 有什么区别

re.text返回的是处理过的Unicode型的数据，

而使用re.content返回的是bytes型的原始数据。

4. 爬虫拿到的HTML和浏览器中的源码不相同时

通过下载源码对比

import requests
url = 'https://www.ygdy8.net/html/gndy/dyzz/index.html'
r  = requests.get(url)
r.encoding = r.apparent_encoding
html = r.text
with open('test.html','w',encoding='utf8') as f:
f.write(html)

python3中编码怎样获取网页

感谢各位的阅读！关于python3中编码怎样获取网页就分享到这里了，希望以上内容可以对大家有一定的帮助，让大家可以学到更多知识。如果觉得文章不错，可以把它分享出去让更多的人看到吧！

标题名称：python3中编码怎样获取网页-创新互联
网站网址：http://chengdu.cdxwcx.cn/article/cdcipi.html

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

首页

网站建设

网站制作案例

解决方案

网站设计报价

网站制作动态

关于我们

联系我们

成都网站建设设计将想法与焦点和您一起共享

python3中编码怎样获取网页-创新互联

其他资讯

直播代运营的收费标准是怎么样的？直播代运营公司推荐

吉林短视频产品运营招聘

江苏抖音账号直播运营哪里学习(呼市抖音账号运营在哪儿？专业吗想找家抖

襄阳短视频获客推广,襄阳百度推广

短视频运营有前途嘛,短视频运营公司靠谱吗

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

成都网站建设设计 将想法与焦点和您一起共享

python3中编码怎样获取网页-创新互联

其他资讯

直播代运营的收费标准是怎么样的？直播代运营公司推荐

吉林短视频产品运营招聘

江苏抖音账号直播运营哪里学习(呼市抖音账号运营在哪儿？专业吗想找家抖

襄阳短视频获客推广,襄阳百度推广

短视频运营有前途嘛,短视频运营公司靠谱吗

成都网站建设设计将想法与焦点和您一起共享