python爬虫入门需要了解的库有哪些

小编给大家分享一下python爬虫入门需要了解的库有哪些，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！

创新互联公司是网站建设技术企业，为成都企业提供专业的成都网站制作、成都网站设计，网站设计，网站制作，网站改版等技术服务。拥有十载丰富建站经验和众多成功案例，为您定制适合企业的网站。十载品质，值得信赖！

请求库：

1. requests 这个库是爬虫最常用的一个库

2. Selenium Selenium 是一个自动化测试工具，利用它我们可以驱动浏览器执行特定的动作，如点击、下拉等操作对于一些用JS做谊染的页面来说，这种抓取方式是非常有效的。

3.ChomeDrive 安装了这个库，才能驱动Chrome浏览器完成相应的操作

4.GeckoDriver 使用W3C WebDriver兼容客户端与基于Gecko的浏览器进行交互的代理。

5.PhantomJS PhantomJS 是一个无界面、可脚本编程的 WebKit 浏览器引擎，它原生支持多种Web标准：Dom操作，css选择器，json，Canvas以及SVG。

6.aiohttp 之前接收requests库是一个阻塞式HTTP请求库，当我们发送一个请求后。程序会一直等待服务器响应，直到服务器响应后，程序才会最下一步处理。其实，这个过程比较耗时间。如果程序可以在等待的过程中做一些其他的事情，如进行请求的调度，响应的处理等，那么爬虫的效率就会比之前的那种方式有很大的提升。而aiohttp就是这样一个提供异步web服务的库。使用说这个库用起来还是相当方便的。

解析库：

1.lxml lxml是python的一个解析库，这个库支持HTML和xml的解析，支持XPath的解析方式，而且效率也是非常高的，深受广大程序员的热爱

2.Beautiful Soup Beautiful Soup也是python里一个HTML或XMl的解析库，它可以很方便的懂网页中提取数据，拥有强大的API和多种解析方式。

3.pyquery 同样是一个强大的网页解析工具，它提供了和 jQuery 类似的语法来解析HTML 文梢，

数据库：

1.MySQL 数据库

2.MongoDB Mo goDB 是由＋＋语言编写的非关系型数据库，是一个基于分布式文件存储的开源数据库系统内容存储形式类似 JSON 对象，它的字段值可以包含其他文档、数组及文档数组，非常灵活

3.redis 是一个基于存的高效的非关系型数据库，

存储库：

1.PyMySOL

2.PyMongo

3.redis-py

4.RedisDump

web库：

1.Flask 是一个轻量级的Web服务程序，它简单，易用，灵活

2.Tornado 是一个支持异步的Web框架，通过使用非阻塞I/O流，可以支持成千上万的开放式连接。

APP爬取相关库：

1.Charles 是一个网络抓包工具，相比 Fiddler，其功能更为强大且跨平台支持得更好。

2.mitmproxy 是一个支持HTTP和HTTPS的抓包工具，类似于Fiddler，Charles的功能，只不过它通过控制台的形式操作。

3.Android

以上是“python爬虫入门需要了解的库有哪些”这篇文章的所有内容，感谢各位的阅读！相信大家都有了一定的了解，希望分享的内容对大家有所帮助，如果还想学习更多知识，欢迎关注创新互联行业资讯频道！

本文标题：python爬虫入门需要了解的库有哪些
本文地址：http://chengdu.cdxwcx.cn/article/jpheje.html

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

首页

网站建设

网站制作案例

解决方案

网站设计报价

网站制作动态

关于我们

联系我们

成都网站建设设计将想法与焦点和您一起共享

python爬虫入门需要了解的库有哪些

其他资讯

oracle如何清数据,oracle 清除数据

矩阵相乘函数python,矩阵方程相乘

c语言标准函数库要背吗,C语言必背代码

windows7系统的手机的简单介绍

vb.net读写csv,VB net

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

成都网站建设设计 将想法与焦点和您一起共享

python爬虫入门需要了解的库有哪些

其他资讯

oracle如何清数据,oracle 清除数据

矩阵相乘函数python,矩阵方程相乘

c语言标准函数库要背吗,C语言必背代码

windows7系统的手机的简单介绍

vb.net读写csv,VB net

成都网站建设设计将想法与焦点和您一起共享