胖蔡叨叨叨
你听我说

后端

后端开发
Python Scrapy入门示例-胖蔡叨叨叨

Python Scrapy入门示例

胖蔡阅读(251)赞(0)

Scrapy是用纯Python实现一个为了爬取网站数据、提取结构性数据而编写的应用框架,用途非常广泛。框架的力量,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片,非常之方便。

Python Tesseract库尝试实现验证码识别-胖蔡叨叨叨

Python Tesseract库尝试实现验证码识别

胖蔡阅读(242)赞(0)

Tesseract 是一个 OCR 库,目前由 Google 赞助(Google 也是一家以 OCR 和机器学习技术闻名于世的公司)。Tesseract 是目前公认最优秀、最精确的开源 OCR 系统。 除了极高的精确度,Tesseract ...

Python 接入微信公众号-胖蔡叨叨叨

Python 接入微信公众号

胖蔡阅读(163)赞(2)

登录微信公众平台官网后,在公众平台后台管理页面 - 开发者中心页,点击“修改配置”按钮,填写服务器地址(URL)、Token和EncodingAESKey,其中URL是开发者用来接收微信消息和事件的接口URL。Token可由开发者可以任意填...

Python实现双向链表-胖蔡叨叨叨

Python实现双向链表

胖蔡阅读(122)赞(2)

一种更复杂的链表是“双向链表”或“双面链表”。每个节点有两个链接:一个指向前一个节点,当此节点为第一个节点时,指向空值;而另一个指向下一个节点,当此节点为最后一个节点时,指向空值。

使用XPath进行爬虫-胖蔡叨叨叨

使用XPath进行爬虫

胖蔡阅读(124)赞(0)

XPath来做一个简单的爬虫,我们尝试爬取某个贴吧里的所有帖子,并且将该这个帖子里每个楼层发布的图片下载到本地。

Python  Requests更加人性化的HTTP-胖蔡叨叨叨

Python Requests更加人性化的HTTP

胖蔡阅读(107)赞(0)

Requests 继承了urllib2的所有特性。Requests支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动确定响应内容的编码,支持国际化的 URL 和 POST 数据自动编码。Requests能完全...

Python Selenium与PhantomJs-胖蔡叨叨叨

Python Selenium与PhantomJs

胖蔡阅读(108)赞(0)

Selenium 库里有个叫 WebDriver 的 API。WebDriver 有点儿像可以加载网站的浏览器,但是它也可以像 BeautifulSoup 或者其他 Selector 对象一样用来查找页面元素,与页面上的元素进行交互 (发送...

Redis数据操作-胖蔡叨叨叨

Redis数据操作

胖蔡阅读(129)赞(0)

Redis是key-value的数据,所以每个数据都是一个键值对。键的类型是字符串,值的类型分为五种:字符串string、哈希hash、列表list、集合set、有序集合zset。