系统

Linux中swap虚拟内存配置

在实际生产环境中，我们的服务器由于内存配置资源有限，会遇到一些线上服务宕机或者内存溢出等问题，那么如何解决这些问题呢，一方面我们要确认问题的具体原因，通过排查自身应用服务的问题，一方面增加我们的内存资源配置，如果短期内无法增加内存资源配置，...

2023-04-18胖蔡阅读(555)赞(0)

各种数值在计算机中表示的方法称之为机器数，其特点是采用二进制，即使用数据0和1表示，小数点则隐含（不占位置）。机器数对应的实际数值称之为真值。

2023-04-18胖蔡阅读(580)赞(0)

Scrapy是用纯Python实现一个为了爬取网站数据、提取结构性数据而编写的应用框架，用途非常广泛。框架的力量，用户只需要定制开发几个模块就可以轻松的实现一个爬虫，用来抓取网页内容以及各种图片，非常之方便。

2023-04-18胖蔡阅读(700)赞(0)

Tesseract 是一个 OCR 库,目前由 Google 赞助(Google 也是一家以 OCR 和机器学习技术闻名于世的公司)。Tesseract 是目前公认最优秀、最精确的开源 OCR 系统。除了极高的精确度,Tesseract ...

2023-04-17胖蔡阅读(1057)赞(0)

计算机系统运行时，系统为确保数据在传输过程中不出错，一般会通过：提高硬件电路的可靠性和提高代码的校验能力（差错和纠错）实现数据传输的稳定性。

2023-04-13胖蔡阅读(401)赞(2)

一种更复杂的链表是“双向链表”或“双面链表”。每个节点有两个链接：一个指向前一个节点，当此节点为第一个节点时，指向空值；而另一个指向下一个节点，当此节点为最后一个节点时，指向空值。

2023-04-13胖蔡阅读(402)赞(0)

和 lxml 一样，Beautiful Soup 也是一个HTML/XML的解析器，主要的功能也是如何解析和提取 HTML/XML 数据。

2023-04-13胖蔡阅读(431)赞(0)

XPath来做一个简单的爬虫，我们尝试爬取某个贴吧里的所有帖子，并且将该这个帖子里每个楼层发布的图片下载到本地。

2023-04-13胖蔡阅读(378)赞(0)

Requests 继承了urllib2的所有特性。Requests支持HTTP连接保持和连接池，支持使用cookie保持会话，支持文件上传，支持自动确定响应内容的编码，支持国际化的 URL 和 POST 数据自动编码。Requests能完全...

2023-04-12胖蔡阅读(388)赞(0)

opener是 urllib2.OpenerDirector 的实例，我们之前一直都在使用的urlopen，它是一个特殊的opener（也就是模块帮我们构建好的）。