python
-
Python python爬虫之字体反爬及解决方案
在爬取某些网站的数据时,经常会发现爬下来的数据夹杂着乱码;但是网页上明明是正常的,这就是此网站做了字体反扒技术;比如 https://su.58.com/qztech/ 这个网站,页面上看起来是正常的数据,但是审查元素会发现,都是乱码,如果我们去除了右下角红框标注的字体文件,会发现页面也会出现乱码其实,这种字体文件,实质上就是一个字典,记载了乱码余正确数据之间的对应关系,在显示的时候,把“乱码” 替换成正确的数据其实我们要做的很简单,就是把字体文件复制下来,保存为ttf,然后需要显示...
薄洪涛 2019-03-16 1104浏览 0评论 -
Python Python之为世界贡献你的轮子
何为轮子?我理解的就是能重复使用的一些包,类,库,,就是咱们通过pip install XX下载的包,今天学习些如何自己写一个包让别人可以使用pip下载并使用第一步,注册账号https://pypi.org/第二步,设置你的轮子信息(就是你的包的结构)wheelname - wheelname - __init__.py &nb...
薄洪涛 2018-10-30 906浏览 0评论