前言
在之前的分享中,我们已经学会了简书和知乎小姐姐的爬虫。今天罗罗攀把魔爪伸向了微博网红们,我们找找谁是最美网红。今天的流程如下:
网页分析
这里的微博网红链接:https://weibo.com/a/hot/7549094253303809_1.html,这个是微博关注中的新鲜事(大家不需要了解太多,就这个url即可)。里面收集了近段时间的热门网红微博。
这个网页简单,我们直接使用lxml库来解析即可。这里就强调一点,这个图片是普清的,进入详细页面可以是高清图片,但我发现只需要将图片的url中的“thumb180”换成“mw690”就可以将图换成高清。例如:
爬虫代码
根据上面的思路,我们编写爬虫代码:
记得换上自己的cookie后就可以直接使用啦~
人脸识别API
之前我们就讲解过了人脸识别API的使用,这里把在讲解一遍。
首先,打开网址(http://ai.baidu.com/tech/face),登陆后立即使用,我们首先创建一个人脸识别的应用。api的使用说简单很简单(看文档就好了),说难也很难(大家的阅读能力在慢慢下降)。首先,我们看着文档(https://ai.baidu.com/docs#/Face-Detect-V3/top),一步步来。
接着我们通过API Key和Secret Key获取token:
我们拿着token,来请求对应的网页就可以获取图片的内容了。我们拿张超越妹妹的图片做例子~
这里的token为前面请求得到的,params的参数中,图片需要base64编码~超越妹妹76.25,还算给力。
综合使用
最后,我们逐一请求我们保存的图片,获取小姐姐图片的分数(这里处理为1-10分),并分别存在不同的文件夹中。
本文转自公号 罗罗攀
后台回复【微博网红】,下载完整代码和高清图片。
本篇文章来源于: 菜鸟学Python
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ 没有基础可以从零开始学python吗?10/27
- ♥ 必看的 Python 分支、循环和条件01/01
- ♥ 编程python或c的介绍?10/15
- ♥ python中计算矩阵特征向量的方法09/25
- ♥ 如何增加pycharm的python字体12/08
- ♥ 如何在python中计算不同类型的变量12/31
内容反馈