首页 > 开发 > Python > 正文

Python 自动登录淘宝并保存登录信息的方法

2020-07-28 14:07:57

字体：大中小

来源：转载

供稿：网友

前段时间时间为大家讲解了如何使用requests库模拟登录淘宝，而今天我们将对该功能进行丰富。所以我们把之前的那个版本定为1.0，而今天修改的版本定为2.0。版本的迭代意味着功能的升级，那今天的2.0版本较之前的1.0版本有哪些改进呢？我们一起来看看！

1.0版本实现步骤

我们先来回顾一下模拟登录淘宝的步骤吧，我们还是先看看淘宝登录的详细时序图：

640?wx_fmt=png

这是淘宝网登录的一个请求流程，而我们模拟登录也是根据这样的一个流程。但是在代码模拟登录的时候就不会分的这么细，我们根据封装的思想将整个登录流程封装在四个方法里面，可以看看下图。

640?wx_fmt=png

为了便于大家理解四步登录法，我又画了一个流程图给大家看看：

640?wx_fmt=png

结合流程图，给大家简单的再讲解一遍这四步具体做了啥：

拿着用户名向淘宝（taobao.com）发起一个post的请求，判断是否出现滑块验证。向淘宝（taobao.com）又发起一个post请求，验证用户名密码是否正确，如果正确则返回一个token。拿着token去阿里巴巴（alibaba.com）交换st码。获取st码之后，拿着st码获取cookies，登录成功。

在面试的时候也许面试官会问你是否爬取或自动登录过淘宝，流程是怎么的？大家就这个把这个四步登录法讲给面试官听，面试官不仅不会你的技术认可，也为认可你的逻辑思维缜密！

2.0版本新增功能

为什么要做2.0版本？因为我在做爬取淘宝商品的时候发现之前登录有一个很不方便的地方：每次程序运行完后，登录的cookies就没了，也就是说下次又要重新登录。

而浏览器却可以保存cookies信息，所以我自然地想到了：将cookies序列化。

序列化 (Serialization)是将对象的状态信息转换为可以存储或传输的形式的过程。――百度百科

简单说序列化就是将对象持久性保存起来，因为原来对象是在内存中，程序运行完了就要释放内存，所有的对象、变量等都会被清除，而序列化则可以把他们保存到文件。即使程序关闭了，下次启动的时候可以读取文件到内存转回对象继续使用，而这个过程叫反序列化。

所以我们2.0的功能就是：将登录后的cookies保存到文件中，下次再登录先从cookies文件读取！也就是增加了一个保存cookies 的功能，我们再看看2.0的流程图。

640?wx_fmt=png

与1.0的流程图相比，其实就多了左边的cookies文件和cookies文件的校验，这也就是我们今天要讲的内容！

别看只是增加了一点点功能，却意义重大：因为这是一个授人予渔的功能，你学会之后其他所有的登录都可以做序列化保存cookies，而且还可以做cookies池！

2.0版本新功能实现

根据上面的流程图，我们可以简单的分析量化一下增加的保存cookies这个共功能：

保存cookies：增加一个方法，当使用st码登录成功后，用来将cookies对象转化为文件

读取cookies：增加一个方法，用来读取cookies文件，将它转化为cookies对象

检查cookies：增加一个方法，用来判断cookies是否失效，如果失效则删除cookies文件，如果有效则直接登录成功！

根据以上三步，我们就可以开始撸代码了

1.保存cookies

保存cookies其实就叫序列化，我们先来看看代码：

上一篇：centos6.7 安装python2.7、pip2.7、easy

下一篇：Python常用模块logging――日志输出功能(示例代码)

学习交流

HTTP 错误 500.19- Internal Server Erro

HTTP 错误 500.19- Internal Server Error 错误解决方法...

热门图片

猜你喜欢的新闻

猜你喜欢的关注

新闻热点

华为Mate40系列或用双处理器：国内麒麟国外骁龙？

2020-07-20 18:53:25

中国移动6月净增5G套餐用户1459万户累计达7019.9万户

2020-07-20 18:49:06

蚂蚁集团计划在科创板和港交所同步上市估值超2000亿美元

2020-07-20 18:46:48

传滴滴最快年内在香港IPO 目标估值800亿美元

2020-07-20 18:43:28

小鹏汽车宣布C+轮融资近5亿美元高瓴红杉等为主要投资者

2020-07-20 18:36:00

微博内测热搜定制功能你可以愉快地吃瓜了吗？

2020-07-17 23:29:41

疑难解答

图片精选

网友关注