[关闭]
@EggGump 2018-07-02T15:45:19.000000Z 字数 141 阅读 461

动态Cookies池

scrapy


1、网站要登录
2、爬取过程过如果频率过高会导致封号
3、维护多个账号的Cookies实现大规模爬取

Cookies池的要求

1、 自动登录更新
2、 定时验证筛选
3、 提供外部接口

Cookies池架构

账号队列
|
生成器
|
Cookies队列 -->API
|
定时检测器

实现

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注