@twein89
2016-08-19T03:58:42.000000Z
字数 398
阅读 796
pyspider
- 店铺爬虫shopspider.py
- 菜单爬虫menuspider.py
- 配置文件config.json
将抓取到的数据以json格式保存到默认的resultdb,每一个链接为一个保存单位,一个链接有30个店铺。如不想保存到resultdb,可以自己在model.py中设计数据库结构后,用python db_create.py创建数据表,并参考shopspider_db.py
可以从resultdb中获取店铺列表后进行抓取,也可以从自己设计的数据库中获取店铺列表(shopspider_db.py)
修改为自己的数据库
pyspider -c config.json