[关闭]
@twein89 2017-02-06T09:19:59.000000Z 字数 960 阅读 596

pyspider

爬虫


开发须知


抓取脚本编写


调试

想要调试一个项目比如dm_shows.py这个脚本
可以在本地用pyspider one命令调试,例如pyspider one damai/dm_shows.py


项目部署,更新

生产环境配置文件是product_config.json
步骤一:git 提交, push
步骤二:ssh spdubt后,进入project/spider_master后,git pull
步骤三:重启项目。pkill pyspider停止,
sudo nohup /root/.pyenv/versions/venv35/bin/pyspider -c product_config.json &启动
步骤四:打开http://192.168.199.179:5000/后把修改过的脚本贴到同名项目里,并save,有时会需要修改下crawl_config里面的itag参数


调用on_message方法的api例子
api:
http://192.168.199.179:8000/spider/send-msg-tasks
{
"project_name": "ctrip_room_spider",
"batch_code": "NPR16112900000000059",
"code_list": ["1981155", "1995296"],
"task_type": "S_ROOM_SPIDER"
}


添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注