[关闭]
@EggGump 2018-07-02T15:45:33.000000Z 字数 413 阅读 453

爬知乎用户信息

scrapy


settings.py:
ROBOTSTXT_OBEY = False
这个是一个在服务器中的配置文件,它用于告诉爬虫哪些可爬,哪些不可爬,一般设为False

加头部信息,浏览器会检查头信息。
settings.py

  1. DEFAULT_REQUEST_HEADERS = {
  2. 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
  3. 'Accept-Language': 'en',
  4. 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36',
  5. 'authorization': 'oauth c3cef7c66a1843f8b3a9e6a1e3160e20'
  6. }
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注