[关闭]
@killa 2015-07-30T09:16:39.000000Z 字数 1619 阅读 691

Answers.com 爬取调查

APEX QA QAPair

基本信息

  1. 整个网站中有两种信息页面:问题页面和文章页面。问题页面是人们提出的问题、其答案及一些其他信息包括相关问题、相关文章、回答者相关信息。
  2. 问题都有配图,但配图是系统自己定的,不包含提问者的信息。

提问、回答与修改权限

  1. 用户需要首先搜索自己想问的问题,系统会自动选择最相关的问题返回。只有在搜索无结果的情况下才允许提出新的问题。
  2. 任何非登录用户都可回答一个未被回答过的问题,将显示回答者为Community。
  3. 每个问题只能有一个答案,不允许用户添加答案,但是允许登陆用户在提问者未锁定问题的前提下修改别人的答案。提问者怎么锁定问题没有找到。

分类获取


问题页面获取


答案及其他信息获取


雪智哥的分布式爬虫框架使用

今天中午跟他请教了一下,觉得还是挺难上手的。他们爬豆瓣都是一边爬一边解析,只拿最想要的数据。

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注