@heavysheep
2017-05-08T10:04:40.000000Z
字数 973
阅读 904
文档
说明:由于上航给的接口又拖又慢,所以直接用抓爬的方式形成数据,此文档并非API接口形成的数据文档。
表位置:mongoDB
- eastnb
- tourism
数据更新时间:每日早9点
日志位置:ssh//root@192.168.161.137 root/work-space/tourism.log
表中只有三条数据,分别对应最受关注、今日推荐、当季热门三个列表。
字段名称 | 字段类型 | 字段释义 | 备注 |
---|---|---|---|
list_name | string | 列表名 | 代表该列表类型,分别是focus(最受关注)、today(今日推荐)、hot(当季热门) |
overwrite_time | ISODate | 上次覆写时间 | |
item_list | list | 数据内容列表 | 索引编号是其在原网页中的排序,故索引有意义 |
title | string | 线路标题 | |
preview | string | 线路预览图外链 | |
tag | string | 标签类型 | 分为跟团游、自由行、None三种情况 |
length | string | 旅游时长 | 例如“8天7晚” |
feature | string | 产品特色 | 换行以\n分隔 |
start | string | 起始站点 | |
end | string | 结束站点 | 国内一般都是“中国” |
lowest_price | string | 最低价 | XXX元起 |
order_api | string | 对方移动端购买入口 | 用以生成购买入口二维码 |
href | string | 原网址链接 | |
calendar | list | 线路日历表 | 下面详细说明 |
publicity_shots | list | 线路宣传照外链 | |
trip_arrangements | list | 行程安排 | 下面详细说明 |
calendar字段
字段名称 | 字段类型 | 字段释义 | 备注 |
---|---|---|---|
date | ISODate | 可参团时间 | |
price | string | 当日价格 | 如果你看到不同时间价格都相同那是正常的... |
limit | string | 人数限制 | 不同线路文本不同,因此不建议修改。 |
trip_arrangements字段
每个列表索引只对应一个值,但为了防止上航方面的数据问题,还是使用列列表内单元素字典的方式,字典的键为“第 x 日”。
字段名称 | 字段类型 | 字段释义 | 备注 |
---|---|---|---|
route | string | 当日路线 | |
hotel | string | 当日入住 | 上航的数据,没有可能为“无”,“N”和空字符串等 |
details | string | 当日路程详情 | 没有为空字符串 |
dining | dict | 当日用餐 | 键必然分为“早餐”、“午餐”、“晚餐”三种情况,对应值可能为空字符串 |