[关闭]
@heavysheep 2017-05-08T10:04:40.000000Z 字数 973 阅读 904

上航假期(旅游)数据文档

文档


概述

说明:由于上航给的接口又拖又慢,所以直接用抓爬的方式形成数据,此文档并非API接口形成的数据文档。
表位置mongoDB - eastnb - tourism
数据更新时间:每日早9点
日志位置:ssh//root@192.168.161.137 root/work-space/tourism.log

字段说明

表中只有三条数据,分别对应最受关注、今日推荐、当季热门三个列表。

字段名称 字段类型 字段释义 备注
list_name string 列表名 代表该列表类型,分别是focus(最受关注)、today(今日推荐)、hot(当季热门)
overwrite_time ISODate 上次覆写时间
item_list list 数据内容列表 索引编号是其在原网页中的排序,故索引有意义
title string 线路标题
preview string 线路预览图外链
tag string 标签类型 分为跟团游、自由行、None三种情况
length string 旅游时长 例如“8天7晚”
feature string 产品特色 换行以\n分隔
start string 起始站点
end string 结束站点 国内一般都是“中国”
lowest_price string 最低价 XXX元起
order_api string 对方移动端购买入口 用以生成购买入口二维码
href string 原网址链接
calendar list 线路日历表 下面详细说明
publicity_shots list 线路宣传照外链
trip_arrangements list 行程安排 下面详细说明

calendar字段

字段名称 字段类型 字段释义 备注
date ISODate 可参团时间
price string 当日价格 如果你看到不同时间价格都相同那是正常的...
limit string 人数限制 不同线路文本不同,因此不建议修改。

trip_arrangements字段
每个列表索引只对应一个值,但为了防止上航方面的数据问题,还是使用列列表内单元素字典的方式,字典的键为“第 x 日”。

字段名称 字段类型 字段释义 备注
route string 当日路线
hotel string 当日入住 上航的数据,没有可能为“无”,“N”和空字符串等
details string 当日路程详情 没有为空字符串
dining dict 当日用餐 键必然分为“早餐”、“午餐”、“晚餐”三种情况,对应值可能为空字符串
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注