@heavysheep
2017-02-16T13:18:59.000000Z
字数 617
阅读 1299
比赛
result:每家店铺每日交易成功数量
view:每家店铺每日浏览量
shop_id | city_name | location_id | per_pay | score | comment_cnt | shop_level | cate_name.. |
---|---|---|---|---|---|---|---|
商家id | 城市名 | 所在位置编号 | 人均消费 | 评分 | 评论数 | 商铺等级 | 分类 |
shop_id:主键,索引
city_name:获取气温、消费能力、消费习惯
location_id:聚类算法,估计功效太低没什么意义,pass
per_pay:检测与result负相关,与view负相关。
socre:检测与result正相关,与view正相关。
comment_cnt:检测与result正相关,与view正相关。
shop_level:检测与result正相关,与view正相关
cate_name:分类太细,考虑只保留使用“超市”和“美食”进行区分。
检测per_pay、score、comment_cnt、shop——level与view、result的关联度。
user_id | shop_id | time_stamp |
---|---|---|
付费用户id | 商家id | 消费时间 |
time_stamp:分解出日期day和时间time列。
user_id | shop_id | time_stamp |
---|---|---|
浏览用户id | 商家id | 浏览时间 |
time_stamp:分解出日期day和时间time列。