@bergus
2017-02-17T21:26:03.000000Z
字数 576
阅读 1059
问卷
Q-a
一、从数据库提取信息(单题、该用户)
1. 历史数据中用户回答该问题的次数
2. 不同回答的次数
3. 不同回答的具体答案
4. 答题的时间
二、历史数据信息(单题、全部用户)
1. 全部用户在该问题的答题次数
2. 全部用户的答案分布
3. 全部用户的答题平均时间
4. 全部用户答题时间的方差
5. 该用户的答题时间在全部用户中的百分比位置
6. 两个问题答案之间的条件概率表
三、全部题目(该用户)
1. 该用户总体答题时间
2. 全用户的答题平均时间
3. 全用户方差
4. *该用户总体答题时间在全用户中的百分比位置
5. 之前是否有没有完成问卷的情况
6. 用户填写问卷的时间间隔
二、算分
1. Time percentile
2. Fraud Score(该用户本次问卷答案在所有问卷数据中出现的可能性分值)
3. Serious Score(该用户本次问卷答案在所有问卷数据中的认真程度分值)
4. Consistence Score(该用户本次问卷与其历史问卷的答案、耗时等,比较分值)
5. 上线初期通过蓝领贷的答题时间数据来过滤坏问卷(答题时间过短)
三、推题
1. 全部固定20题
2. 固定15题,随机推送5题
3. 收集10题的结果,分两次分别选择5题进行推送
4. 每天更新一次推送题库(把极端单峰分布的题目去掉)
5.
推题:
1. 题目总数
2. 当前分页
3. 重复次数?去掉?
4. user_id?
5. exam_id?
算分: