@Vany 2016-03-09T12:41:56.000000Z 字数 1346 阅读 1272

2015-2016春夏学期规划TODO

规划

目标

Ambkari: Hadoop, Spark, 维护
做出一个Project，一篇Paper
工程上lead一个系统的实现，暂定Twinkle
其他：上课、学习理论知识，参与其他的项目

时间规划

Ambari 1-2周内
Project的成型的基本想法1-2周内讨论出来
Twinkle招人，讨论规划

想法

快递物流模型的进一步扩展

原文将网络看成一个静态的，学习一遍模型后就停止了
但网络模型实际上是根据实际情况变化的，例如双11，会导致运力下降，如何表示出来这种情况是个问题
快递慢是由于分拣、运输能力不够导致的，可以在这里再进行建模
而且每一个快递的路径其实有很多Common sites，因此如果我们能利用起来，可能预测更准，或者分析更多的东西
还可以考虑网络的实时化更新
网络上的运力有一定的Capability，如果能分析出来运送速度和数量关系，来体现运力，就可以进行建模
除了做预测，可以做流量的分配以及评估

顺丰，需求
细粒度的需求

三天就可以达到？
宏观更好的规划其运输量，分配成本

网络空间的数据挖掘

MAC

research topic analysis，paper, recommandation

文章推荐的想法 (context based, user-based recommandation)
一个平台stork，基于keyword的
如果我们的Paper Reading System做出来，就可以做基于user的推荐了

知乎,Quora上的挖一挖

(Topic) Trend Analyzer
upvote dynamic network (most influential node)
Ref:

https://www.quora.com/challenges
https://data.quora.com/

自行车Demo（可视化的流场）

论文的核心思想——流动
一种是从一个点开始的流动状况的展现
二是全局流动状况的展现，展现趋势，以及一些站点的存量变化速度，用以直观的决策调度
我认为核心思想是形象化的展现预测，以及直观的供人辨认来调度
比如一个站点满架、空架很久了可以形象化的表现出来，给人提示
实时仿真决策预测、决策？（需要实时数据接口）

电动车道路匹配算法

TODO

Ambari

重构原先的代码，改成可以apply.sh hostlist script.sh
部署Python3
将yumsource迁移到非201上
部署好slave3,4, 其中3,4在200机器上
PYTHONHASHSEED的问题（需要重启下？）
Python3及相应的package(离线下载，再分发的方式)
增大下内存, 以及CPU、核心的数量
再建立slave5,6
Docker
Hadoop, Yarn, Node(Resource)Manager, ZooKeeper 架构

系统的文章是什么样的（架构），多少工作（故事）能做成一个系统

PaperTarget/Searching

MobiSys/SenSys
SIGMetrics
SIGSpatial
BigData (Conference, Congress, Trans)
KDD
RTSS (Real-time System Symposium)
ACM TIST (Trans on Intelligent Systems and Technology)