2015-2016春夏学期规划TODO
规划
目标
- Ambkari: Hadoop, Spark, 维护
- 做出一个Project,一篇Paper
- 工程上lead一个系统的实现,暂定Twinkle
- 其他:上课、学习理论知识,参与其他的项目
时间规划
- Ambari 1-2周内
- Project的成型的基本想法1-2周内讨论出来
- Twinkle招人,讨论规划
想法
快递物流模型的进一步扩展
- 原文将网络看成一个静态的,学习一遍模型后就停止了
但网络模型实际上是根据实际情况变化的,例如双11,会导致运力下降,如何表示出来这种情况是个问题
- 快递慢是由于分拣、运输能力不够导致的,可以在这里再进行建模
- 而且每一个快递的路径其实有很多Common sites,因此如果我们能利用起来,可能预测更准,或者分析更多的东西
还可以考虑网络的实时化更新
- 网络上的运力有一定的Capability,如果能分析出来运送速度和数量关系,来体现运力,就可以进行建模
- 除了做预测,可以做流量的分配以及评估
顺丰,需求
细粒度的需求
三天就可以达到?
宏观更好的规划其运输量,分配成本
网络空间的数据挖掘
MAC
research topic analysis,paper, recommandation
- 文章推荐的想法 (context based, user-based recommandation)
- 一个平台stork,基于keyword的
- 如果我们的Paper Reading System做出来,就可以做基于user的推荐了
知乎,Quora上的挖一挖
自行车Demo(可视化的流场)
- 论文的核心思想——流动
- 一种是从一个点开始的流动状况的展现
- 二是全局流动状况的展现,展现趋势,以及一些站点的存量变化速度,用以直观的决策调度
- 我认为核心思想是形象化的展现预测,以及直观的供人辨认来调度
- 比如一个站点满架、空架很久了可以形象化的表现出来,给人提示
- 实时仿真决策预测、决策?(需要实时数据接口)
电动车道路匹配算法
TODO
Ambari
- 重构原先的代码,改成可以
apply.sh hostlist script.sh
- 部署Python3
- 将yumsource迁移到非201上
- 部署好slave3,4, 其中3,4在200机器上
- PYTHONHASHSEED的问题(需要重启下?)
- Python3及相应的package(离线下载,再分发的方式)
- 增大下内存, 以及CPU、核心的数量
- 再建立slave5,6
- Docker
- Hadoop, Yarn, Node(Resource)Manager, ZooKeeper 架构
系统的文章是什么样的(架构),多少工作(故事)能做成一个系统
PaperTarget/Searching
MobiSys/SenSys
SIGMetrics
SIGSpatial
BigData (Conference, Congress, Trans)
KDD
RTSS (Real-time System Symposium)
ACM TIST (Trans on Intelligent Systems and Technology)