@awsekfozc
2016-05-05T13:59:56.000000Z
字数 640
阅读 2131
Hadoop
数据来源:RDBMS关系型数据库,logsr日志文件
1.关系型数据库:Sqoop框架,使关系型数据库表中的数据与HDFS交互。
2.日志文件:Flume框架,实时的抽取日志文件的数据到HDFS上。
数据分析
1.使用java等编程语言,对数据分析
2.使用sql对数据分析。Hive支持类似SQL(HiveQL)的形式。自动解析成MapReduce任务
在此输入正文