@sasaki
2016-04-07T17:30:30.000000Z
字数 808
阅读 1608
BigData
@Title 实战电影评分核计与分析系统
@Version v1.0
@Timestamp 2016-03-18 16:20
@Author Nicholas
@Mail redskirt@outlook.com
数据源格式
movies.dat : 电影编号::电影名::电影类别
ratings.dat: 用户编号::电影编号::电影评分::时间戳
users.dat: 用户编号::性别::年龄::职业::Zip-code
RDBMS表结构设计
movie表 | |
---|---|
列名 | 描述 |
movie_id | 电影编号 |
name | 电影名称 |
type | 电影类别 |
rating表 | |
---|---|
列名 | 描述 |
user_id | 用户编号 |
movie_id | 电影编号 |
rating | 电影评分 |
timestamp | 时间戳 |
user表 | |
---|---|
列名 | 描述 |
user_id | 用户编号 |
gender | 性别 |
age | 年龄 |
job | 职业 |
zipcode | zip_code |
HBase表结构设计
movie表 | ||
---|---|---|
RowKey | Column Family | |
movie_id | info | user |
info:name info:type |
user:user_id |
user表 | ||
---|---|---|
RowKey | Column Family | |
user_id | info | movie |
info:gender info:age info:job info:zipcode |
movie:movie_id |
在HBase中建表
hbase(main):033:0> create 'movie',{NAME => 'info'},{NAME => 'user'}
0 row(s) in 0.3740 seconds
=> Hbase::Table - movie
hbase(main):034:0> create 'user',{NAME => 'info'}, {NAME => 'movie'}
0 row(s) in 0.3550 seconds
=> Hbase::Table - user
HBase官方中文参考文档
http://abloz.com/hbase/book.html