[关闭]
@sasaki 2016-04-07T17:30:30.000000Z 字数 808 阅读 1608

实战电影评分核计与分析系统

BigData


版本控制

  1. @Title 实战电影评分核计与分析系统
  2. @Version v1.0
  3. @Timestamp 2016-03-18 16:20
  4. @Author Nicholas
  5. @Mail redskirt@outlook.com

数据源格式

  1. movies.dat 电影编号::电影名::电影类别
  2. ratings.dat 用户编号::电影编号::电影评分::时间戳
  3. users.dat 用户编号::性别::年龄::职业::Zip-code

RDBMS表结构设计

movie表
列名 描述
movie_id 电影编号
name 电影名称
type 电影类别
rating表
列名 描述
user_id 用户编号
movie_id 电影编号
rating 电影评分
timestamp 时间戳
user表
列名 描述
user_id 用户编号
gender 性别
age 年龄
job 职业
zipcode zip_code

HBase表结构设计

movie表
RowKey Column Family
movie_id info user

info:name

info:type

user:user_id
user表
RowKey Column Family
user_id info movie

info:gender

info:age

info:job

info:zipcode

movie:movie_id

在HBase中建表

  1. hbase(main):033:0> create 'movie',{NAME => 'info'},{NAME => 'user'}
  2. 0 row(s) in 0.3740 seconds
  3. => Hbase::Table - movie
  4. hbase(main):034:0> create 'user',{NAME => 'info'}, {NAME => 'movie'}
  5. 0 row(s) in 0.3550 seconds
  6. => Hbase::Table - user

HBase官方中文参考文档
http://abloz.com/hbase/book.html

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注