[关闭]
@awsekfozc 2015-12-03T23:04:03.000000Z 字数 2446 阅读 1545

Hive DML

Hive

Load data

load方式

基本语法

LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]
说明:
LOCAL:加载本地文件
OVERWRITE:覆盖原有数据
PARTITION:分区数据

示例

  1. ##加载HDFS上的文件
  2. load data inpath '/user/hive/warehouse/testdb.db/emp_ext/emp.txt' into table emp ;
  3. ##加载本地文件
  4. load data local inpath '/opt/datas/dept.txt' into table dept ;
  5. ##加载覆盖原有数据
  6. load data local inpath '/opt/datas/dept.txt' overwrite into table dept ;

insert方式

基本语法

INSERT OVERWRITE TABLE tablename1 [PARTITION (partcol1=val1, partcol2=val2 ...) [IF NOT EXISTS]] select_statement1 FROM from_statement;
说明:
    - OVERWRITE:覆盖原有数据
    - PARTITION:分区数据
    - IF NOT EXISTS:如果不存在
    - select_statement1 FROM from_statement:查询结果集

INSERT INTO TABLE tablename1 [PARTITION (partcol1=val1, partcol2=val2 ...)] select_statement1 FROM from_statement;

示例

  1. hive (testdb)> create table testdb.emp_like like testdb.emp ;
  2. ##加载数据到表
  3. hive (testdb)> insert into table testdb.emp_like select * from testdb.emp ;
  4. ##覆盖数据到表
  5. hive (testdb)> insert OVERWRITE table testdb.emp_like select * from testdb.emp ;

get data

基本语法

INSERT OVERWRITE [LOCAL] DIRECTORY directory1 [ROW FORMAT row_format] SELECT ... FROM ...

示例

  1. ##保存到本地目录的文件中
  2. insert overwrite local directory '/opt/datas/hivedata' select * from testdb.emp ;
  3. ##保存到本地目录的文件中,加入分隔符
  4. insert overwrite local directory '/opt/datas/hivedata2'
  5. ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
  6. select * from testdb.emp ;
  7. ##保存数据到HDFs文件系统上
  8. insert overwrite directory '/user/zc/hive/hivedata' select * from testdb.emp ;
  9. ##命令模式
  10. bin/hive -e "select * from testdb.emp ;" > '/opt/datas/exp_emp_res.txt'

export and import

基本语法

EXPORT TABLE tablename [PARTITION (part_column="value"[, ...])]
  TO 'export_target_path'
  说明:
  PARTITION:到处分区数据
  export_target_path:导出路径

IMPORT [[EXTERNAL] TABLE new_or_original_tablename [PARTITION (part_column="value"[, ...])]]
  FROM 'source_path'
  [LOCATION 'import_target_path']   
  说明:
  EXTERNAL:导入外部表
  new_or_original_tablename:导入后的表名
  PARTITION:导入分区
  source_path:数据路径
  LOCATION:导入后表数据存放路径

示例

  1. ##导出表数据
  2. EXPORT TABLE testdb.emp TO '/user/zc/hive/datas/export/emp' ;
  3. ##导入表数据
  4. IMPORT FROM '/user/zc/hive/datas/export/emp' ;
  5. ##导出分区表数据
  6. EXPORT TABLE emp_partition PARTITION (month="201512",day="01") TO '/user/zc/hive/datas/export/emp_partition' ;

select

基本语法

SELECT [ALL | DISTINCT] select_expr, select_expr, ...
FROM table_reference
[WHERE where_condition]
[GROUP BY col_list]
[CLUSTER BY col_list
  | [DISTRIBUTE BY col_list] [SORT BY col_list]
]
[LIMIT number]
说明:
- ALL:显示全部数据
- DISTINCT:去除重复数据
- select_expr:查询表达式
- table_reference:数据集
- where_condition:条件
- GROUP BY:全局排序
- SORT BY:每个reduce内部排序,全局不是排序
- DISTRIBUTE BY:类似MR中的partition,分区。结合SORT BY使用,放在SORT BY之前
- CLUSTER BY:distribute by 和  sort by 字段相同时,使用cluster by 代替
- LIMIT:只显示结果的number条数据

在此输入正文

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注