Hive 类型
# Hive 类型
| Hive 数据类型 | Java 数据类型 | 长度 | 例子 |
|---|---|---|---|
| TINYINT | byte | 1byte 有符号整数 | 20 |
| SMALINT | short | 2byte 有符号整数 | 20 |
| INT | int | 4byte 有符号整数 | 20 |
| BIGINT | long | 8byte 有符号整数 | 20 |
| BOOLEAN | boolean | 布尔类型,true 或者 false | TRUE FALSE |
| FLOAT | float | 单精度浮点数 | 3.14159 |
| DOUBLE | double | 双精度浮点数 | 3.14159 |
| STRING | string | 字符系列。可以指定字符集。可以使用单引号或者双引号。 | ‘now is the time’ “for all good men” |
| TIMESTAMP | 时间类型 | ||
| BINARY | 字节数组 |
| 数据类型 | 描述 | 语法示例 |
|---|---|---|
| STRUCT | 和 c 语言中的 struct 类似,都可以通过 “点” 符号访问元素内容。例如,如果某个列的数据类型是 STRUCT {first STRING, last STRING}, 那么第 1 个元素可以通过字段.first 来引用。 | struct () 例如 struct<street:string, city:string> |
| MAP | MAP 是一组键 - 值对元组集合,使用数组表示法可以访问数据。例如,如果某个列的数据类型是 MAP,其中键 -> 值对是’first’->’John’和’last’->’Doe’,那么可以通过字段名 [‘last’] 获取最后一个元素 | map () 例如 map<string, int> |
| ARRAY | 数组是一组具有相同类型和名称的变量的集合。这些变量称为数组的元素,每个数组元素都有一个编号,编号从零开始。例如,数组值为 [‘John’, ‘Doe’],那么第 2 个元素可以通过数组名 [1] 进行引用。 | Array () 例如 array <string> |
STRUCT 为结构体 为一个只有成员变量的类
class Peopel{
int age;
String name;
}
Peopel p
p.age = 10
p.name = 15
1
2
3
4
5
6
7
2
3
4
5
6
7
创建一个表
create table test(
name string,
friends array<string>,
children map<string, int>,
address struct<street:string, city:string>
)
row format delimited fields terminated by ',' -- 列分隔符
collection items terminated by '_' -- MAP STRUCT 和 ARRAY 的分隔符(数据分割符号)
map keys terminated by ':'; -- MAP中的key与value的分隔符
1
2
3
4
5
6
7
8
9
2
3
4
5
6
7
8
9
row format delimited fields terminated by ',' -- 列分隔符
collection items terminated by '_' --MAP STRUCT 和 ARRAY 的分隔符 (数据分割符号)
map keys terminated by ':' -- MAP 中的 key 与 value 的分隔符
lines terminated by '\n'; -- 行分隔符
# 上传文件到表数据中
# 从网页端上传

每个文件夹为一个表 直接把文本上传到文件夹 (表) 中
songsong,bingbing_lili,xiao song:18_xiaoxiao song:19,hui long guan_beijing
yangyang,caicai_susu,xiao yang:18_xiaoxiao yang:19,chao yang_beijing
1
2
2
# 从系统中上传到表
cd /opt/module/
mkdir datas
cd datas
1
2
3
2
3
l 在 hive 命令行总 load: data local inpath ' 本地文本路径 ' into table 表名;
从本地加载表
#在hive中
load data local inpath '/opt/module/datas/test.txt' into table test;
1
2
2
# 常用类型查询
普通类型 数组 map 结构体查询
select name,friends[1],children['xiao song'],address.street from test;
1
# 类型转化
隐式类型转换规则如下
任何整数类型都可以隐式地转换为一个范围更广的类型,如 TINYINT 可以转换成 INT,INT 可以转换成 BIGINT。
所有整数类型、FLOAT 和 STRING 类型都可以隐式地转换成 DOUBLE。如果 STRING 类型无法转换为 DOUBLE 则返回 NULL 如想强转为 int 则 cast ('1'as int)+2
TINYINT、SMALLINT、INT 都可以转换为 FLOAT。
BOOLEAN 类型不可以转换为任何其它的类型。
可以使用 CAST 操作显示进行数据类型强制转换
例如 CAST ('1' AS INT) 将把字符串 '1' 转换成整数 1;如果强制类型转换失败,如执行 CAST ('X' AS INT),表达式返回空值 NULL。
编辑 (opens new window)
上次更新: 2023/12/06, 01:31:48