Chiriri's blog Chiriri's blog
首页
  • Java

    • JavaSE
    • JavaEE
    • 设计模式
  • Python

    • Python
    • Python模块
    • 机器学习
  • Golang

    • Golang
    • gRPC
  • 服务器

    • Linux
    • MySQL
    • NoSQL
    • Kubernetes
  • 项目

    • 传智健康
    • 畅购商城
  • Hadoop生态

    • Hadoop
    • Zookeeper
    • Hive
    • Flume
    • Kafka
    • Azkaban
    • Hbase
    • Scala
    • Spark
    • Flink
  • 大数据项目

    • 离线数仓
  • 青训营

    • 第四届青训营
  • HTML

    • HTML
    • JavaScript
  • Vue

    • Vue2
    • TypeScript
    • Vue3
    • Uni-APP
  • 数据结构与算法
  • C语言
  • 考研数据结构
  • 计算机组成原理
  • 计算机操作系统
  • Java基础

    • Java基础
    • Java集合
    • JUC
    • JVM
  • 框架

    • Spring
    • Dubbo
    • Spring Cloud
  • 数据库

    • MySQL
    • Redis
    • Elasticesearch
  • 消息队列

    • RabbitMQ
    • RocketMQ
  • 408

    • 计算机网络
    • 操作系统
    • 算法
  • 分类
  • 标签
  • 归档
  • 导航站
GitHub (opens new window)

Iekr

苦逼后端开发
首页
  • Java

    • JavaSE
    • JavaEE
    • 设计模式
  • Python

    • Python
    • Python模块
    • 机器学习
  • Golang

    • Golang
    • gRPC
  • 服务器

    • Linux
    • MySQL
    • NoSQL
    • Kubernetes
  • 项目

    • 传智健康
    • 畅购商城
  • Hadoop生态

    • Hadoop
    • Zookeeper
    • Hive
    • Flume
    • Kafka
    • Azkaban
    • Hbase
    • Scala
    • Spark
    • Flink
  • 大数据项目

    • 离线数仓
  • 青训营

    • 第四届青训营
  • HTML

    • HTML
    • JavaScript
  • Vue

    • Vue2
    • TypeScript
    • Vue3
    • Uni-APP
  • 数据结构与算法
  • C语言
  • 考研数据结构
  • 计算机组成原理
  • 计算机操作系统
  • Java基础

    • Java基础
    • Java集合
    • JUC
    • JVM
  • 框架

    • Spring
    • Dubbo
    • Spring Cloud
  • 数据库

    • MySQL
    • Redis
    • Elasticesearch
  • 消息队列

    • RabbitMQ
    • RocketMQ
  • 408

    • 计算机网络
    • 操作系统
    • 算法
  • 分类
  • 标签
  • 归档
  • 导航站
GitHub (opens new window)
  • Hadoop

  • Zookeeper

  • Hive

    • 介绍
    • 环境
    • DBeaver
    • Hive 类型
      • 上传文件到表数据中
        • 从网页端上传
        • 从系统中上传到表
      • 常用类型查询
      • 类型转化
    • Hive 客户端命令
    • DDL数据定义
    • DML
    • 查询
    • 函数
    • 自定义函数
    • 压缩和存储
    • 企业优化
    • Hive实战merge
  • Flume

  • Kafka

  • Azkaban

  • Hbase

  • Scala

  • Spark

  • Flink

  • 离线数仓

  • 青训营

  • DolphinScheduler

  • Doris

  • 大数据
  • Hive
Iekr
2021-09-18
目录

Hive 类型

# Hive 类型

Hive 数据类型 Java 数据类型 长度 例子
TINYINT byte 1byte 有符号整数 20
SMALINT short 2byte 有符号整数 20
INT int 4byte 有符号整数 20
BIGINT long 8byte 有符号整数 20
BOOLEAN boolean 布尔类型,true 或者 false TRUE FALSE
FLOAT float 单精度浮点数 3.14159
DOUBLE double 双精度浮点数 3.14159
STRING string 字符系列。可以指定字符集。可以使用单引号或者双引号。 ‘now is the time’ “for all good men”
TIMESTAMP 时间类型
BINARY 字节数组
数据类型 描述 语法示例
STRUCT 和 c 语言中的 struct 类似,都可以通过 “点” 符号访问元素内容。例如,如果某个列的数据类型是 STRUCT {first STRING, last STRING}, 那么第 1 个元素可以通过字段.first 来引用。 struct () 例如 struct<street:string, city:string>
MAP MAP 是一组键 - 值对元组集合,使用数组表示法可以访问数据。例如,如果某个列的数据类型是 MAP,其中键 -> 值对是’first’->’John’和’last’->’Doe’,那么可以通过字段名 [‘last’] 获取最后一个元素 map () 例如 map<string, int>
ARRAY 数组是一组具有相同类型和名称的变量的集合。这些变量称为数组的元素,每个数组元素都有一个编号,编号从零开始。例如,数组值为 [‘John’, ‘Doe’],那么第 2 个元素可以通过数组名 [1] 进行引用。 Array () 例如 array <string>

STRUCT 为结构体 为一个只有成员变量的类

class Peopel{
    int age;
    String name;
}
Peopel p 
p.age = 10
p.name = 15
1
2
3
4
5
6
7

创建一个表

create table test(
name string,
friends array<string>,
children map<string, int>,
address struct<street:string, city:string>
)
row format delimited fields terminated by ','   -- 列分隔符
collection items terminated by '_'   -- MAP STRUCT 和 ARRAY 的分隔符(数据分割符号)
map keys terminated by ':';  -- MAP中的key与value的分隔符
1
2
3
4
5
6
7
8
9
  • row format delimited fields terminated by ',' -- 列分隔符

  • collection items terminated by '_' --MAP STRUCT 和 ARRAY 的分隔符 (数据分割符号)

  • map keys terminated by ':' -- MAP 中的 key 与 value 的分隔符

  • lines terminated by '\n'; -- 行分隔符

# 上传文件到表数据中

# 从网页端上传

image-20210918162052851

每个文件夹为一个表 直接把文本上传到文件夹 (表) 中

songsong,bingbing_lili,xiao song:18_xiaoxiao song:19,hui long guan_beijing
yangyang,caicai_susu,xiao yang:18_xiaoxiao yang:19,chao yang_beijing
1
2

# 从系统中上传到表

cd /opt/module/
mkdir datas
cd datas
1
2
3

l 在 hive 命令行总 load: data local inpath ' 本地文本路径 ' into table 表名;

从本地加载表

#在hive中
load data local inpath '/opt/module/datas/test.txt' into table test;
1
2

# 常用类型查询

普通类型 数组 map 结构体查询

select name,friends[1],children['xiao song'],address.street from test;
1

# 类型转化

隐式类型转换规则如下

  1. 任何整数类型都可以隐式地转换为一个范围更广的类型,如 TINYINT 可以转换成 INT,INT 可以转换成 BIGINT。

  2. 所有整数类型、FLOAT 和 STRING 类型都可以隐式地转换成 DOUBLE。如果 STRING 类型无法转换为 DOUBLE 则返回 NULL 如想强转为 int 则 cast ('1'as int)+2

  3. TINYINT、SMALLINT、INT 都可以转换为 FLOAT。

  4. BOOLEAN 类型不可以转换为任何其它的类型。

  5. 可以使用 CAST 操作显示进行数据类型强制转换

    例如 CAST ('1' AS INT) 将把字符串 '1' 转换成整数 1;如果强制类型转换失败,如执行 CAST ('X' AS INT),表达式返回空值 NULL。

编辑 (opens new window)
上次更新: 2023/12/06, 01:31:48
DBeaver
Hive 客户端命令

← DBeaver Hive 客户端命令→

最近更新
01
k8s
06-06
02
进程与线程
03-04
03
计算机操作系统概述
02-26
更多文章>
Theme by Vdoing | Copyright © 2022-2025 Iekr | Blog
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式