Chiriri's blog Chiriri's blog
首页
  • Java

    • JavaSE
    • JavaEE
    • 设计模式
  • Python

    • Python
    • Python模块
    • 机器学习
  • Golang

    • Golang
    • gRPC
  • 服务器

    • Linux
    • MySQL
    • NoSQL
    • Kubernetes
  • 项目

    • 传智健康
    • 畅购商城
  • Hadoop生态

    • Hadoop
    • Zookeeper
    • Hive
    • Flume
    • Kafka
    • Azkaban
    • Hbase
    • Scala
    • Spark
    • Flink
  • 大数据项目

    • 离线数仓
  • 青训营

    • 第四届青训营
  • HTML

    • HTML
    • JavaScript
  • Vue

    • Vue2
    • TypeScript
    • Vue3
    • Uni-APP
  • 数据结构与算法
  • C语言
  • 考研数据结构
  • 计算机组成原理
  • 计算机操作系统
  • Java基础

    • Java基础
    • Java集合
    • JUC
    • JVM
  • 框架

    • Spring
    • Dubbo
    • Spring Cloud
  • 数据库

    • MySQL
    • Redis
    • Elasticesearch
  • 消息队列

    • RabbitMQ
    • RocketMQ
  • 408

    • 计算机网络
    • 操作系统
    • 算法
  • 分类
  • 标签
  • 归档
  • 导航站
GitHub (opens new window)

Iekr

苦逼后端开发
首页
  • Java

    • JavaSE
    • JavaEE
    • 设计模式
  • Python

    • Python
    • Python模块
    • 机器学习
  • Golang

    • Golang
    • gRPC
  • 服务器

    • Linux
    • MySQL
    • NoSQL
    • Kubernetes
  • 项目

    • 传智健康
    • 畅购商城
  • Hadoop生态

    • Hadoop
    • Zookeeper
    • Hive
    • Flume
    • Kafka
    • Azkaban
    • Hbase
    • Scala
    • Spark
    • Flink
  • 大数据项目

    • 离线数仓
  • 青训营

    • 第四届青训营
  • HTML

    • HTML
    • JavaScript
  • Vue

    • Vue2
    • TypeScript
    • Vue3
    • Uni-APP
  • 数据结构与算法
  • C语言
  • 考研数据结构
  • 计算机组成原理
  • 计算机操作系统
  • Java基础

    • Java基础
    • Java集合
    • JUC
    • JVM
  • 框架

    • Spring
    • Dubbo
    • Spring Cloud
  • 数据库

    • MySQL
    • Redis
    • Elasticesearch
  • 消息队列

    • RabbitMQ
    • RocketMQ
  • 408

    • 计算机网络
    • 操作系统
    • 算法
  • 分类
  • 标签
  • 归档
  • 导航站
GitHub (opens new window)
  • Hadoop

  • Zookeeper

  • Hive

  • Flume

  • Kafka

  • Azkaban

    • Azkaban
    • 任务调度
    • 安装
    • Azkaban实战
      • Command 单一job案例
      • 多job工作流
      • MapReduce
      • hive
  • Hbase

  • Scala

  • Spark

  • Flink

  • 离线数仓

  • 青训营

  • DolphinScheduler

  • Doris

  • 大数据
  • Azkaban
Iekr
2021-11-23
目录

Azkaban实战

# Azkaban 实战

# Command 单一 job 案例

在 windows 环境,创建 job 描述文件,编辑内容如下

#command.job
type=command
command=mkdir /opt/module/test_azkaban
1
2
3

将此文件打包成 zip 不能带中文

image-20211123083346221

创建项目

image-20211123083501719

上传 zip 包

image-20211123083630641

执行

image-20211123083719757

image-20211123083740977

# 多 job 工作流

创建有依赖关系的多个 job 描述

第一个 job: foo.job

#foo.job
type=command
command=mkdir /opt/module/az
1
2
3

第二个 job:bar.job

#bar.job
type=command
dependencies=foo
command=touch /opt/module/az/test.txt
1
2
3
4

打包成 zip 包提交到 azkaban 中

image-20211123084339347

# MapReduce

#foo.job
type=command
command=yarn jar hadoop-mapreduce-examples-3.1.3.jar wordcount /input /output
1
2
3

注意 jar 包也要打包进 zip 中 一般我们使用自定义的 mapreduce

上传执行

# hive

hive.sql

use default;
drop table if exists aztest;
drop table if exists azres;
create external table aztest(id int,name string) row format delimited fields terminated by '\t'location '/student';
load data inpath '/aztest/hiveinput' into table aztest;
create table azres as select * from aztest;
insert overwrite directory '/aztest/hiveoutput' select count(1) from aztest;
1
2
3
4
5
6
7

hive.job

#hive.job
type=command
command=hive -f 'hive.sql'
1
2
3

打包上传并执行

编辑 (opens new window)
上次更新: 2023/12/06, 01:31:48
安装
Hbase

← 安装 Hbase→

最近更新
01
k8s
06-06
02
进程与线程
03-04
03
计算机操作系统概述
02-26
更多文章>
Theme by Vdoing | Copyright © 2022-2025 Iekr | Blog
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式