SeaTunnel 实战:Apache SeaTunnel Web 安装与部署

avatar
作者
筋斗云
阅读量:0

在这里插入图片描述

1. 准备工作

在开始本地运行前,您需要确保您已经安装了 SeaTunnel 所需要的软件:

  • 安装Java (Java 8 或 11, 其他高于Java 8的版本理论上也可以工作) 以及设置 JAVA_HOME。

2. 下载

进入 SeaTunnel 下载页面下载最新版本的发布版安装包,目前最新版本为 1.0.1 版本:

在这里插入图片描述

3. 安装

将下载的压缩包解压缩到指定目录下:

tar -zxvf apache-seatunnel-web-1.0.1-bin.tar.gz -C /opt/ 

创建软连接,便于升级:

ln -s apache-seatunnel-web-1.0.1-bin/ seatunnel-web 

设置 SeaTunnel Web 环境变量:

export SEATUNNEL_WEB_HOME=/opt/seatunnel-web export PATH=${SEATUNNEL_WEB_HOME}/bin:$PATH 

4. 配置

4.1 初始化数据库

初始化数据库有两种方式,一是使用官方提供的初始化脚本,二是直接运行初始化 SQL

4.1.1 使用官方提供的初始化脚本

官方提供了一个 init_sql.sh 初始化数据库的脚本,使用之前需要修改 seatunnel_server_env.sh 文件来修改环境变量:

export HOSTNAME="127.0.0.1" export PORT="3306" export USERNAME="root" export PASSWORD="root" 

如果环境变量有冲突需要改下环境变量的名字以及 init_sql.sh 中的环境变量的名字,可以加上前缀 SEATUNNELT_WEB_ 避免冲突。

修改环境变量之后运行 init_sql.sh 来初始化数据库。

4.1.2 直接运行初始化 SQL

init_sql.sh 初始化数据库的脚本核心是执行 seatunnel_server_mysql.sql

workDir=`dirname $0` workDir=`cd ${workDir};pwd`  source ${workDir}/seatunnel_server_env.sh  usage="Usage: seatunnel_server_env.sh must contain hostname/port/username/password."  if [[ ! -n "${HOSTNAME}" ]]  || [[ ! -n "${PORT}" ]] || [[ ! -n "${USERNAME}" ]] || [[ ! -n "${PASSWORD}" ]]; then     echo $usage     exit 1 fi  mysql -h${HOSTNAME} -P${PORT} -u${USERNAME} -p${PASSWORD} < ${workDir}/seatunnel_server_mysql.sql 

所以你也可以直接选择跳过 init_sql.sh 初始化数据库的脚本来执行 seatunnel_server_mysql.sql。例如,你可以使用 Navicat 导入执行:

在这里插入图片描述

导入执行完后创建的表如下所示:

在这里插入图片描述

4.2 修改端口与数据源

修改 conf/application.yml 配置文件来修改端口号以及 Web 访问数据库的数据源信息:

server:   port: 8801  spring:   application:     name: seatunnel   jackson:     date-format: yyyy-MM-dd HH:mm:ss   datasource:     driver-class-name: com.mysql.cj.jdbc.Driver     url: jdbc:mysql://localhost:3306/seatunnel?useSSL=false&useUnicode=true&characterEncoding=utf-8&allowMultiQueries=true&allowPublicKeyRetrieval=true     username: root     password: root   mvc:     pathmatch:       matching-strategy: ant_path_matcher 

4.3 配置引擎服务信息

复制引擎服务中配置文件到 Web 配置目录下面。将 hazelcast-client 配置文件拷贝到 Web 的 conf 目录下:

cp /opt/seatunnel/config/hazelcast-client.yaml /opt/seatunnel-web/conf/ 

将插件配置文件拷贝到 Web 的 conf 目录下:

cp /opt/seatunnel/connectors/plugin-mapping.properties /opt/seatunnel-web/conf/ 

4.4 配置 MySQL 驱动

在这我们选择 MySQL 作为元数据库,需要对应的驱动包放到 libs 下:

cp mysql-connector-java-8.0.16.jar /opt/seatunnel-web/libs/ 

4.5 配置数据源JAR包

下载 SeaTunnel Web 的源码,将 download_datasource.sh 拷贝到 script 目录下:

cp apache-seatunnel-web-1.0.1-src/seatunnel-server/seatunnel-app/src/main/bin/download_datasource.sh /opt/seatunnel-web/script/ 

根据你的需要选择需要下载的数据源,如果不下载在 Web 中配置数据源时会提示没有可用的数据源:

# get seatunnel web home SEATUNNEL_WEB_HOME=$(cd $(dirname $0);cd ../;pwd) DATASOURCE_DIR=${SEATUNNEL_WEB_HOME}/datasource  # If you don’t want to download a certain data source, you can delete the element below datasource_list=(   "datasource-plugins-api"   "datasource-elasticsearch"   "datasource-hive"   "datasource-jdbc-clickhouse"   "datasource-jdbc-hive"   "datasource-jdbc-mysql"   "datasource-jdbc-postgresql"   "datasource-jdbc-starrocks"   "datasource-jdbc-tidb"   "datasource-kafka"   "datasource-mysql-cdc"   "datasource-starrocks"   "datasource-mongodb" ) 

默认是从 mvvm 下载,可能下载速度很慢,我这边安装了 Maven 并且配置了阿里云仓库,因此将脚本中的 mvvm 命令替换为 mvn 命令改从 maven 中下载:

for i in "${datasource_list[@]}" do         echo "$i"         echo "Downloading datasource: " "$i"   /opt/maven/bin/mvn dependency:get -DgroupId=org.apache.seatunnel -DartifactId="$i" -Dversion="$version" -Ddest="$DATASOURCE_DIR" done 

“$SEATUNNEL_WEB_HOME”/mvnw -> /opt/maven/bin/mvn

下载之后的数据源 JAR 包存放于 datasource 目录下:

(base) localhost:datasource wy$ pwd /opt/seatunnel-web/datasource (base) localhost:datasource wy$ ll total 346456 drwxr-xr-x  15 wy  wheel        480 Jul 22 07:22 ./ drwxr-xr-x  15 wy  wheel        480 Jul 22 07:08 ../ -rw-r--r--   1 wy  wheel    4811050 Jul 22 07:11 datasource-elasticsearch-1.0.1.jar -rw-r--r--   1 wy  wheel  129470689 Jul 22 07:11 datasource-hive-1.0.1.jar -rw-r--r--   1 wy  wheel   23470082 Jul 22 07:11 datasource-jdbc-clickhouse-1.0.1.jar -rw-r--r--   1 wy  wheel     453216 Jul 22 07:11 datasource-jdbc-hive-1.0.1.jar -rw-r--r--   1 wy  wheel     455821 Jul 22 07:11 datasource-jdbc-mysql-1.0.1.jar -rw-r--r--   1 wy  wheel     456241 Jul 22 07:12 datasource-jdbc-postgresql-1.0.1.jar -rw-r--r--   1 wy  wheel      18031 Jul 22 07:12 datasource-jdbc-starrocks-1.0.1.jar -rw-r--r--   1 wy  wheel     455413 Jul 22 07:12 datasource-jdbc-tidb-1.0.1.jar -rw-r--r--   1 wy  wheel   14077433 Jul 22 07:17 datasource-kafka-1.0.1.jar -rw-r--r--   1 wy  wheel    2753901 Jul 22 07:22 datasource-mongodb-1.0.1.jar -rw-r--r--   1 wy  wheel     455430 Jul 22 07:22 datasource-mysql-cdc-1.0.1.jar -rw-r--r--   1 wy  wheel      20116 Jul 22 07:11 datasource-plugins-api-1.0.1.jar -rw-r--r--   1 wy  wheel     457666 Jul 22 07:22 datasource-starrocks-1.0.1.jar (base) localhost:datasource wy$ 

5. 启动 Web

启动 Web 之前,先启动 SeaTunnel:

sh bin/seatunnel-cluster.sh 

然后通过如下命令来启动 Web 服务:

sh bin/seatunnel-backend-daemon.sh start 

登录地址为 http://localhost:8801,此处的 8801 就是上述 application.yml 文件中配置的端口号。默认登录的用户名和密码为 admin/admin:

在这里插入图片描述
登录之后效果如下所示:

在这里插入图片描述

在上述配置数据源JAR包步骤之后就可以支持多种数据源的创建:

在这里插入图片描述

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!