转载:KubeSphere 部署的 Kubernetes 集群使用 GlusterFS 存储实战入门
知识点
定级:入门级
GlusterFS 和 Heketi 简介
GlusterFS 安装部署
Heketi 安装部署
Kubernetes 命令行对接 GlusterFS
实战服务器配置(架构1:1复刻小规模生产环境,配置略有不同)
主机名 | IP | CPU | 内存 | 系统盘 | 数据盘 | 用途 |
---|---|---|---|---|---|---|
ks-master-0 | 192.168.9.91 | 2 | 4 | 50 | 100 | KubeSphere/k8s-master |
ks-master-1 | 192.168.9.92 | 2 | 4 | 50 | 100 | KubeSphere/k8s-master |
ks-master-2 | 192.168.9.93 | 2 | 4 | 50 | 100 | KubeSphere/k8s-master |
ks-worker-0 | 192.168.9.95 | 2 | 4 | 50 | 100 | k8s-worker/CI |
ks-worker-1 | 192.168.9.96 | 2 | 4 | 50 | 100 | k8s-worker |
ks-worker-2 | 192.168.9.97 | 2 | 4 | 50 | 100 | k8s-worker |
storage-0 | 192.168.9.81 | 2 | 4 | 50 | 100+ | ElasticSearch/GlusterFS/Ceph/Longhorn/NFS/ |
storage-1 | 192.168.9.82 | 2 | 4 | 50 | 100+ | ElasticSearch/GlusterFS/Ceph/Longhorn |
storage-2 | 192.168.9.83 | 2 | 4 | 50 | 100+ | ElasticSearch/GlusterFS/Ceph/Longhorn |
registry | 192.168.9.80 | 2 | 4 | 50 | 200 | Sonatype Nexus 3 |
合计 | 10 | 20 | 40 | 500 | 1100+ |
实战环境涉及软件版本信息
操作系统:openEuler 22.03 LTS SP2 x86_64
KubeSphere:3.3.2
Kubernetes:v1.24.12
Containerd:1.6.4
KubeKey: v3.0.8
GlusterFS:10.0-8
Heketi:v10.4.0
1. 简介
上一期实战课程,我们模拟真实的生产环境实战演示了如何使用 KubeKey 将新增 Worker 节点添加到已有的 Kubernetes 集群 。最终我们部署完成了一套 3 Master 和 3 Worker 节点的 Kubernetes 集群。
本期实战课程,我们将实战如何在 openEuler 22.03 LTS SP2 上安装部署 GlusterFS、Hekeiti 以及 Kubernetes 使用 in-tree storage driver 模式对接 GlusterFS 做为集群的后端存储。
1.1 GlusterFS 是什么?
GlusterFS 是一个开源的分布式文件系统,旨在提供可扩展性、高可用性和可靠性的网络文件系统。它通过将多个存储节点组合成一个统一的存储池,为用户提供一个统一的全局文件系统。GlusterFS 具有高扩展性、高可用性、高性能、可横向扩展等特点,并且其没有元数据服务器的设计,让整个服务没有单点故障的隐患。
以下是GlusterFS的主要优点:
可扩展性:GlusterFS 使用横向扩展的方法来增加存储容量和性能。它可以轻松地添加新的存储节点来满足不断增长的存储需求,无需停机或重配置。
高可用性:GlusterFS 利用分布式复制和数据条带化的技术,确保数据的冗余和可用性。如果一个存储节点发生故障,数据仍然可从其他节点访问,保证了高可用性和数据的持续性。
弹性和灵活性:GlusterFS 采用了无元数据服务器的分布式架构,使得存储池可以动态增加或减少。它可以根据需求自动平衡数据和负载,从而提供更好的性能和灵活性。
容错能力:GlusterFS 支持纠删码和存储池快照等高级功能,可以保护数据免受硬件故障和数据损坏的影响。这种容错能力可以提高数据的安全性和可靠性。
1.2 Heketi 是什么?
Kubernetes 使用 GlusterFS 作为后端存储的场景,多数都离不开 Heketi 的身影,那么 Heketi 是什么,充当了什么角色呢?
Heketi 提供了 RESTful 管理接口,能够在 OpenStack,Kubernetes,Openshift 等云平台上实现动态存储资源供应,可用于管理 GlusterFS 卷的生命周期 (动态在 GlusterFS 集群内选择 bricks 构建 volume),支持 GlusterFS 多集群管理。
Heketi 的目标是提供一种在多个存储群集中创建,列出和删除 GlusterFS 卷的简单方法。 Heketi 将智能地管理群集中整个磁盘的分配,创建和删除。
在满足任何请求之前,Heketi 首先需要了解集群的拓扑(topologies )也就是需要配置 topologies.json 文件 。 此 json 文件将数据资源组织为以下内容:群集、节点、设备的归属、以及块的归属。
Heketi-cli 命令行工具向 Heketi 提供需要管理的 GlusterFS 集群的信息。它通过变量 HEKETI_CLI_SERVER 来获取对应的 Heketi 服务端。
Heketi项目目前处于深度维护状态。这意味着项目维护团队只考虑包含关键的错误或安全缺陷。该项目已经在 Jul 7, 2023 被存档。
因此,在 2023 年的今天,选择 Heketi + GlusterFS 的组合不是一个好的选择,请根据需求仔细评估,谨慎选择。
1.3 Kubernets 官方文档对 GlusterFS 的相关说明
先看一组不同版本的官方文档对 GlusterFS 存储的介绍。
v1.24
v1.25
v1.26
v1.27
通过上面的图可以看出,Kubernet v1.24、v1.25 还是可以使用 GlusterFS的,到了 v1.26 开始 已经无法使用 in-tree storage driver 的方式使用 GlusterFS 存储。
但是,并不是说 Kubernetes 不再支持 GlusterFS 了,只是将 Driver 换成了 Container Storage Interface (CSI) volume plugins 模式,具体可以参考 gluster-csi-driver 官方文档。
对于 CSI 模式本文不做过多介绍,后期会专门做一期相关的实战课程。
1.4 Kubernetes 使用 GlusterFS 存储的方式
通过 Heketi 管理 GlusterFS,Kubernetes 调用 Heketi 的接口
GlusterFS 结合 NFS-Ganesha 提供 NFS 存储,Kubernetes 采用 NFS 的方式挂载
Kubernetes 挂载 GlusterFS 提供的数据卷到本地的存储目录,Kubernetes 采用 hostpatch 的方式
Container Storage Interface (CSI) volume plugins(更符合标准规范,可能是更好的选择)
1.5 Kubernetes 对接 GlusterFS 架构
2. 存储服务器初始化配置
请注意,以下操作无特殊说明时需在所有存储节点上执行。本文只选取 Storage-0 节点作为演示,并假定其余服务器都已按照相同的方式进行配置和设置。
2.1 配置主机名
hostnamectl hostname ks-storage-0
2.2 配置 hosts 文件
编辑 /etc/hosts 文件,将规划的服务器 IP 和主机名添加到文件中。
192.168.9.81 ks-storage-0 192.168.9.82 ks-storage-1 192.168.9.83 ks-storage-2
2.3 配置 DNS
echo "nameserver 114.114.114.114" > /etc/resolv.conf
2.4 配置服务器时区
配置服务器时区为 Asia/Shanghai。
timedatectl set-timezone Asia/Shanghai
验证服务器时区,正确配置如下。
[root@ks-storage-0 ~]# timedatectl Local time: Mon 2023-07-17 14:52:33 CST Universal time: Mon 2023-07-17 06:52:33 UTC RTC time: Mon 2023-07-17 06:52:33 Time zone: Asia/Shanghai (CST, +0800) System clock synchronized: yes NTP service: active RTC in local TZ: no
2.5 配置时间同步
安装 chrony 作为时间同步软件。
yum install chrony
修改配置文件 /etc/chrony.conf,修改 ntp 服务器配置。
vi /etc/chrony.conf # 删除所有的 pool 配置 pool pool.ntp.org iburst # 增加国内的 ntp 服务器,或是指定其他常用的时间服务器 pool cn.pool.ntp.org iburst # 上面的手工操作,也可以使用 sed 自动替换 sed -i 's/^pool pool.*/pool cn.pool.ntp.org iburst/g' /etc/chrony.conf
重启并设置 chrony 服务开机自启动。
systemctl enable chronyd --now
验证 chrony 同步状态。
# 执行查看命令 chronyc sourcestats -v # 正常的输出结果如下 [root@ks-storage-0 ~]# chronyc sourcestats -v .- Number of sample points in measurement set. / .- Number of residual runs with same sign. | / .- Length of measurement set (time). | | / .- Est. clock freq error (ppm). | | | / .- Est. error in freq. | | | | / .- Est. offset. | | | | | | On the -. | | | | | | samples. \ | | | | | | | Name/IP Address NP NR Span Frequency Freq Skew Offset Std Dev ============================================================================== time.neu.edu.cn 27 13 139m -0.281 0.837 -1133us 2519us time.cloudflare.com 22 12 127m -0.533 2.392 -10ms 4458us time.neu.edu.cn 32 17 105m +0.084 0.865 +94us 2046us time.cloudflare.com 21 10 155m -0.035 2.036 -4566us 5600us
2.6 关闭系统防火墙
systemctl stop firewalld && systemctl disable firewalld
2.7 禁用 SELinux
openEuler 22.03 SP2 最小化安装的系统默认启用了 SELinux,为了减少麻烦,我们所有的节点都禁用 SELinux。
# 使用 sed 修改配置文件,实现彻底的禁用 sed -i 's/^SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config # 使用命令,实现临时禁用,这一步其实不做也行,KubeKey 会自动配置 setenforce 0
2.8 安装系统工具包
yum install tar
2.9 配置 SSH 配置文件
所有节点必须要配置,否则,后面 Heketi 创建集群的时候会报错(报错信息详见问题4)!!!
echo PubkeyAcceptedKeyTypes=+ssh-rsa >> /etc/ssh/sshd_config echo HostKeyAlgorithms=+ssh-rsa >> /etc/ssh/sshd_config systemctl restart sshd
3. GlusterFS 安装配置
3.1 部署过程概览
安装配置 GlusterFS 服务采用 Ansible 自动化部署,主要包括以下操作步骤
配置 YUM 源
安装 GlusterFS
启动 glusterd 服务
配置可信池
3.2 安装 GlusterFS 服务
安装 GlusterFS 服务
openEuler 默认软件仓库里已经包含了 GlusterFS 相关软件包,无需额外配置。
# 查询 glusterfs-server 是否存在 yum search glusterfs-server # 安装 glusterfs-server yum install glusterfs-server
2.启动并设置开机自启动 glusterd 服务
systemctl enable glusterd --now
3.验证 GlusterFS 服务状态
验证服务状态
systemctl status glusterd
验证服务端口状态
ss -ntlup | grep glusterd
任务执行正确的输出结果如下:
# 服务状态 [root@ks-storage-0 ~]# systemctl status glusterd ● glusterd.service - GlusterFS, a clustered file-system server Loaded: loaded (/usr/lib/systemd/system/glusterd.service; enabled; vendor preset: disabled) Active: active (running) since Mon 2023-07-17 15:22:00 CST; 33s ago Docs: man:glusterd(8) Process: 2585 ExecStart=/usr/sbin/glusterd -p /var/run/glusterd.pid --log-level $LOG_LEVEL $GLU> Main PID: 2586 (glusterd) Tasks: 24 (limit: 21602) Memory: 16.3M CGroup: /system.slice/glusterd.service └─ 2586 /usr/sbin/glusterd -p /var/run/glusterd.pid --log-level INFO Jul 17 15:22:00 ks-storage-0 systemd[1]: Starting GlusterFS, a clustered file-system server... Jul 17 15:22:00 ks-storage-0 systemd[1]: Started GlusterFS, a clustered file-system server. # 服务端口状态 [root@ks-storage-0 ~]# ss -ntlup | grep glusterd tcp LISTEN 0 1024 0.0.0.0:24007 0.0.0.0:* users:(("glusterd",pid=2586,fd=13))
3.4 检测 GlusterFS 集群节点之间的连通性
在执行接下来的任务之前,利用 ping 验证 GlusterFS 集群节点之间的连通性。
利用节点 0,ping 测节点 1
$ ping ks-storege-1 -c 2 # 正确结果 [root@ks-storage-0 ~]# ping ks-storage-1 -c 2 PING ks-storage-1 (192.168.9.82) 56(84) bytes of data. 64 bytes from ks-storage-1 (192.168.9.82): icmp_seq=1 ttl=64 time=0.276 ms 64 bytes from ks-storage-1 (192.168.9.82): icmp_seq=2 ttl=64 time=0.324 ms --- ks-storage-1 ping statistics --- 2 packets transmitted, 2 received, 0% packet loss, time 1059ms rtt min/avg/max/mdev = 0.276/0.300/0.324/0.024 ms
利用节点 0,ping 测节点 2
$ ping ks-storage-2 -c 2 # 正确结果 [root@ks-storage-0 ~]# ping ks-storage-2 -c 2 PING ks-storage-2 (192.168.9.83) 56(84) bytes of data. 64 bytes from ks-storage-2 (192.168.9.83): icmp_seq=1 ttl=64 time=0.552 ms 64 bytes from ks-storage-2 (192.168.9.83): icmp_seq=2 ttl=64 time=0.346 ms --- ks-storage-2 ping statistics --- 2 packets transmitted, 2 received, 0% packet loss, time 1003ms rtt min/avg/max/mdev = 0.346/0.449/0.552/0.103 mstime 999ms rtt min/avg/max/mdev = 0.206/0.256/0.307/0.052 ms
3.5 配置可信池 (Configure the trusted pool)
使用管理命令 gluster 创建可信池子
gluster peer probe ks-storage-1 gluster peer probe ks-storage-2
任务执行正确的输出结果
[root@ks-storage-0 ~]# gluster peer probe ks-storage-1 peer probe: success [root@ks-storage-0 ~]# gluster peer probe ks-storage-2 peer probe: success
2.检查 Peer 状态
gluster peer status
任务执行正确的输出结果
[root@ks-storage-0 ~]# gluster peer status Number of Peers: 2 Hostname: ks-storage-1 Uuid: 0d1fd33c-d2ef-4f04-a9fe-82287066f56c State: Peer in Cluster (Connected) Hostname: ks-storage-2 Uuid: 5ea6d93f-6882-4928-9483-33068b05ece4 State: Peer in Cluster (Connected)
4. Heketi 安装配置
在 GlusterFs 服务器中任选一个节点部署 Heketi, 默认选择节点 0,ks-storage-0,也可以将 Heketi 独立部署
4.1 安装 Heketi
由于 openEuler 官方仓库并没有 heketi 的相关软件包,因此,本节选择手工安装 heketi 的方式。
在 GitHub heketi 发布页面下载最新的二进制发行包
cd /root wget https://github.com/heketi/heketi/releases/download/v10.4.0/heketi-v10.4.0
2.解压 heketi
tar xvf heketi-v10.4.0-release-10.linux.amd64.tar.gz cd heketi cp heketi heketi-cli /usr/bin/
3.创建服务启动用户
useradd -d /var/lib/heketi -s /sbin/nologin heketi
4.创建 heketi 服务配置文件目录
mkdir /etc/heketi
5.创建 hekiti system 服务文件
vi /usr/lib/systemd/system/heketi.service
[Unit] Description=Heketi Server [Service] Type=simple WorkingDirectory=/var/lib/heketi User=heketi ExecStart=/usr/bin/heketi --config=/etc/heketi/heketi.json Restart=on-failure StandardOutput=syslog StandardError=syslog [Install] WantedBy=multi-user.target
4.2 配置 Heketi
1.创建用于管理用的 SSH 密钥
ssh-keygen -N '' -t rsa -q -f /etc/heketi/heketi_key # 设置权限,否则后面会报错 chmod 0600 /etc/heketi/heketi_key.pub chown heketi.heketi /etc/heketi/heketi_key*
2.分发 pub 密钥到所有节点
ssh-copy-id -i /etc/heketi/heketi_key.pub root@ks-storage-0 ssh-copy-id -i /etc/heketi/heketi_key.pub root@ks-storage-1 ssh-copy-id -i /etc/heketi/heketi_key.pub root@ks-storage-2
3.验证免密登陆
ssh -i /etc/heketi/heketi_key root@ks-storage-0
4.创建 Heketi 服务配置文件
本文使用必要的配置项编写配置文件,更多的配置文件的写法和说明可以参考下载的源码中的示例。
vi /etc/heketi/heketi.json
{ "_port_comment": "Heketi Server Port Number", "port": "18080", "_use_auth": "Enable JWT authorization. Please enable for deployment", "use_auth": true, "_jwt": "Private keys for access", "jwt": { "_admin": "Admin has access to all APIs", "admin": { "key": "admin@P@88W0rd" }, "_user": "User only has access to /volumes endpoint", "user": { "key": "user@P@88W0rd" } }, "_glusterfs_comment": "GlusterFS Configuration", "glusterfs": { "_executor_comment": [ "Execute plugin. Possible choices: mock, ssh", "mock: This setting is used for testing and development.", " It will not send commands to any node.", "ssh: This setting will notify Heketi to ssh to the nodes.", " It will need the values in sshexec to be configured.", "kubernetes: Communicate with GlusterFS containers over", " Kubernetes exec api." ], "executor": "ssh", "_sshexec_comment": "SSH username and private key file information", "sshexec": { "keyfile": "/etc/heketi/heketi_key", "user": "root", "port": "22", "fstab": "/etc/fstab" }, "_kubeexec_comment": "Kubernetes configuration", "kubeexec": { "host" :"https://kubernetes.host:8443", "cert" : "/path/to/crt.file", "insecure": false, "user": "kubernetes username", "password": "password for kubernetes user", "namespace": "OpenShift project or Kubernetes namespace", "fstab": "Optional: Specify fstab file on node. Default is /etc/fstab" }, "_db_comment": "Database file name", "db": "/var/lib/heketi/heketi.db", "_loglevel_comment": [ "Set log level. Choices are:", " none, critical, error, warning, info, debug", "Default is warning" ], "loglevel" : "warning" } }
需要根据实际环境修改的参数说明
jwt.admin.key:连接 heketi 时,admin 用户的密码
jwt.user.key: 连接 heketi 时,user 用户的密码
port: heketi 服务的端口号
loglevel:唯一可选配置, log 日志输出的级别,开发环境可以设置为 debug,生产环境建议 warning
4.3 启动 Heketi 服务
启动并设置开机自动启动 heketi 服务
systemctl enable heketi --now
查看 heketi 服务状态
systemctl status heketi -l
服务正常启动结果
[root@ks-storage-0 ~]# systemctl status heketi -l ● heketi.service - Heketi Server Loaded: loaded (/usr/lib/systemd/system/heketi.service; enabled; vendor preset: disabled) Active: active (running) since Mon 2023-07-17 17:31:40 CST; 18s ago Main PID: 3320 (heketi) Tasks: 7 (limit: 21602) Memory: 7.2M CGroup: /system.slice/heketi.service └─ 3320 /usr/bin/heketi --config=/etc/heketi/heketi.json Jul 17 17:31:40 ks-storage-0 systemd[1]: Started Heketi Server. Jul 17 17:31:40 ks-storage-0 heketi[3320]: Heketi v10.4.0-release-10 (using go: go1.15.14) Jul 17 17:31:40 ks-storage-0 heketi[3320]: 2023/07/17 17:31:40 no SSH_KNOWN_HOSTS specified, skipping ssh host verification Jul 17 17:31:40 ks-storage-0 heketi[3320]: Listening on port 18080
查看接口状态
curl http://192.168.9.81:18080/hello
注意:192.168.9.81 为安装 heketi 服务的节点 IP,实际使用中注意替换。
接口正常输出结果
[root@ks-storage-0 ~]# curl http://192.168.9.81:18080/hello Hello from Heketi
4.4 配置存储
创建存储集群拓扑文件,该文件包含添加到 Heketi 的集群、节点和磁盘的信息。
vi /etc/heketi/topology.json
{ "clusters": [ { "nodes": [ { "node": { "hostnames": { "manage": [ "192.168.9.81" ], "storage": [ "192.168.9.81" ] }, "zone": 1 }, "devices": [ "/dev/sdb" ] }, { "node": { "hostnames": { "manage": [ "192.168.9.82" ], "storage": [ "192.168.9.82" ] }, "zone": 1 }, "devices": [ "/dev/sdb" ] }, { "node": { "hostnames": { "manage": [ "192.168.9.83" ], "storage": [ "192.168.9.83" ] }, "zone": 1 }, "devices": [ "/dev/sdb" ] } ] } ] }
说明:
manage 和 storage: 一定要填写对应节点 IP,使用主机名后面会报错。
devices:填写磁盘的全路径名称,可以写多个,一定要使用裸盘名不要使用分区名,也不需要给磁盘提前分区
2.根据拓扑文件创建集群
heketi-cli --server http://192.168.9.81:18080 --user admin --secret admin@P@88W0rd topology load --json=/etc/heketi/topology.json
正确的输出结果如下:
[root@ks-storage-0 ~]# heketi-cli --server http://192.168.9.81:18080 --user admin --secret admin@P@88W0rd topology load --json=/etc/heketi/topology.json Creating cluster ... ID: 9ad37206ce6575b5133179ba7c6e0935 Allowing file volumes on cluster. Allowing block volumes on cluster. Creating node 192.168.9.81 ... ID: 0108350a9d13578febbfd0502f8077ff Adding device /dev/sdb ... OK Creating node 192.168.9.82 ... ID: 5e99fe0cd727b8066f200bad5524c544 Adding device /dev/sdb ... OK Creating node 192.168.9.83 ... ID: 7bb26eb30c1c61456b5ae8d805c01cf1 Adding device /dev/sdb ... OK
3.配置heketi管理用环境变量
为了方便日后的运维管理,将 heketi-cli 的常用参数和命令组合成一条 alias 命令。
echo "alias heketi-cli='heketi-cli --server http://192.168.9.81:18080 --user admin --secret admin@P@88W0rd'" >> ~/.bashrc
验证 Alias 别名是否生效
source ~/.bashrc heketi-cli cluster list # 返回如下结果,说明配置成功 [root@ks-storage-0 ~]# heketi-cli cluster list Clusters: Id:9ad37206ce6575b5133179ba7c6e0935 [file][block]
4.5 功能验证测试
查看集群列表
[root@ks-storage-0 ~]# heketi-cli cluster list Clusters: Id:9ad37206ce6575b5133179ba7c6e0935 [file][block]
查看集群详细信息
[root@ks-storage-0 ~]# heketi-cli cluster info 9ad37206ce6575b5133179ba7c6e0935 Cluster id: 9ad37206ce6575b5133179ba7c6e0935 Nodes: 0108350a9d13578febbfd0502f8077ff 5e99fe0cd727b8066f200bad5524c544 7bb26eb30c1c61456b5ae8d805c01cf1 Volumes: Block: true File: true
查看集群节点列表
[root@ks-storage-0 ~]# heketi-cli node list Id:0108350a9d13578febbfd0502f8077ff Cluster:9ad37206ce6575b5133179ba7c6e0935 Id:5e99fe0cd727b8066f200bad5524c544 Cluster:9ad37206ce6575b5133179ba7c6e0935 Id:7bb26eb30c1c61456b5ae8d805c01cf1 Cluster:9ad37206ce6575b5133179ba7c6e0935
创建卷
# 创建一个2G大小3副本的卷 [root@ks-storage-0 ~]# heketi-cli volume create --size=2 --replica=3 Name: vol_2a8574593fc69b25cd6e2f5750655be2 Size: 2 Volume Id: 2a8574593fc69b25cd6e2f5750655be2 Cluster Id: 9ad37206ce6575b5133179ba7c6e0935 Mount: 192.168.9.81:vol_2a8574593fc69b25cd6e2f5750655be2 Mount Options: backup-volfile-servers=192.168.9.82,192.168.9.83 Block: false Free Size: 0 Reserved Size: 0 Block Hosting Restriction: (none) Block Volumes: [] Durability Type: replicate Distribute Count: 1 Replica Count: 3
查看创建的卷
[root@ks-storage-0 ~]# heketi-cli volume list Id:2a8574593fc69b25cd6e2f5750655be2 Cluster:9ad37206ce6575b5133179ba7c6e0935 Name:vol_2a8574593fc69b25cd6e2f5750655be2
查看服务器挂载点
[root@ks-storage-0 ~]# df -h Filesystem Size Used Avail Use% Mounted on devtmpfs 4.0M 0 4.0M 0% /dev tmpfs 1.7G 0 1.7G 0% /dev/shm tmpfs 682M 17M 666M 3% /run tmpfs 4.0M 0 4.0M 0% /sys/fs/cgroup /dev/mapper/openeuler-root 17G 1.6G 15G 10% / tmpfs 1.7G 0 1.7G 0% /tmp /dev/sda1 974M 151M 756M 17% /boot /dev/mapper/vg_9af38756fe916fced666fcd3de786c19-brick_d5bf4398fc579087ceb11cc5910c5215 2.0G 47M 2.0G 3% /var/lib/heketi/mounts/vg_9af38756fe916fced666fcd3de786c19/brick_d5bf4398fc579087ceb11cc5910c5215
挂载测试-挂载卷
[root@ks-storage-0 ~]# mount -t glusterfs 192.168.9.81:vol_2a8574593fc69b25cd6e2f5750655be2 /mnt/ # mount 命令中的 192.168.9.82:vol_a2a8574593fc69b25cd6e2f5750655be2 为上方 heketi-cli volum create 时,命令结果返回值 Mount 字段的值。 # 也可以使用 heketi-cli volume info 2a8574593fc69b25cd6e2f5750655be2 获取
查看挂载详情
[root@ks-storage-0 ~]# df -h Filesystem Size Used Avail Use% Mounted on devtmpfs 4.0M 0 4.0M 0% /dev tmpfs 1.7G 0 1.7G 0% /dev/shm tmpfs 682M 17M 666M 3% /run tmpfs 4.0M 0 4.0M 0% /sys/fs/cgroup /dev/mapper/openeuler-root 17G 1.6G 15G 10% / tmpfs 1.7G 0 1.7G 0% /tmp /dev/sda1 974M 151M 756M 17% /boot /dev/mapper/vg_9af38756fe916fced666fcd3de786c19-brick_d5bf4398fc579087ceb11cc5910c5215 2.0G 47M 2.0G 3% /var/lib/heketi/mounts/vg_9af38756fe916fced666fcd3de786c19/brick_d5bf4398fc579087ceb11cc5910c5215 192.168.9.81:vol_2a8574593fc69b25cd6e2f5750655be2
写入文件测试
[root@ks-storage-0 ~]# echo "`date` test write" >> /mnt/test.txt [root@ks-storage-0 ~]# cat /mnt/test.txt Tue Jul 18 02:47:25 PM CST 2023 test write
4.6 清理测试数据
测试完成后,删除测试卷。
删除测试卷
[root@ks-storage-0 ~]# umount /mnt/ [root@ks-storage-0 ~]# heketi-cli volume delete 2a8574593fc69b25cd6e2f5750655be2 Volume 2a8574593fc69b25cd6e2f5750655be2 deleted
查看测试挂载情况
[root@ks-storage-0 ~]# df -h Filesystem Size Used Avail Use% Mounted on devtmpfs 4.0M 0 4.0M 0% /dev tmpfs 1.7G 0 1.7G 0% /dev/shm tmpfs 682M 25M 658M 4% /run tmpfs 4.0M 0 4.0M 0% /sys/fs/cgroup /dev/mapper/openeuler-root 17G 1.6G 15G 10% / tmpfs 1.7G 0 1.7G 0% /tmp /dev/sda1 974M 151M 756M 17% /boot
5. K8s 集群对接 GlusterFS
如无特殊说明,所有涉及 k8s 的操作都在 master-0 节点上执行 , 操作根目录为 /srv/opsman/k8s-yaml
主要的操作过程包含:
安装 GlusterFS 客户端
创建 Secret
创建 StorageClass
创建测试 PVC
创建测试 POD
5.1 安装 glusterfs 客户端
所有 k8s 集群中的节点都需要安装。
yum install glusterfs-fuse -y
5.2 创建 heketi 使用的 Secret 的认证密码
创建 glusterfs 目录 , 并切换到该目录
mkdir -p /srv/opsman/k8s-yaml/glusterfs cd /srv/opsman/k8s-yaml/glusterfs
使用 base64 将密码转码生成 Secret key 使用的值 , 这里的密码为 heketi 配置文件中创建的用户密码
[root@ks-k8s-master-0 glusterfs]# echo -n "admin@P@88W0rd" | base64 YWRtaW5AUEA4OFcwcmQ=
创建 Secret 资源清单文件,执行
vi heketi-secret.yaml
apiVersion: v1 kind: Secret metadata: name: heketi-secret namespace: kube-system data: key: YWRtaW5AUEA4OFcwcmQ= type: kubernetes.io/glusterfs
创建资源
kubectl apply -f heketi-secret.yaml
验证资源
[root@ks-master-0 glusterfs]# kubectl get secrets heketi-secret -n kube-system NAME TYPE DATA AGE heketi-secret kubernetes.io/glusterfs 1 9s
5.3 创建 StorageClass
创建 StorageClass 资源清单文件,执行
vi heketi-storageclass.yaml
apiVersion: storage.k8s.io/v1 kind: StorageClass metadata: name: glusterfs namespace: kube-system parameters: resturl: "http://192.168.9.81:18080" clusterid: "9ad37206ce6575b5133179ba7c6e0935" restauthenabled: "true" restuser: "admin" secretName: "heketi-secret" secretNamespace: "kube-system" volumetype: "replicate:3" provisioner: kubernetes.io/glusterfs reclaimPolicy: Delete
参数说明
parameters.resturl: heketi 服务的管理地址
parameters.clusterid: 在 heketi 节点使用
heketi-cli cluster list
命令返回的集群 idparameters.restuser: heketi.json 配置文件中创建的用户名,默认 admin
parameters.secretName: k8s 中 Secret 资源定义中的 metadata.name
parameters.secretNamespace: k8s 中 Secret 资源定义中的 metadata.namespace
parameters.volumetype: 创建的卷类型和副本数,这里是 3 副本复制卷
创建资源
kubectl apply -f heketi-storageclass.yaml
验证资源
[root@ks-master-0 glusterfs]# kubectl get sc NAME PROVISIONER RECLAIMPOLICY VOLUMEBINDINGMODE ALLOWVOLUMEEXPANSION AGE glusterfs kubernetes.io/glusterfs Delete Immediate false 10s local (default) openebs.io/local Delete WaitForFirstConsumer false 163m
5.4 创建 pvc 测试
创建 pvc 资源清单文件,执行
vi heketi-pvc.yaml
apiVersion: v1 kind: PersistentVolumeClaim metadata: name: heketi-pvc-test annotations: volume.beta.kubernetes.io/storage-provisioner: kubernetes.io/glusterfs spec: storageClassName: "glusterfs" accessModes: - ReadWriteOnce resources: requests: storage: 1Gi
创建资源
kubectl apply -f heketi-pvc.yaml
验证资源
[root@ks-master-0 glusterfs]# kubectl get pvc -o wide NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE VOLUMEMODE heketi-pvc-test Bound pvc-ea179e62-a35c-4f60-8038-c80d0832823b 1Gi RWO glusterfs 9s Filesystem
注意:创建的 pvc 的状态,如果是 Pending,说明连接存储有问题
[root@ks-master-0 glusterfs]# kubectl get pvc -o wide NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE VOLUMEMODE heketi-pvc-test Pending glusterfs 9s Filesystem
查看 SVC
[root@ks-master-0 glusterfs]# kubectl get svc -o wide NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE SELECTOR glusterfs-dynamic-ea179e62-a35c-4f60-8038-c80d0832823b ClusterIP 10.233.50.196 <none> 1/TCP 54s <none> kubernetes ClusterIP 10.233.0.1 <none> 443/TCP 3h29m <none>
5.5 创建测试 Pod 挂载 pvc
创建 Pod 资源清单文件,执行
vi heketi-pod.yaml
kind: Pod apiVersion: v1 metadata: name: heketi-pod-test spec: containers: - name: heketi-container image: busybox command: - sleep - "3600" volumeMounts: - name: heketi-volume mountPath: "/pv-data" readOnly: false volumes: - name: heketi-volume persistentVolumeClaim: claimName: heketi-pvc-test
创建资源
kubectl apply -f heketi-pod.yaml
验证资源
[root@ks-master-0 glusterfs]# kubectl get pods -o wide NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES heketi-pod-test 1/1 Running 0 18s 10.233.118.1 ks-worker-2 <none> <none>
查看 Pod 中磁盘挂载情况
[root@ks-master-0 glusterfs]# kubectl exec heketi-pod-test -- df -h Filesystem Size Used Available Use% Mounted on overlay 16.6G 3.7G 12.0G 23% / tmpfs 64.0M 0 64.0M 0% /dev tmpfs 1.7G 0 1.7G 0% /sys/fs/cgroup 192.168.9.82:vol_308eec3ff24a3684b4f63c67c7d52412 1006.0M 49.8M 956.2M 5% /pv-data /dev/mapper/openeuler-root 16.6G 3.7G 12.0G 23% /etc/hosts /dev/mapper/openeuler-root 16.6G 3.7G 12.0G 23% /dev/termination-log /dev/mapper/openeuler-root 16.6G 3.7G 12.0G 23% /etc/hostname /dev/mapper/openeuler-root 16.6G 3.7G 12.0G 23% /etc/resolv.conf shm 64.0M 0 64.0M 0% /dev/shm tmpfs 2.7G 12.0K 2.7G 0% /var/run/secrets/kubernetes.io/serviceaccount tmpfs 1.7G 0 1.7G 0% /proc/acpi tmpfs 64.0M 0 64.0M 0% /proc/kcore tmpfs 64.0M 0 64.0M 0% /proc/keys tmpfs 64.0M 0 64.0M 0% /proc/timer_list tmpfs 64.0M 0 64.0M 0% /proc/sched_debug tmpfs 1.7G 0 1.7G 0% /proc/scsi tmpfs 1.7G 0 1.7G 0% /sys/firmware
登录 Pod 所在的节点,查看磁盘挂载情况
SSH 登录到节点 ks-worker-2。
[root@ks-worker-2 ~]# df -h Filesystem Size Used Avail Use% Mounted on devtmpfs 4.0M 0 4.0M 0% /dev tmpfs 1.7G 0 1.7G 0% /dev/shm tmpfs 682M 9.6M 673M 2% /run tmpfs 4.0M 0 4.0M 0% /sys/fs/cgroup /dev/mapper/openeuler-root 17G 3.7G 13G 24% / tmpfs 1.7G 0 1.7G 0% /tmp /dev/sda1 974M 151M 756M 17% /boot shm 64M 0 64M 0% /run/containerd/io.containerd.grpc.v1.cri/sandboxes/e18f876d9e4de19985cd47e0c07e28b70c8cd65eac17a0d3e9d17da0715dd1fa/shm overlay 17G 3.7G 13G 24% /run/containerd/io.containerd.runtime.v2.task/k8s.io/e18f876d9e4de19985cd47e0c07e28b70c8cd65eac17a0d3e9d17da0715dd1fa/rootfs overlay 17G 3.7G 13G 24% /run/containerd/io.containerd.runtime.v2.task/k8s.io/83c6f14ac6d4ff38cd46499f3b95bb4b4d421badb49b322373eedf1eb906fc1d/rootfs tmpfs 170M 12K 170M 1% /var/lib/kubelet/pods/e10e996f-ef79-4d3a-87a3-fad668070894/volumes/kubernetes.io~projected/kube-api-access-w8pk6 tmpfs 2.7G 12K 2.7G 1% /var/lib/kubelet/pods/8ddc8c7c-88ee-41c2-9fb8-8535a02d3e21/volumes/kubernetes.io~projected/kube-api-access-rdrlx shm 64M 0 64M 0% /run/containerd/io.containerd.grpc.v1.cri/sandboxes/c47815a2e729725b1dfb5f80265a2fbf32c6ae1149515cdb02ecce90d609014c/shm tmpfs 600M 12K 600M 1% /var/lib/kubelet/pods/d771e322-79a1-4e40-9347-85db30d864e0/volumes/kubernetes.io~projected/kube-api-access-94wt8 overlay 17G 3.7G 13G 24% /run/containerd/io.containerd.runtime.v2.task/k8s.io/c47815a2e729725b1dfb5f80265a2fbf32c6ae1149515cdb02ecce90d609014c/rootfs shm 64M 0 64M 0% /run/containerd/io.containerd.grpc.v1.cri/sandboxes/beb9d1a35c92ee556470bbb8a081aaad84d5b2a1aa476ece85d96efd7a27aa50/shm overlay 17G 3.7G 13G 24% /run/containerd/io.containerd.runtime.v2.task/k8s.io/beb9d1a35c92ee556470bbb8a081aaad84d5b2a1aa476ece85d96efd7a27aa50/rootfs tmpfs 2.7G 12K 2.7G 1% /var/lib/kubelet/pods/efc3ad2a-298f-4b0b-a560-db27d33292ac/volumes/kubernetes.io~projected/kube-api-access-hml7k overlay 17G 3.7G 13G 24% /run/containerd/io.containerd.runtime.v2.task/k8s.io/f8cb26e1641b56c0c80d69bb75266aeaa1ed9cbeaa5b19f5feba97c7953b2d0d/rootfs shm 64M 0 64M 0% /run/containerd/io.containerd.grpc.v1.cri/sandboxes/a09a1428ce0f56562c66f5d47a053171c6a2b262220a02241434da2a2f439c04/shm overlay 17G 3.7G 13G 24% /run/containerd/io.containerd.runtime.v2.task/k8s.io/a09a1428ce0f56562c66f5d47a053171c6a2b262220a02241434da2a2f439c04/rootfs shm 64M 0 64M 0% /run/containerd/io.containerd.grpc.v1.cri/sandboxes/4cfa7ba601638ca8a195a86c265246874d0bf3c5d1c7b1ecd26229f95b223285/shm overlay 17G 3.7G 13G 24% /run/containerd/io.containerd.runtime.v2.task/k8s.io/4cfa7ba601638ca8a195a86c265246874d0bf3c5d1c7b1ecd26229f95b223285/rootfs overlay 17G 3.7G 13G 24% /run/containerd/io.containerd.runtime.v2.task/k8s.io/47b70d46a13b3f63434ace89cbe9ba0fb895d35bef35f53d3b55449e05910562/rootfs tmpfs 2.7G 12K 2.7G 1% /var/lib/kubelet/pods/729df129-5adb-4080-82c3-51f9ff206b65/volumes/kubernetes.io~projected/kube-api-access-4tpsv overlay 17G 3.7G 13G 24% /run/containerd/io.containerd.runtime.v2.task/k8s.io/91a3b0efd570cefcc7609e579af3db7e3491cb5205e8c77236d4cc520b988472/rootfs overlay 17G 3.7G 13G 24% /run/containerd/io.containerd.runtime.v2.task/k8s.io/8d9cb96afc1be06f3214c1887b30bbccbbdd0d73124eaf7ce76e56b731239a5f/rootfs 192.168.9.82:vol_308eec3ff24a3684b4f63c67c7d52412 1006M 50M 957M 5% /var/lib/kubelet/pods/729df129-5adb-4080-82c3-51f9ff206b65/volumes/kubernetes.io~glusterfs/pvc-ea179e62-a35c-4f60-8038-c80d0832823b overlay 17G 3.7G 13G 24% /run/containerd/io.containerd.runtime.v2.task/k8s.io/656b76fdf7d615bd467a1697a741f7933982d69b6520ab0a603bcd74f3a72e5b/rootfs shm 64M 0 64M 0% /run/containerd/io.containerd.grpc.v1.cri/sandboxes/83e3b8baec8fa7f386f0cff2be3c158d5b491848fee942f29f01c44eaa0fe724/shm overlay 17G 3.7G 13G 24% /run/containerd/io.containerd.runtime.v2.task/k8s.io/83e3b8baec8fa7f386f0cff2be3c158d5b491848fee942f29f01c44eaa0fe724/rootfs overlay 17G 3.7G 13G 24% /run/containerd/io.containerd.runtime.v2.task/k8s.io/1c12ffabfb40427232063c51a267cb314e4d1e16a2fe8324f18df407a0f15aa3/rootfs
5.6 登录存储服务器查看底层变化
SSH 登录到节点 ks-storage-0
$ ssh ks-storage-0
查看卷的信息
[root@ks-storage-0 ~]# heketi-cli volume list Id:308eec3ff24a3684b4f63c67c7d52412 Cluster:9ad37206ce6575b5133179ba7c6e0935 Name:vol_308eec3ff24a3684b4f63c67c7d52412 [root@ks-storage-0 ~]# heketi-cli volume info 308eec3ff24a3684b4f63c67c7d52412 Name: vol_308eec3ff24a3684b4f63c67c7d52412 Size: 1 Volume Id: 308eec3ff24a3684b4f63c67c7d52412 Cluster Id: 9ad37206ce6575b5133179ba7c6e0935 Mount: 192.168.9.81:vol_308eec3ff24a3684b4f63c67c7d52412 Mount Options: backup-volfile-servers=192.168.9.82,192.168.9.83 Block: false Free Size: 0 Reserved Size: 0 Block Hosting Restriction: (none) Block Volumes: [] Durability Type: replicate Distribute Count: 1 Replica Count: 3 Snapshot Factor: 1.00
查看 VG 信息
[root@ks-storage-0 ~]# vgdisplay --- Volume group --- VG Name vg_9af38756fe916fced666fcd3de786c19 System ID Format lvm2 Metadata Areas 1 Metadata Sequence No 14 VG Access read/write VG Status resizable MAX LV 0 Cur LV 2 Open LV 1 Max PV 0 Cur PV 1 Act PV 1 VG Size 99.87 GiB PE Size 4.00 MiB Total PE 25567 Alloc PE / Size 260 / <1.02 GiB Free PE / Size 25307 / <98.86 GiB VG UUID jrxfIv-Fnjq-IYF8-aubc-t2y0-zwUp-YxjkDC
查看 LV 信息
[root@ks-storage-0 ~]# lvdisplay --- Logical volume --- LV Name tp_75a46d674329f9f64bdce45666679172 VG Name vg_9af38756fe916fced666fcd3de786c19 LV UUID D2eUjQ-JMW1-zken-0wGd-OV0C-0Cdf-0fJb33 LV Write Access read/write (activated read only) LV Creation host, time ks-storage-0, 2023-07-18 14:52:04 +0800 LV Pool metadata tp_75a46d674329f9f64bdce45666679172_tmeta LV Pool data tp_75a46d674329f9f64bdce45666679172_tdata LV Status available # open 0 LV Size 1.00 GiB Allocated pool data 2.00% Allocated metadata 10.45% Current LE 256 Segments 1 Allocation inherit Read ahead sectors auto - currently set to 8192 Block device 253:5 --- Logical volume --- LV Path /dev/vg_9af38756fe916fced666fcd3de786c19/brick_c74a94a24dd04c89cefd8e8c7e5f9aeb LV Name brick_c74a94a24dd04c89cefd8e8c7e5f9aeb VG Name vg_9af38756fe916fced666fcd3de786c19 LV UUID PaQuh1-2LTW-BGBL-QBBb-RZXf-szid-gVsRPz LV Write Access read/write LV Creation host, time ks-storage-0, 2023-07-18 14:52:04 +0800 LV Pool name tp_75a46d674329f9f64bdce45666679172 LV Status available # open 1 LV Size 1.00 GiB Mapped size 2.00% Current LE 256 Segments 1 Allocation inherit Read ahead sectors auto - currently set to 8192 Block device 253:6 ... 下面是操作系统的 lv 信息,忽略展示
5.7 KubeSphere 管理控制台查验
接下来我们看几张图,看一下在底层创建的存储资源在 KubeSphere 管理控制台中能展示哪些,又是如何展示的?
存储类
持久卷声明
服务
5.8 清理测试资源
清理测试的 Pod、pvc
kubectl delete -f heketi-pod.yaml -f heketi-pvc.yaml
至此,我们完成了 GlusterFS 安装配置、初始化,Heketi 安装配置、集群创建,实现了 Kubernetes 集群和 GlusterFS 存储的对接,并验证测试了存储卷的创建和使用。
6. 常见问题
问题 1
报错信息
[root@ks-storage-0 heketi]# ssh-copy-id -i /etc/heketi/heketi_key.pub root@ks-storeage-0 /usr/bin/ssh-copy-id: INFO: Source of key(s) to be installed: "/etc/heketi/heketi_key.pub" mktemp: failed to create directory via template ‘/root/.ssh/ssh-copy-id.XXXXXXXXXX’: No such file or directory /usr/bin/ssh-copy-id: ERROR: failed to create required temporary directory under ~/.ssh
解决方案
# 在 /root/.ssh/ 生成一套密钥对 ssh-keygen -t ed25519
问题 2
报错信息
[root@ks-storage-0 heketi]# ssh -i /etc/heketi/heketi_key.pub root@ks-storage-0 Authorized users only. All activities may be monitored and reported. @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ @ WARNING: UNPROTECTED PRIVATE KEY FILE! @ @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ Permissions 0644 for '/etc/heketi/heketi_key.pub' are too open. It is required that your private key files are NOT accessible by others. This private key will be ignored. Load key "/etc/heketi/heketi_key.pub": bad permissions root@ks-storage-0's password:
解决方案
# 设置 pub 密钥权限 chmod 0600 /etc/heketi/heketi_key.pub
问题 3
报错信息
[root@ks-storage-0 ~]# systemctl status heketi -l × heketi.service - Heketi Server Loaded: loaded (/usr/lib/systemd/system/heketi.service; enabled; vendor preset: disabled) Active: failed (Result: exit-code) since Mon 2023-07-17 17:29:01 CST; 38s ago Process: 3297 ExecStart=/usr/bin/heketi --config=/etc/heketi/heketi.json (code=exited, status=1/FAILURE) Main PID: 3297 (code=exited, status=1/FAILURE) Jul 17 17:29:00 ks-storage-0 systemd[1]: heketi.service: Main process exited, code=exited, status=1/FAILURE Jul 17 17:29:00 ks-storage-0 systemd[1]: heketi.service: Failed with result 'exit-code'. Jul 17 17:29:01 ks-storage-0 systemd[1]: heketi.service: Scheduled restart job, restart counter is at 5. Jul 17 17:29:01 ks-storage-0 systemd[1]: Stopped Heketi Server. Jul 17 17:29:01 ks-storage-0 systemd[1]: heketi.service: Start request repeated too quickly. Jul 17 17:29:01 ks-storage-0 systemd[1]: heketi.service: Failed with result 'exit-code'. Jul 17 17:29:01 ks-storage-0 systemd[1]: Failed to start Heketi Server. [root@ks-storage-0 ~]# tail /var/log/messages Jul 17 17:29:00 MiWiFi-RA67-srv heketi[3297]: [cmdexec] ERROR 2023/07/17 17:29:00 heketi/executors/sshexec/sshexec.go:137:sshexec.NewSshExecutor: Unable to read private key file Jul 17 17:29:00 MiWiFi-RA67-srv heketi[3297]: [heketi] ERROR 2023/07/17 17:29:00 heketi/apps/glusterfs/app.go:158:glusterfs.(*App).setup: Unable to read private key file Jul 17 17:29:00 MiWiFi-RA67-srv heketi[3297]: ERROR: Unable to start application: Unable to read private key file Jul 17 17:29:00 MiWiFi-RA67-srv systemd[1]: heketi.service: Main process exited, code=exited, status=1/FAILURE Jul 17 17:29:00 MiWiFi-RA67-srv systemd[1]: heketi.service: Failed with result 'exit-code'. Jul 17 17:29:01 MiWiFi-RA67-srv systemd[1]: heketi.service: Scheduled restart job, restart counter is at 5. Jul 17 17:29:01 MiWiFi-RA67-srv systemd[1]: Stopped Heketi Server. Jul 17 17:29:01 MiWiFi-RA67-srv systemd[1]: heketi.service: Start request repeated too quickly. Jul 17 17:29:01 MiWiFi-RA67-srv systemd[1]: heketi.service: Failed with result 'exit-code'. Jul 17 17:29:01 MiWiFi-RA67-srv systemd[1]: Failed to start Heketi Server.
解决方案
# 将 heketi 专用的密钥对的权限属主改为 heketi chown heketi.heketi /etc/heketi/heketi_key*
问题 4
报错信息
[root@ks-storage-0 ~]# heketi-cli --server http://192.168.9.81:18080 --user admin --secret admin@P@88W0rd topology load --json=/etc/heketi/topology.json Creating cluster ... ID: bd753ae13ba74771436f3598da4ec3ad Allowing file volumes on cluster. Allowing block volumes on cluster. Creating node 192.168.9.81 ... Unable to create node: New Node doesn't have glusterd running Creating node 192.168.9.82 ... Unable to create node: New Node doesn't have glusterd running Creating node 192.168.9.83 ... Unable to create node: New Node doesn't have glusterd running [root@ks-storage-0 ~]# tail /var/log/messages Jul 18 08:30:15 ks-storage-0 heketi[768]: [cmdexec] INFO 2023/07/18 08:30:15 Check Glusterd service status in node ks-storage-0 Jul 18 08:30:15 ks-storage-0 sshd[1548]: Connection from 192.168.9.81 port 60910 on 192.168.9.81 port 22 rdomain "" Jul 18 08:30:15 ks-storage-0 sshd[1548]: userauth_pubkey: key type ssh-rsa not in PubkeyAcceptedAlgorithms [preauth] Jul 18 08:30:15 ks-storage-0 heketi[768]: [cmdexec] WARNING 2023/07/18 08:30:15 Failed to create SSH connection to ks-storage-0:22: ssh: handshake failed: ssh: unable to authenticate, attempted methods [none publickey], no supported methods remain Jul 18 08:30:15 ks-storage-0 heketi[768]: [cmdexec] ERROR 2023/07/18 08:30:15 heketi/executors/cmdexec/peer.go:80:cmdexec.(*CmdExecutor).GlusterdCheck: ssh: handshake failed: ssh: unable to authenticate, attempted methods [none publickey], no supported methods remain Jul 18 08:30:15 ks-storage-0 heketi[768]: [heketi] ERROR 2023/07/18 08:30:15 heketi/apps/glusterfs/app_node.go:107:glusterfs.(*App).NodeAdd: ssh: handshake failed: ssh: unable to authenticate, attempted methods [none publickey], no supported methods remain Jul 18 08:30:15 ks-storage-0 heketi[768]: [heketi] ERROR 2023/07/18 08:30:15 heketi/apps/glusterfs/app_node.go:108:glusterfs.(*App).NodeAdd: New Node doesn't have glusterd running Jul 18 08:30:15 ks-storage-0 heketi[768]: [negroni] 2023-07-18T08:30:15+08:00 | 400 | #011 44.521205ms | 192.168.9.81:18080 | POST /nodes Jul 18 08:30:15 ks-storage-0 sshd[1548]: Connection closed by authenticating user root 192.168.9.81 port 60910 [preauth]
解决方案
echo PubkeyAcceptedKeyTypes=+ssh-rsa >> /etc/ssh/sshd_config echo HostKeyAlgorithms=+ssh-rsa >> /etc/ssh/sshd_config
问题 5
报错信息
Warning ProvisioningFailed 15s (x9 over 2m3s) persistentvolume-controller no volume plugin matched name: kubernetes.io/glusterfs
解决方案
Kubernetes 从 v1.26 开始已经不再支持 GlusterFS
# 参考官方文档说明 https://kubernetes.io/docs/concepts/storage/volumes/#types-of-volume glusterfs (removed) Kubernetes 1.27 does not include a glusterfs volume type. The GlusterFS in-tree storage driver was deprecated in the Kubernetes v1.25 release and then removed entirely in the v1.26 release. 问题 6
问题 6
报错信息
[root@ks-master-0 glusterfs]# kubectl get pvc -o wide NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE VOLUMEMODE heketi-pvc-test Pending glusterfs 9s Filesystem [root@ks-master-0 glusterfs]# kubectl describe pvc heketi-pvc-test Name: heketi-pvc-test Namespace: default StorageClass: glusterfs Status: Pending Volume: Labels: <none> Annotations: volume.beta.kubernetes.io/storage-provisioner: kubernetes.io/glusterfs volume.kubernetes.io/storage-provisioner: kubernetes.io/glusterfs Finalizers: [kubernetes.io/pvc-protection] Capacity: Access Modes: VolumeMode: Filesystem Used By: <none> Events: Type Reason Age From Message ---- ------ ---- ---- ------- Warning ProvisioningFailed 12s persistentvolume-controller Failed to provision volume with StorageClass "glusterfs": failed to create volume: failed to get cluster nodes for volume Name: vol_fe3dbcb8154016cb66df102b9b7bc6e6 Size: 1 Volume Id: fe3dbcb8154016cb66df102b9b7bc6e6 Cluster Id: 33da3c174f3ff5c6229e3ed7724689c5 Mount: ks-storage-2:vol_fe3dbcb8154016cb66df102b9b7bc6e6 Mount Options: backup-volfile-servers=ks-storage-1,ks-storage-0 Block: false Free Size: 0 Reserved Size: 0 Block Hosting Restriction: (none) Block Volumes: [] Durability Type: replicate Distributed+Replica: 3 Snapshot Factor: 1.00 : glusterfs server node ip address ks-storage-2 must be a valid IP address, (e.g. 10.9.8.7) Warning ProvisioningFailed 5s persistentvolume-controller Failed to provision volume with StorageClass "glusterfs": failed to create volume: failed to get cluster nodes for volume Name: vol_458d384e96350924d62565f6bdde801f Size: 1 Volume Id: 458d384e96350924d62565f6bdde801f Cluster Id: 33da3c174f3ff5c6229e3ed7724689c5 Mount: ks-storage-2:vol_458d384e96350924d62565f6bdde801f Mount Options: backup-volfile-servers=ks-storage-1,ks-storage-0 Block: false Free Size: 0 Reserved Size: 0 Block Hosting Restriction: (none) Block Volumes: [] Durability Type: replicate Distributed+Replica: 3 Snapshot Factor: 1.00 : glusterfs server node ip address ks-storage-2 must be a valid IP address, (e.g. 10.9.8.7)
解决方案
在利用 Heketi 创建 topology 集群的时候,node.hostnames 的配置使用 IP 地址的形式,不要使用主机名。
注意:这个解决方案只是我在实战的时候遇到并解决的经验,不具有唯一性,可能有其他更好的解决方案。
结束语
本文主要实战演示了在 openEuler 22.03 LTS SP2 安装配置 GlusterFS、Heketi 的详细过程,同时,也详细讲解了 Kubernetes 使用 in-tree storage driver 的模式对接 GlusterFS 的流程、方法、相关技术细节以及常见问题。
本文的操作虽然是基于 openEuler 22.03 LTS SP2,但是整个操作流程同样适用于其他操作系统。
至此,我们搭建完成了 3 Master 和 3 Worker 的 Kubernetes集群,同时,对接了 GlusterFS 作为集群的后端存储。