阅读量:0
在Ubuntu系统中搭建Slurm集群的步骤如下:
安装Slurm软件包: 在所有节点上安装Slurm软件包,可以使用以下命令:
sudo apt-get update sudo apt-get install slurm-wlm
配置Slurm集群:
- 在主节点上编辑Slurm配置文件
/etc/slurm/slurm.conf
,配置节点信息、用户信息、队列信息等。 - 在所有节点上创建Slurm工作目录,例如:
sudo mkdir -p /var/spool/slurmctld sudo mkdir -p /var/spool/slurmd sudo chown slurm: /var/spool/slurmctld sudo chown slurm: /var/spool/slurmd
- 在主节点上编辑Slurm配置文件
启动Slurm服务: 在主节点上启动Slurm控制节点服务:
sudo systemctl start slurmctld
在所有计算节点上启动Slurm工作节点服务:
sudo systemctl start slurmd
测试Slurm集群:
- 在主节点上使用
sinfo
命令查看集群状态:sinfo
- 在主节点上使用
srun
命令提交任务进行测试:srun -N2 hostname
- 在主节点上使用
以上是在Ubuntu系统中搭建Slurm集群的基本步骤,根据实际情况可能还需要进行其他配置和调整。建议参考Slurm官方文档以获取更详细的配置和使用说明。