Ubuntu系统中Slurm集群的搭建教程是什么

avatar
作者
猴君
阅读量:0

在Ubuntu系统中搭建Slurm集群的步骤如下:

  1. 安装Slurm软件包: 在所有节点上安装Slurm软件包,可以使用以下命令:

    sudo apt-get update sudo apt-get install slurm-wlm 
  2. 配置Slurm集群:

    • 在主节点上编辑Slurm配置文件 /etc/slurm/slurm.conf,配置节点信息、用户信息、队列信息等。
    • 在所有节点上创建Slurm工作目录,例如:
      sudo mkdir -p /var/spool/slurmctld sudo mkdir -p /var/spool/slurmd sudo chown slurm: /var/spool/slurmctld sudo chown slurm: /var/spool/slurmd 
  3. 启动Slurm服务: 在主节点上启动Slurm控制节点服务:

    sudo systemctl start slurmctld 

    在所有计算节点上启动Slurm工作节点服务:

    sudo systemctl start slurmd 
  4. 测试Slurm集群:

    • 在主节点上使用 sinfo 命令查看集群状态:
      sinfo 
    • 在主节点上使用 srun 命令提交任务进行测试:
      srun -N2 hostname 

以上是在Ubuntu系统中搭建Slurm集群的基本步骤,根据实际情况可能还需要进行其他配置和调整。建议参考Slurm官方文档以获取更详细的配置和使用说明。

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!