Slurm Tutorial: Efficient Job Management for HPC

Overview

This repository provides a comprehensive guide to using the Slurm Workload Manager for running and managing jobs on High-Performance Computing (HPC) platforms. It covers essential Slurm commands, advanced features, and includes example scripts tailored to various use cases.

Basic Slurm Commands: Learn the foundational commands to submit, monitor, and manage jobs.
Job Dependencies: Understand how to define dependencies between jobs for complex workflows.
Job Arrays: Simplify large-scale, repetitive tasks with job arrays.
Advanced Topics: Explore additional techniques to enhance job management efficiency.

Example Scripts

The repository includes ready-to-use Slurm job scripts for different scenarios, such as:

Simple batch job submission
Running parallel jobs
Submitting job arrays
Submitting jobs with dependencies

Slurm Documentation

https://slurm.schedmd.com/

Slurm Commands

sinfo: Display compute partition and node information

sbatch: Sumbit a job script for remote execution

srun: Launch parallel tasks (job steps) for MPI jobs

salloc: Allocate resources for an interactive job

squeue: Display status of jobs and job steps

sprio: Display job priority information

scancel: Cancel pending or running jobs

sstat: Display status information for running jobs

sacct: Dispaly accounting information for past jobs

seff: Display job efficiency information for past jobs

scontrol: Display or modify Slurm configuration and state

Job Dependencies

Add #SBATCH --dependency=<type> to job script Or use

sbatch --dependency=<type> script.sh
sbatch --dependency=afterok:job_id script.sh
sbatch --dependency=afternotok:job_id script.sh
sbatch --dependency=afterany:job_id script.sh

Job Array

Job arrays offer a mechanism for submitting and managing collections of similar jobs quickly and easily

Acknowledgment

This tutorial was heavily inspired by the YouTube lecture:
Slurm Job Management
by the University of Southern California.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
ExampleScripts		ExampleScripts
README.md		README.md
Slurm-commands.md		Slurm-commands.md
node-split-cpmd-script.sh		node-split-cpmd-script.sh
runbatch_pbe		runbatch_pbe
script-1.sh		script-1.sh
script-arrays.md		script-arrays.md
script-arrays1.sh		script-arrays1.sh
script-arrays2.sh		script-arrays2.sh
summary_slurm.pdf		summary_slurm.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Slurm Tutorial: Efficient Job Management for HPC

Overview

Contents

Example Scripts

Slurm Documentation

Slurm Commands

Job Dependencies

Job Array

Examples

Acknowledgment

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Slurm Tutorial: Efficient Job Management for HPC

Overview

Contents

Example Scripts

Slurm Documentation

Slurm Commands

Job Dependencies

Job Array

Examples

Acknowledgment

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages