IITG2406-01_JobScheduler (Project 3)

Dev: Aman [iitgcs_24061213]

Overview

This program is a distributed job scheduling simulator designed to evaluate multiple scheduling policies across a simulated cluster of worker nodes. This system models real-world scheduling scenarios by managing CPU and memory allocation, allowing for performance analysis with various queueing and resource allocation strategies.

System Architecture

Infrastructure

128 Worker Nodes
24 CPU Cores per Node
64 GB RAM per Node
Distributed Resource Management

Core Components

Job Class

The Job class defines individual jobs with the following attributes and functionalities:

Attributes:
- jobId: Unique identifier
- arrivalTime & timeHour: Temporal properties
- coresReq & memReq: Resource requirements
- execTime: Execution duration
- grossValue: A calculated metric for resource utilization (cores * memory * time)
Functionality:
- Tracks resource requirements
- Outputs formatted status details
- Calculates runtime metrics

WorkerNode Class

Each WorkerNode represents an individual node with:

Resources:
- CPU cores (individually tracked)
- Memory (in GB)
- Utilization status
Operations:
- Checks resource availability
- Allocates and deallocates jobs
- Manages resource status

MasterScheduler Class

The MasterScheduler manages the overall system by:

Components:
- Pool of worker nodes
- Job queue management
- System-wide performance metrics
Responsibilities:
- Implements scheduling policies
- Allocates resources to jobs
- Monitors and logs performance metrics

Implementation Logic

Scheduling Policies

Queue Management Policies

First Come First Serve (FCFS):
- Maintains the original job order
- Acts as a baseline performance metric
Smallest Job First:
- Prioritizes jobs with the smallest resource usage (cores * memory * execTime)
- Optimizes for resource efficiency
Shortest Duration First:
- Prioritizes jobs with the shortest execution time
- Reduces average wait time

Resource Allocation Strategies

First Fit:
- Assigns jobs to the first available node
- Advantages: Fast allocation, suitable for high-throughput
Best Fit:
- Minimizes resource fragmentation by allocating jobs to nodes with the smallest sufficient resource block
- Optimizes both CPU and memory utilization
Worst Fit:
- Allocates jobs to nodes with the maximum available resources
- Aims for load balancing and future job flexibility

Operational Flow

Input Processing

Reads jobs from a file (JobArrival.txt)
Parses and validates each job entry
Populates the job queue

Execution Cycle

Select scheduling policies
Order jobs in the queue based on policy
Allocate resources as per policy
Collect and log performance metrics

Performance Monitoring

Metrics tracked include:

CPU utilization
Memory usage
Job completion rate
Overall resource efficiency

Output Generation

Real-time Console Updates:
- Displays daily performance metrics
- Showcases policy effectiveness and resource utilization
CSV Data Export:
- Records detailed metrics for policy comparisons
- Allows time-series analysis of resource utilization

Analysis Capabilities

Performance Evaluation

Compares policy effectiveness
Analyzes resource utilization trends
Identifies system bottlenecks
Assesses scalability

Optimization Opportunities

Evaluates the efficiency of policy combinations
Improves resource allocation strategies
Enhances queue management practices
Assists in capacity planning

Usage Guidelines

Input Preparation
- Format job specifications in JobArrival.txt
- Ensure job resource requirements are within system limits
Execution
- Run the simulator and specify simulation duration
- Monitor real-time metrics and analyze policy effects
Analysis
- Review CSV output files
- Compare the performance of different policies
- Identify optimal configurations and system efficiencies

Requirements

C++ Standard Library
GCC or equivalent C++ compiler
CSV viewer (optional, for analysis)

Function / Program Description

To run the simulation, simply execute the c++ program. The program will create a MasterScheduler with 128 worker nodes, read jobs from an input file, and simulate for the number of days specified by the user. The user will be given the option to print the assigned jobs to the console, after which, the results will be written to a CSV file for further analysis.

Graphical Representation

After running a 7-day test simulation, data was extracted, processed, and visualized in graphs, with key observations documented here

Conclusion

Through this project, I gained practical insights into distributed job scheduling and resource allocation strategies. Analyzing the efficiency of various scheduling policies highlighted the complexities of balancing resource utilization and system performance, which is crucial for optimizing distributed systems. Moreover, I also applied concepts of file handling as well as data visualisation to analyse and understand job scheduling.

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
.gitignore		.gitignore
Graphical Representation.docx		Graphical Representation.docx
JobArrival.txt		JobArrival.txt
README.md		README.md
final.cpp		final.cpp

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

IITG2406-01_JobScheduler (Project 3)

Overview

System Architecture

Infrastructure

Core Components

Job Class

WorkerNode Class

MasterScheduler Class

Implementation Logic

Scheduling Policies

Queue Management Policies

Resource Allocation Strategies

Operational Flow

Input Processing

Execution Cycle

Performance Monitoring

Output Generation

Analysis Capabilities

Performance Evaluation

Optimization Opportunities

Usage Guidelines

Requirements

Function / Program Description

Graphical Representation

Conclusion

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

IITG2406-01_JobScheduler (Project 3)

Overview

System Architecture

Infrastructure

Core Components

Job Class

WorkerNode Class

MasterScheduler Class

Implementation Logic

Scheduling Policies

Queue Management Policies

Resource Allocation Strategies

Operational Flow

Input Processing

Execution Cycle

Performance Monitoring

Output Generation

Analysis Capabilities

Performance Evaluation

Optimization Opportunities

Usage Guidelines

Requirements

Function / Program Description

Graphical Representation

Conclusion

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages