quic · quic-akuruvil · Mar 4, 2026 · Jan 6, 2026 · Jan 9, 2026 · Jan 9, 2026
@@ -56,6 +56,45 @@ def __init__(self, config_manager: ConfigManager):
         self.output_dir = Path(self.config.training["output_dir"])
         self._setup_environment()
 
+        # Prepare training configuration
+        self.training_config = prepare_training_config(config_manager=self.config_manager)
+
+        # Create datasets
+        logger.log_rank_zero("Creating datasets...")
+        self.train_dataset, self.eval_dataset = self._create_datasets()
+
+        # Create model and tokenizer
+        logger.log_rank_zero("Loading model and tokenizer...")
+        model_instance = self._create_model()
+        self.model = model_instance.model
+        self.tokenizer = model_instance.tokenizer
+
+        # Create optimizer
+        logger.log_rank_zero("Preparing optimizer...")
+        self.optimizer_cls_and_kwargs = self._create_optimizer()
+
+        # Create callbacks
+        logger.log_rank_zero("Creating callbacks...")
+        self.callbacks = self._create_callbacks()
+
+        # Create trainer
+        logger.log_rank_zero("Initializing trainer...")
+        self.trainer = self._create_trainer(
+            model=self.model,
+            tokenizer=self.tokenizer,
+            train_dataset=self.train_dataset,
+            eval_dataset=self.eval_dataset,
+            optimizer_cls_and_kwargs=self.optimizer_cls_and_kwargs,
+            callbacks=self.callbacks,
+            training_config=self.training_config,
+        )
+
+    def get_model_and_tokenizer(self):
+        return self.model, self.tokenizer
+
+    def get_trainer(self):
+        return self.trainer
+
     def _setup_environment(self) -> None:
         """Set up environment variables for output directories."""
         os.environ["OUTPUT_DIR"] = str(self.output_dir)
@@ -95,7 +134,6 @@ def create_dataset_for_split(split_name: str) -> Any:
         # Create training and evaluation datasets using config values
         train_dataset = create_dataset_for_split(train_split)
         eval_dataset = create_dataset_for_split(test_split)
-
         return train_dataset, eval_dataset
 
     def _create_model(self) -> Any:
@@ -157,6 +195,8 @@ def _create_callbacks(self) -> List[Any]:
 
         # callback_config.callbacks is a dictionary of callback configurations
         for callback_name, callback_kwargs in callback_config["callbacks"].items():
+            if callback_kwargs is None:
+                callback_kwargs = {}
             try:
                 callback_instance = ComponentFactory.create_callback(callback_name, **callback_kwargs)
                 callbacks.append(callback_instance)
@@ -216,14 +256,26 @@ def _create_trainer(
 
         # Create trainer arguments instance
         args = args_cls(**training_config)
-        # Initialize trainer
+        dataset_config_dict = self.config_manager.get_dataset_config()
+        split_ratio = dataset_config_dict.get("split_ratio", 0.8)
+        num_samples = dataset_config_dict.get("dataset_num_samples", -1)
+        train_dataset = train_dataset.dataset
+        eval_dataset = eval_dataset.dataset
+        if num_samples > 0:
+            # Truncating datasets to a smaller number of samples.
+            # If you want to use all data, set dataset_num_samples to -1 or remove it from config.
+            logger.warning("Using fewer samples may impact finetuning quality.")
+            subset_train_indices = list(range(0, int(num_samples * split_ratio)))
+            subset_eval_indices = list(range(0, int(num_samples - num_samples * split_ratio)))
+            eval_dataset = eval_dataset.select(subset_eval_indices)
+            train_dataset = train_dataset.select(subset_train_indices)
         trainer = trainer_cls(
             model=model,
             processing_class=tokenizer,
             args=args,
             compute_loss_func=None,
-            train_dataset=train_dataset.dataset,
-            eval_dataset=eval_dataset.dataset,
+            train_dataset=train_dataset,
+            eval_dataset=eval_dataset,
             optimizer_cls_and_kwargs=optimizer_cls_and_kwargs,
             callbacks=callbacks,
             **additional_kwargs,
@@ -234,48 +286,9 @@ def _create_trainer(
         return trainer
 
     def run(self) -> None:
-        """
-        Execute the complete fine-tuning pipeline.
-        """
-        # Validate configuration
-        self.config_manager.validate_config()
-
-        # Prepare training configuration
-        training_config = prepare_training_config(config_manager=self.config_manager)
-
-        # Create datasets
-        logger.log_rank_zero("Creating datasets...")
-        train_dataset, eval_dataset = self._create_datasets()
-
-        # Create model and tokenizer
-        logger.log_rank_zero("Loading model and tokenizer...")
-        model_instance = self._create_model()
-        model = model_instance.model
-        tokenizer = model_instance.tokenizer
-
-        # Create optimizer
-        logger.log_rank_zero("Preparing optimizer...")
-        optimizer_cls_and_kwargs = self._create_optimizer()
-
-        # Create callbacks
-        logger.log_rank_zero("Creating callbacks...")
-        callbacks = self._create_callbacks()
-
-        # Create trainer
-        logger.log_rank_zero("Initializing trainer...")
-        trainer = self._create_trainer(
-            model=model,
-            tokenizer=tokenizer,
-            train_dataset=train_dataset,
-            eval_dataset=eval_dataset,
-            optimizer_cls_and_kwargs=optimizer_cls_and_kwargs,
-            callbacks=callbacks,
-            training_config=training_config,
-        )
-
         # Start training
         logger.log_rank_zero("Starting training...")
-        trainer.train()
+        self.trainer.train()
 
 
 def main():

@@ -0,0 +1,54 @@
+# -----------------------------------------------------------------------------
+#
+# Copyright (c) Qualcomm Technologies, Inc. and/or its subsidiaries.
+# SPDX-License-Identifier: BSD-3-Clause
+#
+# -----------------------------------------------------------------------------
+# Model configuration
+model:
+  model_type: "hf"  # Hugging Face model
+  auto_class_name: "AutoModelForCausalLM" # Auto class to load the model with
+  model_name: "HuggingFaceTB/SmolLM-135M"  # Pretrained model name
+  use_peft: true # Enable PEFT (Parameter Efficient Fine-Tuning)
+  peft_config:
+    lora_r: 16
+    lora_alpha: 16
+    lora_dropout: 0
+    target_modules: ["k_proj","gate_proj","q_proj","up_proj","v_proj","down_proj","o_proj"] # Target modules for LoRA
+    task_type: "CAUSAL_LM"  # Options: CAUSAL_LM, SEQ_2_SEQ_LM, etc.
+    peft_type: "LORA"  # Options: LORA, IA3, etc..
+
+# Dataset configuration
+dataset:
+  dataset_type: "sft_dataset"
+  dataset_name: "yahma/alpaca-cleaned" # Dataset name from Hugging Face Hub
+  prompt_func: "QEfficient.finetune.experimental.preprocessing.alpaca_func:create_alpaca_prompt" # Function to create prompt from dataset fields
+  completion_template: "{output}" # Template for completion field in dataset
+
+
+# Training configuration
+training:
+  type: "sft"
+  gradient_accumulation_steps: 2  # Number of steps to accumulate gradients
+  per_device_train_batch_size: 2  # Batch size per device during training
+  torch_compile: False # Whether to use torch.compile
+  ddp_config: # DDP configuration
+    ddp_backend: "qccl"
+    ddp_find_unused_parameters: False
+    ddp_bucket_cap_mb: 25
+    ddp_broadcast_buffers: True
+    ddp_timeout: 1800
+
+# Optimizer configuration
+optimizers:
+  optimizer_name: "AdamW"
+  lr: 2e-4
+
+scheduler:
+  scheduler_name: "cosine"
+
+callbacks:
+  early_stopping:
+    early_stopping_patience: 3 # Number of epochs to wait before stopping training
+    early_stopping_threshold: 0.001 # Minimum change in metric to qualify as improvement
+  tensorboard:
@@ -0,0 +1,49 @@
+# -----------------------------------------------------------------------------
+#
+# Copyright (c) Qualcomm Technologies, Inc. and/or its subsidiaries.
+# SPDX-License-Identifier: BSD-3-Clause
+#
+# -----------------------------------------------------------------------------
+# Model configuration
+model:
+  model_type: "hf"  # Hugging Face model
+  auto_class_name: "AutoModelForCausalLM" # Auto class to load the model with
+  model_name: "HuggingFaceTB/SmolLM-135M"  # Pretrained model name
+  use_peft: true # Enable PEFT (Parameter Efficient Fine-Tuning)
+  peft_config:
+    lora_r: 16
+    lora_alpha: 16
+    lora_dropout: 0
+    target_modules: ["k_proj","gate_proj","q_proj","up_proj","v_proj","down_proj","o_proj"] # Target modules for LoRA
+    task_type: "CAUSAL_LM"  # Options: CAUSAL_LM, SEQ_2_SEQ_LM, etc.
+    peft_type: "LORA"  # Options: LORA, IA3, etc.
+
+# Dataset configuration
+dataset:
+  dataset_type: "sft_dataset"
+  dataset_name: "yahma/alpaca-cleaned" # Dataset name from Hugging Face Hub
+  prompt_func: "QEfficient.finetune.experimental.preprocessing.alpaca_func:create_alpaca_prompt" # Function to create prompt from dataset fields
+  completion_template: "{output}" # Template for completion field in dataset
+
+
+# Training configuration
+training:
+  type: "sft"
+  gradient_accumulation_steps: 2  # Number of steps to accumulate gradients
+  per_device_train_batch_size: 2  # Batch size per device during training
+  num_train_epochs: 1
+  torch_compile: False # Whether to use torch.compile
+
+# Optimizer configuration
+optimizers:
+  optimizer_name: "AdamW"
+  lr: 2e-4
+
+scheduler:
+  scheduler_name: "cosine"
+
+callbacks:
+  early_stopping:
+    early_stopping_patience: 3 # Number of epochs to wait before stopping training
+    early_stopping_threshold: 0.001 # Minimum change in metric to qualify as improvement
+  tensorboard: