Merge ft_experimental_v1 branch to main#887

Open

quic-akuruvil wants to merge 28 commits intomainfrom

ft_experimental_v1

Contributor

quic-akuruvil commented Mar 25, 2026 •

edited

Loading

Merge HF Trainer FT code base to main

Main API file: QEfficient/cloud/finetune_experimental.py

Documentation:
docs/source/hf_finetune.md – End‑to‑end fine‑tuning pipeline details and sample commands to kick-off
docs/source/config.md – All training hyperparameters and usage using config.yaml

quic-akuruvil changed the title ~~Ft experimental v1~~ Merge ft_experimental_v1 branch to main

quic-akuruvil force-pushed the ft_experimental_v1 branch from 4be2260 to 20436d3 Compare

March 25, 2026 14:11

quic-akuruvil requested review from anujgupt-github, quic-hemagnih, quic-meetkuma, quic-rishinr and vbaddi

March 25, 2026 14:16

quic-akuruvil force-pushed the ft_experimental_v1 branch from 20436d3 to cbea97d Compare

March 25, 2026 14:30

quic-akuruvil requested review from ochougul and quic-swatia

March 25, 2026 14:34

quic-akuruvil assigned quic-akuruvil, quic-swatia, tchawada and smedhe

quic-akuruvil added the fine-tuning label

quic-akuruvil force-pushed the ft_experimental_v1 branch 5 times, most recently from 3e76f60 to fb3fb86 Compare

March 30, 2026 06:42

quic-akuruvil added the ready for review label

quic-akuruvil force-pushed the ft_experimental_v1 branch 3 times, most recently from aff10af to 357d671 Compare

April 22, 2026 08:49

quic-akuruvil force-pushed the ft_experimental_v1 branch from c5b6bd4 to a3a5067 Compare

April 27, 2026 10:31

smedhe and others added 5 commits

April 27, 2026 10:39


          [QEff. Finetune]: Added logger and its test cases. (#644) (#868)

a1202e3

- Added a logger which will log onto console and file. This code is
similar to existing QEff. Finetuning logger code.
- Also added dist_utils which serves as utility code when dealing with
distributed training.
- Added logger test cases for sanity checks.

---------

Signed-off-by: Meet Patel <meetkuma@qti.qualcomm.com>
Signed-off-by: Sharvari Medhe <smedhe@qti.qualcomm.com>
Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          [QEff. Finetune_experimental] cherrypicking pr (#870)

244d15a

cherry picking PRs- 697,658,667,666,656,652,647,649,645

---------

Signed-off-by: Meet Patel <meetkuma@qti.qualcomm.com>
Signed-off-by: Tanisha Chawada <tchawada@qti.qualcomm.com>
Signed-off-by: Dhiraj Kumar Sah <dhirajku@qti.qualcomm.com>
Signed-off-by: Sharvari Medhe <smedhe@qti.qualcomm.com>
Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>
Signed-off-by: Swati Allabadi <sallabad@qti.qualcomm.com>
Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          [QEff. finetune_experimnetal] cherry picking PR-787, 791,813,795 (#872)

d654fe6

we are only cherry-picking PR-787, 791,813,795, skipping rebasing PR
785, cherry-picking experimental related branches from PR 692,747

---------

Signed-off-by: Swati Allabadi <sallabad@qti.qualcomm.com>
Signed-off-by: Sharvari Medhe <smedhe@qti.qualcomm.com>
Signed-off-by: Tanisha Chawada <tchawada@qti.qualcomm.com>
Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>
Co-authored-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>
Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Formatted docs

303f083

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          [QEff.finetune] Adding style remix dataset config (#858)

99cc28e

Adding config file to support style remix dataset

---------

Signed-off-by: Tanisha Chawada <tchawada@qti.qualcomm.com>
Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>

Ann Kuruvilla and others added 18 commits

April 27, 2026 10:39


          Commented unit test from cloud module

6b62fd3

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Added exception handling for dataset loading

c695af4

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Format

71c980b

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          [QEff. Finetuning]: Tests for Pipeline Parallelism and updated docume…

342ecb4

…ntation (#893)

1) Added unit test cases for Pipeline Parallelism
2) Added documentation on how to run these tests
3) Created a constants file

Signed-off-by: Swati Allabadi <sallabad@qti.qualcomm.com>
Co-authored-by: Swati Allabadi <sallabad@qti.qualcomm.com>
Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Fixed repolinter error

354fc46

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Corrected file paths

3523cd7

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Updates

0c1d60f

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Added Trainer arguments reference

d266a70

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Addressed some Qgenie reviews and fixed code

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Added security checks for import_func in dataset.py

053c135

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Adding reference data test for finetune (#897)

d460dea

Added testcase to test compare loss and metrics for different sdks to stable sdk

Signed-off-by: Tanisha Chawada <tchawada@qti.qualcomm.com>


          [QEff. Finetuning]: Updating PP documentation (#899)

4c27770

Updating PP CLI command as per latest changes in config manager
In future, this command should also be updated if any changes are done
in single SOC CLI command

Signed-off-by: Swati Allabadi <sallabad@qti.qualcomm.com>
Co-authored-by: Swati Allabadi <sallabad@qti.qualcomm.com>
Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Updated gsm8k sample config and docs

b4b3cbf

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Added inference support for post finetune model

c4229a5

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Upgrade transformers to v4.57.3

72c2e7c

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Format

ddf92a0

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Added config params as tables for user reference

6b7cc7e

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Logging support added for HF Trainer stack (#943)

69d48ca

Added the following support for easy visualization of training and
validation statistics:

1. train_logger callback function which captures the per epoch time, per
epoch loss metric and per epoch perplexity
2. This function also captures number of trainable parameters, number of
samples in training and eval dataset
3. All these are logged into a log file which can be given as an input
by user by setting the flag --log_file_path in the input config .yaml
file.

Signed-off-by: abhamidi <abhamidi@qti.qualcomm.com>
Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>

quic-akuruvil force-pushed the ft_experimental_v1 branch 2 times, most recently from c85f4e8 to 13382d8 Compare

April 27, 2026 16:38


          Updated the config.md file with logging changes (#945)

78e96d7

Signed-off-by: Anusha V.S Bhamidipati <abhamidi@qti.qualcomm.com>

quic-akuruvil force-pushed the ft_experimental_v1 branch from 13382d8 to 78e96d7 Compare

April 27, 2026 16:45

Ann Kuruvilla added 4 commits

April 27, 2026 16:55


          Dataset clamping when num_samples>dataset_len and skip type-only defa…

ea844e5

…ults in trainer config

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Format

3ff5aca

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Overrides with CLI args when combination of CLI and YAML is given

8c8b2ff

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>


          Added dependency versions

1af42df

Signed-off-by: Ann Kuruvilla <akuruvil@qti.qualcomm.com>

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Reviewers

anujgupt-github Awaiting requested review from anujgupt-github

quic-meetkuma Awaiting requested review from quic-meetkuma

vbaddi Awaiting requested review from vbaddi

quic-hemagnih Awaiting requested review from quic-hemagnih

quic-rishinr Awaiting requested review from quic-rishinr

ochougul Awaiting requested review from ochougul

quic-swatia Awaiting requested review from quic-swatia

Labels

fine-tuning ready for review