Teacher student model by titu1994 · Pull Request #1 · titu1994/NeMo

titu1994 · 2021-08-27T21:38:04Z

Temp

Signed-off-by: smajumdar <titu1994@gmail.com>

…match Signed-off-by: smajumdar <titu1994@gmail.com>

Signed-off-by: smajumdar <titu1994@gmail.com>

…t object Signed-off-by: smajumdar <titu1994@gmail.com>

Signed-off-by: smajumdar <titu1994@gmail.com>

* cache-aware streaming export Test onnx streaming conformer ctc WER Constant att cache width with len param Remove some extra functions in cache_aware runner transpose cache so that batch is first for trt Signed-off-by: Greg Clark <grclark@nvidia.com> * fix export for full-context conformer * WIP trying to improve onnx perf Signed-off-by: Greg Clark <grclark@nvidia.com> * Adding test scripts Signed-off-by: Greg Clark <grclark@nvidia.com> * More perf testing script Signed-off-by: Greg Clark <grclark@nvidia.com> * Updates for jit torch_tensorrt tracing Signed-off-by: Greg Clark <grclark@nvidia.com> * Fixed trace warnings Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * Rearranging tests Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * Fixing non-caching case Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * testing Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * Fixed channel cache length issue Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * cache-aware streaming export Test onnx streaming conformer ctc WER Constant att cache width with len param Remove some extra functions in cache_aware runner transpose cache so that batch is first for trt Signed-off-by: Greg Clark <grclark@nvidia.com> * fix export for full-context conformer * WIP trying to improve onnx perf Signed-off-by: Greg Clark <grclark@nvidia.com> * Adding test scripts Signed-off-by: Greg Clark <grclark@nvidia.com> * More perf testing script Signed-off-by: Greg Clark <grclark@nvidia.com> * Updates for jit torch_tensorrt tracing Signed-off-by: Greg Clark <grclark@nvidia.com> * stash Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * Reverting non-essential changes Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * Offset=None case Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * Remove test scripts Signed-off-by: Greg Clark <grclark@nvidia.com> * Clean up speech_to_text_cache_aware_streaming_infer Signed-off-by: Greg Clark <grclark@nvidia.com> * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * Revert pad -> constant_pad_nd Signed-off-by: Greg Clark <grclark@nvidia.com> * conformer-encoder set window_size from streaming_cfg Signed-off-by: Greg Clark <grclark@nvidia.com> * Fixes for working export(), using more constants Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * Optional rand init for cahce Signed-off-by: Greg Clark <grclark@nvidia.com> * Folding update_cache with constants Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * More folding Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * Reducing diff #1 Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * Reducing diff NVIDIA-NeMo#2 Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * Reducing diff NVIDIA-NeMo#3 Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * Fixed unit tests, more reverts Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * Export fixes Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * Reverted slice changes that ruined ONNX perf Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> * Adding back keep_all_outputs and drop_extra_preencoded Signed-off-by: Greg Clark <grclark@nvidia.com> * Fix export Signed-off-by: Greg Clark <grclark@nvidia.com> --------- Signed-off-by: Greg Clark <grclark@nvidia.com> Signed-off-by: Boris Fomitchev <bfomitchev@nvidia.com> Co-authored-by: Boris Fomitchev <bfomitchev@nvidia.com> Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> Co-authored-by: Vahid Noroozi <VahidooX@users.noreply.github.com>

titu1994 and others added 30 commits June 15, 2021 15:21

First draft of teacher student model

5a16e98

Signed-off-by: smajumdar <titu1994@gmail.com>

First draft of teacher student model

519b69d

Signed-off-by: smajumdar <titu1994@gmail.com>

Add Multi Node Rank tests

f2f02b4

Signed-off-by: smajumdar <titu1994@gmail.com>

Add Multi Node Rank tests

f07c82f

Signed-off-by: smajumdar <titu1994@gmail.com>

LGTM fixes

db478bc

Signed-off-by: smajumdar <titu1994@gmail.com>

Add support for default loss configs set by the student

62f00a4

Signed-off-by: smajumdar <titu1994@gmail.com>

Clear up teacher config mentions

a90feab

Signed-off-by: smajumdar <titu1994@gmail.com>

Add comments

c85e372

Signed-off-by: smajumdar <titu1994@gmail.com>

Add temporary script to train teacher student model

be3bbbe

Signed-off-by: smajumdar <titu1994@gmail.com>

Refactor from TeacherStudent to DistillationModelPT

52d219f

Signed-off-by: smajumdar <titu1994@gmail.com>

Add distillation validation checks prior to training

5ae6186

Signed-off-by: smajumdar <titu1994@gmail.com>

Add support for adding student train loss to distillation loss

fbe1c3e

Signed-off-by: smajumdar <titu1994@gmail.com>

Correct type

1ec7875

Signed-off-by: smajumdar <titu1994@gmail.com>

Remove awkward class based delegation

e37a693

Signed-off-by: smajumdar <titu1994@gmail.com>

Incorporate review

76ae431

Signed-off-by: smajumdar <titu1994@gmail.com>

Preserve the tokenizer config for ASR

adfe1bd

Signed-off-by: smajumdar <titu1994@gmail.com>

Add checkpoint initialization for decoder when performing similarity …

b358fd1

…match Signed-off-by: smajumdar <titu1994@gmail.com>

Remove decoder initialization

c6faa19

Signed-off-by: smajumdar <titu1994@gmail.com>

Generalize and merge the api pathways for primary and secondary losses

125a2e4

Signed-off-by: smajumdar <titu1994@gmail.com>

Correct logging

27a826f

Signed-off-by: smajumdar <titu1994@gmail.com>

Fix formatting

59a3b9e

Signed-off-by: smajumdar <titu1994@gmail.com>

Refactor API to use global semantics when selecting teacher or studen…

2d2ffe1

…t object Signed-off-by: smajumdar <titu1994@gmail.com>

Correct imports

0992b9a

Signed-off-by: smajumdar <titu1994@gmail.com>

Correct constructor

cd0612e

Signed-off-by: smajumdar <titu1994@gmail.com>

Update japer distillation of subblocks in encoder

c4c526e

Signed-off-by: smajumdar <titu1994@gmail.com>

Refactor CTC distillation

69be53d

Signed-off-by: smajumdar <titu1994@gmail.com>

Add temperature scaling support to decoder

1da5af7

Signed-off-by: smajumdar <titu1994@gmail.com>

Update documentation

b89addb

Signed-off-by: smajumdar <titu1994@gmail.com>

Refactor temperature scaling

b4d60a1

Signed-off-by: smajumdar <titu1994@gmail.com>

Implements knowledge distillation, due to Hinton, for NMT

a020d88

sergiogcharles and others added 27 commits September 2, 2021 10:28

Update README.md

29792db

Update README.md

9d19932

Update README.md

4b9cb92

Update README.md

21f2ac1

Update README.md

12648a1

Update README.md

01f2432

Update README.md

471f091

Update README.md

c85503b

Update README.md

fdbe581

Update README.md

94ba120

Update README.md

e899084

Update README.md

3600031

Guide

b673266

Update README.md

a61da18

Clean up

d573df8

Update README.md

ddd268f

Clean up

3a66859

Clean up

f766a20

README update

069f050

README update

23f2343

README update

86aea3f

README update

6c2a820

README update

7b02fe9

README update

7b1fbe1

README update

83fee8e

README update

175c766

README update

5e70106

titu1994 closed this Sep 23, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Teacher student model#1

Teacher student model#1
titu1994 wants to merge 229 commits intomainfrom
teacher_student_model

titu1994 commented Aug 27, 2021

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Comments

Conversation

titu1994 commented Aug 27, 2021

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Comments