[Auto] Refactor output tracing across model backends (cluster-43979-11): merged 7 of 10 PRs by evalstate · Pull Request #29 · evalstate/transformers

evalstate · 2026-04-24T11:05:37Z

Cluster: cluster-43979-11
Source repo cluster inspected for huggingface/transformers issue huggingface#43979.

Merged PRs:

[ResNet] Refactor output tracing to decorator-based interface huggingface/transformers#44007: Merged ResNet, RegNet, and RT-DETR ResNet decorator-based output tracing with local conflict resolution.
Refactor FNet and CVT output tracing huggingface/transformers#43996: Merged FNet and CvT output tracing refactor with local conflict resolution.
Ouptut tracing: Standardizing MobileNetv2 huggingface/transformers#44013: Merged MobileNetV2 output tracing refactor with local conflict resolution.
Refactor DeBERTa's output tracing interface huggingface/transformers#44044: Merged DeBERTa v2 output tracing refactor with local conflict resolution.
refactor efficientnet output tracing with @capture_outputs and @can_r… huggingface/transformers#44072: Merged EfficientNet output tracing refactor with local conflict resolution.
Refactor SpeechT5 output tracing to standardized output capture huggingface/transformers#44129: Merged SpeechT5 output tracing refactor with local conflict resolution.
Refactor gptj output tracing to use standardized decorators huggingface/transformers#44722: Merged GPT-J output tracing refactor; preferred over overlapping GPT-J alternatives.

Skipped PRs:

Refactor RemBERT to use output tracing decorators huggingface/transformers#44085: Duplicate/misfiled GPT-J-only change despite RemBERT title; overlapped with merged GPT-J PR Refactor gptj output tracing to use standardized decorators huggingface/transformers#44722.

Failed PRs:

Refactor GPT-J to use standardized output tracing (#43979) huggingface/transformers#44066: Merge conflicted in GPT-J and CodeGen; CodeGen part appeared unsafe because CodeGenBlock would return a tensor while CodeGenModel still expected tuple outputs.
Refactored vits to match standardized output collection interface huggingface/transformers#44154: Merge conflicted in VITS and was aborted; patch appeared outdated/unsafe with invalid capture import path, commented-out output plumbing, and wrong recorder attribute name.

Notes:

Issue Call to contributions: refactor output tracing in transformers huggingface/transformers#43979 is closed, but several open PRs still had locally mergeable model-specific output tracing changes.
Only protected runtime/session artifacts remained untracked.
Ran python -m py_compile over changed files successfully.
Ran git diff --check origin/main...HEAD successfully.
A direct import smoke test could not run because the local environment is missing packaging.

Next steps:

Review resolved conflicts in the merged model files for semantic correctness.
Run targeted model tests for ResNet, RegNet, CvT, FNet, MobileNetV2, DeBERTa v2, EfficientNet, SpeechT5, and GPT-J.
Run make style and make typing or make check-repo before any PR-ready handoff.
Revisit VITS only with a corrected patch using the current output_capturing API.

…eturn_tuple decorators

…tuple Migrate the GPT-J model to use the new standardized output collection decorators, replacing manual accumulation of hidden states and attention weights with hook-based capturing. Changes: - Add `_can_record_outputs` to `GPTJPreTrainedModel` mapping hidden_states to GPTJBlock and attentions to GPTJAttention - Add `@capture_outputs` and `@merge_with_config_defaults` to `GPTJModel.forward()` - Add `@can_return_tuple` to all task head models (ForCausalLM, ForSequenceClassification, ForQuestionAnswering) - Remove `output_attentions`, `output_hidden_states`, and `return_dict` parameters from all forward signatures - Remove manual accumulator loops and return_dict branching - Simplify GPTJBlock to return plain `torch.Tensor` instead of tuple - Update attention forward signatures to always return `(attn_output, attn_weights)` without conditional logic Resolves huggingface#43979

The CodeGenBlock is a documented copy of GPTJBlock. This syncs it to match the updated signature after removing output_attentions parameter and simplifying the return type to plain torch.Tensor. Generated via `python utils/check_copies.py --fix_and_overwrite`.

The previous commit auto-synced CodeGenBlock.forward() with the refactored GPTJBlock, but CodeGenModel still passes output_attentions to CodeGenBlock and expects a tuple return. Since the CodeGen model has not been refactored to use the new decorators yet, restore CodeGenBlock's original forward() signature and remove the '# Copied from' directive to decouple it from GPTJBlock until CodeGen gets its own output tracing refactor.

…er-cluster-43979-11-20260424104629 # Conflicts: # src/transformers/models/regnet/modeling_regnet.py # src/transformers/models/resnet/modeling_resnet.py

…er-cluster-43979-11-20260424104629 # Conflicts: # src/transformers/models/cvt/modeling_cvt.py # src/transformers/models/fnet/modeling_fnet.py

…er-cluster-43979-11-20260424104629 # Conflicts: # src/transformers/models/mobilenet_v2/modeling_mobilenet_v2.py

…er-cluster-43979-11-20260424104629 # Conflicts: # src/transformers/models/deberta_v2/modeling_deberta_v2.py

…er-cluster-43979-11-20260424104629 # Conflicts: # src/transformers/models/efficientnet/modeling_efficientnet.py

…er-cluster-43979-11-20260424104629 # Conflicts: # src/transformers/models/speecht5/modeling_speecht5.py

…er-cluster-43979-11-20260424104629 # Conflicts: # src/transformers/models/gptj/modeling_gptj.py

evalstate · 2026-04-24T11:06:34Z

Trace for this mergeability run: https://huggingface.co/datasets/evalstate/transformers-merge-experiments/blob/main/2604241146-WWBEjU__dev__codex.jsonl

beelapranay and others added 22 commits February 14, 2026 13:04

Refactor FNet and CVT output tracing

fc58a7b

Refactor ResNet output handling to decorators

08f02cf

refactor: tracing

1d5aa9c

add hooks to deberta_v2

a1c15f9

fix ruff

1361b6d

fix output_attentions arg

c8f5b2a

fix output_attentions arg

75ff815

refactor efficientnet output tracing with @capture_outputs and @can_r…

e6be956

…eturn_tuple decorators

Refactor SpeechT5 output tracing to standardized output capture

8b716be

Fix repository copy checks after ResNet output refactor

2f9a2db

Fix missing RegNet decorator imports after copy sync

6e022f6

Enable hidden-state capture for RegNet outputs

411c2c7

Merge remote-tracking branch 'refs/remotes/pr/44007' into merge-clust…

2be5e57

…er-cluster-43979-11-20260424104629 # Conflicts: # src/transformers/models/regnet/modeling_regnet.py # src/transformers/models/resnet/modeling_resnet.py

Merge remote-tracking branch 'refs/remotes/pr/43996' into merge-clust…

e31b8b0

…er-cluster-43979-11-20260424104629 # Conflicts: # src/transformers/models/cvt/modeling_cvt.py # src/transformers/models/fnet/modeling_fnet.py

Merge remote-tracking branch 'refs/remotes/pr/44013' into merge-clust…

e7ab649

…er-cluster-43979-11-20260424104629 # Conflicts: # src/transformers/models/mobilenet_v2/modeling_mobilenet_v2.py

Merge remote-tracking branch 'refs/remotes/pr/44044' into merge-clust…

11af826

…er-cluster-43979-11-20260424104629 # Conflicts: # src/transformers/models/deberta_v2/modeling_deberta_v2.py

Merge remote-tracking branch 'refs/remotes/pr/44072' into merge-clust…

435f6fd

…er-cluster-43979-11-20260424104629 # Conflicts: # src/transformers/models/efficientnet/modeling_efficientnet.py

Merge remote-tracking branch 'refs/remotes/pr/44129' into merge-clust…

93b730e

…er-cluster-43979-11-20260424104629 # Conflicts: # src/transformers/models/speecht5/modeling_speecht5.py

Merge remote-tracking branch 'refs/remotes/pr/44722' into merge-clust…

953d3f8

…er-cluster-43979-11-20260424104629 # Conflicts: # src/transformers/models/gptj/modeling_gptj.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Auto] Refactor output tracing across model backends (cluster-43979-11): merged 7 of 10 PRs#29

[Auto] Refactor output tracing across model backends (cluster-43979-11): merged 7 of 10 PRs#29
evalstate wants to merge 22 commits intomainfrom
merge-cluster-cluster-43979-11-20260424104629

evalstate commented Apr 24, 2026

Uh oh!

evalstate commented Apr 24, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

8 participants

Conversation

evalstate commented Apr 24, 2026

Uh oh!

evalstate commented Apr 24, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

8 participants