Is this docstring of `encoder_hidden_states` argument in `Transformer2DModel` correct?

https://github.com/huggingface/diffusers/blob/e607a582cfaa7dfaf7913fc3bb54c35eceee583c/src/diffusers/models/transformer_2d.py#L228-L230

The shape is `(batch_size, seq_length, embedding_dim)`, isn't it? Also it's supposed to be float tensor. Or maybe it supports both long and float?

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Is this docstring of `encoder_hidden_states` argument in `Transformer2DModel` correct? #3062

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

	encoder_hidden_states ( `torch.LongTensor` of shape `(batch size, encoder_hidden_states dim)`, optional):
	Conditional embeddings for cross attention layer. If not given, cross-attention defaults to
	self-attention.

Is this docstring of encoder_hidden_states argument in Transformer2DModel correct? #3062

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions

Is this docstring of `encoder_hidden_states` argument in `Transformer2DModel` correct? #3062