### Describe the feature 训练大模型,增大batchsize有助于训练的稳定性,对于特别大的模型batchsize大小受限,只能通过梯度累积的方式实现增大batchsize的目的,gemini能否实现支持梯度累积呢?
Describe the feature
训练大模型,增大batchsize有助于训练的稳定性,对于特别大的模型batchsize大小受限,只能通过梯度累积的方式实现增大batchsize的目的,gemini能否实现支持梯度累积呢?