作者大佬,我发现英文的同步效果非常好,但是如果用中文的语音数据去inference,音频与视频非常不同步,这个是Deepspeech的原因还是说需要再重训一个A2KP?非常期待您的回复! https://github.com/yuangan/EAT_code/assets/141640497/4c4e0f35-9469-4bbb-af06-de067c07731e
作者大佬,我发现英文的同步效果非常好,但是如果用中文的语音数据去inference,音频与视频非常不同步,这个是Deepspeech的原因还是说需要再重训一个A2KP?非常期待您的回复!
test2_hap_mytemplate.mp4