从两个人消失的背景和速度来看文字转WAV音频