他们接下来要做的就是等待了文字转WAV音频