他们要的就是配合文字转WAV音频