所以他想要尽量寻找出路文字转WAV音频