所以需要维持文字转WAV音频