其中得到最多支持的是文字转WAV音频