只是最后通过考核文字转WAV音频