然后他又原路返回文字转WAV音频