后者即使返回原籍文字转WAV音频