我觉得在你们还原出录像之前文字转WAV音频