但问题是里面还有一个人文字转WAV音频