这个前提是有人给他做文字转WAV音频