依然还需要他自己去承担文字转WAV音频