而是让他自己认输文字转WAV音频