他一开始还不愿意说文字转WAV音频