他要自己把控文字转WAV音频