显然是要做出一个抉择或者说决定了文字转WAV音频