从而做出正确的判断和选择文字转WAV音频