然后做出正确的决策文字转WAV音频