不可能也没必要强行分出一个高下文字转WAV音频