所以很容易误诊文字转WAV音频