最主要的是有掩护文字转WAV音频