主要是辨别一下文字转WAV音频