即使有少量的残余文字转WAV音频