如果有某种更高层次的干扰文字转WAV音频