便是大量的嘈杂声传来文字转WAV音频