这个时候他们需要的是一个安静的空间文字转WAV音频