形成一个巨大的捕捉空间文字转WAV音频