在场的人都是以小队为一个队列站一起的文字转WAV音频