剩下五个席位则分别是文字转WAV音频