然后向我们在场的每个人文字转WAV音频