然后每人一面前一块文字转WAV音频