随后在人群的后方文字转WAV音频