毕竟只有他们两组人人数相同文字转WAV音频