首先她们四人文字转WAV音频