不过从其余的四个人的语气之中文字转WAV音频