他们三个人应该是最先被挑选出来的文字转WAV音频