所以几个候选人之间都相差无几文字转WAV音频