即便是最后通过选拔的分数不高文字转WAV音频