还有工作人员在收集他们训练时的数据文字转WAV音频