其实也是一种变相的对收集的数据智能选择的功能文字转WAV音频