所以她比我们多出三种属性文字转WAV音频