换句话说斯科拉就是他的人文字转WAV音频