这件事情从本质上面来说文字转WAV音频