在我想来是有两种原因文字转WAV音频