主要基于以下几个原因文字转WAV音频