因为每个人都有不同的角度和诉求文字转WAV音频