他们还是可以保持一定的自主性的文字转WAV音频