所以这也局限于他们在某些领域相对就弱了许多文字转WAV音频