也就是说一方面是比较克制的文字转WAV音频