它越来越能理解一些更为复杂的指令文字转WAV音频