它好像也是在注视自己文字转WAV音频