不过他们暂时还只能是远远看着文字转WAV音频