而是直接让分身的目光可以借助本体看到文字转WAV音频