但从她的动作和声音能察觉得出来文字转WAV音频