在一个隐蔽的观察点内文字转WAV音频