认为是观测者的观测行为文字转WAV音频