能够同时观察到他们的人文字转WAV音频