无法直接捕捉描述文字转WAV音频