因为她能够分辨的出文字转WAV音频