所以他能得到一半文字转WAV音频