所以他会预判另外一个方向文字转WAV音频