我们也会事先知道文字转WAV音频