因此他们并不知道文字转WAV音频