也就是说按照正常的情况文字转WAV音频