初步核定为文字转WAV音频