通常是指文字转WAV音频