则为先发文字转WAV音频